Snap Inc. ha anunciado el desarrollo de un modelo de inteligencia artificial capaz de generar imágenes a partir de descripciones de texto en dispositivos móviles en menos de dos segundos.
El modelo, denominado SnapFusion, es un modelo de difusión de texto a imagen que crea imágenes a partir de descripciones en lenguaje natural. A diferencia de otros modelos similares que requieren hardware potente y procesamiento en la nube, SnapFusion está diseñado para funcionar directamente en dispositivos móviles, ofreciendo resultados rápidos y preservando la privacidad del usuario. Para lograr esta eficiencia, los investigadores de Snap han optimizado la arquitectura de la red y mejorado las técnicas de destilación de pasos, reduciendo la complejidad computacional sin sacrificar la calidad de las imágenes generadas. En pruebas realizadas con el conjunto de datos MS-COCO, SnapFusion superó a modelos como Stable Diffusion v1.5 en métricas de calidad de imagen, utilizando menos pasos de denoising. Este avance democratiza la creación de contenido, permitiendo a los usuarios generar imágenes de alta calidad directamente desde sus dispositivos móviles.
Puntos más importantes:
- Snap Inc. ha desarrollado SnapFusion, un modelo de IA que genera imágenes a partir de texto en dispositivos móviles.
- SnapFusion funciona en menos de dos segundos, sin necesidad de hardware potente ni procesamiento en la nube.
- El modelo optimiza la arquitectura de la red y mejora las técnicas de destilación para reducir la complejidad computacional.
- En pruebas, SnapFusion superó a modelos existentes en métricas de calidad de imagen con menos pasos de denoising.
- Este avance permite a los usuarios generar imágenes de alta calidad directamente desde sus dispositivos móviles, preservando la privacidad.
Enlace: https://techcrunch.com/2025/02/04/snap-unveils-ai-text-to-image-model-for-mobile-devices/