La versión más reciente del modelo de texto a imagen creado por Google se encuentra disponible para los usuarios puedan realizar pruebas y sorprenderse con el rendimiento que ofrece.
Image 3 es el generador de IA más avanzado que pone disposición del gran público Google. Este modelo rivaliza con Midjourney, DALL-E 3, y con el críticado Grok-2 de X (ex Twitter) debido a su falta de restricciones éticas.
Google por su parte adoptó un enfoque diferente a la creación de Elon Musk, que rápidamente ganó notoriedad por generar imágenes fake de figuras públicas y otras que directamente violan los derechos de autor.
A diferencia del modelo de IA Grok-2, Google afirmó que "usó un extenso filtrado y etiquetado de datos para minimizar el contenido dañino en los conjuntos de datos y redujo la probabilidad de salidas dañinas", informó Mashable. Las imágenes creadas por Imagen 3 cuentan con una particularidad novedosa: llevan marca de agua digital SynthID de Google para identificar su procedencia.
Más allá de los protocolos de seguridad, Google dijo que Imagen 3 "tiene mayor versatilidad y comprensión de los prompts, alta calidad de imágenes generadas y mejor procesamiento de texto", un problema recurrente en todos los modelos de generación de imágenes con IA.
Imagen 3 pic.twitter.com/r36urQLy1i
— AK (@_akhaliq) August 15, 2024
En lo que hace a críticas, algunos usuarios en Reddit se quejaron de que el modelo de Google es demasiado restrictivo en el tipo de imágenes que les permite generar.
Imagen 3 ya está disponible por medio de ImageFX y VertexAI. Pronto se la podrá disfrutar en todas las funciones de Google AI en Workspace y Géminis en la web y el teléfono móbil.