Google lanza un generador de imágenes impulsado por IA

Que los deepfakes de Taylor Swift se vayan al diablo, Google está lanzando una nueva herramienta impulsada por IA, ImageFX, para la creación de imágenes.

Respaldado por Imagen 2, un modelo de imágenes GenAI desarrollado por el equipo de DeepMind de Google, ImageFX ofrece una interfaz de usuario basada en instrucciones para crear y editar imágenes. Eso no es diferente a herramientas como DALL-E 3 de OpenAI, Midjourney, Imagine with Meta AI de Meta y Designer de Microsoft. Pero el giro único de ImageFX son los "chips expresivos" —básicamente una lista de sugerencias de palabras clave que permiten a los usuarios experimentar con las "dimensiones adyacentes" de sus creaciones e ideas.

“Diseñado para la experimentación y la creatividad, ImageFX te permite crear imágenes con una simple instrucción de texto, y luego modificarlas fácilmente con una nueva forma de instrucción utilizando chips expresivos,” escribe Google en una publicación de blog.

Pero, ¿qué hay del potencial de abuso, especialmente a la luz de los eventos recientes?

Google afirma que ha tomado medidas para asegurarse de que ImageFX no se pueda utilizar de maneras no previstas, por ejemplo, agregando “salvaguardias técnicas” para limitar “resultados problemáticos” como contenido violento, ofensivo y sexualmente explícito. ImageFX también cuenta con un filtro a nivel de instrucción para “personas nombradas”, presumiblemente figuras públicas —aunque Google no fue especialmente claro en ese punto en sus materiales de prensa.

“Invertimos en la seguridad de los datos de entrenamiento desde el principio,” dijo Google. “De acuerdo con nuestros principios de IA, también realizamos pruebas adversariales extensas y red teaming para identificar y mitigar posibles contenidos dañinos y problemáticos.”

Como medida de seguridad adicional, Google etiqueta las imágenes producidas con ImageFX con SynthID, una marca de agua digital que supuestamente es robusta contra ediciones y recortes de imágenes.

“Las marcas de agua SynthID son imperceptibles para el ojo humano pero detectables para la identificación,” continúa Google en la publicación del blog. “Con información adicional en ‘Acerca de esta imagen’, sabrás si una imagen pudo haber sido generada con las herramientas de IA de Google cuando te encuentres con ella en la Búsqueda de Google o Chrome.”

Encontrarás ImageFX en AI Test Kitchen, la aplicación web de Google para proyectos experimentales de IA.

Imagen 2 ampliado

En noticias relacionadas hoy, Google dijo que está llevando Imagen 2 a más de sus productos y servicios a partir de esta semana, incluyendo la experiencia de búsqueda de inteligencia artificial de próxima generación y la familia de servicios de inteligencia artificial gestionados Vertex AI.

Imagen 2 —que también ahora alimenta capacidades de texto a imagen en Google Ads y Duet AI en Workspace, la suite de productos GenAI de Google para la productividad— ha llegado a la Experiencia Generativa de Búsqueda de Google (SGE). SGE, que comenzó a ofrecer herramientas de generación de imágenes a los usuarios en la Búsqueda de Imágenes de Google en octubre pasado, ahora aprovecha Imagen 2 para generar imágenes. Los usuarios pueden ingresar una instrucción especificando qué tipo de imagen desean y SGE devolverá cuatro resultados directamente en la experiencia conversacional de SGE.

En Vertex AI, Imagen 2 está disponible a través de una API para los clientes de Google Cloud. Además, Imagen 2 ahora es invocable a través de Bard, el chatbot impulsado por IA de Google.

“Con Imagen 2, Bard entiende instrucciones simples o complejas para que puedas generar una variedad de imágenes de alta calidad,” explica Google. “Simplemente escribe una descripción —como ‘crea una imagen de un perro montando una tabla de surf’— y Bard generará visuales personalizadas y variadas para ayudar a materializar tu idea.”

Google aún no ha revelado los datos utilizados para entrenar Imagen 2, lo cual, aunque decepcionante, no es exactamente una sorpresa. Es una cuestión legal abierta si los proveedores de GenAI como Google pueden entrenar un modelo con datos de dominio público —incluso con derechos de autor— y luego comercializar ese modelo.

Litigios relevantes están avanzando en los tribunales, con los proveedores argumentando que están protegidos por la doctrina del uso justo. Pero pasará un tiempo antes de que se asiente el polvo.

Mientras tanto, Google está jugando seguro al guardar silencio sobre el asunto.