Google experimenta con un nuevo generador de imágenes que combina tres imágenes en una sola creación

Spread the love

Google Labs, el brazo experimental de Google, está probando un nuevo generador de imágenes llamado Whisk. Esta herramienta permite a las personas solicitar imágenes en lugar de texto, lo que les permite remezclar una foto alterando el sujeto, la escena y el estilo.

Whisk utiliza el modelo de generación de imágenes de Google, Imagen 3, para combinar tres imágenes: una para el sujeto, otra para la escena y una para el estilo. Por ejemplo, puedes seleccionar una foto tuya como sujeto, un paisaje futurista como escena y un estilo de anime para el aspecto final.

El modelo genera automáticamente una descripción detallada de tus imágenes, que luego se utiliza para guiar a Imagen 3 en la creación de una remezcla de la foto. También puedes ingresar indicaciones de texto para definir aún más el resultado deseado, incluidas descripciones detalladas como «El sujeto está montando una bicicleta voladora».

Debido a que Whisk solo se centra en algunas características clave de cada imagen, la empresa explica que los resultados no siempre pueden cumplir con tus expectativas. Por ejemplo, el sujeto generado podría diferir en altura, peso, peinado o tono de piel. Google dice que puedes ver y editar las indicaciones subyacentes en cualquier momento.

El experimento actualmente solo está disponible para usuarios basados en los Estados Unidos en labs.google/whisk.

[[IMG::…]]