Google Labs lanza Whisk: Una nueva forma de crear imágenes con IA a partir de fotos

04 Apr 2025 12:55 PM

A diferencia de las herramientas de generación de imágenes que dependen de comandos de texto, Whisk permite crear imágenes utilizando como base otras imágenes.

Google Labs, la división experimental de Google, ha presentado su más reciente creación en el campo de la inteligencia artificial generativa: Whisk. A diferencia de las herramientas tradicionales de generación de imágenes que dependen de detallados comandos de texto, Whisk permite a los usuarios crear imágenes únicas utilizando como base otras imágenes.

Esta innovadora herramienta, lanzada inicialmente en Estados Unidos, ofrece una manera rápida y divertida de explorar la creatividad visual. En lugar de escribir largas descripciones, los usuarios simplemente arrastran y sueltan imágenes para definir el sujeto, la escena y el estilo deseado, permitiendo que la IA de Whisk remezcle estos elementos y genere algo completamente nuevo.

¿Qué es Whisk y cómo funciona?

Whisk se basa en la combinación de dos potentes modelos de IA de Google: Gemini e Imagen 3. El proceso comienza cuando el usuario carga las imágenes de referencia. El modelo Gemini analiza estas imágenes y genera automáticamente una descripción detallada de cada una. Estas descripciones se envían luego a Imagen 3, el modelo de generación de imágenes más reciente de Google, que utiliza la información para crear la imagen final.

La clave de Whisk reside en que captura la esencia del sujeto de las imágenes cargadas, en lugar de crear una réplica exacta. Esto facilita la experimentación y la combinación de diferentes sujetos, escenas y estilos de maneras novedosas. Por ejemplo, se puede tomar una foto de una mascota, una imagen de un paisaje urbano y un estilo de pintura al óleo para generar una representación única de la mascota en ese entorno y con ese estilo artístico.

¿Cómo empezar a usar Whisk?

Actualmente, Whisk está disponible como un experimento en Google Labs para usuarios ubicados en Estados Unidos. Para probarlo, los interesados pueden visitar la página labs.google/whisk.

El proceso para crear imágenes con Whisk es sencillo:

Acceder a la plataforma: Dirígete a la página de Whisk en Google Labs.
Cargar imágenes: Arrastra y suelta una imagen para cada una de las siguientes categorías:
- Sujeto: La imagen del objeto o personaje principal que deseas incluir en tu creación.
- Escena: La imagen del entorno o fondo donde quieres que se sitúe el sujeto.
- Estilo: La imagen que define el estilo visual general que deseas aplicar.
Remezclar y generar: Una vez cargadas las imágenes, haz clic en el botón de generar. Whisk utilizará la IA para combinar los elementos y crear nuevas imágenes basadas en tus referencias.
Explorar variaciones: Whisk suele generar múltiples variaciones de la imagen remezclada, permitiéndote elegir la que más te guste.
Editar el prompt (opcional): Para un mayor control, Whisk permite a los usuarios ver y editar los prompts de texto subyacentes generados por Gemini, brindando la posibilidad de refinar aún más los resultados.

Un enfoque en la exploración creativa rápida

Google describe Whisk como una nueva clase de herramienta creativa, más enfocada en la exploración visual rápida que en la edición de píxeles perfecta. Su objetivo es permitir a los usuarios experimentar con ideas de forma intuitiva, generando rápidamente docenas de opciones visuales para luego seleccionar las que mejor se adapten a sus necesidades.

Si bien Whisk aún se encuentra en una fase experimental, su enfoque innovador para la creación de imágenes con IA tiene el potencial de abrir nuevas posibilidades creativas para artistas, diseñadores y cualquier persona interesada en la generación de imágenes. Los usuarios en Estados Unidos ya pueden probar esta herramienta y compartir sus comentarios para ayudar a dar forma a su futuro desarrollo.