¡La función de generación de imágenes de ChatGPT recibe una actualización!

Spread the love

Durante una transmisión en vivo el martes, el CEO de OpenAI, Sam Altman, anunció la primera gran actualización de las capacidades de generación de imágenes de ChatGPT en más de un año.

ChatGPT ahora puede aprovechar el modelo GPT-4o de la empresa para crear y modificar imágenes y fotos de forma nativa. GPT-4o ha sido la base de la plataforma de chatbot con inteligencia artificial de la empresa durante mucho tiempo, pero hasta ahora, el modelo solo había podido generar y editar texto, no imágenes.

Altman dijo que la generación de imágenes nativa de GPT-4o está disponible hoy en ChatGPT y Sora, el producto de generación de videos de inteligencia artificial de OpenAI, para los suscriptores del plan Pro de $200 al mes de la empresa. OpenAI dice que la función se implementará pronto en los usuarios Plus y gratuitos de ChatGPT, así como en los desarrolladores que utilicen el servicio de API de la empresa.

GPT-4o con la salida de imágenes «piensa» un poco más que el modelo de generación de imágenes que reemplaza efectivamente, DALL-E 3, para crear imágenes más precisas y detalladas, según describe OpenAI. GPT-4o puede editar imágenes existentes, incluso imágenes con personas en ellas, transformándolas o «rellenando» detalles como objetos del primer plano y del fondo.

Para impulsar la nueva función de imágenes, OpenAI le dijo al Wall Street Journal que entrenaron a GPT-4o en «datos disponibles públicamente», así como en datos exclusivos de sus asociaciones con empresas como Shutterstock.

Muchos proveedores de inteligencia artificial generativa ven los datos de entrenamiento como una ventaja competitiva, por lo que los guardan junto con cualquier información relacionada. Pero los detalles de los datos de entrenamiento también son una fuente potencial de demandas relacionadas con la propiedad intelectual, otro desincentivo para que las empresas revelen mucho.

«Respetamos los derechos de los artistas en cuanto a cómo producimos el resultado, y tenemos políticas que nos impiden generar imágenes que imiten directamente el trabajo de cualquier artista vivo», dijo Brad Lightcap, director de operaciones de OpenAI, en un comunicado al Journal.

OpenAI ofrece un formulario de exclusión que permite a los creadores solicitar que sus obras se eliminen de sus conjuntos de datos de entrenamiento. La empresa también dice que respeta las solicitudes de evitar que sus bots de raspado web recopilen datos de entrenamiento, incluidas imágenes, de sitios web.

La función de generación de imágenes mejorada de ChatGPT sigue los pasos de la salida de imágenes nativas experimentales de Google para Gemini 2.0 Flash, uno de los modelos principales de la empresa. La poderosa función se volvió viral en las redes sociales, pero no necesariamente por las mejores razones. Resulta que el componente de imágenes de Gemini 2.0 Flash tenía pocos guardabarros, lo que permitía a las personas eliminar marcas de agua y crear imágenes que representen personajes con derechos de autor.

Este artículo se actualizó a las 12 pm PT para incluir la declaración de OpenAI al Wall Street Journal sobre los datos de entrenamiento de GPT-4o.

[[IMG::…]]