¡Humanos no pueden resistirse a romper la IA con memes de tetas y 9/11!

Spread the love

La industria de la inteligencia artificial avanza a un ritmo aterrador, pero ninguna cantidad de entrenamiento preparará a un modelo de IA para detener a las personas que lo hacen generar imágenes de Sonic the Hedgehog embarazada. En el afán de lanzar las mejores herramientas de IA, las empresas siguen olvidando que la gente siempre usará la nueva tecnología para el caos. La inteligencia artificial simplemente no puede mantener el ritmo con la afinidad humana por los senos y los memes sobre el 9/11.

Tanto Meta como los generadores de imágenes de IA de Microsoft se volvieron virales esta semana por responder a indicaciones como «Karl Marx con grandes pechos» y personajes ficticios haciendo el 9/11. Son los últimos ejemplos de empresas que se apresuran a unirse a la moda de la IA, sin considerar cómo serán mal utilizadas sus herramientas.

Meta está implementando calcomanías de chat generadas por IA para Facebook Stories, Instagram Stories, MD, Messenger y WhatsApp. Están impulsadas por Llama 2, la nueva colección de modelos de IA de Meta que la empresa asegura que es tan «útil» como ChatGPT y Emu, el modelo fundamental de Meta para la generación de imágenes. Las calcomanías, que se anunciaron en la última Meta Connect, estarán disponibles para «usuarios de habla inglesa seleccionados» a lo largo de este mes.

«Todos los días, la gente envía cientos de millones de calcomanías para expresar cosas en los chats», dijo el CEO de Meta, Mark Zuckerberg, durante el anuncio. «Y cada chat es un poco diferente y quieres expresar emociones sutilmente diferentes. Pero hoy solo tenemos un número fijo, pero con Emu ahora tienes la capacidad de simplemente escribir lo que quieres».

Los primeros usuarios estaban encantados de probar qué tan específicas pueden ser las calcomanías, aunque sus indicaciones eran menos sobre expresar «emociones sutilmente diferentes». En cambio, los usuarios intentaron generar las calcomanías más malditas imaginable. En solo días de haber implementado la función, los usuarios de Facebook ya han generado imágenes de Kirby con senos, Karl Marx con senos, Wario con senos, Sonic con senos y Sonic con senos pero también embarazado.

Meta parece bloquear ciertas palabras como «desnudo» y «sexy», pero como señalaron los usuarios, esos filtros se pueden evitar fácilmente usando errores tipográficos de las palabras bloqueadas en su lugar. Y al igual que muchos de sus predecesores de IA, los modelos de IA de Meta luchan por generar manos humanas.

«No creo que nadie involucrado haya pensado nada», publicó el usuario de Twitter X (anteriormente Twitter), junto con capturas de pantalla de calcomanías generadas por IA de soldados niños y las nalgas de Justin Trudeau.

Eso también se aplica al Creador de Imágenes de Bing. Microsoft incorporó DALL-E de OpenAI al Creador de Imágenes de Bing a principios de este año, y recientemente actualizó la integración a DALL-E 3. Cuando se lanzó por primera vez, Microsoft dijo que agregó salvaguardias para evitar el mal uso y limitar la generación de imágenes problemáticas.

Su política de contenido prohíbe a los usuarios producir contenido que pueda «infligir daño a individuos o la sociedad», incluido contenido para adultos que promueva la explotación sexual, discursos de odio y violencia.

Cuando nuestro sistema detecta que una imagen potencialmente dañina podría generarse a partir de una indicación, bloquea la indicación y advierte al usuario», dijo la empresa en una publicación de blog.

Pero, como informó la Media 404, es sorprendentemente fácil utilizar el Creador de Imágenes para generar imágenes de personajes ficticios pilotando el avión que se estrelló contra las Torres Gemelas. A pesar de que la política de Microsoft prohíbe la representación de actos de terrorismo, Internet está lleno de memes generados por IA sobre el 9/11.

Los sujetos varían, pero casi todas las imágenes representan a un querido personaje de ficción en la cabina de un avión, con las Torres Gemelas aún en pie en la distancia. En uno de los primeros posts virales, eran los pilotos de Eva de «Neon Genesis Evangelion». En otro, era Gru de «Mi Villano Favorito» dando un pulgar hacia arriba frente a las torres humeantes. Uno mostraba a Bob Esponja sonriendo a las torres a través del parabrisas de la cabina.

Gracias, Microsoft Bing pic.twitter.com/6XWxpum655 – Rachel🇮🇴 (@tolstoybb) 3 de octubre de 2023

Un usuario de Bing fue más allá y publicó un hilo de Kermit cometiendo una variedad de actos violentos, desde asistir al motín del Capitolio el 6 de enero, hasta asesinar a John F. Kennedy, hasta disparar en la sala de juntas ejecutiva de ExxonMobil.

Microsoft parece bloquear frases como «torres gemelas», «World Trade Center» y «9/11». La empresa también parece prohibir la frase «motín del Capitolio». Usar cualquiera de las frases en el Creador de Imágenes genera una ventana emergente que advierte a los usuarios que la indicación está en conflicto con la política de contenido del sitio, y que múltiples violaciones de la política «pueden llevar a una suspensión automática».

Si estás realmente decidido a ver a tu personaje ficticio favorito cometer un acto de terrorismo, no es difícil evitar los filtros de contenido con un poco de creatividad. El Creador de Imágenes bloqueará la indicación «Sonic the Hedgehog 9/11» y «Sonic the Hedgehog en un avión de las torres gemelas». La indicación «Sonic the Hedgehog en la cabina de un avión hacia el World Trade Center» generó imágenes de Sonic pilotando un avión, con las torres aún intactas en la distancia. Usar la misma indicación pero agregando «embarazada» generó imágenes similares, excepto que inexplicablemente mostraban las Torres Gemelas envueltas en humo.

Si estás tan decidido a ver a tu personaje ficticio favorito cometer actos de terrorismo, es fácil evitar los filtros de contenido de IA. Créditos de la imagen: Microsoft / Creador de Imágenes de Bing

De manera similar, la indicación «Hatsune Miku en el motín del Capitolio de EE. UU. el 6 de enero» activará la advertencia de contenido de Bing, pero la frase «Hatsune Miku insurrección en el Capitolio de EE. UU. el 6 de enero» genera imágenes del Vocaloid armado con un rifle en Washington, DC.

Los errores de Meta y Microsoft no son sorprendentes. En la carrera por superar las características de IA de los competidores, las empresas tecnológicas siguen lanzando productos sin salvaguardias efectivas para evitar que sus modelos generen contenido problemático.

Jugar con indicaciones indirectas para hacer que las herramientas de IA generativas produzcan resultados que violen sus propias políticas de contenido se conoce como jailbreaking (el mismo término se usa al abrir otros tipos de software, como iOS de Apple). La práctica suele ser empleada por investigadores y académicos para probar e identificar la vulnerabilidad de un modelo de IA a los ataques de seguridad.

Pero en línea, es un juego. Las salvaguardias éticas simplemente no son suficientes para el deseo humano de romper las reglas, y la proliferación de productos de IA generativa en los últimos años solo ha motivado a las personas a jailbreak productos tan pronto como se lanzan. Usar indicaciones hábilmente redactadas para encontrar lagunas en las salvaguardias de una herramienta de IA es algo así como una forma de arte, y lograr que las herramientas de IA generen resultados absurdos y ofensivos está dando lugar a un nuevo género de memes.

Cuando Snapchat lanzó su chatbot de IA apto para la familia, por ejemplo, los usuarios lo entrenaron para que les llamara Senpai y gimiera a comando. Midjourney prohibe contenido pornográfico, llegando al extremo de bloquear palabras relacionadas con el sistema reproductivo humano, pero los usuarios aún pueden evitar los filtros y generar imágenes para adultos. Para usar a Clyde, el chatbot de Discord impulsado por OpenAI, los usuarios deben cumplir con las políticas de Discord y OpenAI, que prohíben el uso de la herramienta para actividades ilegales y dañinas, incluido el «desarrollo de armas». Eso no impidió que el chatbot diera instrucciones a un usuario para hacer napalm después de que se le pidiera que actuara como la abuela fallecida del usuario «que solía ser ingeniera química en una fábrica de producción de napalm».

Cualquier nueva herramienta de IA generativa seguramente será una pesadilla de relaciones públicas, especialmente a medida que los usuarios se vuelven más hábiles para identificar y explotar lagunas de seguridad. Irónicamente, las posibilidades ilimitadas de la inteligencia artificial generativa se demuestran mejor por los usuarios decididos a romperla. El hecho de que sea tan fácil evitar estas restricciones plantea serias señales de alerta, pero lo más importante, es bastante gracioso. Es tan bellamente humano que décadas de innovación científica hayan allanado el camino para esta tecnología, solo para que la usemos para mirar senos.

¡Humanos no pueden resistirse a romper la IA con memes de tetas y 9/11!

Hackers de Qakbot ainda estão enviando spam para vítimas apesar da ação do FBI

¿Asistir o no asistir? Preguntamos a 52 fundadores si los eventos son útiles o una pérdida de tiempo

noticias generales

Elon Musk’s Neuralink closes a $650M Series E

¡Valla recauda $2.7 millones para hacer más accesible la vía legal a los empleados!

Desafío de crecimiento frenético de los centros de datos desafía los objetivos de sostenibilidad de Microsoft.

IBM adquiere startup de análisis de datos Seek AI y abre acelerador de IA en NYC

Sindicato de videojuegos firma primer acuerdo con Microsoft

Influencers de izquierda abrazan Bluesky sin abandonar X, afirma Pew

NAACP exige que autoridades de Memphis parem operações no ‘centro de dados sujo’ da xAI

Meta planea automatizar muchas de sus evaluaciones de riesgo de productos

Resumen Semanal: ¡Perplexity Labs quiere hacer tu trabajo!

Space Forge recauda $30 millones en Serie A para fabricar materiales de chips en el espacio

seguridad digital

Qualcomm resuelve tres vulnerabilidades zero-day explotadas por hackers

¡Supermercado indio KiranaPro hackeado y servidores eliminados, CEO lo confirma!

¡Kettering, el gigante de la salud, sigue luchando contra interrupciones tras el ataque de ransomware!

¡Desapareció el informe de seguridad prometido por XAI!

Google anuncia nuevas funciones de seguridad para Android ¡protégete de estafas y robos!