XAI culpa la obsesión de Grok con el genocidio blanco por una «modificación no autorizada

Spread the love

xAI culpó a una «modificación no autorizada» por un error en su chatbot Grok impulsado por IA que causó que Grok se refiriera repetidamente al «genocidio blanco en Sudáfrica» cuando se invocaba en ciertos contextos en X.

El miércoles, Grok comenzó a responder a docenas de publicaciones en X con información sobre el genocidio blanco en Sudáfrica, incluso en respuesta a temas no relacionados. Las extrañas respuestas provenían de la cuenta de Grok en X, que responde a los usuarios con publicaciones generadas por IA siempre que una persona etiqueta «@grok».

Según una publicación del jueves de la cuenta oficial de X de xAI, se realizó un cambio el miércoles por la mañana en la indicación del sistema del bot de Grok, las instrucciones de alto nivel que guían el comportamiento del bot, que dirigía a Grok a proporcionar una «respuesta específica» sobre un «tema político». xAI dice que el ajuste «violó las políticas internas y los valores fundamentales», y que la empresa ha «realizado una investigación exhaustiva».

Es la segunda vez que xAI ha reconocido públicamente que un cambio no autorizado en el código de Grok provocó que la IA respondiera de manera controvertida.

En febrero, Grok censuró brevemente menciones desfavorables de Donald Trump y Elon Musk, el fundador multimillonario de xAI y propietario de X. Igor Babuschkin, líder de ingeniería de xAI, dijo que se instruyó a Grok por un empleado sin autorización para ignorar fuentes que mencionaran a Musk o Trump difundiendo información errónea, y que xAI revirtió el cambio tan pronto como los usuarios comenzaron a señalarlo.

xAI dijo el jueves que va a realizar varios cambios para evitar que ocurran incidentes similares en el futuro. A partir de hoy, xAI publicará las indicaciones del sistema de Grok en GitHub, así como un registro de cambios. La empresa también dice que también «implementará controles y medidas adicionales» para garantizar que los empleados de xAI no puedan modificar la indicación del sistema sin revisión y establecerá un «equipo de monitoreo 24/7 para responder a incidentes con respuestas de Grok que no son detectadas por los sistemas automatizados».