¡Codex de OpenAI es parte de una nueva generación de herramientas de codificación con agencia!

Spread the love

El pasado viernes, OpenAI presentó un nuevo sistema de codificación llamado Codex, diseñado para realizar tareas de programación complejas a partir de comandos en lenguaje natural. Codex lleva a OpenAI a un nuevo grupo de herramientas de codificación agentes que recién comienzan a tomar forma.

Desde el temprano Copilot de GitHub hasta herramientas contemporáneas como Cursor y Windsurf, la mayoría de los asistentes de codificación de IA operan como una forma excepcionalmente inteligente de autocompletar. Generalmente, estas herramientas viven en un entorno de desarrollo integrado, y los usuarios interactúan directamente con el código generado por la IA. La perspectiva de simplemente asignar una tarea y regresar cuando esté terminada está en gran medida fuera de alcance.

Pero estas nuevas herramientas de codificación agentes, lideradas por productos como Devin, SWE-Agent, OpenHands y OpenAI Codex, están diseñadas para funcionar sin que los usuarios tengan que ver el código. El objetivo es operar como el gerente de un equipo de ingeniería, asignando problemas a través de sistemas de trabajo como Asana o Slack y verificando cuando se ha alcanzado una solución.

Para los creyentes en formas altamente capaces de IA, es el siguiente paso lógico en una progresión natural de la automatización que cada vez se hace cargo de más trabajo de software.

«Al principio, la gente simplemente escribía código presionando cada golpe de tecla», explica Kilian Lieret, un investigador de Princeton y miembro del equipo de SWE-Agent. «GitHub Copilot fue el primer producto que ofreció un autocompletado real, lo cual es una especie de segunda etapa. Todavía estás absolutamente en el circuito, pero a veces puedes tomar un atajo».

El objetivo de los sistemas agentes es pasar completamente por alto los entornos de desarrollo, en lugar de presentar a los agentes de codificación un problema y dejarlos resolverlo por sí mismos. «Llevamos las cosas de vuelta a la capa de gestión, donde simplemente asigno un informe de error y el robot intenta solucionarlo de manera completamente autónoma», dice Lieret.

Es un objetivo ambicioso y, hasta ahora, se ha demostrado difícil.