Composo ayuda a las empresas a monitorear el rendimiento de las aplicaciones de inteligencia artificial

Spread the love

La inteligencia artificial (IA) y los modelos de lenguaje grandes (LLMs) que los impulsan tienen una gran cantidad de aplicaciones útiles, pero a pesar de todas sus promesas, no son muy confiables. Nadie sabe cuándo se resolverá este problema, por lo que tiene sentido que veamos startups encontrando una oportunidad en ayudar a las empresas a asegurarse de que las aplicaciones impulsadas por LLMs por las que están pagando funcionen como se espera.

La startup con sede en Londres, Composo, siente que tiene una ventaja en tratar de resolver ese problema, gracias a sus modelos personalizados que pueden ayudar a las empresas a evaluar la precisión y calidad de las aplicaciones que son impulsadas por LLMs. La compañía es similar a Agenta, Freeplay, Humanloop y LangSmith, que afirman ofrecer una alternativa sólida basada en LLM a las pruebas humanas, listas de verificación y herramientas de observabilidad existentes. Pero Composo afirma que es diferente porque ofrece tanto una opción sin código como una API. Esto es notable porque amplía el alcance de su mercado potencial: no es necesario ser un desarrollador para usarlo, y los expertos en el sector y los ejecutivos pueden evaluar las aplicaciones de IA en busca de inconsistencias, calidad y precisión por sí mismos.

En la práctica, Composo combina un modelo de recompensa entrenado en la salida que una persona preferiría ver en una aplicación de IA con un conjunto de criterios específicos para esa aplicación para crear un sistema que evalúa básicamente las salidas de la aplicación frente a esos criterios. Por ejemplo, un chatbot de triaje médico puede tener configuradas guías personalizadas para verificar síntomas de alerta, y Composo puede puntuar qué tan consistentemente lo hace la aplicación. Recientemente, la compañía lanzó una API pública para Composo Align, un modelo para evaluar aplicaciones de LLM en cualquier criterio.

Imagem destacada

La estrategia parece estar funcionando en cierta medida: tiene nombres como Accenture, Palantir y McKinsey en su base de clientes, y recientemente recaudó $2 millones en financiamiento pre-semilla. La pequeña cantidad recaudada aquí no es inusual para una startup en el clima actual de inversión de riesgo, pero es notable porque esto es Terra de la IA, después de todo: el financiamiento para tales compañías es abundante.

Según el cofundador y CEO de Composo, Sebastian Fox, el número relativamente bajo se debe a que el enfoque de la startup no es particularmente intensivo en capital. «Durante al menos los próximos tres años, no prevemos recaudar cientos de millones porque hay mucha gente construyendo modelos de base y haciéndolo de manera muy efectiva, y ese no es nuestro PUS», dijo Fox, ex consultor de McKinsey. «En cambio, cada mañana, si me despierto y veo una noticia de que OpenAI ha hecho un gran avance en sus modelos, eso es bueno para mi negocio». Con el dinero fresco, Composo planea expandir su equipo de ingeniería (liderado por el cofundador y CTO Luke Markham, un ex ingeniero de aprendizaje automático en Graphcore), adquirir más clientes y reforzar sus esfuerzos de I+D. «El enfoque de este año es mucho más sobre escalar la tecnología que ahora tenemos en esas compañías», dijo Fox.

El fondo de pre-semilla de IA británico Twin Path Ventures lideró la ronda de inversión, en la que también participaron JVH Ventures y EWOR (este último había respaldado la startup a través de su programa de aceleración). «Composo está abordando un cuello de botella crítico en la adopción de la IA empresarial», dijo un portavoz de Twin Path en un comunicado. Ese cuello de botella es un gran problema para el movimiento general de IA, particularmente en el segmento empresarial, dijo Fox. «La gente está sobre la emoción y ahora está pensando: ‘Bueno, en realidad, ¿esto realmente cambia algo sobre mi negocio en su forma actual? Porque no es lo suficientemente confiable y no es lo suficientemente consistente. Y aunque lo sea, no puedes demostrarme cuánto es», dijo. Ese cuello de botella podría hacer que Composo sea más valioso para las compañías que quieran implementar IA pero podrían incurrir en riesgo reputacional al hacerlo. Fox dice que esa es la razón por la que su compañía optó por ser agnóstica en la industria, pero aún así tener resonancia en los espacios de cumplimiento, legal, salud y seguridad.

En cuanto a su foso competitivo, Fox siente que la I+D necesaria para llegar aquí no es trivial. «Tanto la arquitectura del modelo como los datos que hemos utilizado para entrenarlo», dijo, explicando que Composo Align se entrenó en un «gran conjunto de datos de evaluaciones de expertos». Todavía queda la pregunta de qué podrían hacer los gigantes tecnológicos si simplemente golpearan sus enormes arcas para abordar este problema, pero Composo cree que tiene una ventaja como pionero. «La otra [cosa] es los datos que acumulamos con el tiempo», dijo Fox, refiriéndose a cómo Composo ha construido preferencias de evaluación. Debido a que evalúa aplicaciones frente a un conjunto flexible de criterios, Composo también se ve a sí misma como mejor adaptada al surgimiento de la IA agente que los competidores que utilizan un enfoque más limitado. «En mi opinión, definitivamente no estamos en la etapa en la que los agentes funcionan bien, y eso es precisamente lo que estamos tratando de ayudar a resolver», dijo Fox. ¡TechCrunch tiene un boletín centrado en la IA! ¡Regístrate aquí para recibirlo en tu bandeja de entrada todos los miércoles!

CEO de Snap ayuda a lanzar programa de recuperación de incendios en LA

Christie’s anuncia subasta de arte AI, ¡y no todos están contentos!