Datos de alta calidad pueden ser la clave para inteligencia artificial de alta calidad. Con estudios que encuentran que la curación de conjuntos de datos, más que el tamaño, es lo que realmente afecta el rendimiento de un modelo de IA, no es sorprendente que haya un énfasis creciente en las prácticas de gestión de conjuntos de datos. Según algunas encuestas, los investigadores de IA hoy pasan gran parte de su tiempo en tareas de preparación y organización de datos.
Los hermanos Vahan Petrosyan y Tigran Petrosyan sintieron el dolor de tener que manejar muchos datos mientras entrenaban algoritmos en la universidad. Vahan llegó tan lejos como para crear una herramienta de gestión de datos durante su investigación de doctorado en segmentación de imágenes.
Unos años más tarde, Vahan se dio cuenta de que los desarrolladores, e incluso las corporaciones, pagarían con gusto por herramientas similares. Así que los hermanos fundaron una empresa, SuperAnnotate, para construirla.
«Durante la explosión de innovación en 2023 en torno a modelos y IA multimodal, la necesidad de conjuntos de datos de alta calidad se volvió más estricta, con cada organización teniendo múltiples casos de uso que requieren datos especializados», dijo Vahan en un comunicado. «Vimos la oportunidad de construir una plataforma fácil de usar y de bajo código, como una navaja suiza para los datos de entrenamiento de IA moderna.»
SuperAnnotate, cuyos clientes incluyen a Databricks y Canva, ayuda a los usuarios a crear y hacer un seguimiento de grandes conjuntos de datos de entrenamiento de IA. La startup se enfocó inicialmente en el etiquetado de software, pero ahora proporciona herramientas para ajustar, iterar y evaluar conjuntos de datos.
Con la plataforma de SuperAnnotate, los usuarios pueden conectar datos de fuentes locales y en la nube para crear proyectos de datos en los que pueden colaborar con compañeros. Desde un panel de control, los usuarios pueden comparar el rendimiento de los modelos por los datos que se utilizaron para entrenarlos, y luego desplegar esos modelos en varios entornos una vez que estén listos.

SuperAnnotate también proporciona a las empresas acceso a un mercado de trabajadores de la multitud para tareas de anotación de datos. Las anotaciones suelen ser piezas de texto que etiquetan el significado o partes de los datos en los que los modelos se entrenan, y sirven como hitos para los modelos, «enseñándoles» a distinguir cosas, lugares e ideas.
Para ser sinceros, hay varios hilos de Reddit sobre el tratamiento de los anotadores de datos de SuperAnnotate, y no son halagadores. Los anotadores se quejan de problemas de comunicación, expectativas poco claras y bajos salarios.
Por su parte, SuperAnnotate afirma que paga las tarifas del mercado justo y que sus demandas a los anotadores no están fuera de lo normal para la industria. Hemos pedido a la empresa que proporcione información más detallada sobre sus prácticas y actualizaremos esta pieza si recibimos una respuesta.
Editar: Unas horas después de que se publicara esta historia, SuperAnnotate envió esta declaración por correo electrónico: «Hace unos ocho meses, durante un período de rápido crecimiento, encontramos desafíos para mantener una comunicación clara con algunos anotadores que trabajaban en nuestros proyectos. Como a veces ocurre durante un rápido crecimiento, surgieron algunas brechas en los procesos. Tomamos en serio estos comentarios y desde entonces hemos realizado mejoras tanto en cómo interactúan los anotadores con la plataforma como en los procesos de comunicación».
Hay varios competidores en el espacio de gestión de datos de IA, incluyendo startups como Scale AI, Weka y Dataloop. Aunque con sede en San Francisco, SuperAnnotate ha logrado mantenerse a la par, recientemente recaudando $36 millones en una ronda Serie B liderada por Socium Ventures, con la participación de Nvidia, Databricks Ventures y Play Time Ventures.
El capital fresco, que eleva el total recaudado de SuperAnnotate a poco más de $53 millones, se utilizará para aumentar su equipo actual de alrededor de 100 empleados, para I+D de productos y para hacer crecer la base de clientes de SuperAnnotate de aproximadamente 100 empresas.
«Aimamos a construir una plataforma capaz de adaptarse completamente a las necesidades cambiantes de las empresas y de ofrecer una amplia personalización en el ajuste fino de datos», dijo Vahan.