Estudiantes universitarios crean revolucionario modelo de inteligencia artificial para desafiar a NotebookLM

Spread the love

**Jóvenes crean inteligencia artificial abierta para la generación de clips al estilo de podcasts**

Un par de estudiantes universitarios, con poca experiencia en IA, aseguran haber desarrollado un modelo de inteligencia artificial disponible públicamente que puede crear clips al estilo de podcasts. El mercado de herramientas de síntesis de voz es amplio y está en crecimiento. ElevenLabs es una de las compañías más grandes en esto, pero hay varios competidores. Los inversores ven el potencial de estas herramientas. El año pasado, las startups que trabajan en tecnologías de IA de voz recaudaron más de $398 millones en financiamiento de capital de riesgo, según PitchBook.

**Un nuevo enfoque en la generación de voces sintéticas**

Toby Kim, uno de los cofundadores de Nari Labs, con sede en Corea, el equipo detrás del modelo recién lanzado, mencionó que él y su compañero cofundador empezaron a estudiar sobre IA de voz hace tres meses. Inspirados por NotebookLM, querían crear un modelo que ofreciera más control sobre las voces generadas y «libertad en el guion».

[[IMG::]]

**Disponible para el público**

Disponible en la plataforma de desarrollo de IA Hugging Face y en GitHub, Dia puede funcionar en la mayoría de las computadoras modernas con al menos 10GB de VRAM. Genera una voz aleatoria a menos que se solicite con una descripción de un estilo deseado, pero también puede imitar la voz de una persona.

**Desafíos y próximos pasos**

Al igual que muchos generadores de voz, Dia ofrece pocas medidas de seguridad. Sería bastante fácil crear desinformación o grabaciones fraudulentas. Nari desalienta el uso indebido del modelo para hacerse pasar por otra persona, engañar o participar en campañas ilegales, pero el equipo afirma que «no es responsable» de su mal uso. Nari también planea publicar un informe técnico sobre Dia y ampliar el soporte del modelo a idiomas más allá del inglés.