¡Google está integrando su modelo de inteligencia artificial Gemini Nano en Chrome para escritorio!

Spread the love

En la conferencia para desarrolladores Google I/O 2024 del martes, Google anunció que está construyendo Gemini Nano, el modelo de IA más pequeño, directamente en el cliente de escritorio de Chrome, comenzando con Chrome 126. Esto, según la compañía, permitirá a los desarrolladores utilizar el modelo en el dispositivo para impulsar sus propias características de IA. Google planea usar esta nueva capacidad para potenciar características como la herramienta existente «ayúdame a escribir» de Workspace Lab en Gmail, por ejemplo.

Según la compañía, el reciente trabajo en WebGPU y el soporte WASM en Chrome permite que estos modelos se ejecuten a una velocidad razonable en una amplia variedad de hardware. En una reunión informativa antes del anuncio del martes, Jon Dahlke, director de gestión de productos de Chrome en Google, señaló que Google estaba en conversaciones con otros proveedores de navegadores para habilitar esto, o una característica similar, en sus navegadores también. «Hemos comenzado a involucrarnos con otros navegadores y abriremos un programa de vista previa temprana para desarrolladores», escribió Dahlke en el anuncio del martes. «Con WebGPU, WASM y Gemini integrados en Chrome, creemos que la web ESTÁ lista para la IA».

Dudo que la mayoría de los competidores de Chrome quieran apostar exclusivamente por los modelos de IA de Google. Lo que tiene más sentido es habilitar a los navegadores, y a los desarrolladores, para ejecutar el modelo de su elección. Google optaría claramente por ejecutar Gemini para sus aplicaciones, pero estos modelos son lo suficientemente pequeños como para permitir a los desarrolladores elegir el que deseen para sus aplicaciones. Sin embargo, la apuesta de Google es habilitar una serie de API de alto nivel en Chrome para traducir, subtitular y transcribir texto en el navegador utilizando sus modelos Gemini.

«Para ofrecer esta característica, ajustamos nuestra versión más eficiente de Gemini y optimizamos Chrome», dijo Dahlke durante la presentación de hoy en la conferencia para desarrolladores en I/O. «Ahora queremos brindarte acceso a los modelos Gemini en Chrome. Nuestra visión es darte los modelos de IA más potentes en Chrome para llegar a miles de millones de usuarios sin tener que preocuparte por la ingeniería rápida, el ajuste fino, la capacidad y el costo. Todo lo que tienes que hacer es llamar a algunas API de alto nivel: traducción, subtítulos, transcripción. Este es un gran cambio para la web y queremos hacerlo bien». Para los desarrolladores, Google también está utilizando el modelo integrado Gemini Nano para potenciar algunas características nuevas en la Consola de Chrome DevTools. Gracias a esto, las herramientas de desarrollo de Chrome ahora pueden explicar errores y proporcionar soluciones de depuración directamente en la consola.

¡Estamos lanzando un boletín de IA! Regístrese aquí para comenzar a recibirlo en sus buzones el 5 de junio.