Google presenta Gemma, una nueva familia de modelos ligeros
Google ha anunciado hoy el lanzamiento de Gemma, una nueva familia de modelos ligeros de código abierto. Estos nuevos modelos, comenzando con Gemma 2B y Gemma 7B, han sido "inspirados por Gemini" y están disponibles para uso comercial e investigativo.
Google no nos ha proporcionado un documento detallado sobre cómo estos modelos se desempeñan en comparación con modelos similares de Meta y Mistral, por ejemplo, y solo señaló que son "de última generación". La empresa sí mencionó que estos son modelos densos de solo decodificador, que es la misma arquitectura que utilizó para sus modelos Gemini (y sus modelos anteriores de PaLM) y que veremos las comparativas más tarde hoy en el ranking de Hugging Face.
Acceso a Gemma y herramientas de desarrollo
Para empezar con Gemma, los desarrolladores pueden acceder a cuadernos Colab y Kaggle listos para usar, así como integraciones con Hugging Face, MaxText y NeMo de Nvidia. Una vez pre-entrenados y ajustados, estos modelos pueden ejecutarse en cualquier lugar.
Si bien Google destaca que estos son modelos abiertos, cabe destacar que no son de código abierto. De hecho, en una reunión informativa antes del anuncio de hoy, Janine Banks de Google destacó el compromiso de la empresa con el código abierto, pero también señaló que Google es muy intencional en la forma en que se refiere a los modelos de Gemma.
"Los modelos abiertos se han vuelto bastante generalizados en la industria", dijo Banks. "Y a menudo se refiere a modelos de pesos abiertos, donde hay un amplio acceso para que los desarrolladores e investigadores personalicen y ajusten los modelos, pero, al mismo tiempo, los términos de uso, como la redistribución, así como la propiedad de las variantes desarrolladas, varían según los términos de uso específicos del modelo. Y así vemos alguna diferencia entre lo que tradicionalmente llamaríamos de código abierto y decidimos que tenía más sentido referirnos a nuestros modelos de Gemma como modelos abiertos".
Potencial de desarrollo de aplicaciones de IA
Los tamaños de estos modelos son adecuados para muchos casos de uso y, según el director de gestión de productos de Google DeepMind, Tris Warkentin, "la calidad de generación ha aumentado significativamente en el último año". Esto desbloquea nuevas formas de desarrollar aplicaciones de IA, incluida la capacidad de ejecutar inferencias y ajustes en tu escritorio o portátil de desarrollo local con tu GPU RTX o en un único host en GCP con Cloud TPUs, por ejemplo.
Esto también es cierto para los modelos abiertos de los competidores de Google en este espacio, por lo que tendremos que ver cómo se desempeñan los modelos de Gemma en escenarios del mundo real. Además de los nuevos modelos, Google también está lanzando un nuevo kit de herramientas de IA generativa responsable para proporcionar "orientación y herramientas esenciales para crear aplicaciones de IA más seguras con Gemma", así como una herramienta de depuración.
Otras noticias • IA
Threads lanza "Dear Algo" para personalizar contenido y mejorar interacción
Threads, la plataforma de Meta, ha introducido "Dear Algo", una función de personalización que permite a los usuarios solicitar contenido específico de forma pública y...
Cofundadores de xAI abandonan la empresa, inquietud por futuro
Las recientes salidas de cofundadores en xAI, incluida la de Yuhuai Wu y Jimmy Ba, generan preocupación sobre la estabilidad y cultura de la empresa....
Meridian recauda 17 millones para revolucionar la modelización financiera
Meridian, una startup innovadora en modelización financiera, ha recaudado 17 millones de dólares para desarrollar un entorno de desarrollo integrado que optimiza la creación de...
Elon Musk planea fábrica lunar para revolucionar inteligencia artificial
Elon Musk anunció planes para establecer una fábrica lunar a través de xAI, buscando revolucionar la inteligencia artificial con recursos lunares. Sin embargo, la reciente...
Controversia en debut olímpico por música de inteligencia artificial
El debut olímpico de los patinadores checos Kateřina Mrázková y Daniel Mrázek ha generado controversia por usar música generada por inteligencia artificial. Esto plantea preguntas...
Amazon busca licenciar contenido para empresas de IA
Amazon está explorando un mercado para que los editores licencien su contenido a empresas de IA, buscando establecer relaciones más sostenibles en un entorno legal...
Fuga de talento en xAI pone en riesgo su futuro
La salida de Yuhuai Wu y otros cofundadores de xAI destaca una preocupante fuga de talento en el sector de inteligencia artificial. La presión interna,...
Boston Dynamics cambia de CEO en medio de incertidumbre
Boston Dynamics enfrenta un cambio de liderazgo tras la renuncia de Robert Playter como CEO, con Amanda McMaster asumiendo el cargo interinamente. Este cambio genera...
Lo más reciente
- 1
Apple compra derechos de "Severance" por 70 millones de dólares
- 2
FTC presiona a Apple por censura en Apple News
- 3
Modal Labs busca financiación para alcanzar valoración de 2.500 millones
- 4
xAI reestructura equipos y despide empleados en nueva dirección
- 5
OpenAI disuelve equipo de alineación de IA generando preocupaciones éticas
- 6
Microsoft advierte sobre vulnerabilidades críticas en Windows y Office
- 7
Uber Eats lanza Asistente de Carrito para facilitar compras

