Google presenta Gemma, una nueva familia de modelos ligeros
Google ha anunciado hoy el lanzamiento de Gemma, una nueva familia de modelos ligeros de código abierto. Estos nuevos modelos, comenzando con Gemma 2B y Gemma 7B, han sido "inspirados por Gemini" y están disponibles para uso comercial e investigativo.
Google no nos ha proporcionado un documento detallado sobre cómo estos modelos se desempeñan en comparación con modelos similares de Meta y Mistral, por ejemplo, y solo señaló que son "de última generación". La empresa sí mencionó que estos son modelos densos de solo decodificador, que es la misma arquitectura que utilizó para sus modelos Gemini (y sus modelos anteriores de PaLM) y que veremos las comparativas más tarde hoy en el ranking de Hugging Face.
Acceso a Gemma y herramientas de desarrollo
Para empezar con Gemma, los desarrolladores pueden acceder a cuadernos Colab y Kaggle listos para usar, así como integraciones con Hugging Face, MaxText y NeMo de Nvidia. Una vez pre-entrenados y ajustados, estos modelos pueden ejecutarse en cualquier lugar.
Si bien Google destaca que estos son modelos abiertos, cabe destacar que no son de código abierto. De hecho, en una reunión informativa antes del anuncio de hoy, Janine Banks de Google destacó el compromiso de la empresa con el código abierto, pero también señaló que Google es muy intencional en la forma en que se refiere a los modelos de Gemma.
"Los modelos abiertos se han vuelto bastante generalizados en la industria", dijo Banks. "Y a menudo se refiere a modelos de pesos abiertos, donde hay un amplio acceso para que los desarrolladores e investigadores personalicen y ajusten los modelos, pero, al mismo tiempo, los términos de uso, como la redistribución, así como la propiedad de las variantes desarrolladas, varían según los términos de uso específicos del modelo. Y así vemos alguna diferencia entre lo que tradicionalmente llamaríamos de código abierto y decidimos que tenía más sentido referirnos a nuestros modelos de Gemma como modelos abiertos".
Potencial de desarrollo de aplicaciones de IA
Los tamaños de estos modelos son adecuados para muchos casos de uso y, según el director de gestión de productos de Google DeepMind, Tris Warkentin, "la calidad de generación ha aumentado significativamente en el último año". Esto desbloquea nuevas formas de desarrollar aplicaciones de IA, incluida la capacidad de ejecutar inferencias y ajustes en tu escritorio o portátil de desarrollo local con tu GPU RTX o en un único host en GCP con Cloud TPUs, por ejemplo.
Esto también es cierto para los modelos abiertos de los competidores de Google en este espacio, por lo que tendremos que ver cómo se desempeñan los modelos de Gemma en escenarios del mundo real. Además de los nuevos modelos, Google también está lanzando un nuevo kit de herramientas de IA generativa responsable para proporcionar "orientación y herramientas esenciales para crear aplicaciones de IA más seguras con Gemma", así como una herramienta de depuración.
Otras noticias • IA
Rivalidad entre OpenAI y Anthropic marca Cumbre de IA en Delhi
La Cumbre de Impacto de IA en Nueva Delhi evidenció la rivalidad entre OpenAI y Anthropic, destacando sus diferencias estratégicas y éticas. Mientras OpenAI planea...
Ambani invierte ₹10 billones en infraestructura de IA en India
Mukesh Ambani, presidente de Reliance, anunció una inversión de ₹10 billones para desarrollar infraestructura de IA en India, destacando la autosuficiencia tecnológica y la sostenibilidad....
Amazon avanza en robótica a pesar de desafíos y suspensiones
Amazon ha enfrentado desafíos en su ambición robótica, como la suspensión del proyecto Blue Jay, que no cumplió con los estándares esperados. A pesar de...
Google lanza Gemini, IA que crea música personalizada fácilmente
Google ha lanzado Gemini, una herramienta de IA que permite a los usuarios crear música personalizada describiendo sus ideas. Utilizando el modelo Lyria 3, democratiza...
OpenAI colabora con universidades indias para impulsar la IA educativa
OpenAI expande su presencia en India, colaborando con seis instituciones de educación superior para integrar la inteligencia artificial en el aprendizaje. Su enfoque incluye formación...
Kana lanza agentes de IA personalizables para optimizar marketing digital
Kana, una nueva startup de marketing fundada por Tom Chavez y Vivek Vaidya, presenta agentes de IA personalizables que optimizan campañas. Con una sólida experiencia...
Autodesk invierte 200 millones en World Labs para innovar diseño
Autodesk ha invertido 200 millones de dólares en World Labs, destacando su innovador modelo 3D, Marble. Esta colaboración busca integrar inteligencia artificial en el diseño,...
Sarvam lanza IA en lenguas locales para autosuficiencia tecnológica
Sarvam, un laboratorio indio, ha lanzado nuevos modelos de inteligencia artificial adaptados a lenguas locales, promoviendo la autosuficiencia tecnológica en India. Con el apoyo gubernamental...
Lo más reciente
- 1
Juicio contra Meta examina adicción juvenil a redes sociales
- 2
Waymo retira propuesta de robotaxis en Nueva York por regulaciones
- 3
Meta cerrará Messenger web obligando a usar Facebook
- 4
Tenga expone datos de 600 clientes tras brecha de seguridad
- 5
Current revoluciona la lectura digital con flujo continuo de noticias
- 6
Mirai revoluciona la IA en dispositivos móviles y ordenadores
- 7
OpenAI y Reliance mejoran JioHotstar con búsqueda conversacional

