Google presenta Gemma, una nueva familia de modelos ligeros
Google ha anunciado hoy el lanzamiento de Gemma, una nueva familia de modelos ligeros de código abierto. Estos nuevos modelos, comenzando con Gemma 2B y Gemma 7B, han sido "inspirados por Gemini" y están disponibles para uso comercial e investigativo.
Google no nos ha proporcionado un documento detallado sobre cómo estos modelos se desempeñan en comparación con modelos similares de Meta y Mistral, por ejemplo, y solo señaló que son "de última generación". La empresa sí mencionó que estos son modelos densos de solo decodificador, que es la misma arquitectura que utilizó para sus modelos Gemini (y sus modelos anteriores de PaLM) y que veremos las comparativas más tarde hoy en el ranking de Hugging Face.
Acceso a Gemma y herramientas de desarrollo
Para empezar con Gemma, los desarrolladores pueden acceder a cuadernos Colab y Kaggle listos para usar, así como integraciones con Hugging Face, MaxText y NeMo de Nvidia. Una vez pre-entrenados y ajustados, estos modelos pueden ejecutarse en cualquier lugar.
Si bien Google destaca que estos son modelos abiertos, cabe destacar que no son de código abierto. De hecho, en una reunión informativa antes del anuncio de hoy, Janine Banks de Google destacó el compromiso de la empresa con el código abierto, pero también señaló que Google es muy intencional en la forma en que se refiere a los modelos de Gemma.
"Los modelos abiertos se han vuelto bastante generalizados en la industria", dijo Banks. "Y a menudo se refiere a modelos de pesos abiertos, donde hay un amplio acceso para que los desarrolladores e investigadores personalicen y ajusten los modelos, pero, al mismo tiempo, los términos de uso, como la redistribución, así como la propiedad de las variantes desarrolladas, varían según los términos de uso específicos del modelo. Y así vemos alguna diferencia entre lo que tradicionalmente llamaríamos de código abierto y decidimos que tenía más sentido referirnos a nuestros modelos de Gemma como modelos abiertos".
Potencial de desarrollo de aplicaciones de IA
Los tamaños de estos modelos son adecuados para muchos casos de uso y, según el director de gestión de productos de Google DeepMind, Tris Warkentin, "la calidad de generación ha aumentado significativamente en el último año". Esto desbloquea nuevas formas de desarrollar aplicaciones de IA, incluida la capacidad de ejecutar inferencias y ajustes en tu escritorio o portátil de desarrollo local con tu GPU RTX o en un único host en GCP con Cloud TPUs, por ejemplo.
Esto también es cierto para los modelos abiertos de los competidores de Google en este espacio, por lo que tendremos que ver cómo se desempeñan los modelos de Gemma en escenarios del mundo real. Además de los nuevos modelos, Google también está lanzando un nuevo kit de herramientas de IA generativa responsable para proporcionar "orientación y herramientas esenciales para crear aplicaciones de IA más seguras con Gemma", así como una herramienta de depuración.
Otras noticias • IA
Google lanza Gemini, la nueva era de la automatización empresarial
Google ha presentado la Gemini Enterprise Agent Platform, una herramienta de inteligencia artificial destinada a optimizar la gestión empresarial. Con un enfoque en la seguridad...
OpenAI e Infosys unen fuerzas para revolucionar el desarrollo de software
OpenAI e Infosys han establecido una colaboración para integrar herramientas de inteligencia artificial en la plataforma Topaz AI, buscando transformar el desarrollo de software y...
Thinking Machines Lab y Google Cloud firman acuerdo multimillonario
Thinking Machines Lab y Google Cloud han firmado un acuerdo multimillonario que permitirá a la startup acceder a la infraestructura avanzada de Google, mejorando su...
Google revoluciona sus mapas con IA y análisis geoespacial
Google ha presentado innovaciones en su plataforma de mapas, incluyendo herramientas de IA para crear escenas realistas y analizar datos satelitales. Estas mejoras optimizan la...
SpaceX y Cursor se unen para revolucionar la inteligencia artificial
SpaceX ha formado una alianza estratégica con Cursor para desarrollar inteligencia artificial avanzada y ha considerado adquirir la empresa por 60.000 millones de dólares. Esta...
Vulnerabilidad en ciberseguridad de empresas tras acceso a Mythos
El acceso no autorizado a Mythos, herramienta de ciberseguridad de Anthropic, resalta la vulnerabilidad de las empresas ante terceros. Este incidente subraya la necesidad de...
ChatGPT Images 2.0 revoluciona diseño gráfico y publicidad creativa
La generación de imágenes por inteligencia artificial ha evolucionado con ChatGPT Images 2.0, que ofrece alta calidad, versatilidad y rapidez. Este avance transforma el diseño...
Startups de IA innovan con agentes autónomos y especializados
Las startups de inteligencia artificial, como NeoCognition, buscan desarrollar agentes especializados y fiables. Con el respaldo de inversores, estas empresas se centran en crear sistemas...
Lo más reciente
- 1
Tesla crece en ingresos pero enfrenta caídas en entregas y beneficios
- 2
SpaceX busca diversificar con adquisición de Cursor por 60 mil millones
- 3
Artemis II revoluciona comunicaciones láser en la exploración espacial
- 4
Google Cloud lanza TPUs de octava generación para IA
- 5
Vulnerabilidad en iPhones permite acceso a mensajes eliminados
- 6
Google Cloud Next presenta innovaciones de IA y seguridad mejorada
- 7
Google lanza AI Overviews en Gmail para respuestas rápidas

