Google presenta Gemma, una nueva familia de modelos ligeros
Google ha anunciado hoy el lanzamiento de Gemma, una nueva familia de modelos ligeros de código abierto. Estos nuevos modelos, comenzando con Gemma 2B y Gemma 7B, han sido "inspirados por Gemini" y están disponibles para uso comercial e investigativo.
Google no nos ha proporcionado un documento detallado sobre cómo estos modelos se desempeñan en comparación con modelos similares de Meta y Mistral, por ejemplo, y solo señaló que son "de última generación". La empresa sí mencionó que estos son modelos densos de solo decodificador, que es la misma arquitectura que utilizó para sus modelos Gemini (y sus modelos anteriores de PaLM) y que veremos las comparativas más tarde hoy en el ranking de Hugging Face.
Acceso a Gemma y herramientas de desarrollo
Para empezar con Gemma, los desarrolladores pueden acceder a cuadernos Colab y Kaggle listos para usar, así como integraciones con Hugging Face, MaxText y NeMo de Nvidia. Una vez pre-entrenados y ajustados, estos modelos pueden ejecutarse en cualquier lugar.
Si bien Google destaca que estos son modelos abiertos, cabe destacar que no son de código abierto. De hecho, en una reunión informativa antes del anuncio de hoy, Janine Banks de Google destacó el compromiso de la empresa con el código abierto, pero también señaló que Google es muy intencional en la forma en que se refiere a los modelos de Gemma.
"Los modelos abiertos se han vuelto bastante generalizados en la industria", dijo Banks. "Y a menudo se refiere a modelos de pesos abiertos, donde hay un amplio acceso para que los desarrolladores e investigadores personalicen y ajusten los modelos, pero, al mismo tiempo, los términos de uso, como la redistribución, así como la propiedad de las variantes desarrolladas, varían según los términos de uso específicos del modelo. Y así vemos alguna diferencia entre lo que tradicionalmente llamaríamos de código abierto y decidimos que tenía más sentido referirnos a nuestros modelos de Gemma como modelos abiertos".
Potencial de desarrollo de aplicaciones de IA
Los tamaños de estos modelos son adecuados para muchos casos de uso y, según el director de gestión de productos de Google DeepMind, Tris Warkentin, "la calidad de generación ha aumentado significativamente en el último año". Esto desbloquea nuevas formas de desarrollar aplicaciones de IA, incluida la capacidad de ejecutar inferencias y ajustes en tu escritorio o portátil de desarrollo local con tu GPU RTX o en un único host en GCP con Cloud TPUs, por ejemplo.
Esto también es cierto para los modelos abiertos de los competidores de Google en este espacio, por lo que tendremos que ver cómo se desempeñan los modelos de Gemma en escenarios del mundo real. Además de los nuevos modelos, Google también está lanzando un nuevo kit de herramientas de IA generativa responsable para proporcionar "orientación y herramientas esenciales para crear aplicaciones de IA más seguras con Gemma", así como una herramienta de depuración.
Otras noticias • IA
YouTube Shorts integra IA para revolucionar la creación de contenido
YouTube Shorts, con 200 mil millones de visualizaciones diarias, integra inteligencia artificial para permitir a los creadores usar su imagen y voz. Esto plantea retos...
OpenAI lanza auriculares "Sweet Pea" con inteligencia artificial integrada
OpenAI se prepara para lanzar su primer dispositivo, unos auriculares inalámbricos llamados "Sweet Pea". Con un procesador de 2 nanómetros, busca integrar inteligencia artificial localmente....
Adobe Acrobat revoluciona productividad con nuevas herramientas de IA
Adobe ha integrado herramientas de IA en Acrobat, facilitando la creación de presentaciones, resúmenes en formato de podcast y edición mediante comandos de texto. Estas...
Energía geotérmica en EE. UU. podría superar 60 gigavatios
La energía geotérmica, subestimada hasta ahora, tiene un gran potencial en EE. UU., con estimaciones que podrían superar los 60 gigavatios para 2050. La startup...
Gasto en apps móviles supera a juegos gracias a IA generativa
En 2025, el gasto en aplicaciones móviles no relacionadas con juegos superó al de juegos, alcanzando 85 mil millones de dólares. Este crecimiento se debe...
EE. UU. permite exportación de chips a China, surgen preocupaciones
La reciente decisión de EE. UU. de permitir la exportación de chips de Nvidia y AMD a China ha generado preocupaciones sobre la seguridad nacional...
Startups indias impulsan el auge de la inteligencia artificial de voz
El crecimiento de la inteligencia artificial de voz en India está impulsado por startups como Bolna, que han superado desafíos de monetización y atraído inversiones...
Musk relanza Dojo3 para innovar en IA espacial
Elon Musk ha reactivado el proyecto Dojo3, centrado en la computación de IA espacial, tras desmantelar su anterior superordenador. Este enfoque audaz busca establecer centros...
Lo más reciente
- 1
Bluesky y X transforman la personalización en redes sociales
- 2
RadixArk optimiza la inferencia de IA con velocidad y eficiencia
- 3
Anthropic presenta nueva Constitución de Claude para inteligencia artificial ética
- 4
Todoist Ramble transforma el habla en tareas organizadas eficientemente
- 5
Escándalo en NeurIPS revela 100 citaciones ficticias en investigaciones
- 6
Daneses boicotean productos estadounidenses por amenazas de Trump
- 7
Zipline expande su flota de drones en EE.UU. con $600M

