IA | Inteligencia

Google presenta familia Gemma: modelos ligeros de IA inspirados en Gemini

Google presenta Gemma, una nueva familia de modelos ligeros

Google ha anunciado hoy el lanzamiento de Gemma, una nueva familia de modelos ligeros de código abierto. Estos nuevos modelos, comenzando con Gemma 2B y Gemma 7B, han sido "inspirados por Gemini" y están disponibles para uso comercial e investigativo.

Google no nos ha proporcionado un documento detallado sobre cómo estos modelos se desempeñan en comparación con modelos similares de Meta y Mistral, por ejemplo, y solo señaló que son "de última generación". La empresa sí mencionó que estos son modelos densos de solo decodificador, que es la misma arquitectura que utilizó para sus modelos Gemini (y sus modelos anteriores de PaLM) y que veremos las comparativas más tarde hoy en el ranking de Hugging Face.

Acceso a Gemma y herramientas de desarrollo

Para empezar con Gemma, los desarrolladores pueden acceder a cuadernos Colab y Kaggle listos para usar, así como integraciones con Hugging Face, MaxText y NeMo de Nvidia. Una vez pre-entrenados y ajustados, estos modelos pueden ejecutarse en cualquier lugar.

Si bien Google destaca que estos son modelos abiertos, cabe destacar que no son de código abierto. De hecho, en una reunión informativa antes del anuncio de hoy, Janine Banks de Google destacó el compromiso de la empresa con el código abierto, pero también señaló que Google es muy intencional en la forma en que se refiere a los modelos de Gemma.

"Los modelos abiertos se han vuelto bastante generalizados en la industria", dijo Banks. "Y a menudo se refiere a modelos de pesos abiertos, donde hay un amplio acceso para que los desarrolladores e investigadores personalicen y ajusten los modelos, pero, al mismo tiempo, los términos de uso, como la redistribución, así como la propiedad de las variantes desarrolladas, varían según los términos de uso específicos del modelo. Y así vemos alguna diferencia entre lo que tradicionalmente llamaríamos de código abierto y decidimos que tenía más sentido referirnos a nuestros modelos de Gemma como modelos abiertos".

Potencial de desarrollo de aplicaciones de IA

Los tamaños de estos modelos son adecuados para muchos casos de uso y, según el director de gestión de productos de Google DeepMind, Tris Warkentin, "la calidad de generación ha aumentado significativamente en el último año". Esto desbloquea nuevas formas de desarrollar aplicaciones de IA, incluida la capacidad de ejecutar inferencias y ajustes en tu escritorio o portátil de desarrollo local con tu GPU RTX o en un único host en GCP con Cloud TPUs, por ejemplo.

Esto también es cierto para los modelos abiertos de los competidores de Google en este espacio, por lo que tendremos que ver cómo se desempeñan los modelos de Gemma en escenarios del mundo real. Además de los nuevos modelos, Google también está lanzando un nuevo kit de herramientas de IA generativa responsable para proporcionar "orientación y herramientas esenciales para crear aplicaciones de IA más seguras con Gemma", así como una herramienta de depuración.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Adquisición estratégica

Asana compra Stack AI por 75 millones para potenciar IA

Asana ha adquirido Stack AI por 75 millones de dólares, reforzando su enfoque en la automatización de flujos de trabajo mediante inteligencia artificial. Esta estrategia...

Tokens IA

Shanghái lanza mercado de derivados para tokens de IA

La Bolsa de Futuros de Shanghái está desarrollando un mercado de derivados para tokens de IA, impulsado por la creciente demanda de GPUs. Este avance...

Financiación récord

Anthropic alcanza 965 mil millones tras recaudar 65 mil millones

Anthropic ha recaudado 65 mil millones de dólares en su última ronda de financiación, alcanzando una valoración de 965 mil millones. Con el lanzamiento de...

Networking tecnológico

StrictlyVC Los Ángeles 2026: Innovación y networking en tecnología

El evento StrictlyVC Los Ángeles 2026, el 18 de junio, reunirá a líderes del capital de riesgo y la tecnología en un entorno propicio para...

Innovación tecnológica

Anthropic lanza Opus 4.8 con mejoras en gestión de datos

Anthropic ha lanzado Opus 4.8, mejorando la gestión de datos inciertos y presentando Dynamic Workflows para tareas complejas. Este lanzamiento responde a la presión del...

Interacción avanzada

Sesame lanza app de agentes conversacionales para mejorar interacciones

Sesame, una startup cofundada por creadores de Oculus, ha lanzado una innovadora aplicación de agentes conversacionales. Su tecnología permite interacciones más fluidas y personalizadas, mejorando...

Confusión ética

Confusión por declaraciones de Musk en acuerdo xAI-Anthropic

El acuerdo entre xAI y Anthropic busca fortalecer la computación en la nube en un contexto de alta demanda. Sin embargo, las declaraciones contradictorias de...

Revolución Siri

Apple transforma Siri con IA y nueva app independiente

Apple está revolucionando Siri con una nueva interfaz y capacidades de inteligencia artificial, integrando funciones proactivas y colaborando con otros gigantes tecnológicos. Además, se espera...