Google lanza su nuevo modelo de lenguaje Gemini y su actualización de TPU en la nube
Google ha anunciado hoy el lanzamiento de su nuevo modelo de lenguaje Gemini y, con él, la compañía también ha lanzado su nueva TPU en la nube, la versión actualizada de su TPU v5e, que se lanzó al público a principios de este año. El pod v5p consta de un total de 8.960 chips y cuenta con la interconexión más rápida de Google hasta ahora, con hasta 4.800 Gbps por chip. Google ha entrenado a Gemini en estos nuevos chips personalizados.
Chips más rápidos y mejor rendimiento
No sorprende que Google prometa que estos chips son significativamente más rápidos que los TPU v4. El equipo afirma que el v5p ofrece una mejora del 2x en FLOPS y una mejora del 3x en memoria de alta velocidad. Es un poco como comparar el nuevo modelo Gemini con el antiguo modelo OpenAI GPT 3.5. Después de todo, Google ya ha llevado el estado del arte más allá del TPU v4. Sin embargo, los pods v5e fueron en muchos sentidos una versión inferior de los pods v4, con solo 256 chips v5e por pod en comparación con los 4096 del v4, y un rendimiento total de 197 TFLOPs de punto flotante de 16 bits por chip v5e en comparación con los 275 del v4. Para el nuevo v5p, Google promete hasta 459 TFLOPs de rendimiento de punto flotante de 16 bits, respaldado por una interconexión más rápida.
Mayor velocidad y eficiencia
Google afirma que esto significa que el TPU v5p puede entrenar un modelo de lenguaje grande como el GPT3-175B 2.8 veces más rápido que el TPU v4, y hacerlo de manera más rentable también (aunque el TPU v5e, aunque más lento, ofrece en realidad un rendimiento relativo por dólar superior al del v5p).
"In our early stage usage, Google DeepMind and Google Research have observed 2X speedups for LLM training workloads using TPU v5p chips compared to the performance on our TPU v4 generation," writes Jeff Dean, Chief Scientist, Google DeepMind and Google Research. "The robust support for ML Frameworks (JAX, PyTorch, TensorFlow) and orchestration tools enables us to scale even more efficiently on v5p. With the 2nd generation of SparseCores we also see significant improvement in the performance of embeddings-heavy workloads. TPUs are vital to enabling our largest-scale research and engineering efforts on cutting edge models like Gemini."
El nuevo TPU v5p aún no está disponible para el público en general, por lo que los desarrolladores tendrán que ponerse en contacto con su gerente de cuenta de Google para estar en la lista.
Implicaciones para la investigación y el desarrollo de modelos avanzados
Este anuncio de Google tiene implicaciones significativas para la comunidad de investigación y desarrollo de modelos de lenguaje. Con el TPU v5p, los investigadores podrán entrenar modelos de lenguaje más grandes y complejos de manera más rápida y eficiente. Esto abre la puerta a avances en el campo de la traducción automática, el procesamiento del lenguaje natural y otras aplicaciones de inteligencia artificial que requieren modelos de lenguaje de gran escala.
Además, la mejora en el rendimiento de los chips y la interconexión más rápida también beneficiará a las empresas que utilizan la inteligencia artificial en sus operaciones diarias. Con el TPU v5p, las empresas podrán entrenar modelos de lenguaje personalizados y optimizados para sus necesidades específicas de manera más rápida y rentable, lo que les permitirá mejorar la precisión y eficiencia de sus sistemas de inteligencia artificial.
En resumen, el lanzamiento del modelo de lenguaje Gemini y la actualización de la TPU v5p de Google marcan un avance significativo en el campo de la inteligencia artificial. Estas mejoras en el rendimiento y la eficiencia permitirán a los investigadores y empresas desarrollar y desplegar modelos de lenguaje más avanzados, lo que impulsará la innovación y el progreso en el campo de la inteligencia artificial.
Otras noticias • IA
Anthropic demanda al DOD por restricciones en colaboración gubernamental
Anthropic ha demandado al Departamento de Defensa por ser etiquetada como riesgo para la cadena de suministro, impidiendo su colaboración con el gobierno. La empresa...
Neura Robotics y Qualcomm unen fuerzas para revolucionar la robótica
La colaboración entre Neura Robotics y Qualcomm destaca la importancia de unir fuerzas en el desarrollo de soluciones robóticas avanzadas. Esta alianza, centrada en la...
Nscale, respaldada por Nvidia, alcanza valoración de 14.600 millones
Nscale, respaldada por Nvidia, alcanza una valoración de 14.600 millones de dólares gracias a su estrategia de integración vertical y financiación significativa. Con proyectos ambiciosos...
Expertos piden regulación ética para una inteligencia artificial segura
La "Declaración Pro-Humana" aboga por una regulación responsable de la inteligencia artificial (IA) para evitar su uso perjudicial. Reúne a expertos de diversas ideologías, enfatizando...
Caitlin Kalinowski renuncia a OpenAI por preocupaciones éticas
Caitlin Kalinowski, ejecutiva de OpenAI, renunció por preocupaciones éticas tras un acuerdo controvertido con el Pentágono sobre el uso de IA en defensa. Su decisión...
Defensa de EE. UU. clasifica a Anthropic como riesgo ético
El Departamento de Defensa de EE. UU. ha clasificado a Anthropic como un riesgo por su negativa a ceder su tecnología para usos militares. Microsoft...
Claude supera a ChatGPT y gana la confianza del público
Claude, el modelo de inteligencia artificial de Anthropic, ha experimentado un crecimiento inesperado en usuarios y descargas, superando a ChatGPT en ciertos aspectos. Su postura...
Meta abre WhatsApp a chatbots de terceros en Brasil
Meta ha permitido el uso de chatbots de terceros en WhatsApp en Brasil, tras presiones regulatorias de CADE. Aunque esto fomenta la competencia, los altos...
Lo más reciente
- 1
Empleados de OpenAI y Google DeepMind respaldan demanda de Anthropic
- 2
Bluesky cambia de CEO ante desafíos de moderación y regulación
- 3
Inteligencia artificial transforma desarrollo de software y mejora calidad
- 4
Ticketmaster bajo fuego por precios altos y prácticas monopolísticas
- 5
Chevrolet Bolt regresa impulsando la electrificación y sostenibilidad de GM
- 6
OpenAI adquiere Promptfoo para fortalecer la seguridad de IA
- 7
Periwinkle revoluciona redes sociales con control de datos propio

