Nvidia sorprende en su presentación en GTC
Durante la conferencia Google Cloud Next en Las Vegas, se han presentado una serie de nuevos tipos de instancias y aceleradores en la plataforma Google Cloud. A pesar de la reciente presentación de Nvidia de su plataforma Blackwell, no se espera que Google ofrezca estas máquinas pronto. Sin embargo, se espera que el soporte para Nvidia HGX B200 para cargas de trabajo de IA y HPC y GB200 NBL72 para el entrenamiento de modelos de lenguaje grande llegue a principios de 2025. Una novedad interesante es que los servidores GB200 estarán refrigerados por líquido.
Una nueva instancia para entrenar modelos de lenguaje grande
Para los desarrolladores que necesitan más potencia para entrenar modelos de lenguaje grande hoy en día, Google también ha anunciado la instancia A3 Mega. Esta instancia, desarrollada en colaboración con Nvidia, cuenta con las GPU H100 estándar de la industria, pero las combina con un nuevo sistema de red que puede ofrecer hasta el doble de ancho de banda por GPU. Además, se ha presentado la instancia A3 confidential, que permite a los clientes "proteger mejor la confidencialidad y la integridad de los datos sensibles y las cargas de trabajo de IA durante el entrenamiento y la inferencia".
Google lanza sus procesadores Cloud TPU v5p
En cuanto a los chips propios de Google, la compañía ha lanzado sus procesadores Cloud TPU v5p, los aceleradores de IA más potentes desarrollados internamente hasta la fecha, disponibles en general. Estos chips ofrecen una mejora del 2x en operaciones de punto flotante por segundo y una mejora del 3x en la velocidad de ancho de banda de memoria.
Nuevas opciones de almacenamiento optimizadas para IA
Además de los nuevos chips, Google también ha anunciado nuevas opciones de almacenamiento optimizadas para IA. Hyperdisk ML, actualmente en vista previa, es el servicio de almacenamiento de bloques de próxima generación de la compañía que puede mejorar los tiempos de carga de modelos hasta en un 3.7x, según Google.
Nuevas instancias tradicionales y optimizadas por Intel
Google Cloud también está lanzando una serie de instancias más tradicionales, impulsadas por los procesadores Intel de cuarta y quinta generación Xeon. Por ejemplo, las nuevas instancias C4 y N4 de propósito general contarán con los Xeons de quinta generación Emerald Rapids, con el C4 centrado en el rendimiento y el N4 en el precio. Las nuevas instancias C4 están actualmente en vista previa privada, y las máquinas N4 están disponibles hoy en día. También en vista previa están las nuevas máquinas bare-metal C3, impulsadas por los Xeons de cuarta generación más antiguos, las instancias bare-metal optimizadas para memoria X4 (también en vista previa) y la Z3, la primera máquina virtual optimizada para almacenamiento de Google Cloud que promete ofrecer "el mayor IOPS para instancias optimizadas para almacenamiento entre los principales proveedores de nube".
Otras noticias • IA
DuckDuckGo crece al priorizar privacidad y personalización en búsquedas
DuckDuckGo ha crecido significativamente al ofrecer una experiencia de búsqueda sin inteligencia artificial, capitalizando la creciente preocupación por la privacidad. Sus nuevas extensiones permiten a...
Microsoft cambia facturación de GitHub Copilot y desata descontento
La modificación del modelo de facturación de Github Copilot por parte de Microsoft ha generado descontento entre pequeños desarrolladores, al pasar de una suscripción fija...
Desarrolladores en 2026: IA y supervisión para calidad del código
En 2026, los desarrolladores dependen en gran medida de la IA para programar, aunque esto ha generado dudas sobre la calidad del código y el...
Cognition recauda 1.000 millones para su agente de codificación Devin
Cognition, una startup valorada en 26.000 millones, ha recaudado 1.000 millones para su agente de codificación, Devin. Su CEO, Scott Wu, destaca que Devin asistirá...
Glean revoluciona búsqueda empresarial con IA y 300 millones anuales
Glean se destaca en la búsqueda empresarial impulsada por IA, con ingresos recurrentes anuales de 300 millones de dólares. Su enfoque en el "context graph"...
La nube se adapta al auge de la inteligencia artificial
La infraestructura en la nube está evolucionando para adaptarse al creciente tráfico generado por agentes de inteligencia artificial. Soluciones como OpenSearch Serverless de AWS permiten...
Asana compra Stack AI por 75 millones para potenciar IA
Asana ha adquirido Stack AI por 75 millones de dólares, reforzando su enfoque en la automatización de flujos de trabajo mediante inteligencia artificial. Esta estrategia...
Shanghái lanza mercado de derivados para tokens de IA
La Bolsa de Futuros de Shanghái está desarrollando un mercado de derivados para tokens de IA, impulsado por la creciente demanda de GPUs. Este avance...
Lo más reciente
- 1
Transforma tu compra con "The Mall", tu centro comercial virtual
- 2
SpaceX prioriza acceso al agua en su OPI por sostenibilidad
- 3
Anthropic busca OPI valorada en casi 1 billón de dólares
- 4
Gigascale lanza fondo de 250 millones para tecnología climática
- 5
Hackeo de Atlas Menu expone vulnerabilidades en ciberseguridad del gaming
- 6
WindBorne Systems transforma la predicción meteorológica con innovación
- 7
SpaceX advierte sobre posible dilución de acciones en IPO

