IA | Tecnología

Google Cloud Next presenta nuevas instancias y aceleradores innovadores

Nvidia sorprende en su presentación en GTC

Durante la conferencia Google Cloud Next en Las Vegas, se han presentado una serie de nuevos tipos de instancias y aceleradores en la plataforma Google Cloud. A pesar de la reciente presentación de Nvidia de su plataforma Blackwell, no se espera que Google ofrezca estas máquinas pronto. Sin embargo, se espera que el soporte para Nvidia HGX B200 para cargas de trabajo de IA y HPC y GB200 NBL72 para el entrenamiento de modelos de lenguaje grande llegue a principios de 2025. Una novedad interesante es que los servidores GB200 estarán refrigerados por líquido.

Una nueva instancia para entrenar modelos de lenguaje grande

Para los desarrolladores que necesitan más potencia para entrenar modelos de lenguaje grande hoy en día, Google también ha anunciado la instancia A3 Mega. Esta instancia, desarrollada en colaboración con Nvidia, cuenta con las GPU H100 estándar de la industria, pero las combina con un nuevo sistema de red que puede ofrecer hasta el doble de ancho de banda por GPU. Además, se ha presentado la instancia A3 confidential, que permite a los clientes "proteger mejor la confidencialidad y la integridad de los datos sensibles y las cargas de trabajo de IA durante el entrenamiento y la inferencia".

Google lanza sus procesadores Cloud TPU v5p

En cuanto a los chips propios de Google, la compañía ha lanzado sus procesadores Cloud TPU v5p, los aceleradores de IA más potentes desarrollados internamente hasta la fecha, disponibles en general. Estos chips ofrecen una mejora del 2x en operaciones de punto flotante por segundo y una mejora del 3x en la velocidad de ancho de banda de memoria.

Nuevas opciones de almacenamiento optimizadas para IA

Además de los nuevos chips, Google también ha anunciado nuevas opciones de almacenamiento optimizadas para IA. Hyperdisk ML, actualmente en vista previa, es el servicio de almacenamiento de bloques de próxima generación de la compañía que puede mejorar los tiempos de carga de modelos hasta en un 3.7x, según Google.

Nuevas instancias tradicionales y optimizadas por Intel

Google Cloud también está lanzando una serie de instancias más tradicionales, impulsadas por los procesadores Intel de cuarta y quinta generación Xeon. Por ejemplo, las nuevas instancias C4 y N4 de propósito general contarán con los Xeons de quinta generación Emerald Rapids, con el C4 centrado en el rendimiento y el N4 en el precio. Las nuevas instancias C4 están actualmente en vista previa privada, y las máquinas N4 están disponibles hoy en día. También en vista previa están las nuevas máquinas bare-metal C3, impulsadas por los Xeons de cuarta generación más antiguos, las instancias bare-metal optimizadas para memoria X4 (también en vista previa) y la Z3, la primera máquina virtual optimizada para almacenamiento de Google Cloud que promete ofrecer "el mayor IOPS para instancias optimizadas para almacenamiento entre los principales proveedores de nube".


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Inversión tecnológica

AirTrunk invierte 30.000 millones en India para centros de datos

La inversión de AirTrunk de 30.000 millones de dólares en India para desarrollar 5GW de centros de datos destaca el potencial del país como epicentro...

Evolución IA

Mira Murati resalta la evolución humana de la IA

Mira Murati, CEO de Thinking Machines Lab, destaca la evolución de la IA y la importancia de modelos de interacción más humanos. Enfrentando desafíos como...

Inversión estratégica

Anthropic alcanza valoración de 965.000 millones tras recaudar 65.000 millones

Anthropic ha recaudado 65.000 millones de dólares, alcanzando una valoración de 965.000 millones. La cofundadora, Daniela Amodei, destaca la necesidad de capital para seguir innovando....

Innovación tecnológica

StrictlyVC Los Ángeles: Innovaciones en tecnología y capital de riesgo

El evento StrictlyVC en Los Ángeles, programado para el 18 de junio, reunirá a líderes del sector tecnológico para discutir innovaciones en capital de riesgo,...

Laboratorio innovador

Brian Chesky lanza laboratorio de IA para innovar en Airbnb

Brian Chesky, CEO de Airbnb, planea establecer un laboratorio de inteligencia artificial para liderar en el sector. Con una visión centrada en la experiencia del...

Construcción temporal

Meta construye centros de datos en Ohio pero enfrenta desafíos

Meta ha comenzado a construir centros de datos en tiendas temporales en Nueva Albany, Ohio, con el objetivo de acelerar la construcción y reducir costos....

Comunicación eficiente

Poke revoluciona la comunicación empresarial en iMessage con IA

Poke, la primera IA aprobada en la plataforma Messages for Business de Apple, transforma la comunicación entre consumidores y empresas, permitiendo interacciones eficientes a través...

Innovaciones esperadas

WWDC 2026 promete revolucionar Siri y mejorar aplicaciones clave

La WWDC 2026 genera gran expectación por la renovación de Siri, que se volverá más conversacional y capaz de realizar tareas complejas. También se esperan...