Nvidia sorprende en su presentación en GTC
Durante la conferencia Google Cloud Next en Las Vegas, se han presentado una serie de nuevos tipos de instancias y aceleradores en la plataforma Google Cloud. A pesar de la reciente presentación de Nvidia de su plataforma Blackwell, no se espera que Google ofrezca estas máquinas pronto. Sin embargo, se espera que el soporte para Nvidia HGX B200 para cargas de trabajo de IA y HPC y GB200 NBL72 para el entrenamiento de modelos de lenguaje grande llegue a principios de 2025. Una novedad interesante es que los servidores GB200 estarán refrigerados por líquido.
Una nueva instancia para entrenar modelos de lenguaje grande
Para los desarrolladores que necesitan más potencia para entrenar modelos de lenguaje grande hoy en día, Google también ha anunciado la instancia A3 Mega. Esta instancia, desarrollada en colaboración con Nvidia, cuenta con las GPU H100 estándar de la industria, pero las combina con un nuevo sistema de red que puede ofrecer hasta el doble de ancho de banda por GPU. Además, se ha presentado la instancia A3 confidential, que permite a los clientes "proteger mejor la confidencialidad y la integridad de los datos sensibles y las cargas de trabajo de IA durante el entrenamiento y la inferencia".
Google lanza sus procesadores Cloud TPU v5p
En cuanto a los chips propios de Google, la compañía ha lanzado sus procesadores Cloud TPU v5p, los aceleradores de IA más potentes desarrollados internamente hasta la fecha, disponibles en general. Estos chips ofrecen una mejora del 2x en operaciones de punto flotante por segundo y una mejora del 3x en la velocidad de ancho de banda de memoria.
Nuevas opciones de almacenamiento optimizadas para IA
Además de los nuevos chips, Google también ha anunciado nuevas opciones de almacenamiento optimizadas para IA. Hyperdisk ML, actualmente en vista previa, es el servicio de almacenamiento de bloques de próxima generación de la compañía que puede mejorar los tiempos de carga de modelos hasta en un 3.7x, según Google.
Nuevas instancias tradicionales y optimizadas por Intel
Google Cloud también está lanzando una serie de instancias más tradicionales, impulsadas por los procesadores Intel de cuarta y quinta generación Xeon. Por ejemplo, las nuevas instancias C4 y N4 de propósito general contarán con los Xeons de quinta generación Emerald Rapids, con el C4 centrado en el rendimiento y el N4 en el precio. Las nuevas instancias C4 están actualmente en vista previa privada, y las máquinas N4 están disponibles hoy en día. También en vista previa están las nuevas máquinas bare-metal C3, impulsadas por los Xeons de cuarta generación más antiguos, las instancias bare-metal optimizadas para memoria X4 (también en vista previa) y la Z3, la primera máquina virtual optimizada para almacenamiento de Google Cloud que promete ofrecer "el mayor IOPS para instancias optimizadas para almacenamiento entre los principales proveedores de nube".
Otras noticias • IA
Elon Musk genera críticas tras celebrar con video de IA
Elon Musk celebró la aprobación de un paquete de compensación de un billón de dólares compartiendo un video generado por inteligencia artificial, lo que generó...
OpenAI pide al gobierno ampliar créditos para infraestructura de IA
OpenAI ha solicitado al gobierno de EE.UU. ampliar el Crédito Fiscal de Inversión en Fabricación Avanzada para facilitar la construcción de infraestructura de IA. Destacan...
Urgente regulación ética para la inteligencia artificial y salud mental
La creciente preocupación por la inteligencia artificial, especialmente tras demandas contra OpenAI por su modelo GPT-4o, resalta la necesidad de regulaciones éticas. Casos trágicos de...
Kim Kardashian advierte sobre riesgos de ChatGPT en estudios legales
Kim Kardashian comparte su experiencia con ChatGPT, revelando una "amistad tóxica" que le costó el fracaso en sus exámenes de derecho. Su interacción resalta la...
OpenAI proyecta 20.000 millones en ingresos para 2025
OpenAI se posiciona como líder en inteligencia artificial, proyectando ingresos anuales de 20.000 millones de dólares para 2025. Con innovaciones en dispositivos, robótica y exploración...
Sora de OpenAI arrasa en Android con 470,000 descargas
Sora, la innovadora app de creación de vídeos de OpenAI, ha tenido un lanzamiento exitoso en Android con 470,000 descargas en su primer día, superando...
OpenAI enfrenta retos financieros en su expansión tecnológica y ética
OpenAI enfrenta desafíos financieros significativos en su expansión, con un crecimiento proyectado de 20.000 millones de dólares y una inversión de 1,4 billones en centros...
Kindle Translate transforma la auto-publicación con traducciones automáticas gratuitas
La llegada de Kindle Translate de Amazon promete revolucionar la auto-publicación al ofrecer traducciones automáticas gratuitas para autores. Aunque facilita el acceso a mercados internacionales,...
Lo más reciente
- 1
Inteligencia artificial revoluciona el emprendimiento y exige innovación
- 2
Rad Power Bikes al borde del cierre por falta de financiamiento
- 3
Optimismo y riesgos en inversiones de infraestructura para IA
- 4
Wikipedia impulsa IA con modelo sostenible y directrices claras
- 5
Google lanza Gemini, el asistente de IA para el hogar
- 6
Fusión Carbon Direct y Pachama promueve transparencia en créditos de carbono
- 7
Google Maps mejora con IA para mapas interactivos y navegación

