Nvidia lanza una nueva plataforma de software para simplificar el despliegue de modelos de IA
En su conferencia GTC, Nvidia anunció hoy Nvidia NIM, una nueva plataforma de software diseñada para agilizar el despliegue de modelos de IA personalizados y pre-entrenados en entornos de producción. NIM aprovecha el trabajo de software que Nvidia ha realizado en torno a la inferencia y la optimización de modelos, haciéndolo fácilmente accesible al combinar un modelo dado con un motor de inferencia optimizado y empaquetarlo en un contenedor, convirtiéndolo en un microservicio accesible. "Normalmente, llevaría a los desarrolladores semanas, si no meses, enviar contenedores similares", argumenta Nvidia, "y eso si la empresa incluso tiene talento interno de IA. Con NIM, Nvidia claramente tiene como objetivo crear un ecosistema de contenedores listos para la IA que utilicen su hardware como capa fundamental con estos microservicios curados como la capa de software principal para las empresas que desean acelerar su hoja de ruta de IA".
Amplia gama de modelos y colaboraciones con grandes empresas tecnológicas
NIM actualmente incluye soporte para modelos de NVIDIA, A121, Adept, Cohere, Getty Images y Shutterstock, así como modelos abiertos de Google, Hugging Face, Meta, Microsoft, Mistral AI y Stability AI. Nvidia ya está trabajando con Amazon, Google y Microsoft para que estos microservicios de NIM estén disponibles en SageMaker, Kubernetes Engine y Azure AI, respectivamente. También se integrarán en frameworks como Deepset, LangChain y LlamaIndex. La empresa tiene como objetivo seguir añadiendo capacidades adicionales con el tiempo, como por ejemplo, hacer que el operador Nvidia RAG LLM esté disponible como un NIM, lo que promete facilitar la construcción de chatbots de IA generativos que pueden integrarse con datos personalizados.
Colaboraciones con clientes y socios estratégicos
Esta conferencia no estaría completa sin algunos anuncios de clientes y socios. Entre los usuarios actuales de NIM se encuentran empresas como Box, Cloudera, Cohesity, Datastax, Dropbox y NetApp. "Las plataformas empresariales establecidas están sentadas sobre una mina de oro de datos que pueden transformarse en copilotos de IA generativos", dijo Jensen Huang, fundador y CEO de NVIDIA. "Creados con nuestro ecosistema de socios, estos microservicios de IA en contenedores son los bloques de construcción para que las empresas de todos los sectores se conviertan en empresas de IA".
Impulso de Nvidia en el ámbito empresarial
En cuanto al motor de inferencia, Nvidia utilizará el Triton Inference Server, TensorRT y TensorRT-LLM. Algunos de los microservicios de Nvidia disponibles a través de NIM incluirán Riva para personalizar modelos de habla y traducción, cuOpt para optimizaciones de enrutamiento y el modelo Earth-2 para simulaciones meteorológicas y climáticas. "Creemos que la GPU de Nvidia es el mejor lugar para ejecutar la inferencia de estos modelos", dijo Manuvir Das, jefe de informática empresarial de Nvidia, "y creemos que NVIDIA NIM es el mejor paquete de software, el mejor tiempo de ejecución, para que los desarrolladores construyan encima y se centren en las aplicaciones empresariales, y dejen que Nvidia haga el trabajo de producir estos modelos para ellos de la manera más eficiente y de calidad empresarial, para que puedan hacer el resto de su trabajo".
Otras noticias • IA
AirTrunk invierte 30.000 millones en India para centros de datos
La inversión de AirTrunk de 30.000 millones de dólares en India para desarrollar 5GW de centros de datos destaca el potencial del país como epicentro...
Mira Murati resalta la evolución humana de la IA
Mira Murati, CEO de Thinking Machines Lab, destaca la evolución de la IA y la importancia de modelos de interacción más humanos. Enfrentando desafíos como...
Anthropic alcanza valoración de 965.000 millones tras recaudar 65.000 millones
Anthropic ha recaudado 65.000 millones de dólares, alcanzando una valoración de 965.000 millones. La cofundadora, Daniela Amodei, destaca la necesidad de capital para seguir innovando....
StrictlyVC Los Ángeles: Innovaciones en tecnología y capital de riesgo
El evento StrictlyVC en Los Ángeles, programado para el 18 de junio, reunirá a líderes del sector tecnológico para discutir innovaciones en capital de riesgo,...
Brian Chesky lanza laboratorio de IA para innovar en Airbnb
Brian Chesky, CEO de Airbnb, planea establecer un laboratorio de inteligencia artificial para liderar en el sector. Con una visión centrada en la experiencia del...
Meta construye centros de datos en Ohio pero enfrenta desafíos
Meta ha comenzado a construir centros de datos en tiendas temporales en Nueva Albany, Ohio, con el objetivo de acelerar la construcción y reducir costos....
Poke revoluciona la comunicación empresarial en iMessage con IA
Poke, la primera IA aprobada en la plataforma Messages for Business de Apple, transforma la comunicación entre consumidores y empresas, permitiendo interacciones eficientes a través...
WWDC 2026 promete revolucionar Siri y mejorar aplicaciones clave
La WWDC 2026 genera gran expectación por la renovación de Siri, que se volverá más conversacional y capaz de realizar tareas complejas. También se esperan...
Lo más reciente
- 1
Exejecutivo de IBM denuncia encubrimiento de graves brechas de seguridad
- 2
Cierre de inscripciones para Startup Battlefield 200 el 8 de junio
- 3
SpaceX y Google firman acuerdo de 920 millones para IA
- 4
Lectric eBikes prospera en crisis con nuevas marcas innovadoras
- 5
Supabase alcanza 10.500 millones tras recaudar 500 millones
- 6
Silent Ransom Group combina ataques digitales y tácticas físicas
- 7
Fuga en EEI resalta desafíos de cooperación espacial internacional

