Nvidia lanza una nueva plataforma de software para simplificar el despliegue de modelos de IA
En su conferencia GTC, Nvidia anunció hoy Nvidia NIM, una nueva plataforma de software diseñada para agilizar el despliegue de modelos de IA personalizados y pre-entrenados en entornos de producción. NIM aprovecha el trabajo de software que Nvidia ha realizado en torno a la inferencia y la optimización de modelos, haciéndolo fácilmente accesible al combinar un modelo dado con un motor de inferencia optimizado y empaquetarlo en un contenedor, convirtiéndolo en un microservicio accesible. "Normalmente, llevaría a los desarrolladores semanas, si no meses, enviar contenedores similares", argumenta Nvidia, "y eso si la empresa incluso tiene talento interno de IA. Con NIM, Nvidia claramente tiene como objetivo crear un ecosistema de contenedores listos para la IA que utilicen su hardware como capa fundamental con estos microservicios curados como la capa de software principal para las empresas que desean acelerar su hoja de ruta de IA".
Amplia gama de modelos y colaboraciones con grandes empresas tecnológicas
NIM actualmente incluye soporte para modelos de NVIDIA, A121, Adept, Cohere, Getty Images y Shutterstock, así como modelos abiertos de Google, Hugging Face, Meta, Microsoft, Mistral AI y Stability AI. Nvidia ya está trabajando con Amazon, Google y Microsoft para que estos microservicios de NIM estén disponibles en SageMaker, Kubernetes Engine y Azure AI, respectivamente. También se integrarán en frameworks como Deepset, LangChain y LlamaIndex. La empresa tiene como objetivo seguir añadiendo capacidades adicionales con el tiempo, como por ejemplo, hacer que el operador Nvidia RAG LLM esté disponible como un NIM, lo que promete facilitar la construcción de chatbots de IA generativos que pueden integrarse con datos personalizados.
Colaboraciones con clientes y socios estratégicos
Esta conferencia no estaría completa sin algunos anuncios de clientes y socios. Entre los usuarios actuales de NIM se encuentran empresas como Box, Cloudera, Cohesity, Datastax, Dropbox y NetApp. "Las plataformas empresariales establecidas están sentadas sobre una mina de oro de datos que pueden transformarse en copilotos de IA generativos", dijo Jensen Huang, fundador y CEO de NVIDIA. "Creados con nuestro ecosistema de socios, estos microservicios de IA en contenedores son los bloques de construcción para que las empresas de todos los sectores se conviertan en empresas de IA".
Impulso de Nvidia en el ámbito empresarial
En cuanto al motor de inferencia, Nvidia utilizará el Triton Inference Server, TensorRT y TensorRT-LLM. Algunos de los microservicios de Nvidia disponibles a través de NIM incluirán Riva para personalizar modelos de habla y traducción, cuOpt para optimizaciones de enrutamiento y el modelo Earth-2 para simulaciones meteorológicas y climáticas. "Creemos que la GPU de Nvidia es el mejor lugar para ejecutar la inferencia de estos modelos", dijo Manuvir Das, jefe de informática empresarial de Nvidia, "y creemos que NVIDIA NIM es el mejor paquete de software, el mejor tiempo de ejecución, para que los desarrolladores construyan encima y se centren en las aplicaciones empresariales, y dejen que Nvidia haga el trabajo de producir estos modelos para ellos de la manera más eficiente y de calidad empresarial, para que puedan hacer el resto de su trabajo".
Otras noticias • IA
Inteligencia artificial transforma servicio al cliente con Parloa
La inteligencia artificial está revolucionando el servicio al cliente, destacando startups como Parloa, que ha recaudado 350 millones de dólares. A medida que la automatización...
WhatsApp permite chatbots en Brasil, genera preocupación por monopolio
WhatsApp ha permitido que los chatbots de inteligencia artificial operen en Brasil, tras suspender una política restrictiva. Esto ha generado preocupaciones sobre la competencia y...
Cofundadores de Thinking Machines Lab se van a OpenAI
La salida de dos cofundadores de Thinking Machines Lab hacia OpenAI destaca la inestabilidad en la startup, a pesar de su reciente éxito financiero. Este...
OpenAI y Cerebras firman acuerdo multimillonario para potenciar IA
OpenAI ha firmado un acuerdo multimillonario con Cerebras para mejorar su capacidad computacional en inteligencia artificial. Este acuerdo, valorado en más de 10.000 millones de...
ChatGPT 5.2 revoluciona la resolución de problemas matemáticos abiertos
Neel Somani descubrió que el modelo ChatGPT 5.2 resuelve problemas matemáticos abiertos, especialmente los de Erdős, con notable eficacia. Este avance sugiere una colaboración creciente...
Ciberseguridad y AI: nuevos retos y defensas innovadoras emergen
La ciberseguridad se enfrenta a nuevos retos con el uso de inteligencia artificial por parte de ciberdelincuentes. Startups como Depthfirst están innovando en defensa, destacando...
Google presenta Personal Intelligence para respuestas personalizadas en Gemini
Google ha lanzado la función Personal Intelligence en su aplicación Gemini, que conecta y razona datos de diversas aplicaciones para ofrecer respuestas personalizadas. Esta innovación...
Skild AI alcanza valoración de 14.000 millones en siete meses
Skild AI, una startup de robótica, ha alcanzado una valoración de más de 14.000 millones de dólares en siete meses, tras una ronda de financiación...
Lo más reciente
- 1
Trump firma acuerdo histórico con Taiwán por 250.000 millones
- 2
Irán sufre apagón de internet en medio de protestas masivas
- 3
Higgsfield recauda 80 millones y alcanza valoración de 1.3 mil millones
- 4
Discord impulsa OPIs en tecnología mientras Liftoff busca 400 millones
- 5
EE.UU. impone arancel del 25% a semiconductores para competir con China
- 6
Wikimedia celebra 25 años con nuevas alianzas tecnológicas
- 7
India desafía estructuras fiscales offshore con fallo del Tribunal Supremo

