Nvidia lanza una nueva plataforma de software para simplificar el despliegue de modelos de IA
En su conferencia GTC, Nvidia anunció hoy Nvidia NIM, una nueva plataforma de software diseñada para agilizar el despliegue de modelos de IA personalizados y pre-entrenados en entornos de producción. NIM aprovecha el trabajo de software que Nvidia ha realizado en torno a la inferencia y la optimización de modelos, haciéndolo fácilmente accesible al combinar un modelo dado con un motor de inferencia optimizado y empaquetarlo en un contenedor, convirtiéndolo en un microservicio accesible. "Normalmente, llevaría a los desarrolladores semanas, si no meses, enviar contenedores similares", argumenta Nvidia, "y eso si la empresa incluso tiene talento interno de IA. Con NIM, Nvidia claramente tiene como objetivo crear un ecosistema de contenedores listos para la IA que utilicen su hardware como capa fundamental con estos microservicios curados como la capa de software principal para las empresas que desean acelerar su hoja de ruta de IA".
Amplia gama de modelos y colaboraciones con grandes empresas tecnológicas
NIM actualmente incluye soporte para modelos de NVIDIA, A121, Adept, Cohere, Getty Images y Shutterstock, así como modelos abiertos de Google, Hugging Face, Meta, Microsoft, Mistral AI y Stability AI. Nvidia ya está trabajando con Amazon, Google y Microsoft para que estos microservicios de NIM estén disponibles en SageMaker, Kubernetes Engine y Azure AI, respectivamente. También se integrarán en frameworks como Deepset, LangChain y LlamaIndex. La empresa tiene como objetivo seguir añadiendo capacidades adicionales con el tiempo, como por ejemplo, hacer que el operador Nvidia RAG LLM esté disponible como un NIM, lo que promete facilitar la construcción de chatbots de IA generativos que pueden integrarse con datos personalizados.
Colaboraciones con clientes y socios estratégicos
Esta conferencia no estaría completa sin algunos anuncios de clientes y socios. Entre los usuarios actuales de NIM se encuentran empresas como Box, Cloudera, Cohesity, Datastax, Dropbox y NetApp. "Las plataformas empresariales establecidas están sentadas sobre una mina de oro de datos que pueden transformarse en copilotos de IA generativos", dijo Jensen Huang, fundador y CEO de NVIDIA. "Creados con nuestro ecosistema de socios, estos microservicios de IA en contenedores son los bloques de construcción para que las empresas de todos los sectores se conviertan en empresas de IA".
Impulso de Nvidia en el ámbito empresarial
En cuanto al motor de inferencia, Nvidia utilizará el Triton Inference Server, TensorRT y TensorRT-LLM. Algunos de los microservicios de Nvidia disponibles a través de NIM incluirán Riva para personalizar modelos de habla y traducción, cuOpt para optimizaciones de enrutamiento y el modelo Earth-2 para simulaciones meteorológicas y climáticas. "Creemos que la GPU de Nvidia es el mejor lugar para ejecutar la inferencia de estos modelos", dijo Manuvir Das, jefe de informática empresarial de Nvidia, "y creemos que NVIDIA NIM es el mejor paquete de software, el mejor tiempo de ejecución, para que los desarrolladores construyan encima y se centren en las aplicaciones empresariales, y dejen que Nvidia haga el trabajo de producir estos modelos para ellos de la manera más eficiente y de calidad empresarial, para que puedan hacer el resto de su trabajo".
Otras noticias • IA
WindBorne Systems transforma la predicción meteorológica con innovación
WindBorne Systems, fundada por estudiantes de Stanford, ha revolucionado la predicción meteorológica con su modelo WeatherMesh 6, que utiliza globos meteorológicos y aprendizaje profundo para...
DuckDuckGo crece al priorizar privacidad y personalización en búsquedas
DuckDuckGo ha crecido significativamente al ofrecer una experiencia de búsqueda sin inteligencia artificial, capitalizando la creciente preocupación por la privacidad. Sus nuevas extensiones permiten a...
Microsoft cambia facturación de GitHub Copilot y desata descontento
La modificación del modelo de facturación de Github Copilot por parte de Microsoft ha generado descontento entre pequeños desarrolladores, al pasar de una suscripción fija...
Desarrolladores en 2026: IA y supervisión para calidad del código
En 2026, los desarrolladores dependen en gran medida de la IA para programar, aunque esto ha generado dudas sobre la calidad del código y el...
Cognition recauda 1.000 millones para su agente de codificación Devin
Cognition, una startup valorada en 26.000 millones, ha recaudado 1.000 millones para su agente de codificación, Devin. Su CEO, Scott Wu, destaca que Devin asistirá...
Glean revoluciona búsqueda empresarial con IA y 300 millones anuales
Glean se destaca en la búsqueda empresarial impulsada por IA, con ingresos recurrentes anuales de 300 millones de dólares. Su enfoque en el "context graph"...
La nube se adapta al auge de la inteligencia artificial
La infraestructura en la nube está evolucionando para adaptarse al creciente tráfico generado por agentes de inteligencia artificial. Soluciones como OpenSearch Serverless de AWS permiten...
Asana compra Stack AI por 75 millones para potenciar IA
Asana ha adquirido Stack AI por 75 millones de dólares, reforzando su enfoque en la automatización de flujos de trabajo mediante inteligencia artificial. Esta estrategia...
Lo más reciente
- 1
Florida demanda a OpenAI por incidentes violentos con ChatGPT
- 2
Hackeo masivo en Instagram revela fallos de seguridad críticos
- 3
Transforma tu compra con "The Mall", tu centro comercial virtual
- 4
SpaceX prioriza acceso al agua en su OPI por sostenibilidad
- 5
Anthropic busca OPI valorada en casi 1 billón de dólares
- 6
Gigascale lanza fondo de 250 millones para tecnología climática
- 7
Hackeo de Atlas Menu expone vulnerabilidades en ciberseguridad del gaming

