Nvidia lanza una nueva plataforma de software para simplificar el despliegue de modelos de IA
En su conferencia GTC, Nvidia anunció hoy Nvidia NIM, una nueva plataforma de software diseñada para agilizar el despliegue de modelos de IA personalizados y pre-entrenados en entornos de producción. NIM aprovecha el trabajo de software que Nvidia ha realizado en torno a la inferencia y la optimización de modelos, haciéndolo fácilmente accesible al combinar un modelo dado con un motor de inferencia optimizado y empaquetarlo en un contenedor, convirtiéndolo en un microservicio accesible. "Normalmente, llevaría a los desarrolladores semanas, si no meses, enviar contenedores similares", argumenta Nvidia, "y eso si la empresa incluso tiene talento interno de IA. Con NIM, Nvidia claramente tiene como objetivo crear un ecosistema de contenedores listos para la IA que utilicen su hardware como capa fundamental con estos microservicios curados como la capa de software principal para las empresas que desean acelerar su hoja de ruta de IA".
Amplia gama de modelos y colaboraciones con grandes empresas tecnológicas
NIM actualmente incluye soporte para modelos de NVIDIA, A121, Adept, Cohere, Getty Images y Shutterstock, así como modelos abiertos de Google, Hugging Face, Meta, Microsoft, Mistral AI y Stability AI. Nvidia ya está trabajando con Amazon, Google y Microsoft para que estos microservicios de NIM estén disponibles en SageMaker, Kubernetes Engine y Azure AI, respectivamente. También se integrarán en frameworks como Deepset, LangChain y LlamaIndex. La empresa tiene como objetivo seguir añadiendo capacidades adicionales con el tiempo, como por ejemplo, hacer que el operador Nvidia RAG LLM esté disponible como un NIM, lo que promete facilitar la construcción de chatbots de IA generativos que pueden integrarse con datos personalizados.
Colaboraciones con clientes y socios estratégicos
Esta conferencia no estaría completa sin algunos anuncios de clientes y socios. Entre los usuarios actuales de NIM se encuentran empresas como Box, Cloudera, Cohesity, Datastax, Dropbox y NetApp. "Las plataformas empresariales establecidas están sentadas sobre una mina de oro de datos que pueden transformarse en copilotos de IA generativos", dijo Jensen Huang, fundador y CEO de NVIDIA. "Creados con nuestro ecosistema de socios, estos microservicios de IA en contenedores son los bloques de construcción para que las empresas de todos los sectores se conviertan en empresas de IA".
Impulso de Nvidia en el ámbito empresarial
En cuanto al motor de inferencia, Nvidia utilizará el Triton Inference Server, TensorRT y TensorRT-LLM. Algunos de los microservicios de Nvidia disponibles a través de NIM incluirán Riva para personalizar modelos de habla y traducción, cuOpt para optimizaciones de enrutamiento y el modelo Earth-2 para simulaciones meteorológicas y climáticas. "Creemos que la GPU de Nvidia es el mejor lugar para ejecutar la inferencia de estos modelos", dijo Manuvir Das, jefe de informática empresarial de Nvidia, "y creemos que NVIDIA NIM es el mejor paquete de software, el mejor tiempo de ejecución, para que los desarrolladores construyan encima y se centren en las aplicaciones empresariales, y dejen que Nvidia haga el trabajo de producir estos modelos para ellos de la manera más eficiente y de calidad empresarial, para que puedan hacer el resto de su trabajo".
Otras noticias • IA
Kim Kardashian advierte sobre riesgos de ChatGPT en estudios legales
Kim Kardashian comparte su experiencia con ChatGPT, revelando una "amistad tóxica" que le costó el fracaso en sus exámenes de derecho. Su interacción resalta la...
OpenAI proyecta 20.000 millones en ingresos para 2025
OpenAI se posiciona como líder en inteligencia artificial, proyectando ingresos anuales de 20.000 millones de dólares para 2025. Con innovaciones en dispositivos, robótica y exploración...
Sora de OpenAI arrasa en Android con 470,000 descargas
Sora, la innovadora app de creación de vídeos de OpenAI, ha tenido un lanzamiento exitoso en Android con 470,000 descargas en su primer día, superando...
OpenAI enfrenta retos financieros en su expansión tecnológica y ética
OpenAI enfrenta desafíos financieros significativos en su expansión, con un crecimiento proyectado de 20.000 millones de dólares y una inversión de 1,4 billones en centros...
Kindle Translate transforma la auto-publicación con traducciones automáticas gratuitas
La llegada de Kindle Translate de Amazon promete revolucionar la auto-publicación al ofrecer traducciones automáticas gratuitas para autores. Aunque facilita el acceso a mercados internacionales,...
Subtle Computing revoluciona la comunicación con su aislamiento de voz
Subtle Computing, una startup californiana, ha desarrollado un innovador modelo de aislamiento de voz para entornos ruidosos, mejorando la interacción humano-máquina. Fundada por emprendedores de...
Meta lanza Vibes en Europa tras recepción mixta en EE. UU
Vibes, la nueva plataforma de vídeos cortos generados por IA de Meta, se lanza en Europa tras una recepción mixta en EE. UU. A pesar...
Inception revoluciona desarrollo de software con IA y financiación millonaria
Inception, una startup de IA respaldada por figuras destacadas y con 50 millones de dólares en financiación, explora modelos de difusión para el desarrollo de...
Lo más reciente
- 1
OpenAI pide al gobierno ampliar créditos para infraestructura de IA
- 2
Startups prosperan con compensación flexible y formación continua
- 3
Urgente regulación ética para la inteligencia artificial y salud mental
- 4
Rivian otorga a CEO paquete de acciones de 5.000 millones
- 5
GoWish supera 13,6 millones de usuarios y lidera el mercado
- 6
Strap cruzado de Apple genera opiniones divididas y dudas económicas
- 7
Ciberataque de Clop expone vulnerabilidades en Oracle y medios

