IA | Modelos revolucionarios

Nvidia lanza Cosmos WFMs para revolucionar la IA generativa

mar, 7 de enero de 2025

La revolución de los modelos de mundo de Nvidia

En un momento donde la inteligencia artificial (IA) está transformando la manera en que interactuamos con la tecnología, Nvidia ha decidido dar un paso audaz al presentar su nueva familia de modelos de mundo, denominados Cosmos World Foundation Models (Cosmos WFMs), durante el CES 2025 en Las Vegas. Esta iniciativa marca un hito significativo en la evolución de los modelos de IA, inspirándose en la forma en que los humanos desarrollan modelos mentales del mundo que les rodea. Con la promesa de generar vídeos “conscientes de la física”, Nvidia se posiciona como un líder en la vanguardia de la IA generativa.

El anuncio de los Cosmos WFMs promete una nueva era de simulaciones físicas que podrían ser utilizadas en diversas aplicaciones, desde la robótica hasta el desarrollo de vehículos autónomos. Estos modelos, disponibles a través de la API de Nvidia, los catálogos NGC, GitHub y la plataforma de desarrollo de IA Hugging Face, están diseñados para ser ajustados según las necesidades específicas de los desarrolladores e investigadores.

Un vistazo a los Cosmos WFMs

Nvidia ha categorizado su nueva familia de modelos en tres tipos distintos: Nano, Super y Ultra. Los modelos Nano están optimizados para aplicaciones de baja latencia y en tiempo real, mientras que los modelos Super son descritos como “líneas base de alto rendimiento”. Por último, los modelos Ultra ofrecen la máxima calidad y fidelidad en los resultados generados. Esta clasificación permite a los desarrolladores elegir el modelo que mejor se adapte a sus requerimientos, lo que resulta crucial en un campo tan dinámico como la IA.

Los modelos varían en tamaño, con un rango que va de 4 a 14 mil millones de parámetros. Este número de parámetros es un indicador directo de la capacidad de resolución de problemas de un modelo: cuanto más parámetros, generalmente mejor será el rendimiento. En este sentido, Nvidia ha creado un ecosistema que no solo busca innovar, sino también facilitar el acceso a tecnologías de vanguardia.

La diversidad en la gama de modelos asegura que tanto las startups como las grandes corporaciones puedan aprovechar las ventajas de los Cosmos WFMs.

La ética y el uso de datos en la formación de modelos

Un aspecto controvertido del lanzamiento de los Cosmos WFMs es el origen de los datos utilizados para entrenarlos. Nvidia ha afirmado que los modelos han sido entrenados utilizando 9,000 billones de tokens, lo que equivale a 20 millones de horas de interacciones humanas reales, datos ambientales, industriales, robóticos y de conducción. Sin embargo, la falta de claridad sobre la procedencia de estos datos ha generado preocupaciones en torno a los derechos de autor.

Algunos informes sugieren que Nvidia podría haber utilizado vídeos de YouTube protegidos por derechos de autor sin el consentimiento adecuado. Cuando se le consultó sobre este asunto, un portavoz de Nvidia defendió que “Cosmos no está diseñado para copiar o infringir obras protegidas”. Aseguró que el modelo aprende de una manera similar a como lo hacen los humanos, recopilando datos de diversas fuentes públicas y privadas, y que su uso es legal.

Sin embargo, expertos en derechos de autor advierten que este tipo de afirmaciones puede no resistir un examen judicial. La interpretación del “uso justo”, que permite el uso de obras protegidas para crear algo nuevo, se ha vuelto un tema candente en el ámbito legal y es probable que las decisiones futuras de los tribunales tengan un impacto significativo en la forma en que se desarrollan y utilizan los modelos de IA.

Aplicaciones prácticas de los modelos Cosmos

Los Cosmos WFMs no son solo una curiosidad tecnológica; su potencial para transformar industrias enteras es considerable. Nvidia ha afirmado que estos modelos son capaces de generar “datos sintéticos de alta calidad y controlables” a partir de textos o cuadros de vídeo, lo que puede ser fundamental para la formación de modelos de robótica y vehículos autónomos.

La capacidad de simular entornos realistas abre un abanico de posibilidades, desde la formación de sistemas de navegación para vehículos hasta la creación de escenarios de prueba para robots en fábricas. Por ejemplo, los modelos pueden generar vídeos basados en combinaciones de entradas como texto, imágenes y datos de sensores de robots, lo que facilita la creación de simulaciones altamente realistas.

Empresas como Waabi, Wayve, Fortellix y Uber ya han mostrado interés en probar los Cosmos WFMs para diversas aplicaciones, incluyendo la búsqueda y curación de vídeos y el desarrollo de modelos de IA para vehículos autónomos.

La distinción entre “abierto” y “código abierto”

Es importante señalar que, aunque Nvidia ha presentado los Cosmos WFMs como modelos “abiertos”, no cumplen con la definición estricta de “código abierto”. En términos generales, un modelo de IA que se considera de código abierto debe proporcionar información suficiente sobre su diseño y los datos de entrenamiento para que alguien pueda recrearlo sustancialmente. Hasta el momento, Nvidia no ha publicado detalles sobre los datos de entrenamiento utilizados ni ha proporcionado todas las herramientas necesarias para recrear los modelos desde cero.

Esto ha llevado a críticas sobre la naturaleza “abierta” de los Cosmos WFMs, ya que la falta de transparencia en cuanto a los datos de entrenamiento y el proceso de desarrollo limita la capacidad de la comunidad para auditar y reproducir estos modelos. A pesar de esto, Nvidia continúa argumentando que su enfoque permitirá un acceso más amplio a herramientas avanzadas de IA.

Implicaciones para el futuro de la IA y la movilidad

El CEO de Nvidia, Jensen Huang, ha expresado su esperanza de que los Cosmos WFMs logren para el mundo de la robótica y la IA industrial lo que el modelo Llama ha hecho por el sector empresarial. La visión de Nvidia es que su tecnología impulsará un futuro donde la movilidad y la automatización sean más seguras y eficientes, gracias a la generación de datos sintéticos y simulaciones físicas precisas.

La colaboración con empresas como Uber indica que hay un interés real en cómo estas tecnologías pueden ser integradas en soluciones prácticas y escalables para la industria del transporte. La IA generativa se perfila como un componente clave en la creación de vehículos autónomos, lo que podría revolucionar la forma en que nos desplazamos.

La innovación en este campo también podría llevar a un aumento en la competitividad entre empresas, lo que obligaría a las organizaciones a adaptarse rápidamente a los cambios tecnológicos. En este contexto, los Cosmos WFMs se presentan como una herramienta poderosa para aquellos que buscan mantenerse a la vanguardia de la revolución tecnológica en curso.

La respuesta del mercado y la comunidad

El lanzamiento de los Cosmos WFMs ha sido recibido con gran interés en la comunidad tecnológica. Muchos desarrolladores y académicos están ansiosos por explorar las capacidades de estos modelos y cómo pueden aplicarse en sus respectivos campos. Sin embargo, también existe una preocupación subyacente sobre las implicaciones éticas y legales del uso de datos en el entrenamiento de modelos de IA.

La comunidad espera que Nvidia aborde estas preocupaciones de manera proactiva, proporcionando mayor transparencia sobre el proceso de recopilación de datos y el uso de derechos de autor. El éxito a largo plazo de los Cosmos WFMs dependerá no solo de su rendimiento técnico, sino también de cómo la empresa maneje las cuestiones éticas relacionadas con la IA.

Con la mirada puesta en el futuro, Nvidia está preparada para jugar un papel fundamental en la evolución de la IA generativa y su aplicación en una variedad de industrias. La posibilidad de que estos modelos transformen el panorama tecnológico es innegable, pero también plantea preguntas importantes sobre la responsabilidad y la ética en el desarrollo de tecnologías emergentes.

Otras noticias • IA

Atención automatizada

Airbnb lanza bot de IA que reduce consultas humanas un 15%

02 may

Airbnb ha implementado un bot de servicio al cliente basado en inteligencia artificial en EE. UU., con un 50% de usuarios utilizándolo. Esto ha reducido...

Interacción comunitaria

Reddit lanza chatbot para satisfacer a Seekers y aumentar compromiso

01 may

Reddit ha identificado dos tipos de usuarios: Scrollers, que buscan interacción comunitaria, y Seekers, que buscan respuestas. Para estos últimos, ha lanzado Reddit Answers, un...

Asistente mejorado

Amazon presenta Alexa+ con IA generativa para interacciones mejoradas

01 may

Amazon ha lanzado Alexa+, un asistente digital mejorado con IA generativa, que busca ofrecer interacciones más naturales. Aunque enfrenta retos tecnológicos y limitaciones actuales, la...

Transformación científica

Inteligencia artificial revoluciona ciencia, pero genera escepticismo persistente

01 may

La inteligencia artificial está transformando la investigación científica, con herramientas como las de FutureHouse que prometen acelerar descubrimientos. Sin embargo, persisten limitaciones y escepticismo entre...

IA accesible

Olmo 2 1B democratiza la IA con un billón de parámetros

01 may

Olmo 2 1B, lanzado por Ai2, es un modelo de inteligencia artificial con un billón de parámetros, diseñado para ser accesible y eficiente en dispositivos...

Mejoras funcionales

Claude de Anthropic se actualiza con nuevas integraciones avanzadas

01 may

Anthropic ha actualizado su chatbot Claude con nuevas integraciones que mejoran su conectividad y capacidad de investigación profunda. Asociaciones con empresas como Atlassian y Zapier...

Acceso inmediato

Google elimina lista de espera y lanza AI Mode para todos

01 may

Google ha eliminado la lista de espera para su función AI Mode, permitiendo a todos los usuarios mayores de 18 años en EE. UU. acceder...

Alianzas estratégicas

World une alianzas estratégicas para revolucionar la seguridad digital

01 may

World, una empresa de identificación biométrica, ha formado alianzas estratégicas con Match Group, Kalshi y Stripe para expandir su alcance y facilitar el acceso a...

Nvidia lanza Cosmos WFMs para revolucionar la IA generativa

La revolución de los modelos de mundo de Nvidia

Un vistazo a los Cosmos WFMs

La ética y el uso de datos en la formación de modelos

Aplicaciones prácticas de los modelos Cosmos

La distinción entre “abierto” y “código abierto”

Implicaciones para el futuro de la IA y la movilidad

La respuesta del mercado y la comunidad

Otras noticias • IA

Lo más reciente

Inteligencia artificial prioriza compromiso y descuida calidad en interacciones

Gemini 2.5 de Google genera más contenido inapropiado y preocupaciones

Filtración en Raw expone datos sensibles y genera alarma

Startups innovan en tecnología legal moda y salud a pesar desafíos

NotebookLM de Google transforma la toma de notas móviles

OpenAI mejora IA tras incidentes de respuestas inapropiadas

Inversores aumentan apoyo a startups de tecnología climática