IA | Modelos revolucionarios

Nvidia lanza Cosmos WFMs para revolucionar la IA generativa

La revolución de los modelos de mundo de Nvidia

En un momento donde la inteligencia artificial (IA) está transformando la manera en que interactuamos con la tecnología, Nvidia ha decidido dar un paso audaz al presentar su nueva familia de modelos de mundo, denominados Cosmos World Foundation Models (Cosmos WFMs), durante el CES 2025 en Las Vegas. Esta iniciativa marca un hito significativo en la evolución de los modelos de IA, inspirándose en la forma en que los humanos desarrollan modelos mentales del mundo que les rodea. Con la promesa de generar vídeos “conscientes de la física”, Nvidia se posiciona como un líder en la vanguardia de la IA generativa.

El anuncio de los Cosmos WFMs promete una nueva era de simulaciones físicas que podrían ser utilizadas en diversas aplicaciones, desde la robótica hasta el desarrollo de vehículos autónomos. Estos modelos, disponibles a través de la API de Nvidia, los catálogos NGC, GitHub y la plataforma de desarrollo de IA Hugging Face, están diseñados para ser ajustados según las necesidades específicas de los desarrolladores e investigadores.

Un vistazo a los Cosmos WFMs

Nvidia ha categorizado su nueva familia de modelos en tres tipos distintos: Nano, Super y Ultra. Los modelos Nano están optimizados para aplicaciones de baja latencia y en tiempo real, mientras que los modelos Super son descritos como “líneas base de alto rendimiento”. Por último, los modelos Ultra ofrecen la máxima calidad y fidelidad en los resultados generados. Esta clasificación permite a los desarrolladores elegir el modelo que mejor se adapte a sus requerimientos, lo que resulta crucial en un campo tan dinámico como la IA.

Los modelos varían en tamaño, con un rango que va de 4 a 14 mil millones de parámetros. Este número de parámetros es un indicador directo de la capacidad de resolución de problemas de un modelo: cuanto más parámetros, generalmente mejor será el rendimiento. En este sentido, Nvidia ha creado un ecosistema que no solo busca innovar, sino también facilitar el acceso a tecnologías de vanguardia.

La diversidad en la gama de modelos asegura que tanto las startups como las grandes corporaciones puedan aprovechar las ventajas de los Cosmos WFMs.

La ética y el uso de datos en la formación de modelos

Un aspecto controvertido del lanzamiento de los Cosmos WFMs es el origen de los datos utilizados para entrenarlos. Nvidia ha afirmado que los modelos han sido entrenados utilizando 9,000 billones de tokens, lo que equivale a 20 millones de horas de interacciones humanas reales, datos ambientales, industriales, robóticos y de conducción. Sin embargo, la falta de claridad sobre la procedencia de estos datos ha generado preocupaciones en torno a los derechos de autor.

Algunos informes sugieren que Nvidia podría haber utilizado vídeos de YouTube protegidos por derechos de autor sin el consentimiento adecuado. Cuando se le consultó sobre este asunto, un portavoz de Nvidia defendió que “Cosmos no está diseñado para copiar o infringir obras protegidas”. Aseguró que el modelo aprende de una manera similar a como lo hacen los humanos, recopilando datos de diversas fuentes públicas y privadas, y que su uso es legal.

Sin embargo, expertos en derechos de autor advierten que este tipo de afirmaciones puede no resistir un examen judicial. La interpretación del “uso justo”, que permite el uso de obras protegidas para crear algo nuevo, se ha vuelto un tema candente en el ámbito legal y es probable que las decisiones futuras de los tribunales tengan un impacto significativo en la forma en que se desarrollan y utilizan los modelos de IA.

Aplicaciones prácticas de los modelos Cosmos

Los Cosmos WFMs no son solo una curiosidad tecnológica; su potencial para transformar industrias enteras es considerable. Nvidia ha afirmado que estos modelos son capaces de generar “datos sintéticos de alta calidad y controlables” a partir de textos o cuadros de vídeo, lo que puede ser fundamental para la formación de modelos de robótica y vehículos autónomos.

La capacidad de simular entornos realistas abre un abanico de posibilidades, desde la formación de sistemas de navegación para vehículos hasta la creación de escenarios de prueba para robots en fábricas. Por ejemplo, los modelos pueden generar vídeos basados en combinaciones de entradas como texto, imágenes y datos de sensores de robots, lo que facilita la creación de simulaciones altamente realistas.

Empresas como Waabi, Wayve, Fortellix y Uber ya han mostrado interés en probar los Cosmos WFMs para diversas aplicaciones, incluyendo la búsqueda y curación de vídeos y el desarrollo de modelos de IA para vehículos autónomos.

La distinción entre “abierto” y “código abierto”

Es importante señalar que, aunque Nvidia ha presentado los Cosmos WFMs como modelos “abiertos”, no cumplen con la definición estricta de “código abierto”. En términos generales, un modelo de IA que se considera de código abierto debe proporcionar información suficiente sobre su diseño y los datos de entrenamiento para que alguien pueda recrearlo sustancialmente. Hasta el momento, Nvidia no ha publicado detalles sobre los datos de entrenamiento utilizados ni ha proporcionado todas las herramientas necesarias para recrear los modelos desde cero.

Esto ha llevado a críticas sobre la naturaleza “abierta” de los Cosmos WFMs, ya que la falta de transparencia en cuanto a los datos de entrenamiento y el proceso de desarrollo limita la capacidad de la comunidad para auditar y reproducir estos modelos. A pesar de esto, Nvidia continúa argumentando que su enfoque permitirá un acceso más amplio a herramientas avanzadas de IA.

Implicaciones para el futuro de la IA y la movilidad

El CEO de Nvidia, Jensen Huang, ha expresado su esperanza de que los Cosmos WFMs logren para el mundo de la robótica y la IA industrial lo que el modelo Llama ha hecho por el sector empresarial. La visión de Nvidia es que su tecnología impulsará un futuro donde la movilidad y la automatización sean más seguras y eficientes, gracias a la generación de datos sintéticos y simulaciones físicas precisas.

La colaboración con empresas como Uber indica que hay un interés real en cómo estas tecnologías pueden ser integradas en soluciones prácticas y escalables para la industria del transporte. La IA generativa se perfila como un componente clave en la creación de vehículos autónomos, lo que podría revolucionar la forma en que nos desplazamos.

La innovación en este campo también podría llevar a un aumento en la competitividad entre empresas, lo que obligaría a las organizaciones a adaptarse rápidamente a los cambios tecnológicos. En este contexto, los Cosmos WFMs se presentan como una herramienta poderosa para aquellos que buscan mantenerse a la vanguardia de la revolución tecnológica en curso.

La respuesta del mercado y la comunidad

El lanzamiento de los Cosmos WFMs ha sido recibido con gran interés en la comunidad tecnológica. Muchos desarrolladores y académicos están ansiosos por explorar las capacidades de estos modelos y cómo pueden aplicarse en sus respectivos campos. Sin embargo, también existe una preocupación subyacente sobre las implicaciones éticas y legales del uso de datos en el entrenamiento de modelos de IA.

La comunidad espera que Nvidia aborde estas preocupaciones de manera proactiva, proporcionando mayor transparencia sobre el proceso de recopilación de datos y el uso de derechos de autor. El éxito a largo plazo de los Cosmos WFMs dependerá no solo de su rendimiento técnico, sino también de cómo la empresa maneje las cuestiones éticas relacionadas con la IA.

Con la mirada puesta en el futuro, Nvidia está preparada para jugar un papel fundamental en la evolución de la IA generativa y su aplicación en una variedad de industrias. La posibilidad de que estos modelos transformen el panorama tecnológico es innegable, pero también plantea preguntas importantes sobre la responsabilidad y la ética en el desarrollo de tecnologías emergentes.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Tensiones familiares

Controversia familiar: demanda de Annie Altman contra su hermano Sam

La demanda de Annie Altman contra su hermano Sam, CEO de OpenAI, por abuso sexual ha generado tensiones familiares y cuestionamientos sobre la salud mental...

Innovación tecnológica

Nvidia presenta chips de IA que superan la Ley de Moore

Jensen Huang, CEO de Nvidia, destaca que sus nuevos chips de IA superan la Ley de Moore, ofreciendo un rendimiento 30-40 veces mayor. Introduce tres...

Inversión tecnológica

AWS invertirá 11.000 millones en Georgia, generando 550 empleos

Amazon Web Services (AWS) invertirá al menos 11.000 millones de dólares en Georgia, generando 550 empleos y posicionando al estado como un epicentro tecnológico. Sin...

Asistente digital

Panasonic lanza Umi, asistente digital para el bienestar familiar

Panasonic ha presentado Umi, un asistente digital de bienestar familiar impulsado por inteligencia artificial. Diseñado para mejorar la conexión familiar, Umi permite establecer metas, gestionar...

Movilidad autónoma

Uber y Nvidia impulsan vehículos autónomos con simulaciones avanzadas

Uber ha colaborado con Nvidia para desarrollar vehículos autónomos, utilizando la herramienta Cosmos para simular entornos realistas y optimizar algoritmos de conducción. Esta asociación, parte...

Deepfakes sexuales

Reino Unido busca criminalizar deepfakes sexuales para proteger mujeres

El Reino Unido planea criminalizar la creación de deepfakes sexuales, abordando la creciente preocupación por el abuso en línea, especialmente hacia mujeres. Aunque ya existen...

Inversión tecnológica

Microsoft invierte 3.000 millones en IA y nube en India

Microsoft ha anunciado una inversión de 3.000 millones de dólares en India para potenciar la inteligencia artificial y la nube Azure, formando a 10 millones...

Superordenador accesible

Nvidia lanza Project Digits, superordenador personal de IA asequible

Nvidia ha presentado Project Digits en el CES 2025, un superordenador personal que ofrece potencia de IA accesible para investigadores y estudiantes. Con un rendimiento...