IA | Avance competitivo

Alibaba lanza Qwen2.5-VL, superando a competidores en IA

El auge de la inteligencia artificial en China

La inteligencia artificial (IA) está transformando la forma en que las empresas operan y se comunican. En este contexto, el laboratorio de IA chino DeepSeek ha captado la atención del sector tecnológico global, pero no es el único jugador en este campo. Alibaba, uno de los gigantes del comercio electrónico y la tecnología en China, ha decidido no quedarse atrás y ha presentado una nueva familia de modelos de IA, los Qwen2.5-VL, que prometen revolucionar diversas aplicaciones de análisis de texto e imagen.

Innovaciones en modelos de IA

El equipo de Qwen de Alibaba lanzó el pasado lunes los modelos Qwen2.5-VL, que se destacan por su capacidad para realizar múltiples tareas de análisis. Estos modelos no solo pueden analizar documentos y gráficos, sino que también tienen la habilidad de entender videos y contar objetos en imágenes. Además, poseen la capacidad de interactuar con un PC, similar a lo que hace el modelo de OpenAI, conocido como Operator. Esta versatilidad podría marcar un antes y un después en la manera en que las empresas gestionan la información visual y textual.

La llegada de Qwen2.5-VL plantea un desafío significativo a las soluciones de IA existentes en el mercado, mostrando que el desarrollo tecnológico en China está a la par con los líderes globales.

Comparativa con modelos occidentales

Los resultados de las pruebas de rendimiento del equipo Qwen son notables. Según sus datos, el modelo Qwen2.5-VL más avanzado supera a otros competidores como GPT-4o de OpenAI, Claude 3.5 Sonnet de Anthropic y Gemini 2.0 Flash de Google en diversas evaluaciones relacionadas con la comprensión de videos, matemáticas, análisis de documentos y preguntas y respuestas. Esto indica que Alibaba no solo está intentando ponerse al día con las empresas tecnológicas occidentales, sino que está marcando un nuevo estándar en el desarrollo de la IA.

La diversidad de aplicaciones que ofrece Qwen2.5-VL es una de sus características más destacadas. Puede analizar gráficos y tablas, extraer datos de facturas y formularios escaneados, e incluso "comprender" videos de varias horas de duración. Esta capacidad es especialmente valiosa en sectores como el comercio, donde el análisis de datos visuales y textuales es crucial para la toma de decisiones.

Restricciones en el desarrollo de IA en China

Sin embargo, el desarrollo de modelos de IA en China no está exento de desafíos. Qwen2.5-VL, al ser un producto de una empresa china, enfrenta ciertas restricciones en los temas que puede tratar. Por ejemplo, al intentar abordar cuestiones sensibles como "los errores de Xi Jinping", el modelo devuelve un mensaje de error. Este fenómeno se debe a las regulaciones impuestas por el regulador de internet de China, que supervisa los modelos de IA para asegurar que sus respuestas reflejen "valores socialistas fundamentales".

En este entorno regulatorio, muchos sistemas de IA en China evitan abordar temas que puedan desatar la ira de las autoridades, como la autonomía de Taiwán.

Esto plantea un dilema para las empresas que desean desarrollar tecnología de vanguardia, ya que deben equilibrar la innovación con las limitaciones impuestas por el gobierno. La capacidad de un modelo para operar dentro de un marco regulatorio estricto puede ser tanto una ventaja como una desventaja, dependiendo de cómo se utilice.

Interacción con software y aplicaciones

Uno de los aspectos más interesantes de Qwen2.5-VL es su habilidad para interactuar con software, tanto en PCs como en dispositivos móviles. Un video compartido en las redes sociales mostró a un modelo Qwen2.5-VL lanzando la aplicación Booking.com en un dispositivo Android y reservando un vuelo de Chongqing a Pekín. Esta funcionalidad no solo demuestra la versatilidad del modelo, sino que también abre la puerta a nuevas aplicaciones en el ámbito del comercio electrónico y los servicios digitales.

A pesar de su potencial, algunos videos han mostrado que el rendimiento de Qwen2.5-VL en un entorno de escritorio no siempre es fluido. En un video, se observa al modelo controlando aplicaciones en un escritorio Linux, aunque no parece realizar mucho más allá de cambiar de pestañas. Esto podría indicar que, aunque la IA de Alibaba tiene un gran potencial, todavía está en proceso de optimización y desarrollo.

Modelos en diferentes escalas

La familia de modelos Qwen2.5-VL incluye varias versiones, siendo la más avanzada la Qwen2.5-VL-72B, que está sujeta a una licencia personalizada de Alibaba. Esta licencia requiere que las empresas y desarrolladores con más de 100 millones de usuarios activos mensuales soliciten permiso antes de desplegar el modelo de forma comercial. Las versiones más pequeñas y menos sofisticadas, como Qwen2.5-VL-3B y Qwen2.5-VL-7B, están disponibles bajo una licencia más permisiva, lo que permite a una mayor cantidad de desarrolladores experimentar con estas tecnologías.

Este enfoque escalonado en la disponibilidad de modelos de IA refleja la estrategia de Alibaba para fomentar la innovación mientras protege sus intereses comerciales. Al permitir que los desarrolladores más pequeños accedan a versiones menos complejas de Qwen2.5-VL, Alibaba no solo promueve el uso de su tecnología, sino que también fomenta un ecosistema de innovación en el ámbito de la IA.

La batalla por la supremacía en IA

La competencia en el ámbito de la inteligencia artificial se intensifica cada vez más, no solo entre empresas chinas, sino también en el escenario internacional. Con el auge de DeepSeek y el lanzamiento de Qwen2.5-VL por parte de Alibaba, está claro que China se está posicionando como un líder en la carrera por la IA. La capacidad de estos modelos para superar a sus competidores occidentales en pruebas de rendimiento sugiere que la inversión y el desarrollo en este campo están dando frutos.

Las empresas de tecnología deben prestar atención a estos desarrollos, ya que el avance de la IA en China podría tener un impacto significativo en el mercado global. A medida que las empresas chinas continúan innovando y lanzando nuevos modelos, los líderes de la industria en Occidente se verán obligados a acelerar sus propios desarrollos para no quedarse atrás.

Perspectivas futuras

La llegada de modelos como Qwen2.5-VL representa no solo un avance en la tecnología de IA, sino también una señal de que el futuro de la inteligencia artificial estará marcado por una creciente competencia y un enfoque en la colaboración. Las empresas deben estar preparadas para adaptarse a un entorno en constante cambio, donde la innovación y la regulación jugarán un papel crucial en el desarrollo de nuevas tecnologías.

Los próximos años serán decisivos para la evolución de la IA, y las empresas que sepan adaptarse y aprovechar las oportunidades tendrán una ventaja competitiva en el mercado.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Inteligencia artificial

Helios revoluciona la política pública con inteligencia artificial Proxi

Helios, cofundada por Joe Scheidler y Joseph Farsakh, integra inteligencia artificial en la política pública con su producto Proxi. Este sistema optimiza la toma de...

Sesgo ético

Grok 4 de xAI: ¿Sesgo de Elon Musk en inteligencia artificial?

Grok 4, de xAI, refleja la influencia de las opiniones de Elon Musk en su funcionamiento, lo que cuestiona su objetividad y capacidad para buscar...

Marketplace IA

AWS lanza marketplace de IA para democratizar soluciones personalizadas

El lanzamiento del marketplace de agentes de IA de AWS el 15 de julio promete democratizar el acceso a la inteligencia artificial, permitiendo a empresas...

Creación audiovisual

Google lanza Veo 3, revolucionando la creación de videos

Google ha lanzado Veo 3, una herramienta de inteligencia artificial que permite generar videos a partir de imágenes. Esta innovación democratiza la creación de contenido...

Certificación ágil

Knox acelera certificación FedRAMP y democratiza contratos gubernamentales

Knox, fundada por Irina Denisenko, busca acelerar el proceso de certificación FedRAMP para software como servicio en el sector público, reduciendo el tiempo y coste....

Análisis geoespacial

LGND revoluciona análisis geoespacial con 9 millones en financiación

LGND es una startup que transforma el análisis de datos geoespaciales mediante embebidos vectoriales, mejorando la eficiencia en la interpretación de imágenes satelitales. Con una...

Innovación sostenible

Google impulsa startups de IA con nueva Academia Americana

Google lanza la segunda cohorte de su Academia de Infraestructura Americana, apoyando startups de IA en áreas críticas como ciberseguridad y salud. El programa, sin...

Expansión sanitaria

Diligent Robotics expande flota Moxi para mejorar atención sanitaria

Diligent Robotics, con la incorporación de Rashed Haq y Todd Brugger en su liderazgo, busca expandir su flota de robots Moxi en el sector sanitario....