La rápida ascensión de DeepSeek en el mundo de la inteligencia artificial
La llegada de DeepSeek al panorama de la inteligencia artificial ha sorprendido a analistas y expertos del sector. En cuestión de semanas, esta aplicación de chatbot ha logrado posicionarse en la cima de las listas de aplicaciones tanto en la App Store de Apple como en Google Play. Este fenómeno ha generado una serie de preguntas sobre el futuro de la inteligencia artificial y la competitividad de Estados Unidos en este ámbito.
La revolución de DeepSeek se enmarca en un contexto global donde la carrera por la inteligencia artificial está en pleno apogeo. Mientras que las empresas estadounidenses han sido históricamente líderes en este sector, el ascenso de DeepSeek ha puesto en entredicho esta supremacía. La capacidad de DeepSeek para atraer a usuarios y desarrolladores ha dejado a Wall Street y a expertos en tecnología cuestionando si Estados Unidos puede mantener su ventaja en el desarrollo de chips de inteligencia artificial.
Los orígenes de DeepSeek
DeepSeek no surgió de la nada. Fundada en 2023, la empresa tiene sus raíces en High-Flyer Capital Management, un fondo de cobertura cuantitativo chino. Este fondo fue cofundado por Liang Wenfeng en 2015, quien, desde sus años universitarios en la Universidad de Zhejiang, ha estado interesado en el trading y en el uso de algoritmos para optimizar decisiones financieras. En 2019, Wenfeng lanzó High-Flyer como un fondo de cobertura centrado en el desarrollo de algoritmos de inteligencia artificial.
A partir de 2023, High-Flyer decidió establecer DeepSeek como un laboratorio de investigación en herramientas de inteligencia artificial, separándose de su negocio financiero. Desde el principio, DeepSeek se ha enfocado en construir sus propios centros de datos para el entrenamiento de modelos, aunque se ha visto afectada por las restricciones de exportación de hardware impuestas por Estados Unidos. Para entrenar uno de sus modelos más recientes, DeepSeek se vio obligada a utilizar chips Nvidia H800, una versión menos potente que los H100 disponibles para las empresas estadounidenses.
La plantilla técnica de DeepSeek está compuesta en gran medida por investigadores jóvenes con doctorados en inteligencia artificial. La empresa también ha tomado la inusual decisión de contratar a personas sin formación en informática, con el objetivo de que su tecnología pueda comprender mejor una amplia gama de temas.
Modelos innovadores de DeepSeek
DeepSeek presentó su primera gama de modelos, incluyendo DeepSeek Coder, DeepSeek LLM y DeepSeek Chat, en noviembre de 2023. Sin embargo, fue el lanzamiento de su familia de modelos DeepSeek-V2 en la primavera de 2024 lo que realmente captó la atención de la industria de la inteligencia artificial. DeepSeek-V2, un sistema de análisis de texto e imagen de propósito general, se destacó en varios benchmarks de inteligencia artificial y resultó ser mucho más económico de operar en comparación con modelos similares.
Este avance forzó a la competencia nacional, que incluye gigantes como ByteDance y Alibaba, a reducir los precios de uso de algunos de sus modelos y a ofrecer otros de manera completamente gratuita. El éxito de DeepSeek continuó con el lanzamiento de DeepSeek-V3 en diciembre de 2024, que consolidó aún más su reputación.
Según las pruebas internas de DeepSeek, el modelo V3 supera tanto a modelos descargables y de acceso abierto, como el Llama de Meta, como a modelos "cerrados" que solo se pueden acceder a través de una API, como el GPT-4 de OpenAI. Este desempeño excepcional ha generado un gran interés en la comunidad tecnológica.
La llegada de DeepSeek ha generado un efecto dominó en el sector de la inteligencia artificial, desafiando a las empresas establecidas a adaptarse o quedar atrás.
Además, DeepSeek ha lanzado su modelo de razonamiento R1, que se presentó en enero. Según la compañía, este modelo es capaz de verificar sus propias respuestas, lo que le permite evitar errores comunes que afectan a otros modelos. Aunque R1 requiere más tiempo para llegar a soluciones en comparación con modelos no de razonamiento, su fiabilidad en áreas como física, ciencia y matemáticas es notable.
Sin embargo, el modelo R1 y otros desarrollos de DeepSeek tienen una limitación importante. Al ser un producto de inteligencia artificial desarrollado en China, está sujeto a la regulación del internet del país, que asegura que sus respuestas "encarnen valores socialistas centrales". Por lo tanto, en su aplicación de chatbot, R1 no responderá a preguntas sobre eventos sensibles como la Plaza de Tiananmen o la autonomía de Taiwán.
Un enfoque disruptivo en el mercado
A pesar de su rápido crecimiento, el modelo de negocio de DeepSeek sigue siendo un misterio. La empresa ofrece sus productos y servicios a precios muy por debajo del valor de mercado e incluso proporciona algunos de ellos de forma gratuita. Según DeepSeek, sus avances en eficiencia le permiten mantener una competitividad extrema en costos, aunque algunos expertos han puesto en duda las cifras que la compañía ha presentado.
La estrategia de precios de DeepSeek ha alterado el panorama competitivo en la inteligencia artificial, obligando a otras empresas a replantear su enfoque.
El impacto de DeepSeek en la comunidad de desarrolladores ha sido significativo. Aunque sus modelos no son de código abierto en el sentido tradicional, están disponibles bajo licencias permisivas que permiten su uso comercial. Según Clem Delangue, CEO de Hugging Face, una de las plataformas que aloja los modelos de DeepSeek, los desarrolladores han creado más de 500 modelos "derivados" del R1, acumulando un total de 2.5 millones de descargas.
La capacidad de DeepSeek para competir con rivales más grandes y establecidos ha sido descrita como un fenómeno que "transforma la inteligencia artificial". Este éxito ha tenido consecuencias directas en el mercado; por ejemplo, la caída del 18% en el precio de las acciones de Nvidia en un solo día se ha atribuido en parte a la creciente influencia de DeepSeek.
Microsoft también ha reaccionado ante el ascenso de DeepSeek, anunciando que la compañía está disponible en su servicio Azure AI Foundry. Durante una llamada de ganancias del primer trimestre, el CEO de Meta, Mark Zuckerberg, comentó que el gasto en infraestructura de inteligencia artificial seguirá siendo una "ventaja estratégica" para la empresa, sugiriendo que DeepSeek podría estar influyendo en las decisiones de gasto de sus competidores.
Un futuro incierto
El futuro de DeepSeek parece prometedor en términos de mejoras en sus modelos. Sin embargo, la creciente desconfianza del gobierno de Estados Unidos hacia lo que percibe como una influencia extranjera dañina podría complicar el panorama para la empresa. Con el contexto actual de tensiones geopolíticas y la creciente preocupación por la seguridad nacional, es incierto cómo se desarrollará la situación para DeepSeek en los próximos meses y años.
La evolución de DeepSeek representa un cambio de paradigma en la inteligencia artificial, donde las empresas emergentes pueden desafiar a los titanes establecidos del sector. A medida que continúan desarrollando modelos innovadores y manteniendo una estrategia de precios competitiva, la presión sobre los competidores será cada vez mayor. La industria de la inteligencia artificial está en un momento crítico, y la historia de DeepSeek es solo un capítulo en un libro que aún está siendo escrito.
Otras noticias • IA
OpenAI lanza ChatGPT, la nueva herramienta de inteligencia artificial
OpenAI ha lanzado el agente ChatGPT, una herramienta de inteligencia artificial versátil que permite a los usuarios realizar tareas complejas, como gestionar calendarios y ejecutar...
Mistral potencia Le Chat con innovaciones en inteligencia artificial
Mistral ha actualizado su chatbot Le Chat con innovaciones como un modo de investigación profunda, razonamiento multilingüe, organización de proyectos y edición avanzada de imágenes....
Lovable se convierte en unicornio en solo ocho meses
Lovable, una startup sueca de codificación impulsada por inteligencia artificial, ha alcanzado el estatus de unicornio en ocho meses, acumulando 2,3 millones de usuarios y...
India impulsa computación cuántica con QpiAI y 32 millones
India avanza en computación cuántica con la startup QpiAI, que recibió 32 millones de dólares de financiación. La empresa, que combina IA y computación cuántica,...
Nvidia reanuda ventas de chip H20 AI en China
Nvidia ha reanudado las ventas de su chip H20 AI en China, generando tensiones sobre seguridad nacional y comercio de tierras raras. Esta decisión refleja...
Google lanza llamadas comerciales con IA para mejorar la comunicación
Google ha lanzado una funcionalidad de llamadas comerciales impulsada por IA en EE.UU., permitiendo a los usuarios obtener información sin hablar directamente con humanos. Esta...
Calvin French-Owen expone desafíos de crecimiento en OpenAI
Calvin French-Owen, exingeniero de OpenAI, revela en su blog los desafíos de la rápida expansión de la empresa, que creció de 1,000 a 3,000 empleados....
Meta AI expone conversaciones privadas, genera alarma por seguridad
Un fallo de seguridad en Meta AI permitió a los usuarios acceder a conversaciones privadas de otros, generando preocupaciones sobre la privacidad. Aunque Meta corrigió...
Lo más reciente
- 1
Vulnerabilidades del SS7 amenazan privacidad en el Medio Oriente
- 2
Tensiones en Europa por regulación de IA y desarrollo tecnológico
- 3
Perplexity se asocia con Airtel para expandir IA en India
- 4
Usuarios de Claude Code frustrados por restricciones y falta de comunicación
- 5
Microsoft aumenta emisiones de carbono y lucha por sostenibilidad
- 6
Diarrha N’Diaye-Mbaye cierra Ami Colé ante desafíos empresariales
- 7
Hadrian recauda 260 millones para revitalizar manufactura en EE. UU