La rápida ascensión de DeepSeek en el mundo de la inteligencia artificial
La llegada de DeepSeek al panorama de la inteligencia artificial ha sorprendido a analistas y expertos del sector. En cuestión de semanas, esta aplicación de chatbot ha logrado posicionarse en la cima de las listas de aplicaciones tanto en la App Store de Apple como en Google Play. Este fenómeno ha generado una serie de preguntas sobre el futuro de la inteligencia artificial y la competitividad de Estados Unidos en este ámbito.
La revolución de DeepSeek se enmarca en un contexto global donde la carrera por la inteligencia artificial está en pleno apogeo. Mientras que las empresas estadounidenses han sido históricamente líderes en este sector, el ascenso de DeepSeek ha puesto en entredicho esta supremacía. La capacidad de DeepSeek para atraer a usuarios y desarrolladores ha dejado a Wall Street y a expertos en tecnología cuestionando si Estados Unidos puede mantener su ventaja en el desarrollo de chips de inteligencia artificial.
Los orígenes de DeepSeek
DeepSeek no surgió de la nada. Fundada en 2023, la empresa tiene sus raíces en High-Flyer Capital Management, un fondo de cobertura cuantitativo chino. Este fondo fue cofundado por Liang Wenfeng en 2015, quien, desde sus años universitarios en la Universidad de Zhejiang, ha estado interesado en el trading y en el uso de algoritmos para optimizar decisiones financieras. En 2019, Wenfeng lanzó High-Flyer como un fondo de cobertura centrado en el desarrollo de algoritmos de inteligencia artificial.
A partir de 2023, High-Flyer decidió establecer DeepSeek como un laboratorio de investigación en herramientas de inteligencia artificial, separándose de su negocio financiero. Desde el principio, DeepSeek se ha enfocado en construir sus propios centros de datos para el entrenamiento de modelos, aunque se ha visto afectada por las restricciones de exportación de hardware impuestas por Estados Unidos. Para entrenar uno de sus modelos más recientes, DeepSeek se vio obligada a utilizar chips Nvidia H800, una versión menos potente que los H100 disponibles para las empresas estadounidenses.
La plantilla técnica de DeepSeek está compuesta en gran medida por investigadores jóvenes con doctorados en inteligencia artificial. La empresa también ha tomado la inusual decisión de contratar a personas sin formación en informática, con el objetivo de que su tecnología pueda comprender mejor una amplia gama de temas.
Modelos innovadores de DeepSeek
DeepSeek presentó su primera gama de modelos, incluyendo DeepSeek Coder, DeepSeek LLM y DeepSeek Chat, en noviembre de 2023. Sin embargo, fue el lanzamiento de su familia de modelos DeepSeek-V2 en la primavera de 2024 lo que realmente captó la atención de la industria de la inteligencia artificial. DeepSeek-V2, un sistema de análisis de texto e imagen de propósito general, se destacó en varios benchmarks de inteligencia artificial y resultó ser mucho más económico de operar en comparación con modelos similares.
Este avance forzó a la competencia nacional, que incluye gigantes como ByteDance y Alibaba, a reducir los precios de uso de algunos de sus modelos y a ofrecer otros de manera completamente gratuita. El éxito de DeepSeek continuó con el lanzamiento de DeepSeek-V3 en diciembre de 2024, que consolidó aún más su reputación.
Según las pruebas internas de DeepSeek, el modelo V3 supera tanto a modelos descargables y de acceso abierto, como el Llama de Meta, como a modelos "cerrados" que solo se pueden acceder a través de una API, como el GPT-4 de OpenAI. Este desempeño excepcional ha generado un gran interés en la comunidad tecnológica.
La llegada de DeepSeek ha generado un efecto dominó en el sector de la inteligencia artificial, desafiando a las empresas establecidas a adaptarse o quedar atrás.
Además, DeepSeek ha lanzado su modelo de razonamiento R1, que se presentó en enero. Según la compañía, este modelo es capaz de verificar sus propias respuestas, lo que le permite evitar errores comunes que afectan a otros modelos. Aunque R1 requiere más tiempo para llegar a soluciones en comparación con modelos no de razonamiento, su fiabilidad en áreas como física, ciencia y matemáticas es notable.
Sin embargo, el modelo R1 y otros desarrollos de DeepSeek tienen una limitación importante. Al ser un producto de inteligencia artificial desarrollado en China, está sujeto a la regulación del internet del país, que asegura que sus respuestas "encarnen valores socialistas centrales". Por lo tanto, en su aplicación de chatbot, R1 no responderá a preguntas sobre eventos sensibles como la Plaza de Tiananmen o la autonomía de Taiwán.
Un enfoque disruptivo en el mercado
A pesar de su rápido crecimiento, el modelo de negocio de DeepSeek sigue siendo un misterio. La empresa ofrece sus productos y servicios a precios muy por debajo del valor de mercado e incluso proporciona algunos de ellos de forma gratuita. Según DeepSeek, sus avances en eficiencia le permiten mantener una competitividad extrema en costos, aunque algunos expertos han puesto en duda las cifras que la compañía ha presentado.
La estrategia de precios de DeepSeek ha alterado el panorama competitivo en la inteligencia artificial, obligando a otras empresas a replantear su enfoque.
El impacto de DeepSeek en la comunidad de desarrolladores ha sido significativo. Aunque sus modelos no son de código abierto en el sentido tradicional, están disponibles bajo licencias permisivas que permiten su uso comercial. Según Clem Delangue, CEO de Hugging Face, una de las plataformas que aloja los modelos de DeepSeek, los desarrolladores han creado más de 500 modelos "derivados" del R1, acumulando un total de 2.5 millones de descargas.
La capacidad de DeepSeek para competir con rivales más grandes y establecidos ha sido descrita como un fenómeno que "transforma la inteligencia artificial". Este éxito ha tenido consecuencias directas en el mercado; por ejemplo, la caída del 18% en el precio de las acciones de Nvidia en un solo día se ha atribuido en parte a la creciente influencia de DeepSeek.
Microsoft también ha reaccionado ante el ascenso de DeepSeek, anunciando que la compañía está disponible en su servicio Azure AI Foundry. Durante una llamada de ganancias del primer trimestre, el CEO de Meta, Mark Zuckerberg, comentó que el gasto en infraestructura de inteligencia artificial seguirá siendo una "ventaja estratégica" para la empresa, sugiriendo que DeepSeek podría estar influyendo en las decisiones de gasto de sus competidores.
Un futuro incierto
El futuro de DeepSeek parece prometedor en términos de mejoras en sus modelos. Sin embargo, la creciente desconfianza del gobierno de Estados Unidos hacia lo que percibe como una influencia extranjera dañina podría complicar el panorama para la empresa. Con el contexto actual de tensiones geopolíticas y la creciente preocupación por la seguridad nacional, es incierto cómo se desarrollará la situación para DeepSeek en los próximos meses y años.
La evolución de DeepSeek representa un cambio de paradigma en la inteligencia artificial, donde las empresas emergentes pueden desafiar a los titanes establecidos del sector. A medida que continúan desarrollando modelos innovadores y manteniendo una estrategia de precios competitiva, la presión sobre los competidores será cada vez mayor. La industria de la inteligencia artificial está en un momento crítico, y la historia de DeepSeek es solo un capítulo en un libro que aún está siendo escrito.
Otras noticias • IA
Karandeep Anand asume como CEO de Character.AI para innovar
Karandeep Anand ha sido nombrado CEO de Character.AI, buscando mejorar la seguridad y la experiencia del usuario en la plataforma. Su experiencia en Meta y...
Deezer etiquetará música de inteligencia artificial para proteger derechos
La música generada por inteligencia artificial está en auge, representando el 18% de las nuevas canciones. Deezer comenzará a etiquetar estos álbumes para proteger a...
Lanzan gafas inteligentes Oakley Meta HSTN para deportistas avanzados
Meta y Oakley han lanzado las gafas inteligentes Oakley Meta HSTN, que combinan diseño ergonómico y tecnología avanzada. Con capacidad de grabación en 3K y...
Wix adquiere Base44 por 80 millones, éxito en apps sin código
Maor Shlomo fundó Base44, una startup de creación de aplicaciones sin código, que fue adquirida por Wix por 80 millones de dólares. Con 250,000 usuarios...
Paternidad y AI: desafíos y oportunidades en la crianza moderna
La paternidad en la era de la inteligencia artificial plantea desafíos y oportunidades. Sam Altman, CEO de OpenAI, destaca el uso de ChatGPT para obtener...
Multiplier revoluciona servicios profesionales con adquisición y AI
Multiplier, una startup fundada por Noah Pepper, ha revolucionado el sector de servicios profesionales al adquirir Citrine International Tax y aplicar inteligencia artificial. Esta integración...
Base44, la startup israelí que brilla en el ecosistema tecnológico
La historia de Base44, una startup israelí de codificación "vibe" adquirida por Wix, ilustra el auge de los "unicornios solares". Su enfoque innovador y rápido...
Midjourney lanza V1, revolucionando vídeos y desafiando derechos de autor
Midjourney ha lanzado V1, un modelo de generación de vídeos que transforma imágenes en secuencias de cinco segundos, ampliando las posibilidades creativas. Sin embargo, enfrenta...
Lo más reciente
- 1
Espionaje corporativo en tecnología: el caso de Keith O’Brien
- 2
Cluely recauda 15 millones para innovar en "trampa" ética
- 3
Capital riesgo enfrenta presión por liquidez y resultados inmediatos
- 4
Modelos de IA utilizan chantaje, alertan sobre regulación urgente
- 5
Startups tecnológicas en auge con adquisiciones y crecimiento notable
- 6
Snap compra Saturn para revolucionar la planificación estudiantil
- 7
TerraPower recauda 650 millones para innovadora planta nuclear en Wyoming