El ascenso meteórico de DeepSeek en el mundo de la inteligencia artificial
La inteligencia artificial (IA) ha sido uno de los campos más dinámicos y debatidos de la tecnología en los últimos años. Sin embargo, el reciente surgimiento de DeepSeek ha captado la atención de analistas y entusiastas de la IA en todo el mundo. La app de chatbot de DeepSeek ha escalado rápidamente hasta la cima de las listas de aplicaciones en la App Store de Apple y Google Play, lo que ha llevado a muchos a cuestionar la posición de Estados Unidos en la carrera de la inteligencia artificial. El ascenso de DeepSeek ha desafiado las nociones establecidas sobre la competencia en el ámbito de la IA.
Orígenes de DeepSeek: un giro inesperado
DeepSeek no es una startup cualquiera. Fundada como una extensión del fondo de cobertura High-Flyer Capital Management, la empresa tiene raíces profundas en el mundo financiero. El cofundador Liang Wenfeng, un apasionado de la IA, lanzó High-Flyer en 2019, centrando sus esfuerzos en el desarrollo de algoritmos de IA para informar decisiones comerciales. Sin embargo, en 2023, decidieron crear DeepSeek como un laboratorio de investigación en IA, separado de su negocio financiero.
A pesar de los desafíos que enfrentó en sus inicios, incluyendo las restricciones impuestas por Estados Unidos sobre la exportación de hardware, DeepSeek ha logrado construir sus propios centros de datos para el entrenamiento de modelos. Sin embargo, tuvo que recurrir a chips Nvidia H800, una versión menos potente de los H100, para poder continuar con sus investigaciones. La necesidad de adaptarse a las limitaciones del hardware ha llevado a DeepSeek a innovar en sus métodos de desarrollo.
Un equipo técnico con una visión fresca
DeepSeek ha sido capaz de atraer a un equipo técnico joven y ambicioso, reclutando a investigadores de doctorado de universidades chinas de renombre. La compañía no solo se ha enfocado en científicos de la computación, sino que también ha contratado a personas de diversas disciplinas para enriquecer su enfoque. Esta estrategia diversificada ha permitido a DeepSeek entender y abordar una amplia gama de problemas a través de la IA.
La elección de un equipo técnico diverso refleja una tendencia creciente en la industria de la IA, donde la intersección de diferentes disciplinas puede dar lugar a innovaciones sorprendentes. Además, el compromiso de DeepSeek con la investigación y el desarrollo ha sido clave para su éxito en el lanzamiento de modelos competitivos.
Los modelos que están revolucionando el mercado
DeepSeek lanzó su primer conjunto de modelos en noviembre de 2023, incluyendo DeepSeek Coder, DeepSeek LLM y DeepSeek Chat. Sin embargo, fue el lanzamiento de la familia de modelos DeepSeek-V2 en la primavera de 2024 lo que realmente capturó la atención de la industria. Este sistema de análisis de texto e imagen no solo mostró un rendimiento superior en varios benchmarks de IA, sino que también resultó ser mucho más económico de operar que otros modelos existentes.
La competitividad de DeepSeek ha forzado a gigantes como ByteDance y Alibaba a reducir precios y ofrecer modelos de manera gratuita, alterando así el equilibrio del mercado.
Con el lanzamiento de DeepSeek-V3 en diciembre de 2024, la compañía consolidó su posición como un competidor formidable. Según las pruebas internas de DeepSeek, su modelo V3 supera a otros modelos, incluyendo los de acceso abierto como Llama de Meta y los modelos cerrados como GPT-4 de OpenAI. Esto ha llevado a una reevaluación de las expectativas sobre lo que puede ofrecer una empresa emergente en comparación con los actores establecidos.
Un modelo de razonamiento que destaca
Uno de los lanzamientos más interesantes de DeepSeek ha sido su modelo de razonamiento R1, presentado en enero. Este modelo es capaz de autoevaluarse, lo que significa que puede verificar sus propias respuestas y evitar errores comunes que suelen afectar a otros modelos. Aunque el tiempo de respuesta es un poco más lento que el de los modelos tradicionales, la fiabilidad en áreas como la física y las matemáticas lo convierte en una herramienta valiosa.
Sin embargo, este enfoque tiene sus desventajas. Todos los modelos de DeepSeek, incluidos R1 y V3, están sujetos a regulaciones impuestas por el regulador de internet de China. Esto significa que ciertos temas delicados, como la Plaza de Tiananmen o la autonomía de Taiwán, son intencionadamente evitados en las respuestas generadas por sus modelos. Esta restricción plantea interrogantes sobre la libertad de expresión y la ética en el desarrollo de la IA.
Un modelo de negocio en evolución
El modelo de negocio de DeepSeek es un tema de debate. A diferencia de muchas empresas que optan por estrategias de precios premium, DeepSeek ha elegido ofrecer sus productos a un costo significativamente inferior. Incluso ha decidido regalar algunos de sus servicios, lo que ha generado un revuelo en la comunidad tecnológica.
DeepSeek argumenta que sus avances en eficiencia le permiten ser extremadamente competitivo en precios. Sin embargo, algunos expertos han cuestionado la veracidad de las cifras que la compañía ha presentado. A pesar de estas controversias, los desarrolladores han adoptado rápidamente los modelos de DeepSeek, creando más de 500 modelos derivados de R1, que han acumulado 2,5 millones de descargas en total.
El impacto en el mercado y la reacción de los gigantes tecnológicos
El éxito de DeepSeek ha sido tan significativo que ha comenzado a afectar a empresas mucho más grandes. En un giro inesperado, la valoración de las acciones de Nvidia cayó un 18% en un solo día, lo que refleja la preocupación del mercado por la creciente competencia. El CEO de OpenAI, Sam Altman, se vio obligado a responder públicamente al fenómeno DeepSeek, lo que subraya la magnitud del desafío que representa.
Microsoft ha reconocido el potencial de DeepSeek al integrar sus servicios en la plataforma Azure AI Foundry, una medida que indica la importancia de la startup en el ecosistema de la inteligencia artificial. Durante una llamada de ganancias, el CEO de Meta, Mark Zuckerberg, subrayó que la inversión en infraestructura de IA seguirá siendo una ventaja estratégica para su empresa, sugiriendo que la competencia en este espacio está lejos de terminar.
La respuesta de gobiernos y regulaciones
Sin embargo, no todo es color de rosa para DeepSeek. Algunos países y empresas han decidido prohibir el uso de sus modelos, citando preocupaciones sobre la seguridad y la influencia extranjera. En el estado de Nueva York, por ejemplo, se ha prohibido el uso de DeepSeek en dispositivos gubernamentales, lo que plantea interrogantes sobre la viabilidad a largo plazo de la empresa en el mercado estadounidense.
El temor a una posible influencia dañina de tecnologías extranjeras está llevando a gobiernos a establecer barreras, lo que podría limitar la expansión de DeepSeek en el extranjero.
Mientras tanto, el futuro de DeepSeek sigue siendo incierto. Aunque es probable que continúe mejorando sus modelos, la creciente desconfianza por parte de las autoridades estadounidenses podría obstaculizar su desarrollo y expansión. La intersección entre la innovación tecnológica y la regulación gubernamental se está volviendo cada vez más compleja, y DeepSeek es solo uno de los muchos actores que navegan por este paisaje.
A medida que la competencia en el ámbito de la inteligencia artificial se intensifica, el papel de empresas como DeepSeek se vuelve crucial. Su enfoque disruptivo ha desafiado las normas establecidas y ha abierto un nuevo capítulo en la historia de la inteligencia artificial. Sin duda, todos los ojos estarán puestos en esta empresa para ver cómo se desarrolla en el futuro.
Otras noticias • IA
Debate global por uso indebido de IA en contenido sexual
La investigación a xAI por el uso de su chatbot Grok para generar contenido sexual no consensuado ha desatado un debate sobre la responsabilidad de...
Trump propone subasta tecnológica para generar 15 mil millones en energía
La administración Trump propone que las empresas tecnológicas participen en una subasta para añadir 15 mil millones de dólares en nueva generación de energía, en...
OpenAI introduce publicidad en ChatGPT para usuarios gratuitos y "Go"
OpenAI ha anunciado la inclusión de publicidad en ChatGPT, tanto para usuarios gratuitos como de la suscripción "Go". Esta estrategia busca generar ingresos mientras se...
Irina Ghose impulsa la inteligencia artificial en India con Anthropic
La llegada de Irina Ghose a Anthropic y la apertura de su oficina en India subrayan la importancia del país en el mercado de la...
Trump firma acuerdo histórico con Taiwán por 250.000 millones
La administración de Trump ha firmado un acuerdo histórico con Taiwán por 250.000 millones de dólares para impulsar la producción de semiconductores y fortalecer la...
Higgsfield recauda 80 millones y alcanza valoración de 1.3 mil millones
Higgsfield, una startup de generación de vídeo mediante inteligencia artificial, ha recaudado 80 millones de dólares, alcanzando una valoración de 1.3 mil millones. Con más...
EE.UU. impone arancel del 25% a semiconductores para competir con China
La imposición de un arancel del 25% por EE.UU. a semiconductores avanzados, como los chips H200 de Nvidia, refleja la competencia tecnológica con China. Esta...
Wikimedia celebra 25 años con nuevas alianzas tecnológicas
La Fundación Wikimedia celebra su 25 aniversario anunciando nuevas alianzas con empresas de inteligencia artificial y mejoras tecnológicas. Estas iniciativas buscan asegurar la sostenibilidad de...
Lo más reciente
- 1
Sequoia Capital diversifica inversiones en competidores de IA
- 2
Threads supera a X en usuarios móviles diarios activos
- 3
Confer prioriza la privacidad en la era de la IA
- 4
Multimillonarios abandonan California por nuevo impuesto sobre la riqueza
- 5
Energía eólica offshore en EE. UU. avanza pese a retos
- 6
Oshen revoluciona la recolección de datos oceánicos con C-Stars
- 7
Elon Musk demanda a OpenAI y Microsoft por 134.000 millones

