El ascenso meteórico de DeepSeek en el mundo de la inteligencia artificial
La inteligencia artificial (IA) ha sido uno de los campos más dinámicos y debatidos de la tecnología en los últimos años. Sin embargo, el reciente surgimiento de DeepSeek ha captado la atención de analistas y entusiastas de la IA en todo el mundo. La app de chatbot de DeepSeek ha escalado rápidamente hasta la cima de las listas de aplicaciones en la App Store de Apple y Google Play, lo que ha llevado a muchos a cuestionar la posición de Estados Unidos en la carrera de la inteligencia artificial. El ascenso de DeepSeek ha desafiado las nociones establecidas sobre la competencia en el ámbito de la IA.
Orígenes de DeepSeek: un giro inesperado
DeepSeek no es una startup cualquiera. Fundada como una extensión del fondo de cobertura High-Flyer Capital Management, la empresa tiene raíces profundas en el mundo financiero. El cofundador Liang Wenfeng, un apasionado de la IA, lanzó High-Flyer en 2019, centrando sus esfuerzos en el desarrollo de algoritmos de IA para informar decisiones comerciales. Sin embargo, en 2023, decidieron crear DeepSeek como un laboratorio de investigación en IA, separado de su negocio financiero.
A pesar de los desafíos que enfrentó en sus inicios, incluyendo las restricciones impuestas por Estados Unidos sobre la exportación de hardware, DeepSeek ha logrado construir sus propios centros de datos para el entrenamiento de modelos. Sin embargo, tuvo que recurrir a chips Nvidia H800, una versión menos potente de los H100, para poder continuar con sus investigaciones. La necesidad de adaptarse a las limitaciones del hardware ha llevado a DeepSeek a innovar en sus métodos de desarrollo.
Un equipo técnico con una visión fresca
DeepSeek ha sido capaz de atraer a un equipo técnico joven y ambicioso, reclutando a investigadores de doctorado de universidades chinas de renombre. La compañía no solo se ha enfocado en científicos de la computación, sino que también ha contratado a personas de diversas disciplinas para enriquecer su enfoque. Esta estrategia diversificada ha permitido a DeepSeek entender y abordar una amplia gama de problemas a través de la IA.
La elección de un equipo técnico diverso refleja una tendencia creciente en la industria de la IA, donde la intersección de diferentes disciplinas puede dar lugar a innovaciones sorprendentes. Además, el compromiso de DeepSeek con la investigación y el desarrollo ha sido clave para su éxito en el lanzamiento de modelos competitivos.
Los modelos que están revolucionando el mercado
DeepSeek lanzó su primer conjunto de modelos en noviembre de 2023, incluyendo DeepSeek Coder, DeepSeek LLM y DeepSeek Chat. Sin embargo, fue el lanzamiento de la familia de modelos DeepSeek-V2 en la primavera de 2024 lo que realmente capturó la atención de la industria. Este sistema de análisis de texto e imagen no solo mostró un rendimiento superior en varios benchmarks de IA, sino que también resultó ser mucho más económico de operar que otros modelos existentes.
La competitividad de DeepSeek ha forzado a gigantes como ByteDance y Alibaba a reducir precios y ofrecer modelos de manera gratuita, alterando así el equilibrio del mercado.
Con el lanzamiento de DeepSeek-V3 en diciembre de 2024, la compañía consolidó su posición como un competidor formidable. Según las pruebas internas de DeepSeek, su modelo V3 supera a otros modelos, incluyendo los de acceso abierto como Llama de Meta y los modelos cerrados como GPT-4 de OpenAI. Esto ha llevado a una reevaluación de las expectativas sobre lo que puede ofrecer una empresa emergente en comparación con los actores establecidos.
Un modelo de razonamiento que destaca
Uno de los lanzamientos más interesantes de DeepSeek ha sido su modelo de razonamiento R1, presentado en enero. Este modelo es capaz de autoevaluarse, lo que significa que puede verificar sus propias respuestas y evitar errores comunes que suelen afectar a otros modelos. Aunque el tiempo de respuesta es un poco más lento que el de los modelos tradicionales, la fiabilidad en áreas como la física y las matemáticas lo convierte en una herramienta valiosa.
Sin embargo, este enfoque tiene sus desventajas. Todos los modelos de DeepSeek, incluidos R1 y V3, están sujetos a regulaciones impuestas por el regulador de internet de China. Esto significa que ciertos temas delicados, como la Plaza de Tiananmen o la autonomía de Taiwán, son intencionadamente evitados en las respuestas generadas por sus modelos. Esta restricción plantea interrogantes sobre la libertad de expresión y la ética en el desarrollo de la IA.
Un modelo de negocio en evolución
El modelo de negocio de DeepSeek es un tema de debate. A diferencia de muchas empresas que optan por estrategias de precios premium, DeepSeek ha elegido ofrecer sus productos a un costo significativamente inferior. Incluso ha decidido regalar algunos de sus servicios, lo que ha generado un revuelo en la comunidad tecnológica.
DeepSeek argumenta que sus avances en eficiencia le permiten ser extremadamente competitivo en precios. Sin embargo, algunos expertos han cuestionado la veracidad de las cifras que la compañía ha presentado. A pesar de estas controversias, los desarrolladores han adoptado rápidamente los modelos de DeepSeek, creando más de 500 modelos derivados de R1, que han acumulado 2,5 millones de descargas en total.
El impacto en el mercado y la reacción de los gigantes tecnológicos
El éxito de DeepSeek ha sido tan significativo que ha comenzado a afectar a empresas mucho más grandes. En un giro inesperado, la valoración de las acciones de Nvidia cayó un 18% en un solo día, lo que refleja la preocupación del mercado por la creciente competencia. El CEO de OpenAI, Sam Altman, se vio obligado a responder públicamente al fenómeno DeepSeek, lo que subraya la magnitud del desafío que representa.
Microsoft ha reconocido el potencial de DeepSeek al integrar sus servicios en la plataforma Azure AI Foundry, una medida que indica la importancia de la startup en el ecosistema de la inteligencia artificial. Durante una llamada de ganancias, el CEO de Meta, Mark Zuckerberg, subrayó que la inversión en infraestructura de IA seguirá siendo una ventaja estratégica para su empresa, sugiriendo que la competencia en este espacio está lejos de terminar.
La respuesta de gobiernos y regulaciones
Sin embargo, no todo es color de rosa para DeepSeek. Algunos países y empresas han decidido prohibir el uso de sus modelos, citando preocupaciones sobre la seguridad y la influencia extranjera. En el estado de Nueva York, por ejemplo, se ha prohibido el uso de DeepSeek en dispositivos gubernamentales, lo que plantea interrogantes sobre la viabilidad a largo plazo de la empresa en el mercado estadounidense.
El temor a una posible influencia dañina de tecnologías extranjeras está llevando a gobiernos a establecer barreras, lo que podría limitar la expansión de DeepSeek en el extranjero.
Mientras tanto, el futuro de DeepSeek sigue siendo incierto. Aunque es probable que continúe mejorando sus modelos, la creciente desconfianza por parte de las autoridades estadounidenses podría obstaculizar su desarrollo y expansión. La intersección entre la innovación tecnológica y la regulación gubernamental se está volviendo cada vez más compleja, y DeepSeek es solo uno de los muchos actores que navegan por este paisaje.
A medida que la competencia en el ámbito de la inteligencia artificial se intensifica, el papel de empresas como DeepSeek se vuelve crucial. Su enfoque disruptivo ha desafiado las normas establecidas y ha abierto un nuevo capítulo en la historia de la inteligencia artificial. Sin duda, todos los ojos estarán puestos en esta empresa para ver cómo se desarrolla en el futuro.
Otras noticias • IA
Apple lanza Apple Intelligence en Vision Pro con nuevas funciones
Apple introduce Apple Intelligence en el Vision Pro con la actualización VisionOS 2.4, mejorando la interacción mediante generación de texto e imágenes. Destacan funciones como...
Incertidumbre laboral tras adquisición de Humane por HP
La adquisición de Humane por HP por 116 millones de dólares ha generado incertidumbre entre sus empleados, con ofertas laborales desiguales y despidos. A pesar...
Apple presenta el iPhone 16e para conquistar el mercado indio
Apple lanza el iPhone 16e, un modelo asequible para el mercado indio, buscando captar consumidores en un entorno competitivo dominado por Android. A pesar de...
Helix revoluciona la robótica doméstica con lenguaje natural
Helix, un modelo de robótica humanoide de Figure, permite a los robots interpretar comandos de lenguaje natural y realizar tareas del hogar. Aunque enfrenta desafíos...
Mercor recauda 100 millones y alcanza valoración de 2.000 millones
Mercor, una startup de reclutamiento impulsada por inteligencia artificial, ha recaudado 100 millones de dólares en su Serie B, alcanzando una valoración de 2.000 millones....
Codeium busca fondos para alcanzar valoración de 2.85 mil millones
Codeium, una startup de programación asistida por IA, está en proceso de recaudar fondos que podrían elevar su valoración a 2.85 mil millones de dólares....
Google retira Gemini de iOS para impulsar descarga independiente
Google ha retirado su asistente de IA, Gemini, de su aplicación principal en iOS para impulsar su descarga como app independiente. Este cambio busca mejorar...
Google lanza Career Dreamer para guiar trayectorias profesionales personalizadas
Career Dreamer de Google es una herramienta de inteligencia artificial que ayuda a los usuarios a explorar trayectorias profesionales personalizadas, creando una narrativa laboral sólida....
Lo más reciente
- 1
DeepSeek lanza R1 y sacude el mercado de la IA
- 2
1X lanza prototipo de robot doméstico Neo Gamma innovador
- 3
Apple News+ Food desafía a aplicaciones de recetas independientes
- 4
Meta abre nuevo centro en India tras despidos masivos
- 5
Sakana AI enfrenta desaceleraciones tras promesas de Nvidia sobre IA
- 6
Controversia por compra de Carbon Engineering por Occidental Petroleum
- 7
Bybit sufre robo de 401,346 ETH, alarma en criptomonedas