IA | Inteligencia híbrida

Deep Cogito presenta modelos híbridos de IA para superinteligencia

La nueva era de la inteligencia artificial: Deep Cogito y sus innovadores modelos híbridos

En el mundo de la inteligencia artificial, el desarrollo de modelos que puedan razonar y aprender de forma autónoma ha sido un objetivo ambicioso durante años. La reciente aparición de la empresa Deep Cogito ha marcado un hito significativo en este ámbito, presentando una familia de modelos de IA que combinan razonamiento y no razonamiento, ofreciendo una versatilidad sin precedentes. La compañía, que ha salido de un período de sigilo, ha revelado su modelo insignia, Cogito 1, que promete revolucionar la forma en que interactuamos con la inteligencia artificial.

Innovación en modelos híbridos

Deep Cogito ha desarrollado modelos híbridos que se adaptan a diferentes necesidades de procesamiento. A diferencia de otros modelos que requieren una gran cantidad de recursos para realizar tareas complejas, los modelos de Cogito pueden alternar entre un modo de razonamiento y un modo más sencillo, optimizando así el uso de la capacidad computacional. Esta flexibilidad permite que los modelos respondan a preguntas simples de manera rápida, mientras que se toma el tiempo necesario para analizar preguntas más complejas.

El avance en la inteligencia artificial se ha visto acompañado de una creciente demanda por modelos que no solo sean potentes, sino también eficientes. La capacidad de estos modelos de razonar y reflexionar antes de proporcionar una respuesta puede cambiar las reglas del juego en campos como la educación, la investigación y la toma de decisiones empresariales.

Un equipo pequeño, un gran impacto

Deep Cogito ha logrado desarrollar sus modelos en un tiempo sorprendentemente corto. Con un equipo reducido que trabajó durante aproximadamente 75 días, la compañía ha creado una serie de modelos que van desde 3 mil millones hasta 70 mil millones de parámetros. Estos parámetros son esenciales, ya que determinan la habilidad del modelo para resolver problemas; a mayor número de parámetros, generalmente mejor será el rendimiento.

La estrategia de Deep Cogito no se basa en la creación de modelos desde cero, sino en la mejora de modelos existentes. Han utilizado como base los modelos abiertos Llama de Meta y Qwen de Alibaba, a los que han aplicado enfoques de entrenamiento innovadores para potenciar su rendimiento. Esto demuestra que la colaboración y la mejora continua son clave en el campo de la inteligencia artificial.

La combinación de modelos híbridos permite a Deep Cogito no solo competir, sino superar a otros modelos populares en el mercado, incluidos aquellos desarrollados por gigantes como Meta y DeepSeek.

Resultados que hablan por sí mismos

Los resultados de las pruebas internas de Deep Cogito son prometedores. El modelo más grande de la serie, Cogito 70B, ha demostrado superar a otros modelos en evaluaciones de matemáticas y lenguaje. En particular, cuando se activa el modo de razonamiento, este modelo se desempeña mejor que el modelo de razonamiento R1 de DeepSeek en varias métricas. Además, cuando el razonamiento está desactivado, el Cogito 70B también supera al recientemente lanzado Llama 4 Scout de Meta en LiveBench, una prueba de IA de propósito general.

Estos resultados no solo son un testimonio de la eficacia de los modelos de Deep Cogito, sino que también resaltan la competencia feroz en el espacio de la inteligencia artificial. A medida que más empresas ingresan al mercado, la innovación y la mejora continua se vuelven esenciales para mantenerse relevantes.

Acceso y disponibilidad

Una de las características más destacadas de Deep Cogito es su compromiso con la accesibilidad. Todos los modelos Cogito 1 están disponibles para descarga o uso a través de APIs en proveedores de nube como Fireworks AI y Together AI. Esto permite que investigadores, desarrolladores y empresas puedan experimentar con estos modelos sin necesidad de realizar una gran inversión inicial.

La accesibilidad de los modelos de Cogito no solo democratiza el acceso a la inteligencia artificial, sino que también fomenta la innovación en diversos sectores al permitir que más personas exploren sus capacidades.

La visión a largo plazo de Deep Cogito

Fundada en junio de 2024, Deep Cogito es una empresa joven pero ambiciosa. Sus cofundadores, Drishan Arora y Dhruv Malhotra, tienen un historial impresionante en el campo de la inteligencia artificial. Malhotra, quien fue gerente de producto en Google AI lab DeepMind, aportó su experiencia en tecnología de búsqueda generativa, mientras que Arora, como ingeniero de software senior en Google, ha trabajado en proyectos que exigen un alto nivel de complejidad técnica.

La visión de Deep Cogito va más allá de los modelos híbridos actuales. La empresa tiene como objetivo construir una "superinteligencia general" que pueda realizar tareas mejor que la mayoría de los humanos y descubrir capacidades completamente nuevas que aún no hemos imaginado. Este objetivo ambicioso plantea preguntas sobre el futuro de la inteligencia artificial y su impacto en la sociedad.

Desafíos en el camino hacia la superinteligencia

A pesar de los logros de Deep Cogito, el camino hacia la superinteligencia no está exento de desafíos. La competencia en el campo de la inteligencia artificial es feroz, con numerosas empresas y laboratorios de investigación que luchan por estar a la vanguardia de la innovación. Además, los problemas éticos relacionados con el uso de la inteligencia artificial, como la privacidad de los datos y el sesgo algorítmico, siguen siendo preocupaciones importantes que deben abordarse.

La empresa ha declarado que actualmente se encuentra en las primeras etapas de su curva de escalado, utilizando solo una fracción de la capacidad computacional típicamente reservada para el entrenamiento de modelos de lenguaje a gran escala. Esto sugiere que Deep Cogito aún tiene mucho potencial por explorar y que las mejoras en sus modelos podrían ser significativas en el futuro cercano.

Mirando hacia el futuro

Deep Cogito ha comenzado a investigar enfoques complementarios de post-entrenamiento para mejorar aún más sus modelos. Este tipo de investigación es crucial para mantener la competitividad en un campo que evoluciona rápidamente. La capacidad de automejorarse es una característica que podría diferenciar a Deep Cogito de otros competidores en el espacio de la inteligencia artificial.

El compromiso de la empresa con la innovación y la mejora continua es un indicativo de su deseo de ser un jugador clave en la revolución de la inteligencia artificial. Con la promesa de modelos que no solo resuelven problemas, sino que también razonan y aprenden, Deep Cogito podría cambiar la forma en que interactuamos con la tecnología en los años venideros.

Conclusiones preliminares

Deep Cogito está posicionándose como un actor importante en el panorama de la inteligencia artificial. Con su enfoque en modelos híbridos y su visión de construir una superinteligencia general, la empresa no solo está innovando, sino que también está planteando preguntas sobre el futuro de la IA y su lugar en nuestra sociedad. Con un equipo talentoso y una ambiciosa hoja de ruta, Deep Cogito tiene el potencial de influir en el desarrollo de la inteligencia artificial en los próximos años.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Suscripción intermedia

OpenAI lanza plan de suscripción para desarrolladores a 100 dólares

OpenAI ha lanzado un nuevo plan de suscripción de 100 dólares al mes para desarrolladores, ofreciendo mayor capacidad de codificación con Codex. Este plan se...

Crisis cibernética

Mercor enfrenta crisis tras brecha de datos sensible y demandas

Mercor, una startup de inteligencia artificial, enfrenta una crisis tras una brecha de datos que comprometió información sensible. La situación ha llevado a la suspensión...

Tiroteo tecnológico

Tiroteo en Florida genera demanda contra OpenAI por ChatGPT

Un tiroteo en la Universidad Estatal de Florida, donde se alega que el atacante usó ChatGPT para planificar el ataque, ha llevado a una demanda...

Acceso restringido

Anthropic limita acceso a Mythos para priorizar seguridad cibernética

Anthropic ha restringido el acceso a su modelo de IA, Mythos, para detectar vulnerabilidades en software, priorizando la seguridad y la colaboración entre grandes empresas....

IA multimodal

Meta lanza Muse Spark y escala en la App Store

Meta ha lanzado Muse Spark, un modelo de IA que ha impulsado su aplicación Meta AI al 5º puesto en la App Store de EE....

Estrategia tecnológica

Amazon refuerza su liderazgo tecnológico con inteligencia artificial y satélites

En su carta a los accionistas, Andy Jassy destaca la estrategia de Amazon en inteligencia artificial con Trainium, la competencia con Intel mediante Graviton, el...

Inversión ética

AWS invierte 50.000 millones en OpenAI y genera controversia

Amazon Web Services (AWS) ha invertido 50.000 millones de dólares en OpenAI, generando debates sobre ética y competencia. Matt Garman, CEO de AWS, defiende la...

Recomendaciones personalizadas

Tubi integra ChatGPT para recomendaciones personalizadas de contenido

Tubi ha lanzado una integración con ChatGPT, permitiendo a los usuarios recibir recomendaciones personalizadas de su vasta biblioteca de contenido mediante lenguaje natural. Esta innovación...