Competencia | IA

Anthropic lanza Claude 2.1, rivalizando con GPT de OpenAI

Anthropic lanza Claude 2.1, una mejora en su modelo de lenguaje de IA

La compañía de inteligencia artificial Anthropic acaba de lanzar Claude 2.1, una mejora en su modelo de lenguaje de IA que lo mantiene competitivo en comparación con la serie GPT de OpenAI. Esta nueva versión también cuenta con una característica adicional muy útil: "estar desarrollada por una compañía que no está en guerra consigo misma".

Tres mejoras importantes en Claude 2.1

Esta actualización de Claude presenta tres mejoras principales: ventana de contexto, precisión y extensibilidad.

En cuanto a la ventana de contexto, que se refiere a cuántos datos puede analizar el modelo a la vez, Anthropic ha superado a OpenAI. Sam Altman, el CEO de OpenAI, anunció una ventana de 128.000 tokens en el Dev Day de la compañía, y ahora Claude 2.1 puede manejar hasta 200.000 tokens. Esto es suficiente para analizar "bases de código completas, estados financieros como los S-1 o incluso obras literarias largas como La Ilíada", según informa Anthropic.

Por supuesto, tener más información no significa necesariamente que el modelo la maneje mejor. GPT-4 sigue siendo el estándar de oro en generación de código, por ejemplo, y Claude manejará las solicitudes de manera diferente a sus competidores, algunas veces mejor y otras peor. Es un trabajo en progreso y, en última instancia, los usuarios deberán descubrir la mejor manera de aprovechar esta nueva capacidad.

Mayor precisión y uso de herramientas

La precisión también ha mejorado, según "un amplio conjunto de preguntas complejas y factuales que ponen a prueba las debilidades conocidas de los modelos actuales". Los resultados muestran que Claude 2.1 proporciona menos respuestas incorrectas, tiene menos probabilidades de alucinar y es mejor para estimar cuándo no puede estar seguro, optando por no proporcionar información incorrecta en lugar de hacerlo. Nuevamente, la utilidad práctica de esto solo puede ser evaluada por los usuarios al ponerlo en funcionamiento.

Por último, Claude 2.1 ahora puede utilizar herramientas, al igual que los cuervos y los bonobos. Sin embargo, no se trata de palos afilados para el modelo de lenguaje de IA, sino más bien de una funcionalidad de agente que estamos viendo emerger en modelos destinados a interactuar con interfaces web. Si el modelo determina que la mejor forma de responder una pregunta no es razonándola, sino utilizando una calculadora o una API conocida, lo hará.

Por ejemplo, si no sabe qué automóvil o portátil recomendar a alguien que solicita consejo sobre un producto, puede llamar a un modelo o base de datos mejor equipados para responder esa pregunta, o incluso realizar una búsqueda en la web si es apropiado.

La competencia avanza mientras OpenAI enfrenta problemas internos

Estas mejoras iterativas seguramente serán bien recibidas por los desarrolladores que utilizan regularmente Claude, y demuestran que cada día perdido en luchas de poder en OpenAI puede ser una oportunidad perdida para la competencia. Si bien los modelos de Anthropic pueden no estar siempre al mismo nivel que los de OpenAI, esta industria avanza rápidamente. Unas semanas libres para ponerse al día podrían marcar más diferencia de la que nadie espera.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Lanzamiento

Ex cofundador de OpenAI lanza Safe Superintelligence Inc. en Palo Alto

Ilya Sutskever, ex cofundador de OpenAI, ha lanzado Safe Superintelligence Inc. (SSI) con un enfoque en la seguridad de la IA. La empresa, con sede...

Redes

Snap presenta modelo de difusión de imágenes en tiempo real

Snap ha presentado un modelo de difusión de imágenes en tiempo real para dispositivos que genera experiencias de realidad aumentada vívidas. También ha lanzado herramientas...

Innovación

DeepMind crea tecnología V2A para bandas sonoras automáticas en videos

DeepMind, laboratorio de IA de Google, desarrolla tecnología V2A para generar bandas sonoras automáticas para videos. La herramienta sincroniza música, efectos de sonido y diálogos...

Innovación

Perplexity y Tako revolucionan búsqueda con resultados visuales directos

Perplexity mejora su motor de búsqueda con resultados visuales directos para consultas factuales como el tiempo y la conversión de divisas. La startup colabora con...

Tecnología

TikTok presenta avatares de IA generativa para creadores y marcas

TikTok presenta avatares de IA generativa para creadores y marcas, incluyendo avatares personalizados y de stock, así como una herramienta de doblaje de IA para...

Éxito

Tempus, empresa de pruebas genómicas debuta con éxito en Nasdaq

Tempus, empresa de pruebas genómicas fundada por Eric Lefkosky, debutó en Nasdaq con éxito a pesar de una valoración reducida. Se enfoca en inteligencia artificial...

Nombramiento

Paul Nakasone se une al consejo de OpenAI por ciberseguridad

El exjefe de la NSA, Paul Nakasone, se unirá al consejo de OpenAI para aportar su experiencia en seguridad y protección. Su incorporación refleja el...

Fraude

Accionistas de Tesla demandan a Elon Musk por desviar recursos

Accionistas de Tesla demandan a Elon Musk por iniciar xAI y desviar talento y recursos de la empresa hacia la nueva startup, violando sus deberes...