IA | Inteligencia

X.ai lanza Grok-1.5, IA generativa con mejoras en razonamiento

X.ai presenta su última versión del modelo de IA generativa Grok-1.5

X.ai, la startup de IA de Elon Musk, ha revelado su último modelo de IA generativa, Grok-1.5. Diseñado para alimentar el chatbot Grok de la red social X en un futuro no muy lejano ("en los próximos días", escribe X.ai en una publicación de blog), Grok-1.5 parece ser una mejora medible con respecto a su predecesor, Grok-1, al menos según los resultados de referencia y especificaciones que X ha publicado.

Mejoras significativas en razonamiento y contexto

Grok-1.5 se beneficia de un "razonamiento mejorado", según X.ai, especialmente en lo que respecta a tareas relacionadas con la programación y las matemáticas. El modelo más que duplica la puntuación de Grok-1 en un popular benchmark de matemáticas, MATH, y obtiene más de diez puntos porcentuales mejor en la prueba HumanEval de generación de lenguaje de programación y habilidades para resolver problemas. Sin embargo, es difícil predecir cómo se traducirán estos resultados en el uso real, ya que los benchmarks de IA comúnmente utilizados no capturan adecuadamente cómo interactúa la persona promedio con los modelos hoy en día.

Una mejora que debería llevar a ganancias observables es la cantidad de contexto que Grok-1.5 puede tener en comparación con Grok-1. Grok-1.5 tiene un contexto de 128.000 tokens, lo que se refiere a fragmentos de texto en bruto (por ejemplo, la palabra "fantástico" dividida en "fan", "tas" y "tic"). Los modelos con ventanas de contexto pequeñas tienden a olvidar el contenido de conversaciones incluso muy recientes, mientras que los modelos con contextos más grandes evitan este problema y, como beneficio adicional, comprenden mejor el flujo de datos que reciben.

Posibles cambios en la capacidad de respuesta y funciones adicionales

Históricamente, lo que ha diferenciado a los modelos Grok de X.ai de otros modelos de IA generativa es que responden a preguntas sobre temas que suelen estar fuera de los límites para otros modelos, como conspiraciones e ideas políticas más controvertidas. Los modelos también responden a preguntas con "un toque rebelde", como lo ha descrito Musk, e incluso con un lenguaje descarado si se solicita. Aún no está claro qué cambios, si los hay, Grok-1.5 trae en estas áreas, ya que X.ai no hace referencia a ello en la publicación del blog.

X.ai dice que Grok-1.5 estará disponible pronto para probadores tempranos en X, acompañado de "varias nuevas funciones". Musk ha insinuado anteriormente la posibilidad de resumir hilos y respuestas y sugerir contenido para publicaciones; veremos si llegan lo suficientemente pronto. El anuncio de Grok-1.5 llega después de que X.ai hiciera de código abierto Grok-1, aunque sin el código necesario para ajustarlo o entrenarlo aún más. Más recientemente, Musk dijo que más usuarios en X, específicamente aquellos que pagan por el plan Premium de $8 al mes de X, tendrían acceso a Grok, el chatbot, que anteriormente solo estaba disponible para los clientes Premium+ de X (que pagan $16 al mes).


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Gestión IA

Anysphere lanza app web para gestionar agentes de codificación IA

Anysphere ha lanzado una aplicación web para gestionar agentes de codificación impulsados por IA, mejorando la productividad de los desarrolladores. Esta herramienta permite asignar tareas...

IA errática

Claudius, la IA que gestiona una expendedora, sorprende y divierte

El experimento "Project Vend" con Claudius, un agente de IA que gestiona una máquina expendedora, revela su comportamiento errático y cómico al tomar decisiones absurdas....

Competencia creativa

Inteligencia artificial: talento busca impacto más que salario alto

La inteligencia artificial está en auge, con empresas como Meta compitiendo por atraer talento mediante ofertas salariales complejas. Investigadores valoran más que el dinero, buscando...

Impacto laboral

Anthropic lanza programa para investigar impacto de la IA en empleo

Anthropic ha lanzado el programa "Futuros Económicos" para investigar el impacto de la IA en el empleo y la economía. Se centra en subvenciones para...

Privacidad cuestionada

Facebook propone editar fotos pero genera dudas sobre privacidad

Facebook, bajo Meta, propone acceder a la galería de fotos de los usuarios para sugerir ediciones, generando preocupaciones sobre la privacidad y el consentimiento. La...

Competencia intensa

Competencia por talento en IA: startups vs grandes empresas

La competencia por talento en inteligencia artificial es intensa, con empresas como Meta ofreciendo compensaciones atractivas, aunque no siempre en efectivo inmediato. Muchos investigadores prefieren...

Recomendaciones éticas

Crossing Minds y OpenAI transforman el comercio electrónico ético

Crossing Minds se une a OpenAI para revolucionar el comercio electrónico mediante sistemas de recomendación basados en IA, priorizando la ética y la privacidad. La...

Ética cuestionable

Cluely recauda 15 millones pero enfrenta dudas éticas y de calidad

Cluely, una startup controvertida que promueve el "engaño", ha recaudado 15 millones de dólares de Andreessen Horowitz. Su enfoque de marketing provocador genera atención, pero...