IA | Verificación automática

AWS lanza herramientas para combatir alucinaciones en IA

Innovaciones en la Nube: AWS Lanza Herramientas para Combatir las Alucinaciones en la IA

En el ámbito de la inteligencia artificial (IA), la fiabilidad de los modelos generativos es un tema de creciente preocupación. Recientemente, Amazon Web Services (AWS) ha dado un paso importante al anunciar su nuevo servicio, denominado Automated Reasoning checks, durante la conferencia re:Invent 2024 en Las Vegas. Este nuevo recurso está diseñado para abordar un fenómeno conocido como "alucinaciones", que se refiere a situaciones en las que un modelo de IA proporciona respuestas inexactas o engañosas. Sin embargo, el enfoque de AWS ha suscitado opiniones encontradas entre los expertos.

AWS se presenta como pionero en la lucha contra las alucinaciones de la IA. En un comunicado de prensa, la compañía afirmó que su herramienta es la “primera” y “única” salvaguarda disponible para mitigar este problema. Pero, a medida que se examina más de cerca, la afirmación puede parecer un tanto exagerada, dado que otras plataformas, como Microsoft y Google, ya han implementado características similares en sus respectivos servicios.

Un Panorama Competitivo

La introducción de Automated Reasoning checks no es un desarrollo aislado. Microsoft lanzó este verano su propia función de Corrección, que también tiene como objetivo identificar y señalar texto generado por IA que pueda contener errores fácticos. De igual manera, Google ofrece una herramienta en su plataforma Vertex AI que permite a los usuarios “anclar” los modelos utilizando datos de proveedores externos, conjuntos de datos propios o incluso búsquedas en Google. Esta creciente competencia en el espacio de la IA pone de relieve la necesidad de que las empresas se diferencien y ofrezcan soluciones innovadoras.

La herramienta de AWS permite a los clientes subir información para establecer una “verdad base”, que luego se utiliza para validar las respuestas generadas por los modelos de IA. Automated Reasoning checks analiza cómo el modelo llegó a una respuesta y determina si es correcta o no. Si se detecta una probable alucinación, la herramienta recurre a la verdad base para proporcionar la respuesta correcta, mostrándola junto a la respuesta errónea para que los clientes puedan apreciar la magnitud del error.

El uso de esta herramienta ya ha sido adoptado por PwC, que está diseñando asistentes de IA para sus clientes, lo que resalta su potencial en el mundo empresarial.

La Realidad Detrás de las Alucinaciones

Es importante entender por qué los modelos de IA experimentan estas alucinaciones. Según un experto en el campo, intentar eliminar las alucinaciones de la IA es como intentar eliminar el hidrógeno del agua. Los modelos de IA son sistemas estadísticos que identifican patrones en una serie de datos y predicen qué datos son los más probables que sigan, basándose en ejemplos previos. Así, las respuestas generadas por un modelo no son respuestas en el sentido estricto, sino predicciones de cómo deberían ser respondidas las preguntas, con un margen de error inherente.

AWS sostiene que Automated Reasoning checks utiliza un razonamiento “lógicamente preciso” y “verificable” para llegar a sus conclusiones. Sin embargo, la compañía no ha proporcionado datos que demuestren la fiabilidad de la herramienta. Esto plantea interrogantes sobre la efectividad real de la solución en la práctica, ya que la eliminación de errores en la IA sigue siendo un desafío considerable.

Nuevas Funciones en Bedrock

Además de Automated Reasoning checks, AWS también ha presentado otra herramienta llamada Model Distillation, que permite transferir las capacidades de un modelo grande a uno más pequeño, lo que puede resultar en un uso más económico y eficiente de los recursos. Este desarrollo responde a la necesidad de optimizar el rendimiento sin comprometer demasiado la precisión.

El proceso de Model Distillation implica que, después de que el cliente proporcione ejemplos de prompts, Amazon Bedrock se encarga de generar respuestas y ajustar el modelo más pequeño. Esto incluye la posibilidad de crear más datos de muestra si es necesario para completar el proceso de destilación. Sin embargo, existen algunas limitaciones. Actualmente, Model Distillation solo funciona con modelos hospedados en Bedrock de proveedores como Anthropic y Meta, y los modelos grandes y pequeños deben pertenecer a la misma "familia", lo que limita la flexibilidad del usuario.

AWS asegura que los modelos destilados perderán solo una precisión de “menos del 2%”, lo que podría ser un incentivo atractivo para aquellos que buscan maximizar su eficiencia.

Colaboración Multigeneracional

Otra de las novedades que ha presentado AWS es la colaboración entre múltiples agentes, una función que permite a los clientes asignar tareas específicas a diferentes modelos de IA dentro de un proyecto más amplio. Esta característica forma parte de Bedrock Agents, la contribución de AWS a la creciente tendencia de agentes de IA.

Los clientes pueden designar un “agente supervisor” que se encargue de dividir y asignar tareas automáticamente a los diferentes modelos de IA. Este agente puede proporcionar a otros agentes acceso a la información necesaria para completar su trabajo y determinar qué acciones se pueden procesar en paralelo. La idea es que, una vez que todos los agentes especializados completen sus aportaciones, el agente supervisor puede reunir la información y sintetizar los resultados.

La implementación de la colaboración entre múltiples agentes es un intento de hacer que los proyectos de IA sean más manejables y eficientes, permitiendo una división del trabajo que puede llevar a resultados más rápidos y precisos.

Expectativas y Desafíos Futuros

Aunque las nuevas características de AWS han generado interés, es importante considerar cómo se desempeñarán en escenarios del mundo real. La comunidad de expertos en IA sigue siendo cautelosa ante las promesas de soluciones rápidas a problemas complejos como las alucinaciones. A medida que las empresas como AWS continúan innovando y ofreciendo nuevas herramientas, será crucial evaluar su efectividad a medida que se integren en aplicaciones comerciales y de consumo.

El crecimiento de la base de clientes de Bedrock, que se ha multiplicado por 4.7 en el último año, sugiere que hay un interés considerable en estas soluciones. Swami Sivasubramanian, VP de IA y datos en AWS, ha indicado que estas nuevas capacidades están diseñadas para resolver algunos de los principales desafíos que enfrenta la industria al llevar aplicaciones de IA generativa a producción. Esto refleja un enfoque en la innovación continua para atraer a más clientes en un mercado competitivo.

La evolución de la IA generativa y su implementación en diversos sectores es un proceso en constante cambio, y herramientas como Automated Reasoning checks y Model Distillation son pasos importantes en esta dirección. La capacidad de las empresas para adaptarse a estos avances tecnológicos y a las necesidades cambiantes del mercado será determinante en su éxito futuro. A medida que se desarrollan y despliegan estas herramientas, el verdadero impacto de estas innovaciones solo podrá ser juzgado con el tiempo.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Crecimiento tecnológico

India alcanza 100 millones de usuarios semanales de ChatGPT

India cuenta con 100 millones de usuarios semanales de ChatGPT, convirtiéndose en el segundo mayor mercado tras EE. UU. La juventud y el interés en...

Preocupación creativa

Hollywood teme por derechos de autor tras llegada de Seedance 2.0

La llegada de Seedance 2.0, un modelo de IA para crear vídeos, ha generado preocupación en Hollywood por violaciones de derechos de autor. La industria...

Disminución matrícula

Disminuye matrícula en informática mientras surgen programas de IA

La matrícula en informática en universidades de California ha disminuido un 6%, reflejando preocupaciones sobre el empleo tras la graduación. En respuesta, muchas instituciones están...

Controversia legal

Controversia en Hollywood por la llegada de Seedance 2.0

La llegada de Seedance 2.0, un modelo de IA de ByteDance, ha generado controversia en Hollywood por facilitar infracciones de derechos de autor. La industria...

Fondo emprendedor

Gobierno indio destina 1.1 mil millones a startups innovadoras

El gobierno indio lanza un programa de capital de riesgo de 1.1 mil millones de dólares para apoyar startups en sectores como inteligencia artificial y...

Inteligencia artificial

Airbnb integra IA para personalizar experiencias y optimizar propiedades

Airbnb está integrando inteligencia artificial para personalizar la experiencia del usuario y optimizar la gestión de propiedades. Con funciones de búsqueda en lenguaje natural y...

Atención personalizada

Airbnb transforma atención al cliente con inteligencia artificial innovadora

Airbnb está revolucionando su atención al cliente mediante la inteligencia artificial, gestionando un tercio de las consultas en América del Norte. Con un enfoque en...

Éxito publicitario

Claude de Anthropic se dispara en descargas tras Super Bowl

La campaña publicitaria de Anthropic durante el Super Bowl ha impulsado significativamente las descargas de su chatbot, Claude, gracias a su enfoque creativo y humorístico....