IA | Verificación automática

AWS lanza herramientas para combatir alucinaciones en IA

Innovaciones en la Nube: AWS Lanza Herramientas para Combatir las Alucinaciones en la IA

En el ámbito de la inteligencia artificial (IA), la fiabilidad de los modelos generativos es un tema de creciente preocupación. Recientemente, Amazon Web Services (AWS) ha dado un paso importante al anunciar su nuevo servicio, denominado Automated Reasoning checks, durante la conferencia re:Invent 2024 en Las Vegas. Este nuevo recurso está diseñado para abordar un fenómeno conocido como "alucinaciones", que se refiere a situaciones en las que un modelo de IA proporciona respuestas inexactas o engañosas. Sin embargo, el enfoque de AWS ha suscitado opiniones encontradas entre los expertos.

AWS se presenta como pionero en la lucha contra las alucinaciones de la IA. En un comunicado de prensa, la compañía afirmó que su herramienta es la “primera” y “única” salvaguarda disponible para mitigar este problema. Pero, a medida que se examina más de cerca, la afirmación puede parecer un tanto exagerada, dado que otras plataformas, como Microsoft y Google, ya han implementado características similares en sus respectivos servicios.

Un Panorama Competitivo

La introducción de Automated Reasoning checks no es un desarrollo aislado. Microsoft lanzó este verano su propia función de Corrección, que también tiene como objetivo identificar y señalar texto generado por IA que pueda contener errores fácticos. De igual manera, Google ofrece una herramienta en su plataforma Vertex AI que permite a los usuarios “anclar” los modelos utilizando datos de proveedores externos, conjuntos de datos propios o incluso búsquedas en Google. Esta creciente competencia en el espacio de la IA pone de relieve la necesidad de que las empresas se diferencien y ofrezcan soluciones innovadoras.

La herramienta de AWS permite a los clientes subir información para establecer una “verdad base”, que luego se utiliza para validar las respuestas generadas por los modelos de IA. Automated Reasoning checks analiza cómo el modelo llegó a una respuesta y determina si es correcta o no. Si se detecta una probable alucinación, la herramienta recurre a la verdad base para proporcionar la respuesta correcta, mostrándola junto a la respuesta errónea para que los clientes puedan apreciar la magnitud del error.

El uso de esta herramienta ya ha sido adoptado por PwC, que está diseñando asistentes de IA para sus clientes, lo que resalta su potencial en el mundo empresarial.

La Realidad Detrás de las Alucinaciones

Es importante entender por qué los modelos de IA experimentan estas alucinaciones. Según un experto en el campo, intentar eliminar las alucinaciones de la IA es como intentar eliminar el hidrógeno del agua. Los modelos de IA son sistemas estadísticos que identifican patrones en una serie de datos y predicen qué datos son los más probables que sigan, basándose en ejemplos previos. Así, las respuestas generadas por un modelo no son respuestas en el sentido estricto, sino predicciones de cómo deberían ser respondidas las preguntas, con un margen de error inherente.

AWS sostiene que Automated Reasoning checks utiliza un razonamiento “lógicamente preciso” y “verificable” para llegar a sus conclusiones. Sin embargo, la compañía no ha proporcionado datos que demuestren la fiabilidad de la herramienta. Esto plantea interrogantes sobre la efectividad real de la solución en la práctica, ya que la eliminación de errores en la IA sigue siendo un desafío considerable.

Nuevas Funciones en Bedrock

Además de Automated Reasoning checks, AWS también ha presentado otra herramienta llamada Model Distillation, que permite transferir las capacidades de un modelo grande a uno más pequeño, lo que puede resultar en un uso más económico y eficiente de los recursos. Este desarrollo responde a la necesidad de optimizar el rendimiento sin comprometer demasiado la precisión.

El proceso de Model Distillation implica que, después de que el cliente proporcione ejemplos de prompts, Amazon Bedrock se encarga de generar respuestas y ajustar el modelo más pequeño. Esto incluye la posibilidad de crear más datos de muestra si es necesario para completar el proceso de destilación. Sin embargo, existen algunas limitaciones. Actualmente, Model Distillation solo funciona con modelos hospedados en Bedrock de proveedores como Anthropic y Meta, y los modelos grandes y pequeños deben pertenecer a la misma "familia", lo que limita la flexibilidad del usuario.

AWS asegura que los modelos destilados perderán solo una precisión de “menos del 2%”, lo que podría ser un incentivo atractivo para aquellos que buscan maximizar su eficiencia.

Colaboración Multigeneracional

Otra de las novedades que ha presentado AWS es la colaboración entre múltiples agentes, una función que permite a los clientes asignar tareas específicas a diferentes modelos de IA dentro de un proyecto más amplio. Esta característica forma parte de Bedrock Agents, la contribución de AWS a la creciente tendencia de agentes de IA.

Los clientes pueden designar un “agente supervisor” que se encargue de dividir y asignar tareas automáticamente a los diferentes modelos de IA. Este agente puede proporcionar a otros agentes acceso a la información necesaria para completar su trabajo y determinar qué acciones se pueden procesar en paralelo. La idea es que, una vez que todos los agentes especializados completen sus aportaciones, el agente supervisor puede reunir la información y sintetizar los resultados.

La implementación de la colaboración entre múltiples agentes es un intento de hacer que los proyectos de IA sean más manejables y eficientes, permitiendo una división del trabajo que puede llevar a resultados más rápidos y precisos.

Expectativas y Desafíos Futuros

Aunque las nuevas características de AWS han generado interés, es importante considerar cómo se desempeñarán en escenarios del mundo real. La comunidad de expertos en IA sigue siendo cautelosa ante las promesas de soluciones rápidas a problemas complejos como las alucinaciones. A medida que las empresas como AWS continúan innovando y ofreciendo nuevas herramientas, será crucial evaluar su efectividad a medida que se integren en aplicaciones comerciales y de consumo.

El crecimiento de la base de clientes de Bedrock, que se ha multiplicado por 4.7 en el último año, sugiere que hay un interés considerable en estas soluciones. Swami Sivasubramanian, VP de IA y datos en AWS, ha indicado que estas nuevas capacidades están diseñadas para resolver algunos de los principales desafíos que enfrenta la industria al llevar aplicaciones de IA generativa a producción. Esto refleja un enfoque en la innovación continua para atraer a más clientes en un mercado competitivo.

La evolución de la IA generativa y su implementación en diversos sectores es un proceso en constante cambio, y herramientas como Automated Reasoning checks y Model Distillation son pasos importantes en esta dirección. La capacidad de las empresas para adaptarse a estos avances tecnológicos y a las necesidades cambiantes del mercado será determinante en su éxito futuro. A medida que se desarrollan y despliegan estas herramientas, el verdadero impacto de estas innovaciones solo podrá ser juzgado con el tiempo.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Crecimiento inesperado

Apple crece un 6% en ventas de Mac por IA

Apple ha sorprendido con un crecimiento del 6% en las ventas de Mac, impulsado por la demanda de inteligencia artificial. Dispositivos como el MacBook Neo...

Transformación legal

Inteligencia artificial revoluciona el sector legal con Legora

La inteligencia artificial está transformando el sector legal, destacando la inversión de NVentures en Legora, una startup que optimiza el trabajo de abogados. La competencia...

Revolución automotriz

Google presenta Gemini, la IA que transformará la conducción

Google lanzará su sistema de IA, Gemini, en vehículos con Google integrado, mejorando la interacción entre conductores y coches. Con funciones como conversaciones en tiempo...

Diagnóstico prenatal

BioticsAI transforma diagnóstico prenatal con IA y FDA aprobada

BioticsAI, cofundada por Robhy Bustami, está revolucionando el diagnóstico prenatal mediante un copiloto de IA para ultrasonidos. Con la aprobación de la FDA, la empresa...

Desafíos éticos

Elon Musk revela desafíos éticos en distilación de IA

La distilación en inteligencia artificial, revelada por Elon Musk en un juicio contra OpenAI, plantea desafíos éticos y de competencia. Gigantes tecnológicos como OpenAI y...

Seguridad avanzada

OpenAI y Yubico lanzan llaves de seguridad para ChatGPT

OpenAI ha lanzado el sistema Advanced Account Security (AAS) en colaboración con Yubico, introduciendo llaves de seguridad para proteger cuentas de ChatGPT contra el phishing....

Cartera digital

Stripe lanza Link, cartera digital con inteligencia artificial integrada

Stripe ha lanzado Link, una cartera digital que integra inteligencia artificial para facilitar pagos y gestionar finanzas. Permite vincular múltiples métodos de pago, rastrear gastos...

Era publicitaria

Elon Musk transforma X con inteligencia artificial para anunciantes

Elon Musk impulsa a X (antes Twitter) hacia una nueva era publicitaria con un sistema basado en inteligencia artificial, buscando recuperar la confianza de los...