IA | Verificación automática

AWS lanza herramientas para combatir alucinaciones en IA

Innovaciones en la Nube: AWS Lanza Herramientas para Combatir las Alucinaciones en la IA

En el ámbito de la inteligencia artificial (IA), la fiabilidad de los modelos generativos es un tema de creciente preocupación. Recientemente, Amazon Web Services (AWS) ha dado un paso importante al anunciar su nuevo servicio, denominado Automated Reasoning checks, durante la conferencia re:Invent 2024 en Las Vegas. Este nuevo recurso está diseñado para abordar un fenómeno conocido como "alucinaciones", que se refiere a situaciones en las que un modelo de IA proporciona respuestas inexactas o engañosas. Sin embargo, el enfoque de AWS ha suscitado opiniones encontradas entre los expertos.

AWS se presenta como pionero en la lucha contra las alucinaciones de la IA. En un comunicado de prensa, la compañía afirmó que su herramienta es la “primera” y “única” salvaguarda disponible para mitigar este problema. Pero, a medida que se examina más de cerca, la afirmación puede parecer un tanto exagerada, dado que otras plataformas, como Microsoft y Google, ya han implementado características similares en sus respectivos servicios.

Un Panorama Competitivo

La introducción de Automated Reasoning checks no es un desarrollo aislado. Microsoft lanzó este verano su propia función de Corrección, que también tiene como objetivo identificar y señalar texto generado por IA que pueda contener errores fácticos. De igual manera, Google ofrece una herramienta en su plataforma Vertex AI que permite a los usuarios “anclar” los modelos utilizando datos de proveedores externos, conjuntos de datos propios o incluso búsquedas en Google. Esta creciente competencia en el espacio de la IA pone de relieve la necesidad de que las empresas se diferencien y ofrezcan soluciones innovadoras.

La herramienta de AWS permite a los clientes subir información para establecer una “verdad base”, que luego se utiliza para validar las respuestas generadas por los modelos de IA. Automated Reasoning checks analiza cómo el modelo llegó a una respuesta y determina si es correcta o no. Si se detecta una probable alucinación, la herramienta recurre a la verdad base para proporcionar la respuesta correcta, mostrándola junto a la respuesta errónea para que los clientes puedan apreciar la magnitud del error.

El uso de esta herramienta ya ha sido adoptado por PwC, que está diseñando asistentes de IA para sus clientes, lo que resalta su potencial en el mundo empresarial.

La Realidad Detrás de las Alucinaciones

Es importante entender por qué los modelos de IA experimentan estas alucinaciones. Según un experto en el campo, intentar eliminar las alucinaciones de la IA es como intentar eliminar el hidrógeno del agua. Los modelos de IA son sistemas estadísticos que identifican patrones en una serie de datos y predicen qué datos son los más probables que sigan, basándose en ejemplos previos. Así, las respuestas generadas por un modelo no son respuestas en el sentido estricto, sino predicciones de cómo deberían ser respondidas las preguntas, con un margen de error inherente.

AWS sostiene que Automated Reasoning checks utiliza un razonamiento “lógicamente preciso” y “verificable” para llegar a sus conclusiones. Sin embargo, la compañía no ha proporcionado datos que demuestren la fiabilidad de la herramienta. Esto plantea interrogantes sobre la efectividad real de la solución en la práctica, ya que la eliminación de errores en la IA sigue siendo un desafío considerable.

Nuevas Funciones en Bedrock

Además de Automated Reasoning checks, AWS también ha presentado otra herramienta llamada Model Distillation, que permite transferir las capacidades de un modelo grande a uno más pequeño, lo que puede resultar en un uso más económico y eficiente de los recursos. Este desarrollo responde a la necesidad de optimizar el rendimiento sin comprometer demasiado la precisión.

El proceso de Model Distillation implica que, después de que el cliente proporcione ejemplos de prompts, Amazon Bedrock se encarga de generar respuestas y ajustar el modelo más pequeño. Esto incluye la posibilidad de crear más datos de muestra si es necesario para completar el proceso de destilación. Sin embargo, existen algunas limitaciones. Actualmente, Model Distillation solo funciona con modelos hospedados en Bedrock de proveedores como Anthropic y Meta, y los modelos grandes y pequeños deben pertenecer a la misma "familia", lo que limita la flexibilidad del usuario.

AWS asegura que los modelos destilados perderán solo una precisión de “menos del 2%”, lo que podría ser un incentivo atractivo para aquellos que buscan maximizar su eficiencia.

Colaboración Multigeneracional

Otra de las novedades que ha presentado AWS es la colaboración entre múltiples agentes, una función que permite a los clientes asignar tareas específicas a diferentes modelos de IA dentro de un proyecto más amplio. Esta característica forma parte de Bedrock Agents, la contribución de AWS a la creciente tendencia de agentes de IA.

Los clientes pueden designar un “agente supervisor” que se encargue de dividir y asignar tareas automáticamente a los diferentes modelos de IA. Este agente puede proporcionar a otros agentes acceso a la información necesaria para completar su trabajo y determinar qué acciones se pueden procesar en paralelo. La idea es que, una vez que todos los agentes especializados completen sus aportaciones, el agente supervisor puede reunir la información y sintetizar los resultados.

La implementación de la colaboración entre múltiples agentes es un intento de hacer que los proyectos de IA sean más manejables y eficientes, permitiendo una división del trabajo que puede llevar a resultados más rápidos y precisos.

Expectativas y Desafíos Futuros

Aunque las nuevas características de AWS han generado interés, es importante considerar cómo se desempeñarán en escenarios del mundo real. La comunidad de expertos en IA sigue siendo cautelosa ante las promesas de soluciones rápidas a problemas complejos como las alucinaciones. A medida que las empresas como AWS continúan innovando y ofreciendo nuevas herramientas, será crucial evaluar su efectividad a medida que se integren en aplicaciones comerciales y de consumo.

El crecimiento de la base de clientes de Bedrock, que se ha multiplicado por 4.7 en el último año, sugiere que hay un interés considerable en estas soluciones. Swami Sivasubramanian, VP de IA y datos en AWS, ha indicado que estas nuevas capacidades están diseñadas para resolver algunos de los principales desafíos que enfrenta la industria al llevar aplicaciones de IA generativa a producción. Esto refleja un enfoque en la innovación continua para atraer a más clientes en un mercado competitivo.

La evolución de la IA generativa y su implementación en diversos sectores es un proceso en constante cambio, y herramientas como Automated Reasoning checks y Model Distillation son pasos importantes en esta dirección. La capacidad de las empresas para adaptarse a estos avances tecnológicos y a las necesidades cambiantes del mercado será determinante en su éxito futuro. A medida que se desarrollan y despliegan estas herramientas, el verdadero impacto de estas innovaciones solo podrá ser juzgado con el tiempo.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Colaboración digital

Microsoft adquiere Cove para revolucionar la colaboración con IA

Microsoft ha adquirido Cove, una startup centrada en herramientas de colaboración impulsadas por inteligencia artificial. Esta fusión promete transformar la interacción en el trabajo, integrando...

Personalización digital

Sequen revoluciona la personalización digital sin cookies

Sequen, una startup fundada por Zoë Weil, democratiza la personalización digital con tecnología avanzada que evita el uso de cookies. Su plataforma RankTune permite a...

Tensiones regulatorias

Tensiones entre defensa y regulación de inteligencia artificial en EE. UU

El enfrentamiento entre el Departamento de Defensa de EE. UU. y Anthropic destaca las tensiones entre la regulación de la inteligencia artificial y la seguridad...

Acuerdo ético

OpenAI y Amazon colaboran en IA para el gobierno de EE. UU

OpenAI y Amazon Web Services han firmado un acuerdo para comercializar inteligencia artificial al gobierno de EE. UU., ampliando la presencia de OpenAI en el...

Reinvención tecnológica

BuzzFeed lanza Branch Office para fusionar creatividad y tecnología

BuzzFeed se reinventa con Branch Office, enfocándose en aplicaciones de IA como BF Island y Conjure. Aunque la presentación en SXSW fue tibia, la compañía...

Interacciones personalizadas

Google lanza Inteligencia Personal para usuarios en EE. UU

Google ha ampliado su función de Inteligencia Personal a todos los usuarios en EE. UU., permitiendo interacciones más personalizadas con sus dispositivos. Esta herramienta utiliza...

Identidad digital

Tools for Humanity lanza AgentKit para verificar identidades digitales

La startup Tools for Humanity ha lanzado AgentKit, una herramienta que verifica la identidad de usuarios mediante el World ID, un código digital generado por...

Diversidad necesaria

Rana el Kaliouby impulsa diversidad para potenciar la inteligencia artificial

Rana el Kaliouby destaca la importancia de la diversidad en la inteligencia artificial, advirtiendo que su falta puede limitar el potencial económico y ético del...