IA | Verificación automática

AWS lanza herramientas para combatir alucinaciones en IA

Innovaciones en la Nube: AWS Lanza Herramientas para Combatir las Alucinaciones en la IA

En el ámbito de la inteligencia artificial (IA), la fiabilidad de los modelos generativos es un tema de creciente preocupación. Recientemente, Amazon Web Services (AWS) ha dado un paso importante al anunciar su nuevo servicio, denominado Automated Reasoning checks, durante la conferencia re:Invent 2024 en Las Vegas. Este nuevo recurso está diseñado para abordar un fenómeno conocido como "alucinaciones", que se refiere a situaciones en las que un modelo de IA proporciona respuestas inexactas o engañosas. Sin embargo, el enfoque de AWS ha suscitado opiniones encontradas entre los expertos.

AWS se presenta como pionero en la lucha contra las alucinaciones de la IA. En un comunicado de prensa, la compañía afirmó que su herramienta es la “primera” y “única” salvaguarda disponible para mitigar este problema. Pero, a medida que se examina más de cerca, la afirmación puede parecer un tanto exagerada, dado que otras plataformas, como Microsoft y Google, ya han implementado características similares en sus respectivos servicios.

Un Panorama Competitivo

La introducción de Automated Reasoning checks no es un desarrollo aislado. Microsoft lanzó este verano su propia función de Corrección, que también tiene como objetivo identificar y señalar texto generado por IA que pueda contener errores fácticos. De igual manera, Google ofrece una herramienta en su plataforma Vertex AI que permite a los usuarios “anclar” los modelos utilizando datos de proveedores externos, conjuntos de datos propios o incluso búsquedas en Google. Esta creciente competencia en el espacio de la IA pone de relieve la necesidad de que las empresas se diferencien y ofrezcan soluciones innovadoras.

La herramienta de AWS permite a los clientes subir información para establecer una “verdad base”, que luego se utiliza para validar las respuestas generadas por los modelos de IA. Automated Reasoning checks analiza cómo el modelo llegó a una respuesta y determina si es correcta o no. Si se detecta una probable alucinación, la herramienta recurre a la verdad base para proporcionar la respuesta correcta, mostrándola junto a la respuesta errónea para que los clientes puedan apreciar la magnitud del error.

El uso de esta herramienta ya ha sido adoptado por PwC, que está diseñando asistentes de IA para sus clientes, lo que resalta su potencial en el mundo empresarial.

La Realidad Detrás de las Alucinaciones

Es importante entender por qué los modelos de IA experimentan estas alucinaciones. Según un experto en el campo, intentar eliminar las alucinaciones de la IA es como intentar eliminar el hidrógeno del agua. Los modelos de IA son sistemas estadísticos que identifican patrones en una serie de datos y predicen qué datos son los más probables que sigan, basándose en ejemplos previos. Así, las respuestas generadas por un modelo no son respuestas en el sentido estricto, sino predicciones de cómo deberían ser respondidas las preguntas, con un margen de error inherente.

AWS sostiene que Automated Reasoning checks utiliza un razonamiento “lógicamente preciso” y “verificable” para llegar a sus conclusiones. Sin embargo, la compañía no ha proporcionado datos que demuestren la fiabilidad de la herramienta. Esto plantea interrogantes sobre la efectividad real de la solución en la práctica, ya que la eliminación de errores en la IA sigue siendo un desafío considerable.

Nuevas Funciones en Bedrock

Además de Automated Reasoning checks, AWS también ha presentado otra herramienta llamada Model Distillation, que permite transferir las capacidades de un modelo grande a uno más pequeño, lo que puede resultar en un uso más económico y eficiente de los recursos. Este desarrollo responde a la necesidad de optimizar el rendimiento sin comprometer demasiado la precisión.

El proceso de Model Distillation implica que, después de que el cliente proporcione ejemplos de prompts, Amazon Bedrock se encarga de generar respuestas y ajustar el modelo más pequeño. Esto incluye la posibilidad de crear más datos de muestra si es necesario para completar el proceso de destilación. Sin embargo, existen algunas limitaciones. Actualmente, Model Distillation solo funciona con modelos hospedados en Bedrock de proveedores como Anthropic y Meta, y los modelos grandes y pequeños deben pertenecer a la misma "familia", lo que limita la flexibilidad del usuario.

AWS asegura que los modelos destilados perderán solo una precisión de “menos del 2%”, lo que podría ser un incentivo atractivo para aquellos que buscan maximizar su eficiencia.

Colaboración Multigeneracional

Otra de las novedades que ha presentado AWS es la colaboración entre múltiples agentes, una función que permite a los clientes asignar tareas específicas a diferentes modelos de IA dentro de un proyecto más amplio. Esta característica forma parte de Bedrock Agents, la contribución de AWS a la creciente tendencia de agentes de IA.

Los clientes pueden designar un “agente supervisor” que se encargue de dividir y asignar tareas automáticamente a los diferentes modelos de IA. Este agente puede proporcionar a otros agentes acceso a la información necesaria para completar su trabajo y determinar qué acciones se pueden procesar en paralelo. La idea es que, una vez que todos los agentes especializados completen sus aportaciones, el agente supervisor puede reunir la información y sintetizar los resultados.

La implementación de la colaboración entre múltiples agentes es un intento de hacer que los proyectos de IA sean más manejables y eficientes, permitiendo una división del trabajo que puede llevar a resultados más rápidos y precisos.

Expectativas y Desafíos Futuros

Aunque las nuevas características de AWS han generado interés, es importante considerar cómo se desempeñarán en escenarios del mundo real. La comunidad de expertos en IA sigue siendo cautelosa ante las promesas de soluciones rápidas a problemas complejos como las alucinaciones. A medida que las empresas como AWS continúan innovando y ofreciendo nuevas herramientas, será crucial evaluar su efectividad a medida que se integren en aplicaciones comerciales y de consumo.

El crecimiento de la base de clientes de Bedrock, que se ha multiplicado por 4.7 en el último año, sugiere que hay un interés considerable en estas soluciones. Swami Sivasubramanian, VP de IA y datos en AWS, ha indicado que estas nuevas capacidades están diseñadas para resolver algunos de los principales desafíos que enfrenta la industria al llevar aplicaciones de IA generativa a producción. Esto refleja un enfoque en la innovación continua para atraer a más clientes en un mercado competitivo.

La evolución de la IA generativa y su implementación en diversos sectores es un proceso en constante cambio, y herramientas como Automated Reasoning checks y Model Distillation son pasos importantes en esta dirección. La capacidad de las empresas para adaptarse a estos avances tecnológicos y a las necesidades cambiantes del mercado será determinante en su éxito futuro. A medida que se desarrollan y despliegan estas herramientas, el verdadero impacto de estas innovaciones solo podrá ser juzgado con el tiempo.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Transparencia necesaria

GPT-5 genera controversia y llama a la transparencia científica

La controversia sobre GPT-5 destaca la necesidad de claridad y rigor en la comunicación científica. Las afirmaciones exageradas de OpenAI sobre resolver problemas matemáticos no...

Prohibición chatbots

WhatsApp prohibirá chatbots generales para enfocar atención al cliente

WhatsApp prohibirá el uso de chatbots de propósito general a partir del 15 de enero de 2026, buscando centrarse en la atención al cliente. Esta...

Desinformación política

Deepfake de Schumer revela la desinformación en política actual

La difusión de un deepfake de Chuck Schumer por parte de republicanos durante el shutdown gubernamental destaca el uso de desinformación en la política. Este...

Ediciones sugeridas

Facebook lanza IA para editar fotos pero preocupa la privacidad

Facebook ha lanzado una función que utiliza IA para sugerir ediciones de fotos almacenadas en el carrete del usuario. Aunque mejora la creatividad, plantea preocupaciones...

Desaceleración competitiva

ChatGPT enfrenta desaceleración y competencia de Google Gemini

El crecimiento de la app de ChatGPT se ha desacelerado, con una caída en usuarios activos y tiempo de uso. La competencia, especialmente de Google...

Reestructuración IA

SK Telecom reestructura IA y ofrece jubilación voluntaria a empleados

SK Telecom ha reestructurado su división de IA, AI CIC, ofreciendo jubilación voluntaria a empleados para optimizar operaciones. La empresa busca liderar en soluciones de...

Control parental

Meta introduce controles parentales para proteger a adolescentes en IA

Meta ha anunciado nuevas características de control parental para gestionar las interacciones de los adolescentes con personajes de IA, buscando un entorno más seguro. Estas...

Controversia ética

Controversia por videos inapropiados de figuras históricas en Sora

La plataforma de IA Sora de OpenAI ha generado controversia por la creación de videos de figuras históricas, como Martin Luther King Jr., en situaciones...