IA | Transparencia ética

Anthropic promueve transparencia en IA generativa con nuevos prompts

mar, 27 de agosto de 2024

La naturaleza de la inteligencia artificial generativa

La inteligencia artificial generativa ha captado la atención del público en los últimos años, pero es crucial entender que no son seres humanos ni poseen una inteligencia auténtica. En realidad, estos modelos funcionan como sistemas estadísticos que predicen las palabras más probables para continuar una frase. Esto implica que, aunque pueden generar texto que parece humano, no tienen personalidad ni comprensión real. De hecho, su funcionamiento se asemeja más a seguir instrucciones, como lo haría un becario en un entorno laboral severo, sin cuestionar ni quejarse.

Los prompts del sistema: una herramienta esencial

Cada proveedor de inteligencia artificial generativa, desde OpenAI hasta Anthropic, utiliza lo que se conoce como "prompts del sistema". Estos prompts son instrucciones iniciales que preparan a los modelos para comportarse de una manera específica y evitar conductas indeseadas. Por ejemplo, un prompt puede indicar que el modelo debe ser educado, pero nunca disculparse, o que debe ser honesto acerca de sus limitaciones en el conocimiento. Estos mecanismos son fundamentales para controlar el tono y la percepción de las respuestas generadas.

Sin embargo, los proveedores suelen mantener estos prompts en secreto, lo que podría deberse a razones competitivas o al temor de que, si se conocen, se encuentren formas de eludir estas directrices. Un ejemplo de esto es el modelo GPT-4o, cuyo prompt del sistema solo puede ser revelado mediante un ataque de inyección de prompts. Aun así, el resultado de dicho sistema no puede ser considerado completamente fiable.

La transparencia de Anthropic

Anthropic ha decidido tomar un enfoque diferente al publicar los prompts del sistema de sus modelos más recientes, como Claude 3.5 Opus, Sonnet y Haiku. Esto se ha realizado a través de las aplicaciones de Claude para iOS y Android, así como en su plataforma web. Este esfuerzo por ser más transparente se presenta como un intento de posicionarse como un proveedor de IA más ético. Alex Albert, responsable de relaciones con desarrolladores en Anthropic, anunció en una publicación que planean hacer de esta divulgación una práctica habitual a medida que actualicen y ajusten sus prompts del sistema.

Además, han añadido una sección de notas de lanzamiento de nuevos prompts en su documentación. Esto significa que cualquier cambio realizado en los prompts predeterminados será registrado, lo que podría establecer un nuevo estándar en la industria. Este enfoque proactivo podría forzar a otros competidores a seguir su ejemplo y adoptar prácticas similares.

Limitaciones y características de Claude

Los últimos prompts publicados, fechados el 12 de julio, detallan claramente las limitaciones de los modelos Claude. Por ejemplo, se indica que "Claude no puede abrir URL, enlaces ni vídeos", y se especifica que el reconocimiento facial está completamente prohibido. En el caso de Claude 3.5 Opus, se indica que el modelo debe "responder siempre como si fuera completamente ciego a las caras" y "evitar identificar o nombrar a cualquier humano en las imágenes".

No obstante, estos prompts también delinean ciertas características y rasgos de personalidad que Anthropic desea que los modelos Claude exhiban. Por ejemplo, se espera que Claude se presente como "muy inteligente y curiosamente intelectual", disfrutando de escuchar las opiniones humanas sobre diversos temas y participando en discusiones de manera activa.

La creación de una ilusión

Es interesante observar que estos prompts están redactados de una manera que podría recordar a un análisis de personaje en una obra de teatro. La instrucción final para Opus, que dice "Claude está siendo conectado con un humano", sugiere que Claude tiene alguna forma de conciencia que busca cumplir los deseos de su interlocutor humano. Sin embargo, esta es una ilusión que es importante desmantelar. Los prompts para Claude demuestran que, sin la guía y el apoyo humano, estos modelos son, en esencia, "tabulas rasas" aterradoras.

Presión sobre la competencia

Con la introducción de estos registros de cambios en los prompts del sistema, Anthropic está ejerciendo presión sobre sus competidores para que hagan lo mismo. La industria de la inteligencia artificial se encuentra en un punto crítico en el que la transparencia y la ética están ganando protagonismo. El desafío para otros proveedores será ver si se suman a esta tendencia o si continúan operando en la sombra. Esto podría marcar una diferencia significativa en la forma en que los usuarios perciben y utilizan la inteligencia artificial generativa en el futuro.

Otras noticias • IA

Inteligencia artificial

OpenAI lanza ChatGPT, la nueva herramienta de inteligencia artificial

17 jul

OpenAI ha lanzado el agente ChatGPT, una herramienta de inteligencia artificial versátil que permite a los usuarios realizar tareas complejas, como gestionar calendarios y ejecutar...

Innovaciones AI

Mistral potencia Le Chat con innovaciones en inteligencia artificial

17 jul

Mistral ha actualizado su chatbot Le Chat con innovaciones como un modo de investigación profunda, razonamiento multilingüe, organización de proyectos y edición avanzada de imágenes....

Unicornio tecnológico

Lovable se convierte en unicornio en solo ocho meses

17 jul

Lovable, una startup sueca de codificación impulsada por inteligencia artificial, ha alcanzado el estatus de unicornio en ocho meses, acumulando 2,3 millones de usuarios y...

Computación cuántica

India impulsa computación cuántica con QpiAI y 32 millones

16 jul

India avanza en computación cuántica con la startup QpiAI, que recibió 32 millones de dólares de financiación. La empresa, que combina IA y computación cuántica,...

Tensiones comerciales

Nvidia reanuda ventas de chip H20 AI en China

16 jul

Nvidia ha reanudado las ventas de su chip H20 AI en China, generando tensiones sobre seguridad nacional y comercio de tierras raras. Esta decisión refleja...

Llamadas automatizadas

Google lanza llamadas comerciales con IA para mejorar la comunicación

16 jul

Google ha lanzado una funcionalidad de llamadas comerciales impulsada por IA en EE.UU., permitiendo a los usuarios obtener información sin hablar directamente con humanos. Esta...

Crecimiento descontrolado

Calvin French-Owen expone desafíos de crecimiento en OpenAI

15 jul

Calvin French-Owen, exingeniero de OpenAI, revela en su blog los desafíos de la rápida expansión de la empresa, que creció de 1,000 a 3,000 empleados....

Fallo seguridad

Meta AI expone conversaciones privadas, genera alarma por seguridad

15 jul

Un fallo de seguridad en Meta AI permitió a los usuarios acceder a conversaciones privadas de otros, generando preocupaciones sobre la privacidad. Aunque Meta corrigió...

Anthropic promueve transparencia en IA generativa con nuevos prompts

La naturaleza de la inteligencia artificial generativa

Los prompts del sistema: una herramienta esencial

La transparencia de Anthropic

Limitaciones y características de Claude

La creación de una ilusión

Presión sobre la competencia

Otras noticias • IA

Lo más reciente

Vulnerabilidades del SS7 amenazan privacidad en el Medio Oriente

Tensiones en Europa por regulación de IA y desarrollo tecnológico

Perplexity se asocia con Airtel para expandir IA en India

Usuarios de Claude Code frustrados por restricciones y falta de comunicación

Microsoft aumenta emisiones de carbono y lucha por sostenibilidad

Diarrha N’Diaye-Mbaye cierra Ami Colé ante desafíos empresariales

Hadrian recauda 260 millones para revitalizar manufactura en EE. UU