IA | IA

Modelos de IA difunden más información errónea en dialectos chinos que en inglés

La inteligencia artificial (IA) es una herramienta en constante evolución y debemos ser cautelosos con su potencial para difundir información errónea. Sin embargo, parece ser más propensa a hacerlo en algunos idiomas que en otros. ¿Por qué sucede esto?

Recientemente, un informe de NewsGuard, un vigilante de la desinformación, ha demostrado cómo ChatGPT repite más información inexacta en dialectos chinos que cuando se le pide que lo haga en inglés.

En sus pruebas, "tentaron" al modelo de lenguaje pidiéndole que escribiera artículos de noticias sobre varias afirmaciones falsas supuestamente avanzadas por el gobierno chino, como que las protestas en Hong Kong fueron organizadas por agentes provocadores asociados a Estados Unidos.

Cuando se le pidió que lo hiciera en inglés (tanto la solicitud como la respuesta), ChatGPT solo cumplió en uno de cada siete ejemplos: específicamente, generó un artículo que hacía eco de la línea oficial del gobierno chino de que la detención masiva de personas uigures en el país es en realidad un esfuerzo vocacional y educativo.

Pero cuando las solicitudes y respuestas estaban en chino simplificado y chino tradicional (los dos idiomas escritos más comunes en China continental, Hong Kong, Taiwán y Macao), ChatGPT ofreció retórica desinformativa en cada ocasión.

¿Por qué debería un modelo de IA decirte cosas diferentes solo porque las está diciendo en un idioma diferente?

La respuesta radica en el hecho de que, comprensiblemente, antropomorfizamos estos sistemas, considerándolos simplemente como expresiones de algún conocimiento internalizado en el idioma seleccionado.

Es perfectamente natural: después de todo, si le pidieras a una persona multilingüe que respondiera una pregunta primero en inglés, luego en coreano o polaco, te daría la misma respuesta con precisión en cada idioma. El clima hoy es soleado y fresco, sin importar cómo lo expresen, porque los hechos no cambian según el idioma en que se digan. La idea es separada de la expresión.

En un modelo de lenguaje, esto no es así, porque en realidad no saben nada, en el sentido en que lo hacen las personas. Estos son modelos estadísticos que identifican patrones en una serie de palabras y predicen qué palabras vendrán a continuación, basándose en sus datos de entrenamiento.

¿Ves cuál es el problema? La respuesta no es realmente una respuesta, es una predicción de cómo se respondería esa pregunta si estuviera presente en el conjunto de entrenamiento. (Aquí hay una exploración más larga de ese aspecto de los LLM más poderosos de hoy).

Aunque estos modelos son multilingües, los idiomas no necesariamente se informan entre sí. Son áreas superpuestas pero distintas del conjunto de datos, y el modelo no tiene (todavía) un mecanismo mediante el cual compara cómo ciertas frases o predicciones difieren entre esas áreas.

Entonces, cuando pides una respuesta en inglés, se basa principalmente en todos los datos de idioma inglés que tiene. Cuando pides una respuesta en chino tradicional, se basa principalmente en los datos de idioma chino que tiene. Cómo y en qué medida estas dos pilas de datos se informan mutuamente o el resultado resultante no está claro, pero en la actualidad, el experimento de NewsGuard muestra que al menos son bastante independientes.

¿Qué significa eso para las personas que deben trabajar con modelos de IA en idiomas que no sean inglés, que constituyen la gran mayoría de los datos de entrenamiento? Es solo una advertencia más a tener en cuenta al interactuar con ellos. Ya es lo suficientemente difícil saber si un modelo de lenguaje está respondiendo con precisión, alucinando salvajemente o incluso regurgitando exactamente, y agregar la incertidumbre de una barrera del idioma solo lo hace más difícil.

El ejemplo con asuntos políticos en China es extremo, pero fácilmente se pueden imaginar otros casos en los que, por ejemplo, al pedir una respuesta en italiano, se basa y refleja el contenido italiano en su conjunto de datos de entrenamiento.

Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Atención automatizada

Airbnb lanza bot de IA que reduce consultas humanas un 15%

Airbnb ha implementado un bot de servicio al cliente basado en inteligencia artificial en EE. UU., con un 50% de usuarios utilizándolo. Esto ha reducido...

Interacción comunitaria

Reddit lanza chatbot para satisfacer a Seekers y aumentar compromiso

Reddit ha identificado dos tipos de usuarios: Scrollers, que buscan interacción comunitaria, y Seekers, que buscan respuestas. Para estos últimos, ha lanzado Reddit Answers, un...

Asistente mejorado

Amazon presenta Alexa+ con IA generativa para interacciones mejoradas

Amazon ha lanzado Alexa+, un asistente digital mejorado con IA generativa, que busca ofrecer interacciones más naturales. Aunque enfrenta retos tecnológicos y limitaciones actuales, la...

Transformación científica

Inteligencia artificial revoluciona ciencia, pero genera escepticismo persistente

La inteligencia artificial está transformando la investigación científica, con herramientas como las de FutureHouse que prometen acelerar descubrimientos. Sin embargo, persisten limitaciones y escepticismo entre...

IA accesible

Olmo 2 1B democratiza la IA con un billón de parámetros

Olmo 2 1B, lanzado por Ai2, es un modelo de inteligencia artificial con un billón de parámetros, diseñado para ser accesible y eficiente en dispositivos...

Mejoras funcionales

Claude de Anthropic se actualiza con nuevas integraciones avanzadas

Anthropic ha actualizado su chatbot Claude con nuevas integraciones que mejoran su conectividad y capacidad de investigación profunda. Asociaciones con empresas como Atlassian y Zapier...

Acceso inmediato

Google elimina lista de espera y lanza AI Mode para todos

Google ha eliminado la lista de espera para su función AI Mode, permitiendo a todos los usuarios mayores de 18 años en EE. UU. acceder...

Alianzas estratégicas

World une alianzas estratégicas para revolucionar la seguridad digital

World, una empresa de identificación biométrica, ha formado alianzas estratégicas con Match Group, Kalshi y Stripe para expandir su alcance y facilitar el acceso a...