IA | Equidad

OpenAI lanza "Data Partnerships" para combatir sesgos en IA

OpenAI anuncia colaboraciones para crear conjuntos de datos mejorados

OpenAI, la compañía de inteligencia artificial, ha anunciado su nuevo programa de colaboración con instituciones externas para construir conjuntos de datos públicos y privados para el entrenamiento de modelos de IA. Esta iniciativa, llamada "Data Partnerships", tiene como objetivo combatir los sesgos y las deficiencias en los conjuntos de datos utilizados actualmente, los cuales han demostrado ser problemáticos debido a su enfoque centrado en Estados Unidos y en el mundo occidental.

En un comunicado publicado en su blog, OpenAI explica que los conjuntos de datos utilizados para entrenar modelos de lenguaje como el Llama 2 de Meta contienen lenguaje tóxico y sesgos. Estos problemas se amplifican cuando los modelos de IA utilizan estos conjuntos de datos para generar respuestas y realizar tareas.

Para abordar esta problemática, OpenAI busca colaborar con organizaciones externas con el fin de construir conjuntos de datos mejorados. La compañía tiene como objetivo construir conjuntos de datos que reflejen la sociedad humana de manera más precisa y que sean accesibles a todos. Esto incluye datos en diferentes modalidades, como imágenes, audio y video, así como datos que expresen intenciones humanas a través de diferentes idiomas, temas y formatos.

OpenAI se compromete a trabajar con estas organizaciones para digitalizar los datos de entrenamiento, utilizando herramientas de reconocimiento óptico de caracteres y reconocimiento automático de voz. Además, se asegurarán de eliminar cualquier información sensible o personal de los conjuntos de datos, si es necesario.

La compañía planea crear dos tipos de conjuntos de datos: uno de código abierto, que estará disponible para que cualquiera lo utilice en el entrenamiento de modelos de IA, y otro conjunto de datos privados, diseñado para organizaciones que deseen mantener su información privada pero que deseen mejorar la comprensión de los modelos de IA de OpenAI en su dominio específico.

Hasta ahora, OpenAI ha trabajado con el Gobierno de Islandia y la empresa Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés, y con el Free Law Project para mejorar la comprensión de documentos legales por parte de sus modelos.

En resumen, OpenAI busca colaborar con instituciones externas para crear conjuntos de datos más completos y libres de sesgos para el entrenamiento de modelos de IA. Si bien esta iniciativa es prometedora, queda por ver si OpenAI puede realmente superar los desafíos que han dificultado los esfuerzos anteriores en la construcción de conjuntos de datos.

Además, es importante que OpenAI sea transparente sobre el proceso y los desafíos que enfrenta en la creación de estos conjuntos de datos. También es necesario considerar las preocupaciones sobre la motivación comercial detrás de esta iniciativa, ya que OpenAI busca mejorar el rendimiento de sus propios modelos a expensas de otros sin ofrecer una compensación adecuada a los propietarios de los datos.

En definitiva, esta colaboración entre OpenAI y organizaciones externas podría ser un paso importante para mejorar la calidad y la equidad en los conjuntos de datos utilizados en la IA, pero también plantea preguntas sobre la ética y la justa compensación de los propietarios de los datos.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Responsabilidad empresarial

Debate global por uso indebido de IA en contenido sexual

La investigación a xAI por el uso de su chatbot Grok para generar contenido sexual no consensuado ha desatado un debate sobre la responsabilidad de...

Energía sostenible

Trump propone subasta tecnológica para generar 15 mil millones en energía

La administración Trump propone que las empresas tecnológicas participen en una subasta para añadir 15 mil millones de dólares en nueva generación de energía, en...

Publicidad integrada

OpenAI introduce publicidad en ChatGPT para usuarios gratuitos y "Go"

OpenAI ha anunciado la inclusión de publicidad en ChatGPT, tanto para usuarios gratuitos como de la suscripción "Go". Esta estrategia busca generar ingresos mientras se...

Inteligencia artificial

Irina Ghose impulsa la inteligencia artificial en India con Anthropic

La llegada de Irina Ghose a Anthropic y la apertura de su oficina en India subrayan la importancia del país en el mercado de la...

Acuerdo semiconductores

Trump firma acuerdo histórico con Taiwán por 250.000 millones

La administración de Trump ha firmado un acuerdo histórico con Taiwán por 250.000 millones de dólares para impulsar la producción de semiconductores y fortalecer la...

Éxito financiero

Higgsfield recauda 80 millones y alcanza valoración de 1.3 mil millones

Higgsfield, una startup de generación de vídeo mediante inteligencia artificial, ha recaudado 80 millones de dólares, alcanzando una valoración de 1.3 mil millones. Con más...

Aranceles tecnológicos

EE.UU. impone arancel del 25% a semiconductores para competir con China

La imposición de un arancel del 25% por EE.UU. a semiconductores avanzados, como los chips H200 de Nvidia, refleja la competencia tecnológica con China. Esta...

Aniversario sostenible

Wikimedia celebra 25 años con nuevas alianzas tecnológicas

La Fundación Wikimedia celebra su 25 aniversario anunciando nuevas alianzas con empresas de inteligencia artificial y mejoras tecnológicas. Estas iniciativas buscan asegurar la sostenibilidad de...