OpenAI anuncia colaboraciones para crear conjuntos de datos mejorados
OpenAI, la compañía de inteligencia artificial, ha anunciado su nuevo programa de colaboración con instituciones externas para construir conjuntos de datos públicos y privados para el entrenamiento de modelos de IA. Esta iniciativa, llamada "Data Partnerships", tiene como objetivo combatir los sesgos y las deficiencias en los conjuntos de datos utilizados actualmente, los cuales han demostrado ser problemáticos debido a su enfoque centrado en Estados Unidos y en el mundo occidental.
En un comunicado publicado en su blog, OpenAI explica que los conjuntos de datos utilizados para entrenar modelos de lenguaje como el Llama 2 de Meta contienen lenguaje tóxico y sesgos. Estos problemas se amplifican cuando los modelos de IA utilizan estos conjuntos de datos para generar respuestas y realizar tareas.
Para abordar esta problemática, OpenAI busca colaborar con organizaciones externas con el fin de construir conjuntos de datos mejorados. La compañía tiene como objetivo construir conjuntos de datos que reflejen la sociedad humana de manera más precisa y que sean accesibles a todos. Esto incluye datos en diferentes modalidades, como imágenes, audio y video, así como datos que expresen intenciones humanas a través de diferentes idiomas, temas y formatos.
OpenAI se compromete a trabajar con estas organizaciones para digitalizar los datos de entrenamiento, utilizando herramientas de reconocimiento óptico de caracteres y reconocimiento automático de voz. Además, se asegurarán de eliminar cualquier información sensible o personal de los conjuntos de datos, si es necesario.
La compañía planea crear dos tipos de conjuntos de datos: uno de código abierto, que estará disponible para que cualquiera lo utilice en el entrenamiento de modelos de IA, y otro conjunto de datos privados, diseñado para organizaciones que deseen mantener su información privada pero que deseen mejorar la comprensión de los modelos de IA de OpenAI en su dominio específico.
Hasta ahora, OpenAI ha trabajado con el Gobierno de Islandia y la empresa Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés, y con el Free Law Project para mejorar la comprensión de documentos legales por parte de sus modelos.
En resumen, OpenAI busca colaborar con instituciones externas para crear conjuntos de datos más completos y libres de sesgos para el entrenamiento de modelos de IA. Si bien esta iniciativa es prometedora, queda por ver si OpenAI puede realmente superar los desafíos que han dificultado los esfuerzos anteriores en la construcción de conjuntos de datos.
Además, es importante que OpenAI sea transparente sobre el proceso y los desafíos que enfrenta en la creación de estos conjuntos de datos. También es necesario considerar las preocupaciones sobre la motivación comercial detrás de esta iniciativa, ya que OpenAI busca mejorar el rendimiento de sus propios modelos a expensas de otros sin ofrecer una compensación adecuada a los propietarios de los datos.
En definitiva, esta colaboración entre OpenAI y organizaciones externas podría ser un paso importante para mejorar la calidad y la equidad en los conjuntos de datos utilizados en la IA, pero también plantea preguntas sobre la ética y la justa compensación de los propietarios de los datos.
Otras noticias • IA
Coralogix adquiere Aporia y potencia su inteligencia artificial
Coralogix ha adquirido Aporia, fortaleciendo su oferta en inteligencia artificial y supervisión de sistemas. Esta integración permite a las empresas gestionar eficazmente sus cargas de...
Startups de IA en Europa duplican valor y generan empleo
Las startups de inteligencia artificial en Europa están en auge, representando el 25% de la financiación de capital de riesgo. A pesar de la percepción...
Sriram Krishnan se une a la Casa Blanca en IA
Sriram Krishnan ha sido nombrado asesor senior de políticas de inteligencia artificial en la Casa Blanca, destacando la importancia de la IA para la economía...
Google Gemini se expande a 40 idiomas para investigadores globales
Google ha ampliado su herramienta Gemini a 40 nuevos idiomas, permitiendo un asistente de investigación más accesible. Este avance enfrenta desafíos de precisión y verificación...
Dudas sobre Sam Altman y la ética en OpenAI
La comparecencia de Sam Altman ante el Congreso ha generado dudas sobre su relación con OpenAI, especialmente tras revelaciones sobre su participación a través de...
Boon revoluciona la logística con inteligencia artificial y financiación
Boon, una startup fundada por Deepti Yenireddy, busca transformar la logística mediante inteligencia artificial, optimizando procesos y aumentando la eficiencia. Con 20,5 millones de dólares...
Stem AI busca alinear inteligencia artificial con ética humana
Stem AI, cofundada por Emmett Shear, busca alinear la inteligencia artificial con el comportamiento humano y la ética. Con el respaldo de Andreessen Horowitz, la...
TuSimple se convierte en CreateAI y se enfoca en videojuegos
TuSimple se transforma en CreateAI, abandonando el desarrollo de camiones autónomos para centrarse en la animación y videojuegos. A pesar de controversias sobre prácticas de...
Lo más reciente
- 1
DeepSeek V3 transforma la inteligencia artificial con 671 mil millones
- 2
Fundadores de startups deben priorizar educación financiera y prudencia
- 3
GV invierte más de 10.000 millones en 800 startups
- 4
Salarios en startups: transparencia y cultura inclusiva son esenciales
- 5
Onyx Motorbikes renace con Tim Seward y 100 RCR eléctricas
- 6
CredibleX capta 55 millones para financiar PYMEs en MENA
- 7
Debate ético sobre IA: innovación versus responsabilidad en tecnología