OpenAI anuncia colaboraciones para crear conjuntos de datos mejorados
OpenAI, la compañía de inteligencia artificial, ha anunciado su nuevo programa de colaboración con instituciones externas para construir conjuntos de datos públicos y privados para el entrenamiento de modelos de IA. Esta iniciativa, llamada "Data Partnerships", tiene como objetivo combatir los sesgos y las deficiencias en los conjuntos de datos utilizados actualmente, los cuales han demostrado ser problemáticos debido a su enfoque centrado en Estados Unidos y en el mundo occidental.
En un comunicado publicado en su blog, OpenAI explica que los conjuntos de datos utilizados para entrenar modelos de lenguaje como el Llama 2 de Meta contienen lenguaje tóxico y sesgos. Estos problemas se amplifican cuando los modelos de IA utilizan estos conjuntos de datos para generar respuestas y realizar tareas.
Para abordar esta problemática, OpenAI busca colaborar con organizaciones externas con el fin de construir conjuntos de datos mejorados. La compañía tiene como objetivo construir conjuntos de datos que reflejen la sociedad humana de manera más precisa y que sean accesibles a todos. Esto incluye datos en diferentes modalidades, como imágenes, audio y video, así como datos que expresen intenciones humanas a través de diferentes idiomas, temas y formatos.
OpenAI se compromete a trabajar con estas organizaciones para digitalizar los datos de entrenamiento, utilizando herramientas de reconocimiento óptico de caracteres y reconocimiento automático de voz. Además, se asegurarán de eliminar cualquier información sensible o personal de los conjuntos de datos, si es necesario.
La compañía planea crear dos tipos de conjuntos de datos: uno de código abierto, que estará disponible para que cualquiera lo utilice en el entrenamiento de modelos de IA, y otro conjunto de datos privados, diseñado para organizaciones que deseen mantener su información privada pero que deseen mejorar la comprensión de los modelos de IA de OpenAI en su dominio específico.
Hasta ahora, OpenAI ha trabajado con el Gobierno de Islandia y la empresa Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés, y con el Free Law Project para mejorar la comprensión de documentos legales por parte de sus modelos.
En resumen, OpenAI busca colaborar con instituciones externas para crear conjuntos de datos más completos y libres de sesgos para el entrenamiento de modelos de IA. Si bien esta iniciativa es prometedora, queda por ver si OpenAI puede realmente superar los desafíos que han dificultado los esfuerzos anteriores en la construcción de conjuntos de datos.
Además, es importante que OpenAI sea transparente sobre el proceso y los desafíos que enfrenta en la creación de estos conjuntos de datos. También es necesario considerar las preocupaciones sobre la motivación comercial detrás de esta iniciativa, ya que OpenAI busca mejorar el rendimiento de sus propios modelos a expensas de otros sin ofrecer una compensación adecuada a los propietarios de los datos.
En definitiva, esta colaboración entre OpenAI y organizaciones externas podría ser un paso importante para mejorar la calidad y la equidad en los conjuntos de datos utilizados en la IA, pero también plantea preguntas sobre la ética y la justa compensación de los propietarios de los datos.
Otras noticias • IA
La IA revoluciona el empleo y exige adaptación continua
La inteligencia artificial (IA) transforma el mercado laboral, generando crecimiento en empresas que la adoptan, aunque también plantea preocupaciones sobre la pérdida de empleos. La...
Wix adquiere Base44 para potenciar su IA en el mercado
La adquisición de Base44 por Wix destaca la importancia de desarrollar modelos de IA propios en un mercado competitivo. Con su modelo Base1, la empresa...
Google democratiza la creación de imágenes personalizadas con Gemini
Gemini de Google ha democratizado la creación de imágenes mediante IA, permitiendo a todos los usuarios con cuenta de Google generar imágenes personalizadas de forma...
Arena alcanza $100 millones en ingresos en solo ocho meses
Arena, un proveedor de modelos de IA, alcanzó $100 millones en ingresos anuales en ocho meses. Originada en UC Berkeley, su plataforma clasifica modelos mediante...
Corea del Sur destina 518 mil millones a semiconductores y IA
Corea del Sur invertirá 518 mil millones de dólares en semiconductores, estableciendo nuevas fábricas y centros de datos de IA. Esta estrategia busca diversificar la...
California y Anthropic impulsan chatbots en agencias gubernamentales
California, bajo el gobernador Gavin Newsom, colabora con Anthropic para utilizar su chatbot Claude en agencias gubernamentales a bajo coste. Esta iniciativa busca mejorar la...
TIDAL prohíbe monetización de música generada por IA en 2026
TIDAL implementará en julio de 2026 una política que prohíbe la monetización de música generada por IA, buscando proteger la creatividad orgánica de los artistas....
Jay Li lanza Proception con manos robóticas innovadoras y financiación
Jay Li, exresponsable de Tesla, superó un conflicto legal y fundó Proception, centrada en manos robóticas que imitan la destreza humana. Con 11 millones de...
Lo más reciente
- 1
Tesla prueba Cybercab en Austin para revolucionar el transporte urbano
- 2
Blue Origin reestructura lanzamientos tras explosión del New Glenn
- 3
Integración de IA en empresas exige estrategia y cultura adecuadas
- 4
Riverside lanza herramienta para convertir grabaciones en newsletters
- 5
Arcturus innova en cobre sostenible para la transición energética
- 6
X lanza servidor MCP para integrar aplicaciones de IA fácilmente
- 7
Lumo 2.0: el chatbot innovador y ético de Proton

