OpenAI anuncia colaboraciones para crear conjuntos de datos mejorados
OpenAI, la compañía de inteligencia artificial, ha anunciado su nuevo programa de colaboración con instituciones externas para construir conjuntos de datos públicos y privados para el entrenamiento de modelos de IA. Esta iniciativa, llamada "Data Partnerships", tiene como objetivo combatir los sesgos y las deficiencias en los conjuntos de datos utilizados actualmente, los cuales han demostrado ser problemáticos debido a su enfoque centrado en Estados Unidos y en el mundo occidental.
En un comunicado publicado en su blog, OpenAI explica que los conjuntos de datos utilizados para entrenar modelos de lenguaje como el Llama 2 de Meta contienen lenguaje tóxico y sesgos. Estos problemas se amplifican cuando los modelos de IA utilizan estos conjuntos de datos para generar respuestas y realizar tareas.
Para abordar esta problemática, OpenAI busca colaborar con organizaciones externas con el fin de construir conjuntos de datos mejorados. La compañía tiene como objetivo construir conjuntos de datos que reflejen la sociedad humana de manera más precisa y que sean accesibles a todos. Esto incluye datos en diferentes modalidades, como imágenes, audio y video, así como datos que expresen intenciones humanas a través de diferentes idiomas, temas y formatos.
OpenAI se compromete a trabajar con estas organizaciones para digitalizar los datos de entrenamiento, utilizando herramientas de reconocimiento óptico de caracteres y reconocimiento automático de voz. Además, se asegurarán de eliminar cualquier información sensible o personal de los conjuntos de datos, si es necesario.
La compañía planea crear dos tipos de conjuntos de datos: uno de código abierto, que estará disponible para que cualquiera lo utilice en el entrenamiento de modelos de IA, y otro conjunto de datos privados, diseñado para organizaciones que deseen mantener su información privada pero que deseen mejorar la comprensión de los modelos de IA de OpenAI en su dominio específico.
Hasta ahora, OpenAI ha trabajado con el Gobierno de Islandia y la empresa Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés, y con el Free Law Project para mejorar la comprensión de documentos legales por parte de sus modelos.
En resumen, OpenAI busca colaborar con instituciones externas para crear conjuntos de datos más completos y libres de sesgos para el entrenamiento de modelos de IA. Si bien esta iniciativa es prometedora, queda por ver si OpenAI puede realmente superar los desafíos que han dificultado los esfuerzos anteriores en la construcción de conjuntos de datos.
Además, es importante que OpenAI sea transparente sobre el proceso y los desafíos que enfrenta en la creación de estos conjuntos de datos. También es necesario considerar las preocupaciones sobre la motivación comercial detrás de esta iniciativa, ya que OpenAI busca mejorar el rendimiento de sus propios modelos a expensas de otros sin ofrecer una compensación adecuada a los propietarios de los datos.
En definitiva, esta colaboración entre OpenAI y organizaciones externas podría ser un paso importante para mejorar la calidad y la equidad en los conjuntos de datos utilizados en la IA, pero también plantea preguntas sobre la ética y la justa compensación de los propietarios de los datos.
Otras noticias • IA
Google y Apple unen fuerzas en inteligencia artificial por primera vez
La colaboración entre Google y Apple en inteligencia artificial marca un cambio en su relación histórica. Aunque se invierten grandes sumas, la monetización y la...
Gizmo revoluciona la creación de contenido multimedia con IA
Gizmo, desarrollada por Atma Sciences, es una plataforma innovadora que permite a los usuarios crear experiencias multimedia interactivas fácilmente, utilizando inteligencia artificial. Con un crecimiento...
La IA revoluciona el cine, pero genera preocupaciones laborales
La inteligencia artificial está transformando la producción cinematográfica, con Amazon MGM Studios liderando la iniciativa. Colaboraciones con expertos buscan equilibrar tecnología y creatividad. Aunque la...
Tinder lanza Chemistry con IA para mejorar conexiones personales
Tinder ha introducido la función Chemistry, impulsada por inteligencia artificial, para combatir la fatiga de deslizar y ofrecer conexiones más personalizadas. A pesar de enfrentar...
Roblox introduce creación 4D para revolucionar la interactividad virtual
Roblox lanza la creación 4D, revolucionando la interactividad en objetos virtuales. Los creadores pueden diseñar elementos dinámicos y personalizados, enriqueciendo la experiencia de juego. Con...
ElevenLabs alcanza 11.000 millones tras recaudar 500 millones
ElevenLabs ha recaudado 500 millones de dólares, alcanzando una valoración de 11.000 millones. Con planes de expansión internacional y la incorporación de capacidades de video,...
Positron recauda 230 millones para competir con Nvidia en IA
Positron, una startup de semiconductores, ha recaudado 230 millones de dólares en financiación para acelerar la producción de sus chips de memoria de alta velocidad,...
Apple lanza Xcode 26.3 con herramientas de IA para desarrolladores
Apple ha lanzado Xcode 26.3, que integra herramientas de codificación agente, permitiendo a los desarrolladores utilizar modelos de IA como Claude y Codex. Esta actualización...
Lo más reciente
- 1
La voz: nueva interfaz con retos de privacidad y seguridad
- 2
Substack investiga brecha de seguridad que expuso datos de usuarios
- 3
Fundamental revoluciona análisis de datos con modelo Nexus y financiación
- 4
Spotify revoluciona la lectura con libros y audiolibros físicos
- 5
Anthropic y OpenAI intensifican competencia con críticas éticas publicitarias
- 6
Snap Inc. diversifica ingresos con suscripciones y gafas Specs
- 7
Gemini de Google alcanza 750 millones de usuarios activos mensuales

