OpenAI anuncia colaboraciones para crear conjuntos de datos mejorados
OpenAI, la compañía de inteligencia artificial, ha anunciado su nuevo programa de colaboración con instituciones externas para construir conjuntos de datos públicos y privados para el entrenamiento de modelos de IA. Esta iniciativa, llamada "Data Partnerships", tiene como objetivo combatir los sesgos y las deficiencias en los conjuntos de datos utilizados actualmente, los cuales han demostrado ser problemáticos debido a su enfoque centrado en Estados Unidos y en el mundo occidental.
En un comunicado publicado en su blog, OpenAI explica que los conjuntos de datos utilizados para entrenar modelos de lenguaje como el Llama 2 de Meta contienen lenguaje tóxico y sesgos. Estos problemas se amplifican cuando los modelos de IA utilizan estos conjuntos de datos para generar respuestas y realizar tareas.
Para abordar esta problemática, OpenAI busca colaborar con organizaciones externas con el fin de construir conjuntos de datos mejorados. La compañía tiene como objetivo construir conjuntos de datos que reflejen la sociedad humana de manera más precisa y que sean accesibles a todos. Esto incluye datos en diferentes modalidades, como imágenes, audio y video, así como datos que expresen intenciones humanas a través de diferentes idiomas, temas y formatos.
OpenAI se compromete a trabajar con estas organizaciones para digitalizar los datos de entrenamiento, utilizando herramientas de reconocimiento óptico de caracteres y reconocimiento automático de voz. Además, se asegurarán de eliminar cualquier información sensible o personal de los conjuntos de datos, si es necesario.
La compañía planea crear dos tipos de conjuntos de datos: uno de código abierto, que estará disponible para que cualquiera lo utilice en el entrenamiento de modelos de IA, y otro conjunto de datos privados, diseñado para organizaciones que deseen mantener su información privada pero que deseen mejorar la comprensión de los modelos de IA de OpenAI en su dominio específico.
Hasta ahora, OpenAI ha trabajado con el Gobierno de Islandia y la empresa Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés, y con el Free Law Project para mejorar la comprensión de documentos legales por parte de sus modelos.
En resumen, OpenAI busca colaborar con instituciones externas para crear conjuntos de datos más completos y libres de sesgos para el entrenamiento de modelos de IA. Si bien esta iniciativa es prometedora, queda por ver si OpenAI puede realmente superar los desafíos que han dificultado los esfuerzos anteriores en la construcción de conjuntos de datos.
Además, es importante que OpenAI sea transparente sobre el proceso y los desafíos que enfrenta en la creación de estos conjuntos de datos. También es necesario considerar las preocupaciones sobre la motivación comercial detrás de esta iniciativa, ya que OpenAI busca mejorar el rendimiento de sus propios modelos a expensas de otros sin ofrecer una compensación adecuada a los propietarios de los datos.
En definitiva, esta colaboración entre OpenAI y organizaciones externas podría ser un paso importante para mejorar la calidad y la equidad en los conjuntos de datos utilizados en la IA, pero también plantea preguntas sobre la ética y la justa compensación de los propietarios de los datos.
Otras noticias • IA
La nube se adapta al auge de la inteligencia artificial
La infraestructura en la nube está evolucionando para adaptarse al creciente tráfico generado por agentes de inteligencia artificial. Soluciones como OpenSearch Serverless de AWS permiten...
Asana compra Stack AI por 75 millones para potenciar IA
Asana ha adquirido Stack AI por 75 millones de dólares, reforzando su enfoque en la automatización de flujos de trabajo mediante inteligencia artificial. Esta estrategia...
Shanghái lanza mercado de derivados para tokens de IA
La Bolsa de Futuros de Shanghái está desarrollando un mercado de derivados para tokens de IA, impulsado por la creciente demanda de GPUs. Este avance...
Anthropic alcanza 965 mil millones tras recaudar 65 mil millones
Anthropic ha recaudado 65 mil millones de dólares en su última ronda de financiación, alcanzando una valoración de 965 mil millones. Con el lanzamiento de...
StrictlyVC Los Ángeles 2026: Innovación y networking en tecnología
El evento StrictlyVC Los Ángeles 2026, el 18 de junio, reunirá a líderes del capital de riesgo y la tecnología en un entorno propicio para...
Anthropic lanza Opus 4.8 con mejoras en gestión de datos
Anthropic ha lanzado Opus 4.8, mejorando la gestión de datos inciertos y presentando Dynamic Workflows para tareas complejas. Este lanzamiento responde a la presión del...
Sesame lanza app de agentes conversacionales para mejorar interacciones
Sesame, una startup cofundada por creadores de Oculus, ha lanzado una innovadora aplicación de agentes conversacionales. Su tecnología permite interacciones más fluidas y personalizadas, mejorando...
Confusión por declaraciones de Musk en acuerdo xAI-Anthropic
El acuerdo entre xAI y Anthropic busca fortalecer la computación en la nube en un contexto de alta demanda. Sin embargo, las declaraciones contradictorias de...
Lo más reciente
- 1
Tensión entre Nightmare Eclipse y Microsoft por vulnerabilidades divulgadas
- 2
Cognition recauda 1.000 millones para su agente de codificación Devin
- 3
Comedero inteligente Kiwibit transforma la observación de aves
- 4
XCENA lanza chip MX1 para revolucionar la IA en memoria
- 5
Glean revoluciona búsqueda empresarial con IA y 300 millones anuales
- 6
Explosión de New Glenn sacude confianza en Blue Origin y NASA
- 7
Waymo domina vehículos autónomos en Texas con 577 unidades registradas

