OpenAI anuncia colaboraciones para crear conjuntos de datos mejorados
OpenAI, la compañía de inteligencia artificial, ha anunciado su nuevo programa de colaboración con instituciones externas para construir conjuntos de datos públicos y privados para el entrenamiento de modelos de IA. Esta iniciativa, llamada "Data Partnerships", tiene como objetivo combatir los sesgos y las deficiencias en los conjuntos de datos utilizados actualmente, los cuales han demostrado ser problemáticos debido a su enfoque centrado en Estados Unidos y en el mundo occidental.
En un comunicado publicado en su blog, OpenAI explica que los conjuntos de datos utilizados para entrenar modelos de lenguaje como el Llama 2 de Meta contienen lenguaje tóxico y sesgos. Estos problemas se amplifican cuando los modelos de IA utilizan estos conjuntos de datos para generar respuestas y realizar tareas.
Para abordar esta problemática, OpenAI busca colaborar con organizaciones externas con el fin de construir conjuntos de datos mejorados. La compañía tiene como objetivo construir conjuntos de datos que reflejen la sociedad humana de manera más precisa y que sean accesibles a todos. Esto incluye datos en diferentes modalidades, como imágenes, audio y video, así como datos que expresen intenciones humanas a través de diferentes idiomas, temas y formatos.
OpenAI se compromete a trabajar con estas organizaciones para digitalizar los datos de entrenamiento, utilizando herramientas de reconocimiento óptico de caracteres y reconocimiento automático de voz. Además, se asegurarán de eliminar cualquier información sensible o personal de los conjuntos de datos, si es necesario.
La compañía planea crear dos tipos de conjuntos de datos: uno de código abierto, que estará disponible para que cualquiera lo utilice en el entrenamiento de modelos de IA, y otro conjunto de datos privados, diseñado para organizaciones que deseen mantener su información privada pero que deseen mejorar la comprensión de los modelos de IA de OpenAI en su dominio específico.
Hasta ahora, OpenAI ha trabajado con el Gobierno de Islandia y la empresa Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés, y con el Free Law Project para mejorar la comprensión de documentos legales por parte de sus modelos.
En resumen, OpenAI busca colaborar con instituciones externas para crear conjuntos de datos más completos y libres de sesgos para el entrenamiento de modelos de IA. Si bien esta iniciativa es prometedora, queda por ver si OpenAI puede realmente superar los desafíos que han dificultado los esfuerzos anteriores en la construcción de conjuntos de datos.
Además, es importante que OpenAI sea transparente sobre el proceso y los desafíos que enfrenta en la creación de estos conjuntos de datos. También es necesario considerar las preocupaciones sobre la motivación comercial detrás de esta iniciativa, ya que OpenAI busca mejorar el rendimiento de sus propios modelos a expensas de otros sin ofrecer una compensación adecuada a los propietarios de los datos.
En definitiva, esta colaboración entre OpenAI y organizaciones externas podría ser un paso importante para mejorar la calidad y la equidad en los conjuntos de datos utilizados en la IA, pero también plantea preguntas sobre la ética y la justa compensación de los propietarios de los datos.
Otras noticias • IA
Genesis AI lanza GENE-26.5, mano robótica innovadora y ética
Genesis AI presenta su modelo GENE-26.5, una innovadora mano robótica diseñada para replicar la anatomía humana, facilitando la recolección de datos. Con una financiación de...
Google mejora búsqueda con IA, pero surgen dudas de veracidad
Google está evolucionando su motor de búsqueda mediante inteligencia artificial, incorporando opiniones de foros y personalizando resultados. Aunque esto enriquece la experiencia, plantea preocupaciones sobre...
Apple pagará 250 millones por exagerar capacidades de inteligencia artificial
Apple ha acordado pagar 250 millones de dólares para resolver una demanda colectiva por exagerar las capacidades de su inteligencia artificial, afectando la confianza de...
Aplicaciones de citas se reinventan para atraer a jóvenes
Las aplicaciones de citas, como Match Group, enfrentan un cambio generacional, con una disminución en el uso entre los jóvenes que buscan conexiones más auténticas....
Samsung alcanza un billón de dólares gracias a chips AI
Samsung ha alcanzado una valoración de un billón de dólares, impulsada por la demanda de chips para inteligencia artificial. A pesar de sus éxitos financieros,...
QuTwo recauda 25 millones y busca liderar IA en Europa
QuTwo, un laboratorio finlandés de IA fundado por Peter Sarlin, ha recaudado 25 millones de euros y se valora en 325 millones. Su producto principal,...
Altara revoluciona la gestión de datos con inteligencia artificial
Altara, fundada en 2025, utiliza inteligencia artificial para optimizar la gestión de datos en la industria tecnológica, facilitando el diagnóstico de fallos en productos físicos....
Pensilvania demanda a Character.AI por engaños en salud digital
La demanda de Pensilvania contra Character.AI destaca la necesidad de regular la inteligencia artificial en salud, tras acusaciones de engañar a usuarios haciéndose pasar por...
Lo más reciente
- 1
Lachy Groom invierte en Pronto, impulsando servicios a domicilio en India
- 2
xAI y Anthropic transforman la industria tecnológica con nueva alianza
- 3
Snap cancela acuerdo con Perplexity ante desafíos de innovación
- 4
Barry Diller apoya a Sam Altman y la ética en IA
- 5
Microsoft lucha entre IA y sostenibilidad energética para 2030
- 6
Robinhood democratiza inversión en empresas privadas para minoristas
- 7
Braintrust revela vulnerabilidad en seguridad de claves API en AWS

