OpenAI anuncia colaboraciones para crear conjuntos de datos mejorados
OpenAI, la compañía de inteligencia artificial, ha anunciado su nuevo programa de colaboración con instituciones externas para construir conjuntos de datos públicos y privados para el entrenamiento de modelos de IA. Esta iniciativa, llamada "Data Partnerships", tiene como objetivo combatir los sesgos y las deficiencias en los conjuntos de datos utilizados actualmente, los cuales han demostrado ser problemáticos debido a su enfoque centrado en Estados Unidos y en el mundo occidental.
En un comunicado publicado en su blog, OpenAI explica que los conjuntos de datos utilizados para entrenar modelos de lenguaje como el Llama 2 de Meta contienen lenguaje tóxico y sesgos. Estos problemas se amplifican cuando los modelos de IA utilizan estos conjuntos de datos para generar respuestas y realizar tareas.
Para abordar esta problemática, OpenAI busca colaborar con organizaciones externas con el fin de construir conjuntos de datos mejorados. La compañía tiene como objetivo construir conjuntos de datos que reflejen la sociedad humana de manera más precisa y que sean accesibles a todos. Esto incluye datos en diferentes modalidades, como imágenes, audio y video, así como datos que expresen intenciones humanas a través de diferentes idiomas, temas y formatos.
OpenAI se compromete a trabajar con estas organizaciones para digitalizar los datos de entrenamiento, utilizando herramientas de reconocimiento óptico de caracteres y reconocimiento automático de voz. Además, se asegurarán de eliminar cualquier información sensible o personal de los conjuntos de datos, si es necesario.
La compañía planea crear dos tipos de conjuntos de datos: uno de código abierto, que estará disponible para que cualquiera lo utilice en el entrenamiento de modelos de IA, y otro conjunto de datos privados, diseñado para organizaciones que deseen mantener su información privada pero que deseen mejorar la comprensión de los modelos de IA de OpenAI en su dominio específico.
Hasta ahora, OpenAI ha trabajado con el Gobierno de Islandia y la empresa Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés, y con el Free Law Project para mejorar la comprensión de documentos legales por parte de sus modelos.
En resumen, OpenAI busca colaborar con instituciones externas para crear conjuntos de datos más completos y libres de sesgos para el entrenamiento de modelos de IA. Si bien esta iniciativa es prometedora, queda por ver si OpenAI puede realmente superar los desafíos que han dificultado los esfuerzos anteriores en la construcción de conjuntos de datos.
Además, es importante que OpenAI sea transparente sobre el proceso y los desafíos que enfrenta en la creación de estos conjuntos de datos. También es necesario considerar las preocupaciones sobre la motivación comercial detrás de esta iniciativa, ya que OpenAI busca mejorar el rendimiento de sus propios modelos a expensas de otros sin ofrecer una compensación adecuada a los propietarios de los datos.
En definitiva, esta colaboración entre OpenAI y organizaciones externas podría ser un paso importante para mejorar la calidad y la equidad en los conjuntos de datos utilizados en la IA, pero también plantea preguntas sobre la ética y la justa compensación de los propietarios de los datos.
Otras noticias • IA
ByteDance lanza Dreamina Seedance 2.0 para crear vídeos fácilmente
ByteDance ha lanzado Dreamina Seedance 2.0, una herramienta de IA que facilita la creación de vídeos mediante descripciones textuales. Con su expansión en mercados clave,...
Cohere lanza Transcribe, revolucionando el reconocimiento de voz ligero
Cohere ha lanzado Transcribe, un modelo de reconocimiento de voz de código abierto y ligero, que admite 14 idiomas y procesa 525 minutos de audio...
Vigilancia tecnológica: ¿seguridad o violación de la privacidad?
La tecnología de vigilancia enfrenta un debate ético sobre privacidad y seguridad. Empresas como Conntour destacan por su enfoque selectivo y ético, utilizando inteligencia artificial...
Mistral lanza Voxtral TTS, revolucionando la comunicación empresarial
Mistral ha lanzado Voxtral TTS, un innovador modelo de texto a voz que soporta nueve idiomas y permite personalización rápida. Optimizado para rendimiento en tiempo...
Inteligencia artificial genera temor a pérdida de empleos laborales
La rápida evolución de la inteligencia artificial genera incertidumbre laboral, con un aumento del temor a la pérdida de empleos. Propuestas como gravar centros de...
Intensifica carrera por inteligencia artificial entre EE.UU. y China
La carrera global por la inteligencia artificial se intensifica entre Estados Unidos y China, con la startup Manus trasladándose a Singapur y siendo adquirida por...
Inteligencia artificial transforma empleo y genera brecha de habilidades
La inteligencia artificial está transformando el mercado laboral, aunque aún no ha causado un desempleo significativo. Sin embargo, su adopción podría aumentar la desigualdad y...
Melania Trump presenta robot educativo en cumbre sobre tecnología
La primera dama Melania Trump presentó un robot humanoide en la cumbre "Fostering the Future Together", explorando la fusión de tecnología y educación. Aunque promete...
Lo más reciente
- 1
OpenAI pausa modo erótico y prioriza proyectos empresariales y militares
- 2
Google lanza "Live Translate" en iOS para traducciones instantáneas
- 3
Senadores piden datos para regular consumo energético de centros de datos
- 4
Google expande búsqueda conversacional y Live Translate a 200 países
- 5
Aumentan campañas de hacking a usuarios de iPhone vulnerables
- 6
LiteLLM expone malware que roba credenciales en código abierto
- 7
Alianza Rimac Uber Pony.ai lanza robotaxis eléctricos en Zagreb

