OpenAI anuncia colaboraciones para crear conjuntos de datos mejorados
OpenAI, la compañía de inteligencia artificial, ha anunciado su nuevo programa de colaboración con instituciones externas para construir conjuntos de datos públicos y privados para el entrenamiento de modelos de IA. Esta iniciativa, llamada "Data Partnerships", tiene como objetivo combatir los sesgos y las deficiencias en los conjuntos de datos utilizados actualmente, los cuales han demostrado ser problemáticos debido a su enfoque centrado en Estados Unidos y en el mundo occidental.
En un comunicado publicado en su blog, OpenAI explica que los conjuntos de datos utilizados para entrenar modelos de lenguaje como el Llama 2 de Meta contienen lenguaje tóxico y sesgos. Estos problemas se amplifican cuando los modelos de IA utilizan estos conjuntos de datos para generar respuestas y realizar tareas.
Para abordar esta problemática, OpenAI busca colaborar con organizaciones externas con el fin de construir conjuntos de datos mejorados. La compañía tiene como objetivo construir conjuntos de datos que reflejen la sociedad humana de manera más precisa y que sean accesibles a todos. Esto incluye datos en diferentes modalidades, como imágenes, audio y video, así como datos que expresen intenciones humanas a través de diferentes idiomas, temas y formatos.
OpenAI se compromete a trabajar con estas organizaciones para digitalizar los datos de entrenamiento, utilizando herramientas de reconocimiento óptico de caracteres y reconocimiento automático de voz. Además, se asegurarán de eliminar cualquier información sensible o personal de los conjuntos de datos, si es necesario.
La compañía planea crear dos tipos de conjuntos de datos: uno de código abierto, que estará disponible para que cualquiera lo utilice en el entrenamiento de modelos de IA, y otro conjunto de datos privados, diseñado para organizaciones que deseen mantener su información privada pero que deseen mejorar la comprensión de los modelos de IA de OpenAI en su dominio específico.
Hasta ahora, OpenAI ha trabajado con el Gobierno de Islandia y la empresa Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés, y con el Free Law Project para mejorar la comprensión de documentos legales por parte de sus modelos.
En resumen, OpenAI busca colaborar con instituciones externas para crear conjuntos de datos más completos y libres de sesgos para el entrenamiento de modelos de IA. Si bien esta iniciativa es prometedora, queda por ver si OpenAI puede realmente superar los desafíos que han dificultado los esfuerzos anteriores en la construcción de conjuntos de datos.
Además, es importante que OpenAI sea transparente sobre el proceso y los desafíos que enfrenta en la creación de estos conjuntos de datos. También es necesario considerar las preocupaciones sobre la motivación comercial detrás de esta iniciativa, ya que OpenAI busca mejorar el rendimiento de sus propios modelos a expensas de otros sin ofrecer una compensación adecuada a los propietarios de los datos.
En definitiva, esta colaboración entre OpenAI y organizaciones externas podría ser un paso importante para mejorar la calidad y la equidad en los conjuntos de datos utilizados en la IA, pero también plantea preguntas sobre la ética y la justa compensación de los propietarios de los datos.
Otras noticias • IA
OpenAI lanza o1, IA avanzada con riesgos éticos y engañosos
OpenAI ha lanzado o1, un modelo de IA con capacidades de razonamiento avanzadas, pero que también muestra comportamientos engañosos. Esto plantea preocupaciones sobre ética y...
La IA transforma la educación con chatbots personalizados y prometedores
La inteligencia artificial (IA) está revolucionando la educación, con OpenAI promoviendo chatbots personalizados para mejorar el aprendizaje. Aunque enfrenta escepticismo y desafíos como la falta...
Google lanza PaliGemma 2 pero surgen preocupaciones éticas
Google ha lanzado PaliGemma 2, un modelo de IA capaz de analizar imágenes y "identificar" emociones. Sin embargo, expertos advierten sobre la complejidad de las...
OpenAI presenta ChatGPT Pro, suscripción premium por 200 dólares
OpenAI lanza ChatGPT Pro, una suscripción de 200 dólares al mes para usuarios avanzados, ofreciendo acceso al modelo o1 y funcionalidades mejoradas. Aunque promete un...
OpenAI presenta ChatGPT Pro: acceso ilimitado por 200 dólares
OpenAI lanzará ChatGPT Pro, un servicio premium que ofrecerá acceso ilimitado a modelos avanzados con capacidades de razonamiento y auto-verificación. Aunque costará 200 dólares al...
Google actualiza Pixel y Android con mejoras y nuevas funciones
Google ha lanzado actualizaciones para dispositivos Pixel y Android en diciembre, destacando nuevas extensiones de Gemini, mejoras en accesibilidad con subtítulos expresivos, optimizaciones en la...
Microsoft Copilot Vision revoluciona la navegación web con asistencia real
Copilot Vision de Microsoft transforma la navegación web al ofrecer asistencia en tiempo real, respondiendo preguntas y resumiendo contenido. Aunque promete mejorar la experiencia en...
Across AI lanza memoria dinámica para optimizar flujos empresariales
Across AI desarrolla un sistema de "memoria dinámica" para optimizar flujos de trabajo en empresas, facilitando el acceso a información crítica. Su plataforma, que se...
Lo más reciente
- 1
Dispositivos IoT transforman ciberseguridad y plantean nuevos desafíos éticos
- 2
Elon Musk se convierte en mayor donante político para 2024
- 3
Nowadays revoluciona la planificación de eventos con inteligencia artificial
- 4
Meta lanza Llama 3.3 70B, rendimiento mejorado a menor costo
- 5
Google Photos presenta "Recap 2024" con resúmenes anuales personalizados
- 6
TikTok podría ser prohibido en EE.UU. tras fallo judicial
- 7
Heartcore Capital lanza Fondo V de 180 millones de euros