OpenAI anuncia colaboraciones para crear conjuntos de datos mejorados
OpenAI, la compañía de inteligencia artificial, ha anunciado su nuevo programa de colaboración con instituciones externas para construir conjuntos de datos públicos y privados para el entrenamiento de modelos de IA. Esta iniciativa, llamada "Data Partnerships", tiene como objetivo combatir los sesgos y las deficiencias en los conjuntos de datos utilizados actualmente, los cuales han demostrado ser problemáticos debido a su enfoque centrado en Estados Unidos y en el mundo occidental.
En un comunicado publicado en su blog, OpenAI explica que los conjuntos de datos utilizados para entrenar modelos de lenguaje como el Llama 2 de Meta contienen lenguaje tóxico y sesgos. Estos problemas se amplifican cuando los modelos de IA utilizan estos conjuntos de datos para generar respuestas y realizar tareas.
Para abordar esta problemática, OpenAI busca colaborar con organizaciones externas con el fin de construir conjuntos de datos mejorados. La compañía tiene como objetivo construir conjuntos de datos que reflejen la sociedad humana de manera más precisa y que sean accesibles a todos. Esto incluye datos en diferentes modalidades, como imágenes, audio y video, así como datos que expresen intenciones humanas a través de diferentes idiomas, temas y formatos.
OpenAI se compromete a trabajar con estas organizaciones para digitalizar los datos de entrenamiento, utilizando herramientas de reconocimiento óptico de caracteres y reconocimiento automático de voz. Además, se asegurarán de eliminar cualquier información sensible o personal de los conjuntos de datos, si es necesario.
La compañía planea crear dos tipos de conjuntos de datos: uno de código abierto, que estará disponible para que cualquiera lo utilice en el entrenamiento de modelos de IA, y otro conjunto de datos privados, diseñado para organizaciones que deseen mantener su información privada pero que deseen mejorar la comprensión de los modelos de IA de OpenAI en su dominio específico.
Hasta ahora, OpenAI ha trabajado con el Gobierno de Islandia y la empresa Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés, y con el Free Law Project para mejorar la comprensión de documentos legales por parte de sus modelos.
En resumen, OpenAI busca colaborar con instituciones externas para crear conjuntos de datos más completos y libres de sesgos para el entrenamiento de modelos de IA. Si bien esta iniciativa es prometedora, queda por ver si OpenAI puede realmente superar los desafíos que han dificultado los esfuerzos anteriores en la construcción de conjuntos de datos.
Además, es importante que OpenAI sea transparente sobre el proceso y los desafíos que enfrenta en la creación de estos conjuntos de datos. También es necesario considerar las preocupaciones sobre la motivación comercial detrás de esta iniciativa, ya que OpenAI busca mejorar el rendimiento de sus propios modelos a expensas de otros sin ofrecer una compensación adecuada a los propietarios de los datos.
En definitiva, esta colaboración entre OpenAI y organizaciones externas podría ser un paso importante para mejorar la calidad y la equidad en los conjuntos de datos utilizados en la IA, pero también plantea preguntas sobre la ética y la justa compensación de los propietarios de los datos.
Otras noticias • IA
Sam Altman vuelve a ser CEO de OpenAI y nombra nueva junta directiva
Sam Altman ha sido restituido como CEO de OpenAI y ha nombrado una nueva junta directiva. Altman anunció que Mira Murati regresará como CTO y...
See Together cierra ronda de financiación de $102.5 millones
La startup See Together cierra una ronda de financiación de $102.5 millones liderada por Kleiner Perkins. La empresa se dedica a crear infraestructuras de desarrollo...
Amazon lanza Titan Image Generator, creación de imágenes personalizadas
Amazon ha lanzado Titan Image Generator, una herramienta de generación de imágenes con inteligencia artificial que permite crear y personalizar imágenes a partir de descripciones...
Amazon AWS lanza SageMaker HyperPod, revolucionario servicio de entrenamiento de modelos de lenguaje
Amazon AWS ha lanzado SageMaker HyperPod, un nuevo servicio diseñado para entrenar y ajustar modelos de lenguaje de gran tamaño. HyperPod permite crear un clúster...
Pinterest lanza herramienta de búsqueda inclusiva con inteligencia artificial
Pinterest ha lanzado una nueva herramienta que permite a los usuarios filtrar búsquedas por diferentes tipos de cuerpo. Utilizando tecnología de tipo de cuerpo basada...
Amazon lanza "Guardrails for Amazon Bedrock" para controlar lenguaje AI
Amazon ha anunciado una nueva herramienta llamada "Guardrails for Amazon Bedrock" que permite controlar los modelos de lenguaje en aplicaciones de inteligencia artificial. Esto ayuda...
Amazon presenta chips personalizados para IA con mejor rendimiento y eficiencia
Amazon ha presentado en su conferencia re:Invent nuevos chips personalizados para inteligencia artificial. El AWS Trainium2 ofrece un rendimiento hasta 4 veces mejor y una...
Elon Musk lanza chatbot 'Grok' solo para suscriptores Premium+ de X
Elon Musk anuncia el lanzamiento de su chatbot 'Grok' exclusivamente para sus suscriptores Premium+ de X la próxima semana. Esto ha generado expectación y preocupación...
Lo más reciente
- 1
OpenAI pospone lanzamiento de GPT Store hasta 2024
- 2
Fisker reduce producción y busca capital para enfrentar desafíos
- 3
Apple lanza actualizaciones de seguridad para proteger a sus usuarios
- 4
Bluesky implementa herramientas de seguridad para moderar contenido ofensivo
- 5
Startups utilizan inteligencia artificial para conservar bosques y generar beneficios
- 6
Flow48 recauda $25 millones para expandir modelo de financiamiento basado en ingresos en MENA
- 7
Microsoft se prepara para lanzar tienda móvil de Xbox