IA | Modelo multimodal

Mistral lanza Pixtral 12B, innovador modelo multimodal de IA

Introducción a Pixtral 12B

La startup francesa de inteligencia artificial Mistral ha dado un paso importante en el desarrollo de modelos de IA al lanzar su primer modelo multimodal, conocido como Pixtral 12B. Este modelo no solo es capaz de procesar texto, sino que también puede manejar imágenes, lo que lo sitúa en la vanguardia de la tecnología de IA actual. Con un tamaño aproximado de 24 GB y 12 mil millones de parámetros, Pixtral 12B promete ofrecer un rendimiento notable en tareas que requieren la comprensión tanto de texto como de imágenes.

Características técnicas

Los parámetros de un modelo de IA son una medida de su capacidad para resolver problemas. En términos generales, cuantos más parámetros tiene un modelo, mejor será su rendimiento. Pixtral 12B se basa en el modelo de texto Nemo 12B de Mistral, lo que le proporciona una base sólida para el procesamiento de información. Este nuevo modelo puede responder preguntas sobre un número arbitrario de imágenes, independientemente de su tamaño, utilizando URLs de imágenes o imágenes codificadas en base64, un esquema de codificación que convierte datos binarios en texto. Esta flexibilidad en la entrada de datos lo hace especialmente útil para una amplia gama de aplicaciones.

Comparativa con otros modelos

Pixtral 12B se alinea con otros modelos multimodales como Claude de Anthropic y GPT-4o de OpenAI. Teóricamente, debería ser capaz de realizar tareas complejas, como la creación de subtítulos para imágenes y la contabilidad de objetos en fotografías. La capacidad de manejar múltiples tipos de datos simultáneamente abre un abanico de posibilidades en la automatización de tareas que antes requerían intervención humana, y posiciona a Mistral como un competidor serio en el ámbito de la inteligencia artificial.

Acceso y licencias

Los interesados en explorar Pixtral 12B pueden descargarlo a través de un enlace torrent disponible en GitHub y Hugging Face, una plataforma dedicada al desarrollo de IA y aprendizaje automático. El modelo se puede afinar y utilizar bajo la licencia estándar de Mistral, que permite su uso gratuito para fines de investigación y académicos, pero requiere una licencia paga para aplicaciones comerciales. Esta estrategia de licencia permite que la tecnología sea accesible para académicos y desarrolladores, al tiempo que protege los intereses comerciales de la empresa.

Limitaciones y disponibilidad

Desafortunadamente, no fue posible realizar pruebas del modelo Pixtral 12B en el momento de su lanzamiento, ya que no había demostraciones web funcionales disponibles. Sin embargo, Sophia Yang, responsable de relaciones con desarrolladores en Mistral, ha indicado en una publicación en X que el modelo estará disponible para pruebas en las plataformas de chatbot y API de Mistral, denominadas Le Chat y Le Platforme, en un futuro cercano. Esta disponibilidad anticipada sugiere que Mistral está comprometida con la retroalimentación de los usuarios para mejorar su producto.

Cuestiones de derechos de autor

Un aspecto que plantea interrogantes es la fuente de los datos de imagen utilizados para desarrollar Pixtral 12B. La mayoría de los modelos generativos de IA, incluidos los otros modelos de Mistral, son entrenados con grandes cantidades de datos públicos extraídos de la web, que a menudo están protegidos por derechos de autor. Algunos proveedores de modelos argumentan que tienen derechos de "uso justo" que les permiten utilizar estos datos, mientras que muchos titulares de derechos no están de acuerdo y han presentado demandas contra grandes empresas como OpenAI y Midjourney para detener esta práctica. Esta situación plantea un dilema ético y legal que la industria de la IA deberá abordar en los próximos años.

Contexto de financiamiento y estrategia

El lanzamiento de Pixtral 12B llega tras una ronda de financiación de 645 millones de dólares liderada por General Catalyst, que valoró a Mistral en 6 mil millones de dólares. Con poco más de un año de existencia, Mistral ha sido vista por muchos en la comunidad de IA como la respuesta de Europa a OpenAI. La estrategia de la empresa hasta ahora ha consistido en lanzar modelos "abiertos" gratuitos, cobrar por versiones gestionadas de esos modelos y ofrecer servicios de consultoría a clientes corporativos. Esta combinación de enfoques no solo les permite expandir su base de usuarios, sino que también fomenta un ecosistema de desarrollo colaborativo.

Conclusión

La llegada de Pixtral 12B marca un hito significativo en la evolución de los modelos de IA, especialmente en el ámbito multimodal. La capacidad de manejar tanto texto como imágenes no solo amplía las aplicaciones potenciales de la inteligencia artificial, sino que también establece a Mistral como un jugador clave en el competitivo panorama tecnológico actual. La comunidad de desarrolladores y usuarios estará atenta a cómo evoluciona este modelo y qué nuevas aplicaciones se podrán desarrollar en el futuro.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Ética tecnológica

Durk Kingma se une a Anthropic para promover IA ética

Durk Kingma, cofundador de OpenAI, se une a Anthropic, destacando su interés por el desarrollo ético de la inteligencia artificial. Su experiencia en IA generativa...

Privacidad preocupante

Ray-Ban de Meta: preocupaciones por privacidad y uso de datos

Las gafas Ray-Ban de Meta, con cámara integrada, plantean preocupaciones sobre la privacidad y el uso de datos. La falta de transparencia de la empresa...

Recaudación significativa

11x.ai recauda 50 millones y se expande a recursos humanos

11x.ai, startup de bots de ventas impulsados por IA, ha recaudado 50 millones de dólares en una ronda Serie B, valorada en 350 millones. Con...

Controversia regulatoria

Gavin Newsom veta ley de IA por exceso regulatorio

El veto del gobernador de California, Gavin Newsom, a la ley SB 1047 sobre la regulación de la IA ha generado controversia. Aunque bien intencionada,...

Inversión irrelevante

CMA del Reino Unido descarta investigar inversión de Amazon en Anthropic

La CMA del Reino Unido no investigará la inversión de Amazon en Anthropic, ya que no se considera una fusión relevante. Esto refleja un escrutinio...

Financiación cinematográfica

Runway presenta "Hundred Film Fund" para financiar 100 películas AI

Runway lanza el "Hundred Film Fund" con 5 millones de dólares para financiar hasta 100 películas originales que incorporen inteligencia artificial. Esta iniciativa busca democratizar...

Renuncias inquietantes

Renuncias en OpenAI generan inquietud pero aseguran continuidad

La reciente oleada de renuncias en OpenAI, incluyendo a su CTO y directores de investigación, ha generado inquietud. Sam Altman, CEO, enfatiza que son parte...

Voz avanzada

OpenAI presenta Modo de Voz Avanzado en ChatGPT Plus y Teams

OpenAI ha lanzado el Modo de Voz Avanzado para usuarios de ChatGPT Plus y Teams, incorporando nuevas voces inspiradas en la naturaleza y características como...