Baichuan Intelligence lanza su modelo de lenguaje de próxima generación Baichuan-13B
La startup Baichuan Intelligence, fundada por el empresario chino Wang Xiaochuan, ha presentado hoy su nuevo modelo de lenguaje de próxima generación, Baichuan-13B. Wang, quien previamente fundó el proveedor de motores de búsqueda Sogou, ha estado trabajando en el desarrollo de esta plataforma con el objetivo de crear una alternativa china a OpenAI.
Baichuan-13B se presenta como uno de los desarrolladores de modelos de lenguaje más prometedores de China. Este modelo de 13 mil millones de parámetros se basa en la arquitectura Transformer, al igual que el popular modelo GPT de OpenAI. Ha sido entrenado en datos en chino e inglés y se ha optimizado para su aplicación comercial.
En comparación con otros modelos de lenguaje desarrollados en China, Baichuan-13B destaca por su tamaño. Este modelo ha sido entrenado con 1,4 billones de tokens, superando a LLaMa de Meta, que utiliza 1 billón de tokens en su modelo de 13 mil millones de parámetros. Wang ha manifestado en una entrevista su intención de lanzar un modelo a gran escala comparable al GPT-3.5 de OpenAI a finales de este año.
A pesar de ser una startup relativamente joven, Baichuan ha experimentado un rápido desarrollo desde su lanzamiento hace tres meses. A finales de abril, el equipo ya contaba con 50 personas y en junio presentaron su primer modelo de lenguaje, Baichuan-7B, con 7 mil millones de parámetros.
Baichuan-13B, disponible para uso académico y comercial
El modelo base Baichuan-13B está disponible de forma gratuita para académicos y desarrolladores que hayan obtenido la aprobación oficial para utilizarlo con fines comerciales. Esto supone una ventaja significativa para aquellos que buscan utilizar grandes modelos de lenguaje en China, ya que se han impuesto sanciones a los chips de IA estadounidenses en el país. Baichuan-13B ofrece variaciones que se pueden ejecutar en hardware de consumo, incluyendo las tarjetas gráficas Nvidia 3090.
Otras empresas chinas, como el gigante de los motores de búsqueda Baidu, Zhipu.ai y el Instituto de Investigación IDEA, también han invertido considerablemente en grandes modelos de lenguaje. Estas inversiones reflejan la creciente importancia de estos modelos en China, especialmente a medida que el país se prepara para implementar regulaciones de IA más estrictas.
Según informa el Financial Times, China está trabajando en la creación de regulaciones para la IA generativa, con un enfoque particular en el contenido. Esto indica un mayor control en comparación con las normas introducidas en abril. Es posible que las empresas necesiten obtener una licencia antes de lanzar grandes modelos de lenguaje, lo que podría ralentizar los esfuerzos de China por competir con Estados Unidos en esta industria emergente.
En resumen, Baichuan Intelligence ha lanzado su nuevo modelo de lenguaje Baichuan-13B, que se perfila como una alternativa china a los modelos de OpenAI. Con 13 mil millones de parámetros y entrenado en datos en chino e inglés, este modelo se ha optimizado para su uso comercial y está disponible de forma gratuita para académicos y desarrolladores aprobados. China continúa invirtiendo en grandes modelos de lenguaje a medida que se prepara para implementar regulaciones más estrictas en el campo de la IA.
Otras noticias • IA
OpenAI mejora IA tras incidentes de respuestas inapropiadas
OpenAI ha decidido implementar cambios significativos en sus modelos de IA tras incidentes de respuestas inapropiadas de ChatGPT. Se introducirán fases de prueba, mayor transparencia...
Airbnb lanza bot de IA que reduce consultas humanas un 15%
Airbnb ha implementado un bot de servicio al cliente basado en inteligencia artificial en EE. UU., con un 50% de usuarios utilizándolo. Esto ha reducido...
Reddit lanza chatbot para satisfacer a Seekers y aumentar compromiso
Reddit ha identificado dos tipos de usuarios: Scrollers, que buscan interacción comunitaria, y Seekers, que buscan respuestas. Para estos últimos, ha lanzado Reddit Answers, un...
Amazon presenta Alexa+ con IA generativa para interacciones mejoradas
Amazon ha lanzado Alexa+, un asistente digital mejorado con IA generativa, que busca ofrecer interacciones más naturales. Aunque enfrenta retos tecnológicos y limitaciones actuales, la...
Inteligencia artificial revoluciona ciencia, pero genera escepticismo persistente
La inteligencia artificial está transformando la investigación científica, con herramientas como las de FutureHouse que prometen acelerar descubrimientos. Sin embargo, persisten limitaciones y escepticismo entre...
Olmo 2 1B democratiza la IA con un billón de parámetros
Olmo 2 1B, lanzado por Ai2, es un modelo de inteligencia artificial con un billón de parámetros, diseñado para ser accesible y eficiente en dispositivos...
Claude de Anthropic se actualiza con nuevas integraciones avanzadas
Anthropic ha actualizado su chatbot Claude con nuevas integraciones que mejoran su conectividad y capacidad de investigación profunda. Asociaciones con empresas como Atlassian y Zapier...
Google elimina lista de espera y lanza AI Mode para todos
Google ha eliminado la lista de espera para su función AI Mode, permitiendo a todos los usuarios mayores de 18 años en EE. UU. acceder...
Lo más reciente
- 1
Gemini 2.5 Pro de Google completa Pokémon Blue, un hito
- 2
Plataformas de segunda mano se adaptan y crecen en crisis
- 3
Inteligencia artificial prioriza compromiso y descuida calidad en interacciones
- 4
Gemini 2.5 de Google genera más contenido inapropiado y preocupaciones
- 5
Filtración en Raw expone datos sensibles y genera alarma
- 6
Startups innovan en tecnología legal moda y salud a pesar desafíos
- 7
NotebookLM de Google transforma la toma de notas móviles