IA | Innovación

Baichuan Intelligence lanza Baichuan-13B, el modelo de lenguaje que desafía a OpenAI

Baichuan Intelligence lanza su modelo de lenguaje de próxima generación Baichuan-13B

La startup Baichuan Intelligence, fundada por el empresario chino Wang Xiaochuan, ha presentado hoy su nuevo modelo de lenguaje de próxima generación, Baichuan-13B. Wang, quien previamente fundó el proveedor de motores de búsqueda Sogou, ha estado trabajando en el desarrollo de esta plataforma con el objetivo de crear una alternativa china a OpenAI.

Baichuan-13B se presenta como uno de los desarrolladores de modelos de lenguaje más prometedores de China. Este modelo de 13 mil millones de parámetros se basa en la arquitectura Transformer, al igual que el popular modelo GPT de OpenAI. Ha sido entrenado en datos en chino e inglés y se ha optimizado para su aplicación comercial.

En comparación con otros modelos de lenguaje desarrollados en China, Baichuan-13B destaca por su tamaño. Este modelo ha sido entrenado con 1,4 billones de tokens, superando a LLaMa de Meta, que utiliza 1 billón de tokens en su modelo de 13 mil millones de parámetros. Wang ha manifestado en una entrevista su intención de lanzar un modelo a gran escala comparable al GPT-3.5 de OpenAI a finales de este año.

A pesar de ser una startup relativamente joven, Baichuan ha experimentado un rápido desarrollo desde su lanzamiento hace tres meses. A finales de abril, el equipo ya contaba con 50 personas y en junio presentaron su primer modelo de lenguaje, Baichuan-7B, con 7 mil millones de parámetros.

Baichuan-13B, disponible para uso académico y comercial

El modelo base Baichuan-13B está disponible de forma gratuita para académicos y desarrolladores que hayan obtenido la aprobación oficial para utilizarlo con fines comerciales. Esto supone una ventaja significativa para aquellos que buscan utilizar grandes modelos de lenguaje en China, ya que se han impuesto sanciones a los chips de IA estadounidenses en el país. Baichuan-13B ofrece variaciones que se pueden ejecutar en hardware de consumo, incluyendo las tarjetas gráficas Nvidia 3090.

Otras empresas chinas, como el gigante de los motores de búsqueda Baidu, Zhipu.ai y el Instituto de Investigación IDEA, también han invertido considerablemente en grandes modelos de lenguaje. Estas inversiones reflejan la creciente importancia de estos modelos en China, especialmente a medida que el país se prepara para implementar regulaciones de IA más estrictas.

Según informa el Financial Times, China está trabajando en la creación de regulaciones para la IA generativa, con un enfoque particular en el contenido. Esto indica un mayor control en comparación con las normas introducidas en abril. Es posible que las empresas necesiten obtener una licencia antes de lanzar grandes modelos de lenguaje, lo que podría ralentizar los esfuerzos de China por competir con Estados Unidos en esta industria emergente.

En resumen, Baichuan Intelligence ha lanzado su nuevo modelo de lenguaje Baichuan-13B, que se perfila como una alternativa china a los modelos de OpenAI. Con 13 mil millones de parámetros y entrenado en datos en chino e inglés, este modelo se ha optimizado para su uso comercial y está disponible de forma gratuita para académicos y desarrolladores aprobados. China continúa invirtiendo en grandes modelos de lenguaje a medida que se prepara para implementar regulaciones más estrictas en el campo de la IA.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Inversión significativa

STAN recibe 8.5 millones de dólares de Google para crecer

STAN, una plataforma social de gaming india, ha recibido una inversión de 8.5 millones de dólares de Google. Su modelo innovador permite a los usuarios...

Investigación innovadora

Fundamental Research Labs revoluciona la IA con 33 millones en financiación

Fundamental Research Labs, con 33 millones de dólares en financiación, destaca en inteligencia artificial gracias a su enfoque multidisciplinario y productos innovadores como Fairies y...

IA avanzada

Google lanza Gemini 2.5 Deep Think para revolucionar IA

Google ha lanzado Gemini 2.5 Deep Think, un modelo de IA avanzado que utiliza múltiples agentes para ofrecer respuestas precisas y detalladas. Disponible para suscriptores...

Anuncios Alexa

Amazon introduce anuncios en Alexa+ buscando nuevas fuentes de ingresos

Amazon, liderado por Andy Jassy, planea introducir anuncios en su asistente Alexa+, buscando nuevas fuentes de ingresos. Esta estrategia enfrenta desafíos en privacidad y experiencia...

Inversión tecnológica

SixSense recauda 8,5 millones para mejorar detección en semiconductores

SixSense, una startup de Singapur, ha recaudado 8,5 millones de dólares para desarrollar una plataforma de inteligencia artificial que mejora la detección de defectos en...

Inteligencia artificial

Apple refuerza inteligencia artificial en dispositivos pese a críticas

Apple ha intensificado su enfoque en la inteligencia artificial, integrándola en todos sus dispositivos y reestructurando su personal. Aunque enfrenta críticas por retrasos en mejoras...

Crecimiento empresarial

Anthropic supera a OpenAI en mercado empresarial de IA

Anthropic ha superado a OpenAI en el mercado empresarial de IA, alcanzando un 32% de cuota frente al 25% de OpenAI. Su modelo Claude ha...

Inteligencia artificial

Apple refuerza su compromiso con la inteligencia artificial en dispositivos

Apple ha reafirmado su compromiso con la inteligencia artificial, integrándola en sus dispositivos y plataformas. Con un enfoque en adquisiciones tácticas y la calidad de...