LanceDB revoluciona el mundo de la inteligencia artificial con su base de datos de código abierto
Chang She, anteriormente vicepresidente de ingeniería en Tubi y veterano de Cloudera, ha lanzado junto al ingeniero de software Lei Xu LanceDB, una base de datos de código abierto que promete revolucionar el espacio de la inteligencia artificial. She, uno de los co-creadores de Pandas, se encontró con problemas en la infraestructura de datos tradicional al trabajar en el espacio de la IA, lo que le impedía llevar modelos de IA a producción.
"Los ingenieros de machine learning e investigadores de IA a menudo se encuentran con una experiencia de desarrollo deficiente", dijo She en una entrevista. "Las empresas de infraestructura de datos no comprenden realmente el problema de los datos de machine learning a un nivel fundamental".
LanceDB está diseñando el software de base de datos de código abierto LanceDB, que está diseñado para admitir modelos de IA multimodales: modelos que se entrenan y generan imágenes, videos y más además de texto. Respaldado por Y Combinator, LanceDB recaudó $8 millones en una ronda de financiación inicial este mes, liderada por CRV, Essence VC y Swift Ventures, lo que eleva su recaudación total a $11 millones.
"Si la IA multimodal es fundamental para el éxito futuro de su empresa, quiere que su equipo de IA muy costoso se centre en el modelo y en unir la IA con el valor empresarial", dijo Chang. "Desafortunadamente, hoy en día, los equipos de IA pasan la mayor parte de su tiempo lidiando con detalles de infraestructura de datos de bajo nivel. LanceDB proporciona la base que los equipos de IA necesitan para poder centrarse en lo que realmente importa para el valor empresarial y llevar productos de IA al mercado mucho más rápido de lo que sería posible de otra manera".
LanceDB es esencialmente una base de datos de vectores: una base de datos que contiene series de números ("vectores") que codifican el significado de datos no estructurados (por ejemplo, imágenes, texto, etc.).
Como escribió recientemente mi colega Paul Sawers, las bases de datos de vectores están en auge a medida que el ciclo de hype de la IA alcanza su punto máximo. Esto se debe a que son útiles para todo tipo de aplicaciones de IA, desde recomendaciones de contenido en plataformas de comercio electrónico y redes sociales hasta la reducción de alucinaciones.
La competencia en las bases de datos de vectores es feroz, con empresas como Qdrant, Vespa, Weaviate, Pinecone y Chroma, entre otros (sin contar los gigantes de la tecnología). ¿Qué hace único a LanceDB? Mejor flexibilidad, rendimiento y escalabilidad, según Chang.
Por un lado, Chang afirma que LanceDB, que se basa en Apache Arrow, está impulsado por un formato de datos personalizado, Lance Format, optimizado para el entrenamiento y análisis de IA multimodal. Lance Format permite a LanceDB manejar hasta miles de millones de vectores y petabytes de texto, imágenes y videos, y permitir a los ingenieros gestionar diversas formas de metadatos asociados con esos datos.
"Hasta ahora, nunca ha existido un sistema que pueda unir el entrenamiento, la exploración, la búsqueda y el procesamiento de datos a gran escala", dijo Chang. "Lance Format permite a los investigadores y ingenieros de IA tener una única fuente de verdad y obtener un rendimiento ultrarrápido en todo su pipeline de IA. No se trata solo de almacenar vectores".
LanceDB obtiene ingresos vendiendo versiones completamente gestionadas de su software de código abierto con características adicionales como aceleración de hardware y controles de gobierno, y parece que el negocio va viento en popa. La lista de clientes de la empresa incluye a plataformas como Midjourney, Character.ai, WeRide y Airtable.
Chang insistió en que el respaldo reciente de VC de LanceDB no desviará su atención del proyecto de código abierto, que según él ahora está viendo alrededor de 600.000 descargas al mes. "Queríamos crear algo que hiciera 10 veces más fácil el trabajo de los equipos de IA con datos multimodales a gran escala", dijo. "LanceDB ofrece, y seguirá ofreciendo, un conjunto muy rico de integraciones de ecosistemas para minimizar el esfuerzo de adopción".
Otras noticias • Empresas
BANF revoluciona el monitoreo de neumáticos con tecnología avanzada
BANF, una startup coreana, ha desarrollado tecnología avanzada para el monitoreo de la salud de los neumáticos, utilizando sensores y aprendizaje automático. Su sistema mejora...
Slice y North East Small Finance Bank revolucionan la banca india
La fusión de Slice con North East Small Finance Bank marca un hito en el sector bancario indio, destacando la digitalización y la entrada de...
GitHub revoluciona la codificación con Copilot en Xcode
GitHub ha presentado innovaciones en programación asistida por IA en su conferencia Universe, destacando la integración de Copilot en Xcode, que mejora la codificación para...
GitHub Copilot Chat ofrece múltiples modelos de lenguaje para desarrolladores
GitHub ha anunciado que su herramienta Copilot Chat permitirá a los desarrolladores elegir entre varios modelos de lenguaje, como Claude 3.5 y Gemini 1.5 Pro,...
Brightwave revoluciona la investigación financiera con inteligencia artificial
Brightwave, una startup de inteligencia artificial, transforma la investigación financiera al interpretar datos y ofrecer informes resumidos. Su enfoque en gráficos de conocimiento permite identificar...
Nueva herramienta de IA mejora la revisión de código en tiempo real
La nueva herramienta de revisión de código basada en IA ayuda a los desarrolladores a seguir mejores prácticas y estándares organizativos. Analiza el código en...
GMI Cloud capta 82 millones y se enfoca en IA
GMI Cloud, fundada en 2022, ha pivotado de servicios de Bitcoin a infraestructura de nube para IA, captando 82 millones de dólares en financiación. Con...
Agentforce transforma el desarrollo de IA sin código necesario
Agentforce de Salesforce revoluciona el desarrollo de agentes de IA, permitiendo su creación sin necesidad de código. Opera de forma autónoma, mejora la experiencia del...
Lo más reciente
- 1
Mary Barra enfatiza la política en la transición a EVs
- 2
Gecko Materials revoluciona adhesivos con tecnología inspirada en geckos
- 3
Ashton Kutcher: El futuro empresarial es de inteligencia artificial
- 4
Navegación háptica mejora la autonomía de personas con discapacidad visual
- 5
Ashton Kutcher invierte en IA con World Labs y Sound Ventures
- 6
MDC transforma cirugía mínimamente invasiva con robótica en resonancia magnética
- 7
Aesthetic transforma la moda digital con compras instantáneas y Alma