IA | Innovación

DataCebo revoluciona la generación de datos con Synthetic Data Vault

DataCebo lanza una herramienta para crear datos sintéticos con IA generativa

La startup DataCebo ha lanzado una herramienta revolucionaria que permite a las empresas crear datos sintéticos utilizando inteligencia artificial generativa. La compañía, fundada por Kalyan Veeramachaneni y Neha Patki, ha desarrollado una biblioteca de código abierto llamada Synthetic Data Vault (SDV), que permite a las empresas generar datos sintéticos a partir de bases de datos relacionales y tabulares.

Una solución para las empresas que necesitan datos de calidad sin exponer información sensible

Esta herramienta se diferencia de otras herramientas de creación de IA generativa al permitir a los clientes construir un modelo de IA generativa personalizado en sus propias instalaciones y utilizar esos datos sintéticos para una variedad de casos de uso. Esto es especialmente útil para empresas que necesitan utilizar datos empresariales de calidad en modelos de lenguaje grandes, pero que no pueden utilizar información personalmente identificable (PII) para hacerlo.

Según el CEO de DataCebo, Kalyan Veeramachaneni, las empresas han tenido que crear datos sintéticos manualmente, un proceso tedioso y propenso a errores que es difícil de escalar. Sin embargo, utilizando la inteligencia artificial generativa, los clientes de DataCebo pueden simplemente describir el tipo de datos que necesitan y el software generará automáticamente un conjunto de datos sintéticos de alta calidad para fines de prueba sin exponer ninguna información sensible.

Un éxito en la comunidad de código abierto

Los fundadores de DataCebo comenzaron creando una versión de código abierto de su herramienta, que resultó ser extremadamente popular y les ayudó a probar las diversas partes principales del software. La herramienta ha sido descargada más de un millón de veces y cuenta con una comunidad activa de más de mil personas en su canal de Slack.

Según Neha Patki, VP de Producto de DataCebo, esta comunidad ha sido fundamental para validar los algoritmos principales del software y corregir errores rápidamente. "Si hay algún error, nuestros usuarios de código abierto lo encuentran inmediatamente y podemos solucionarlo", afirmó Patki.

La versión empresarial permite manejar hasta cien tablas

La diferencia clave entre la versión de código abierto y la versión empresarial de SDV es la escala. Mientras que la versión de código abierto está diseñada para manejar solo unas pocas tablas, la versión empresarial puede manejar hasta cien tablas. Hasta ahora, los clientes han estado construyendo modelos basados en más de 20 o 30 tablas.

DataCebo actualmente cuenta con 11 empleados y planea contratar más personal en el próximo año para alcanzar alrededor de 20 empleados, dependiendo del crecimiento del negocio.

Financiación de 8,5 millones de dólares para impulsar el crecimiento

La startup ha asegurado una financiación de 8,5 millones de dólares en su ronda de financiación inicial, liderada por Link Ventures y Zetta Venture Partners, con la participación de Uncorrelated Ventures. Estos fondos serán utilizados para impulsar el crecimiento de la compañía y expandir su equipo.

DataCebo está abriendo nuevas posibilidades para las empresas que necesitan datos de calidad sin exponer información sensible. Con su herramienta de creación de datos sintéticos basada en inteligencia artificial generativa, las empresas pueden aprovechar al máximo sus datos y acelerar su proceso de desarrollo y pruebas de modelos de IA.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Comunicación automatizada

AgentMail transforma la comunicación automatizada con 6 millones de dólares

AgentMail ha revolucionado la comunicación automatizada al ofrecer un servicio de correo electrónico para agentes de inteligencia artificial. Con una financiación de 6 millones de...

Detección deepfakes

YouTube lanza herramienta para detectar deepfakes y combatir desinformación

YouTube ha lanzado una herramienta para detectar deepfakes, permitiendo a funcionarios y periodistas solicitar la eliminación de contenido no autorizado. La compañía busca equilibrar la...

Valoración elevada

Legora alcanza valoración de 5.550 millones en financiación reciente

Legora, plataforma de inteligencia artificial para el sector legal, ha alcanzado una valoración de 5.550 millones de dólares tras una ronda de financiación de 550...

Búsqueda mejorada

Google Photos lanza "Ask Photos" y permite búsqueda clásica

Google Photos ha introducido la función "Ask Photos" para buscar imágenes mediante lenguaje natural, pero su recepción ha sido mixta. Ante las críticas, Google ahora...

Colaboración estratégica

Thinking Machines Lab y Nvidia impulsan la IA con nuevo acuerdo

Thinking Machines Lab ha firmado un acuerdo estratégico con Nvidia para desarrollar infraestructura de IA, destacando su crecimiento y la creciente demanda en el sector....

Detección deepfakes

YouTube mejora detección de deepfakes para proteger figuras públicas

YouTube ha ampliado su tecnología para detectar deepfakes, permitiendo a figuras públicas solicitar la eliminación de contenidos manipulados. Este enfoque busca equilibrar la libertad de...

Anillo inteligente

Sandbar lanza anillo inteligente Stream para tomar notas fácilmente

La startup Sandbar ha lanzado el anillo inteligente Stream, diseñado para facilitar la toma de notas mediante un micrófono activado por toque. Con una financiación...

IA integrada

Google integra Gemini en sus aplicaciones para potenciar la productividad

Google ha integrado Gemini, una inteligencia artificial avanzada, en su suite de aplicaciones, transformando Docs, Sheets, Slides y Drive. Las nuevas funciones permiten generar contenido,...