DataCebo lanza una herramienta para crear datos sintéticos con IA generativa
La startup DataCebo ha lanzado una herramienta revolucionaria que permite a las empresas crear datos sintéticos utilizando inteligencia artificial generativa. La compañía, fundada por Kalyan Veeramachaneni y Neha Patki, ha desarrollado una biblioteca de código abierto llamada Synthetic Data Vault (SDV), que permite a las empresas generar datos sintéticos a partir de bases de datos relacionales y tabulares.
Una solución para las empresas que necesitan datos de calidad sin exponer información sensible
Esta herramienta se diferencia de otras herramientas de creación de IA generativa al permitir a los clientes construir un modelo de IA generativa personalizado en sus propias instalaciones y utilizar esos datos sintéticos para una variedad de casos de uso. Esto es especialmente útil para empresas que necesitan utilizar datos empresariales de calidad en modelos de lenguaje grandes, pero que no pueden utilizar información personalmente identificable (PII) para hacerlo.
Según el CEO de DataCebo, Kalyan Veeramachaneni, las empresas han tenido que crear datos sintéticos manualmente, un proceso tedioso y propenso a errores que es difícil de escalar. Sin embargo, utilizando la inteligencia artificial generativa, los clientes de DataCebo pueden simplemente describir el tipo de datos que necesitan y el software generará automáticamente un conjunto de datos sintéticos de alta calidad para fines de prueba sin exponer ninguna información sensible.
Un éxito en la comunidad de código abierto
Los fundadores de DataCebo comenzaron creando una versión de código abierto de su herramienta, que resultó ser extremadamente popular y les ayudó a probar las diversas partes principales del software. La herramienta ha sido descargada más de un millón de veces y cuenta con una comunidad activa de más de mil personas en su canal de Slack.
Según Neha Patki, VP de Producto de DataCebo, esta comunidad ha sido fundamental para validar los algoritmos principales del software y corregir errores rápidamente. "Si hay algún error, nuestros usuarios de código abierto lo encuentran inmediatamente y podemos solucionarlo", afirmó Patki.
La versión empresarial permite manejar hasta cien tablas
La diferencia clave entre la versión de código abierto y la versión empresarial de SDV es la escala. Mientras que la versión de código abierto está diseñada para manejar solo unas pocas tablas, la versión empresarial puede manejar hasta cien tablas. Hasta ahora, los clientes han estado construyendo modelos basados en más de 20 o 30 tablas.
DataCebo actualmente cuenta con 11 empleados y planea contratar más personal en el próximo año para alcanzar alrededor de 20 empleados, dependiendo del crecimiento del negocio.
Financiación de 8,5 millones de dólares para impulsar el crecimiento
La startup ha asegurado una financiación de 8,5 millones de dólares en su ronda de financiación inicial, liderada por Link Ventures y Zetta Venture Partners, con la participación de Uncorrelated Ventures. Estos fondos serán utilizados para impulsar el crecimiento de la compañía y expandir su equipo.
DataCebo está abriendo nuevas posibilidades para las empresas que necesitan datos de calidad sin exponer información sensible. Con su herramienta de creación de datos sintéticos basada en inteligencia artificial generativa, las empresas pueden aprovechar al máximo sus datos y acelerar su proceso de desarrollo y pruebas de modelos de IA.
Otras noticias • IA
Meta compra Manus por 2.000 millones y despierta dudas regulatorias
La adquisición de Manus por Meta por 2.000 millones de dólares genera incertidumbre regulatoria, especialmente en China, donde se investiga si la transacción viola controles...
La IA revoluciona inversiones y empleo, plantea retos éticos
La inteligencia artificial está transformando las inversiones y el mercado laboral, creando oportunidades y desafíos. Las empresas deben adaptarse rápidamente, priorizando habilidades humanas como la...
CES 2026: Innovaciones tecnológicas impulsadas por inteligencia artificial
El CES 2026 ha destacado por la integración de la inteligencia artificial en diversas innovaciones tecnológicas. Empresas como Nvidia, AMD y Amazon han presentado avances...
Desinformación digital crece en redes sociales y necesita solución urgente
La desinformación digital, amplificada por redes sociales e inteligencia artificial, plantea serios riesgos. Un caso reciente en Reddit muestra cómo relatos falsos pueden volverse virales,...
Intel lanza plataforma Panther Lake para revolucionar el gaming portátil
Intel ha anunciado su nueva plataforma de hardware y software para gaming portátil, basada en los procesadores Panther Lake. Este movimiento busca competir con AMD...
Innovaciones sorprendentes en CES 2026 transforman la tecnología diaria
CES 2026 ha presentado gadgets insólitos como un compañero holográfico, un robot panda para mayores, una máquina de hielo silenciosa, un cuchillo de cocina ultrasonido...
Senador propone prohibir juguetes con IA para menores en California
El senador Steve Padilla propone la ley SB 287 en California, que prohibiría durante cuatro años la venta de juguetes con IA para menores de...
Instalan primer imán en reactor de fusión Sparc de CFS
Commonwealth Fusion Systems ha instalado el primer imán en su reactor de fusión Sparc, un avance crucial hacia la energía de fusión. Con 18 imanes...
Lo más reciente
- 1
Artisan AI optimista tras baneo de LinkedIn por violaciones
- 2
Lux Capital cierra fondo de 1.500 millones en tecnología innovadora
- 3
OpenAI lanza ChatGPT Health para mejorar el acceso a salud
- 4
The Audacity satiriza Silicon Valley con humor oscuro y crítica
- 5
Anthropic busca 10.000 millones para alcanzar valoración de 350.000 millones
- 6
Podcasts en educación: Google transforma el aula y motiva estudiantes
- 7
Skylight Calendar 2 transforma la organización familiar con IA

