DataCebo lanza una herramienta para crear datos sintéticos con IA generativa
La startup DataCebo ha lanzado una herramienta revolucionaria que permite a las empresas crear datos sintéticos utilizando inteligencia artificial generativa. La compañía, fundada por Kalyan Veeramachaneni y Neha Patki, ha desarrollado una biblioteca de código abierto llamada Synthetic Data Vault (SDV), que permite a las empresas generar datos sintéticos a partir de bases de datos relacionales y tabulares.
Una solución para las empresas que necesitan datos de calidad sin exponer información sensible
Esta herramienta se diferencia de otras herramientas de creación de IA generativa al permitir a los clientes construir un modelo de IA generativa personalizado en sus propias instalaciones y utilizar esos datos sintéticos para una variedad de casos de uso. Esto es especialmente útil para empresas que necesitan utilizar datos empresariales de calidad en modelos de lenguaje grandes, pero que no pueden utilizar información personalmente identificable (PII) para hacerlo.
Según el CEO de DataCebo, Kalyan Veeramachaneni, las empresas han tenido que crear datos sintéticos manualmente, un proceso tedioso y propenso a errores que es difícil de escalar. Sin embargo, utilizando la inteligencia artificial generativa, los clientes de DataCebo pueden simplemente describir el tipo de datos que necesitan y el software generará automáticamente un conjunto de datos sintéticos de alta calidad para fines de prueba sin exponer ninguna información sensible.
Un éxito en la comunidad de código abierto
Los fundadores de DataCebo comenzaron creando una versión de código abierto de su herramienta, que resultó ser extremadamente popular y les ayudó a probar las diversas partes principales del software. La herramienta ha sido descargada más de un millón de veces y cuenta con una comunidad activa de más de mil personas en su canal de Slack.
Según Neha Patki, VP de Producto de DataCebo, esta comunidad ha sido fundamental para validar los algoritmos principales del software y corregir errores rápidamente. "Si hay algún error, nuestros usuarios de código abierto lo encuentran inmediatamente y podemos solucionarlo", afirmó Patki.
La versión empresarial permite manejar hasta cien tablas
La diferencia clave entre la versión de código abierto y la versión empresarial de SDV es la escala. Mientras que la versión de código abierto está diseñada para manejar solo unas pocas tablas, la versión empresarial puede manejar hasta cien tablas. Hasta ahora, los clientes han estado construyendo modelos basados en más de 20 o 30 tablas.
DataCebo actualmente cuenta con 11 empleados y planea contratar más personal en el próximo año para alcanzar alrededor de 20 empleados, dependiendo del crecimiento del negocio.
Financiación de 8,5 millones de dólares para impulsar el crecimiento
La startup ha asegurado una financiación de 8,5 millones de dólares en su ronda de financiación inicial, liderada por Link Ventures y Zetta Venture Partners, con la participación de Uncorrelated Ventures. Estos fondos serán utilizados para impulsar el crecimiento de la compañía y expandir su equipo.
DataCebo está abriendo nuevas posibilidades para las empresas que necesitan datos de calidad sin exponer información sensible. Con su herramienta de creación de datos sintéticos basada en inteligencia artificial generativa, las empresas pueden aprovechar al máximo sus datos y acelerar su proceso de desarrollo y pruebas de modelos de IA.
Otras noticias • IA
Kulveer Taggar lanza fondo de capital riesgo para startups de YC
Kulveer Taggar, antiguo alumno de Y Combinator, ha fundado Phosphor Capital, un fondo de capital riesgo que invierte exclusivamente en startups de YC. Con 34...
Ilya Sutskever nuevo CEO de Safe Superintelligence tras salida de Gross
Ilya Sutskever asume como CEO de Safe Superintelligence tras la salida de Daniel Gross. La startup, centrada en desarrollar superinteligencia segura, enfrenta desafíos en un...
Controversia por turbinas de gas natural en Shelby County
El Departamento de Salud del Condado de Shelby ha autorizado a xAI a operar 15 turbinas de gas natural, generando preocupaciones ambientales y de salud...
Controversia por tokens de OpenAI genera dudas en inversores
La controversia sobre los "tokens de OpenAI" vendidos por Robinhood ha generado preocupación por la falta de claridad y regulación en la tokenización de acciones....
La IA revoluciona los videojuegos con experiencias inmersivas y personalizadas
La inteligencia artificial está transformando la industria de los videojuegos, con modelos como Veo 3 y Gemini 2.5 Pro prometiendo crear experiencias más inmersivas y...
Perplexity lanza suscripción premium Max ante desafíos financieros
Perplexity lanza su plan de suscripción premium, Perplexity Max, a 200 dólares al mes, buscando atraer a usuarios exigentes en un mercado de IA competitivo....
X lanza notas comunitarias de IA para verificar hechos
X, antes Twitter, introduce notas comunitarias generadas por IA para mejorar la verificación de hechos. Aunque esta colaboración humano-IA busca aumentar la precisión, enfrenta desafíos...
Amazon alcanza un millón de robots y transforma la logística
Amazon ha alcanzado un millón de robots en sus almacenes, transformando la logística y planteando interrogantes sobre el empleo. Con la introducción de inteligencia artificial...
Lo más reciente
- 1
Gallant recauda 18 millones para terapia celular en mascotas
- 2
Microsoft abandona Pakistán tras 25 años de operaciones
- 3
Cluely alcanza 7 millones de dólares en ARR con IA
- 4
Slate Auto lucha por sobrevivir tras eliminar crédito fiscal
- 5
Mensajes directos en Threads aumentan preocupaciones de acoso en línea
- 6
Darragh Buckley invierte en Twin City Bank para fortalecer comunidades
- 7
Juez cuestiona eliminación de recursos sanitarios para comunidad LGBTQ+