DataCebo lanza una herramienta para crear datos sintéticos con IA generativa
La startup DataCebo ha lanzado una herramienta revolucionaria que permite a las empresas crear datos sintéticos utilizando inteligencia artificial generativa. La compañía, fundada por Kalyan Veeramachaneni y Neha Patki, ha desarrollado una biblioteca de código abierto llamada Synthetic Data Vault (SDV), que permite a las empresas generar datos sintéticos a partir de bases de datos relacionales y tabulares.
Una solución para las empresas que necesitan datos de calidad sin exponer información sensible
Esta herramienta se diferencia de otras herramientas de creación de IA generativa al permitir a los clientes construir un modelo de IA generativa personalizado en sus propias instalaciones y utilizar esos datos sintéticos para una variedad de casos de uso. Esto es especialmente útil para empresas que necesitan utilizar datos empresariales de calidad en modelos de lenguaje grandes, pero que no pueden utilizar información personalmente identificable (PII) para hacerlo.
Según el CEO de DataCebo, Kalyan Veeramachaneni, las empresas han tenido que crear datos sintéticos manualmente, un proceso tedioso y propenso a errores que es difícil de escalar. Sin embargo, utilizando la inteligencia artificial generativa, los clientes de DataCebo pueden simplemente describir el tipo de datos que necesitan y el software generará automáticamente un conjunto de datos sintéticos de alta calidad para fines de prueba sin exponer ninguna información sensible.
Un éxito en la comunidad de código abierto
Los fundadores de DataCebo comenzaron creando una versión de código abierto de su herramienta, que resultó ser extremadamente popular y les ayudó a probar las diversas partes principales del software. La herramienta ha sido descargada más de un millón de veces y cuenta con una comunidad activa de más de mil personas en su canal de Slack.
Según Neha Patki, VP de Producto de DataCebo, esta comunidad ha sido fundamental para validar los algoritmos principales del software y corregir errores rápidamente. "Si hay algún error, nuestros usuarios de código abierto lo encuentran inmediatamente y podemos solucionarlo", afirmó Patki.
La versión empresarial permite manejar hasta cien tablas
La diferencia clave entre la versión de código abierto y la versión empresarial de SDV es la escala. Mientras que la versión de código abierto está diseñada para manejar solo unas pocas tablas, la versión empresarial puede manejar hasta cien tablas. Hasta ahora, los clientes han estado construyendo modelos basados en más de 20 o 30 tablas.
DataCebo actualmente cuenta con 11 empleados y planea contratar más personal en el próximo año para alcanzar alrededor de 20 empleados, dependiendo del crecimiento del negocio.
Financiación de 8,5 millones de dólares para impulsar el crecimiento
La startup ha asegurado una financiación de 8,5 millones de dólares en su ronda de financiación inicial, liderada por Link Ventures y Zetta Venture Partners, con la participación de Uncorrelated Ventures. Estos fondos serán utilizados para impulsar el crecimiento de la compañía y expandir su equipo.
DataCebo está abriendo nuevas posibilidades para las empresas que necesitan datos de calidad sin exponer información sensible. Con su herramienta de creación de datos sintéticos basada en inteligencia artificial generativa, las empresas pueden aprovechar al máximo sus datos y acelerar su proceso de desarrollo y pruebas de modelos de IA.
Otras noticias • IA
Controversia por video de Bernie Sanders y chatbot Claude
El video de Bernie Sanders con el chatbot Claude ha generado controversia al mostrar cómo los chatbots pueden reflejar creencias de sus usuarios, lo que...
Sam Altman deja Helion, abre puerta a colaboración con OpenAI
Sam Altman ha dejado su puesto en Helion, lo que sugiere una colaboración entre OpenAI y la startup de fusión para optimizar la producción de...
Helion Energy y OpenAI negocian acuerdo para energía de fusión
Helion Energy y OpenAI están en conversaciones para un acuerdo que aseguraría a OpenAI el 12,5% de la producción de energía de fusión de Helion....
Anthropic rechaza colaborar con el Pentágono por ética
La empresa de IA Anthropic se niega a colaborar con el Pentágono por preocupaciones éticas sobre el uso de su tecnología en vigilancia y armamento....
Controversia por lanzamiento de Composer 2 de Cursor
El lanzamiento de Composer 2 por Cursor ha generado controversia al ser considerado una variante de Kimi 2.5 de Moonshot AI. La falta de transparencia...
Tokens de IA transforman compensación en Silicon Valley, surgen dudas
La compensación en Silicon Valley está evolucionando con la introducción de tokens de IA, que ofrecen a los ingenieros acceso a potencia computacional. Aunque pueden...
Delve enfrenta acusaciones de manipulación de datos y falta de transparencia
Delve, una startup de cumplimiento normativo, enfrenta graves acusaciones de manipulación de datos y falta de transparencia. Un post anónimo revela que la empresa proporcionaba...
Nvidia genera optimismo, pero Wall Street muestra cautela
El discurso de Jensen Huang, CEO de Nvidia, generó optimismo por innovaciones y proyecciones, pero Wall Street reaccionó con cautela, reflejando incertidumbre sobre la IA...
Lo más reciente
- 1
Agile Robots y Google DeepMind transforman la robótica autónoma
- 2
Ultrahuman lanza Ring Pro para recuperar cuota en EE.UU
- 3
Delve enfrenta serias acusaciones que amenazan su futuro
- 4
Swish recauda 38 millones para entrega de comida en 10 minutos
- 5
Apple Maps podría incluir anuncios, generando preocupación entre usuarios
- 6
Kalshi y Polymarket compiten tras la llegada de 5(c) Capital
- 7
Zipline obtiene 200 millones y alcanza valoración de 7.6 mil millones

