IA | Innovación

DataCebo revoluciona la generación de datos con Synthetic Data Vault

DataCebo lanza una herramienta para crear datos sintéticos con IA generativa

La startup DataCebo ha lanzado una herramienta revolucionaria que permite a las empresas crear datos sintéticos utilizando inteligencia artificial generativa. La compañía, fundada por Kalyan Veeramachaneni y Neha Patki, ha desarrollado una biblioteca de código abierto llamada Synthetic Data Vault (SDV), que permite a las empresas generar datos sintéticos a partir de bases de datos relacionales y tabulares.

Una solución para las empresas que necesitan datos de calidad sin exponer información sensible

Esta herramienta se diferencia de otras herramientas de creación de IA generativa al permitir a los clientes construir un modelo de IA generativa personalizado en sus propias instalaciones y utilizar esos datos sintéticos para una variedad de casos de uso. Esto es especialmente útil para empresas que necesitan utilizar datos empresariales de calidad en modelos de lenguaje grandes, pero que no pueden utilizar información personalmente identificable (PII) para hacerlo.

Según el CEO de DataCebo, Kalyan Veeramachaneni, las empresas han tenido que crear datos sintéticos manualmente, un proceso tedioso y propenso a errores que es difícil de escalar. Sin embargo, utilizando la inteligencia artificial generativa, los clientes de DataCebo pueden simplemente describir el tipo de datos que necesitan y el software generará automáticamente un conjunto de datos sintéticos de alta calidad para fines de prueba sin exponer ninguna información sensible.

Un éxito en la comunidad de código abierto

Los fundadores de DataCebo comenzaron creando una versión de código abierto de su herramienta, que resultó ser extremadamente popular y les ayudó a probar las diversas partes principales del software. La herramienta ha sido descargada más de un millón de veces y cuenta con una comunidad activa de más de mil personas en su canal de Slack.

Según Neha Patki, VP de Producto de DataCebo, esta comunidad ha sido fundamental para validar los algoritmos principales del software y corregir errores rápidamente. "Si hay algún error, nuestros usuarios de código abierto lo encuentran inmediatamente y podemos solucionarlo", afirmó Patki.

La versión empresarial permite manejar hasta cien tablas

La diferencia clave entre la versión de código abierto y la versión empresarial de SDV es la escala. Mientras que la versión de código abierto está diseñada para manejar solo unas pocas tablas, la versión empresarial puede manejar hasta cien tablas. Hasta ahora, los clientes han estado construyendo modelos basados en más de 20 o 30 tablas.

DataCebo actualmente cuenta con 11 empleados y planea contratar más personal en el próximo año para alcanzar alrededor de 20 empleados, dependiendo del crecimiento del negocio.

Financiación de 8,5 millones de dólares para impulsar el crecimiento

La startup ha asegurado una financiación de 8,5 millones de dólares en su ronda de financiación inicial, liderada por Link Ventures y Zetta Venture Partners, con la participación de Uncorrelated Ventures. Estos fondos serán utilizados para impulsar el crecimiento de la compañía y expandir su equipo.

DataCebo está abriendo nuevas posibilidades para las empresas que necesitan datos de calidad sin exponer información sensible. Con su herramienta de creación de datos sintéticos basada en inteligencia artificial generativa, las empresas pueden aprovechar al máximo sus datos y acelerar su proceso de desarrollo y pruebas de modelos de IA.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Vídeos creativos

Midjourney lanza V1, revolucionando vídeos y desafiando derechos de autor

Midjourney ha lanzado V1, un modelo de generación de vídeos que transforma imágenes en secuencias de cinco segundos, ampliando las posibilidades creativas. Sin embargo, enfrenta...

Colaboración finalizada

OpenAI termina colaboración con Scale AI, incertidumbre en la industria

OpenAI ha finalizado su colaboración con Scale AI, buscando proveedores de datos más especializados. Esto genera incertidumbre en la industria del etiquetado de datos, mientras...

Desalineación ética

OpenAI revela hallazgos sobre comportamientos desalineados en IA

Investigadores de OpenAI han descubierto características ocultas en modelos de IA que corresponden a comportamientos desalineados, como la toxicidad. Este hallazgo permite ajustar y redirigir...

Controversia ambiental

xAI en el ojo del huracán por turbinas sin permisos

La empresa xAI enfrenta controversia en Memphis por operar turbinas de gas natural sin permisos, lo que podría agravar la calidad del aire y la...

Interacción fluida

Google presenta "Search Live" para búsquedas interactivas y fluidas

Google ha lanzado "Search Live", una funcionalidad que permite a los usuarios interactuar con la IA de forma conversacional y fluida, facilitando la búsqueda de...

Comunidades auténticas

Digg renace con IA y recompensas para comunidades auténticas

La revitalización de Digg busca crear comunidades online auténticas, alejadas de bots y desinformación. Con una nueva aplicación en fase alpha, incorpora inteligencia artificial y...

Ética tecnológica

Desafíos éticos en la búsqueda de inteligencia artificial general

La búsqueda de la inteligencia artificial general (AGI) plantea desafíos éticos y de gobernanza. Iniciativas como "The OpenAI Files" destacan la necesidad de transparencia y...

Competencia intensa

Meta ofrece hasta 100 millones por talento en IA

Meta compite ferozmente por talento en inteligencia artificial, ofreciendo hasta 100 millones de dólares en compensación. A pesar de sus esfuerzos, OpenAI retiene a sus...