Seguridad | Ampliación

Google amplía programa de recompensas para seguridad de IA generativa

Google amplía su programa de recompensas por vulnerabilidades para incluir ataques a la inteligencia artificial generativa

Google ha ampliado su programa de recompensas por vulnerabilidades (VRP, por sus siglas en inglés) para incluir escenarios de ataque específicos para la inteligencia artificial generativa. La compañía anunció que esta expansión incentivará la investigación en seguridad de la IA y permitirá identificar posibles problemas que, en última instancia, harán que la IA sea más segura para todos.

El programa de recompensas por vulnerabilidades de Google paga a los hackers éticos por encontrar y divulgar de manera responsable fallas de seguridad. Dado que la IA generativa presenta nuevos problemas de seguridad, como el potencial de sesgos injustos o manipulación del modelo, Google decidió replantear cómo se categorizan y reportan los errores que recibe.

Para lograr esto, la compañía está utilizando los hallazgos de su recién formado Equipo Rojo de IA, un grupo de hackers que simulan una variedad de adversarios, desde estados-nación y grupos respaldados por el gobierno hasta hacktivistas y personas con malas intenciones, para detectar debilidades de seguridad en la tecnología. Recientemente, el equipo realizó un ejercicio para determinar las mayores amenazas para la tecnología detrás de productos de IA generativa como ChatGPT y Google Bard.

El equipo descubrió que los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) son vulnerables a ataques de inyección de indicaciones, por ejemplo, en los que un hacker crea indicaciones adversas que pueden influir en el comportamiento del modelo. Un atacante podría utilizar este tipo de ataque para generar texto perjudicial u ofensivo o filtrar información confidencial. También advirtieron sobre otro tipo de ataque llamado extracción de datos de entrenamiento, que permite a los hackers reconstruir ejemplos de entrenamiento de manera textual para extraer información personal identificable o contraseñas de los datos.

Ambos tipos de ataques están incluidos en el alcance del VRP ampliado de Google, junto con los ataques de manipulación del modelo y robo del modelo. Sin embargo, Google no ofrecerá recompensas a los investigadores que descubran errores relacionados con problemas de derechos de autor o extracción de datos que reconstruyan información no sensible o pública.

Las recompensas monetarias variarán según la gravedad de la vulnerabilidad descubierta. Actualmente, los investigadores pueden ganar hasta $31,337 si encuentran ataques de inyección de comandos y fallas de deserialización en aplicaciones altamente sensibles, como Google Search o Google Play. Si las fallas afectan a aplicaciones de menor prioridad, la recompensa máxima es de $5,000.

Google informó que pagó más de $12 millones en recompensas a investigadores de seguridad en 2022, lo que demuestra su compromiso con la protección de la IA y la promoción de la investigación en seguridad cibernética. Con esta expansión del VRP, Google busca fomentar aún más la colaboración entre la comunidad de investigadores y la compañía para mejorar la seguridad de la IA generativa y garantizar su uso responsable en beneficio de todos.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • Seguridad

Vulnerabilidad cibernética

FortiBleed expone vulnerabilidades críticas en cortafuegos y VPNs

FortiBleed revela la vulnerabilidad de miles de cortafuegos y VPN de Fortinet, explotando contraseñas predeterminadas. Este ataque subraya la importancia de buenas prácticas en gestión...

Privacidad comprometida

Apple modifica "Hide My Email" generando dudas sobre privacidad

Apple ha cambiado el dominio de su función "Hide My Email" a @private.icloud.com, lo que podría facilitar que aplicaciones bloqueen registros anónimos. Este cambio ha...

Ciberseguridad integral

FBI inaugura Kinetic Cyber Range para entrenar en ciberseguridad

El Kinetic Cyber Range del FBI, inaugurado en 2025, simula una ciudad para entrenar a agentes en la respuesta a ciberataques. Este espacio fomenta la...

Vulnerabilidad crítica

Vulnerabilidad en PeopleSoft expone datos de 100 organizaciones educativas

Oracle ha alertado sobre una vulnerabilidad crítica en PeopleSoft, explotada por el grupo ShinyHunters, que ha comprometido datos de más de 100 organizaciones, principalmente del...

Ciberamenaza significativa

Hackers norcoreanos amenazan ciberseguridad con robos y suplantación

Los hackers norcoreanos, liderados por "Famous Chollima", representan una amenaza significativa en ciberseguridad, infiltrándose en empresas tecnológicas mediante suplantación de identidad y robos de criptomonedas....

Fallo seguridad

ServiceNow enfrenta crisis tras grave fallo de seguridad

ServiceNow ha sufrido un grave fallo de seguridad que permitió el acceso no autorizado a datos sensibles de clientes. La vulnerabilidad ha generado desconfianza entre...

Ciberataque malware

Microsoft desactiva 70 proyectos tras ataque cibernético alarmante

Un ataque cibernético ha comprometido proyectos de código abierto de Microsoft, inyectando malware para robar contraseñas. La compañía ha deshabilitado 70 proyectos en GitHub, generando...

Privacidad digital

WhatsApp frena hacking de NSO Group y defiende la privacidad

WhatsApp ha desbaratado intentos de hacking vinculados a NSO Group, un fabricante de spyware. La lucha por la privacidad digital se intensifica, con la necesidad...