Google amplía su programa de recompensas por vulnerabilidades para incluir ataques a la inteligencia artificial generativa
Google ha ampliado su programa de recompensas por vulnerabilidades (VRP, por sus siglas en inglés) para incluir escenarios de ataque específicos para la inteligencia artificial generativa. La compañía anunció que esta expansión incentivará la investigación en seguridad de la IA y permitirá identificar posibles problemas que, en última instancia, harán que la IA sea más segura para todos.
El programa de recompensas por vulnerabilidades de Google paga a los hackers éticos por encontrar y divulgar de manera responsable fallas de seguridad. Dado que la IA generativa presenta nuevos problemas de seguridad, como el potencial de sesgos injustos o manipulación del modelo, Google decidió replantear cómo se categorizan y reportan los errores que recibe.
Para lograr esto, la compañía está utilizando los hallazgos de su recién formado Equipo Rojo de IA, un grupo de hackers que simulan una variedad de adversarios, desde estados-nación y grupos respaldados por el gobierno hasta hacktivistas y personas con malas intenciones, para detectar debilidades de seguridad en la tecnología. Recientemente, el equipo realizó un ejercicio para determinar las mayores amenazas para la tecnología detrás de productos de IA generativa como ChatGPT y Google Bard.
El equipo descubrió que los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) son vulnerables a ataques de inyección de indicaciones, por ejemplo, en los que un hacker crea indicaciones adversas que pueden influir en el comportamiento del modelo. Un atacante podría utilizar este tipo de ataque para generar texto perjudicial u ofensivo o filtrar información confidencial. También advirtieron sobre otro tipo de ataque llamado extracción de datos de entrenamiento, que permite a los hackers reconstruir ejemplos de entrenamiento de manera textual para extraer información personal identificable o contraseñas de los datos.
Ambos tipos de ataques están incluidos en el alcance del VRP ampliado de Google, junto con los ataques de manipulación del modelo y robo del modelo. Sin embargo, Google no ofrecerá recompensas a los investigadores que descubran errores relacionados con problemas de derechos de autor o extracción de datos que reconstruyan información no sensible o pública.
Las recompensas monetarias variarán según la gravedad de la vulnerabilidad descubierta. Actualmente, los investigadores pueden ganar hasta $31,337 si encuentran ataques de inyección de comandos y fallas de deserialización en aplicaciones altamente sensibles, como Google Search o Google Play. Si las fallas afectan a aplicaciones de menor prioridad, la recompensa máxima es de $5,000.
Google informó que pagó más de $12 millones en recompensas a investigadores de seguridad en 2022, lo que demuestra su compromiso con la protección de la IA y la promoción de la investigación en seguridad cibernética. Con esta expansión del VRP, Google busca fomentar aún más la colaboración entre la comunidad de investigadores y la compañía para mejorar la seguridad de la IA generativa y garantizar su uso responsable en beneficio de todos.
Otras noticias • Seguridad
Martha Root desactiva sitios supremacistas en audaz hacktivismo
Martha Root, disfrazada de Power Ranger Rosa, realizó un audaz ataque cibernético en el Chaos Communication Congress, desactivando sitios web de supremacía blanca. Utilizó chatbots...
Ciberataques amenazan a la industria aseguradora y sus clientes
La industria aseguradora enfrenta crecientes ciberataques, como el reciente incidente de Aflac que comprometió datos de 22.65 millones de clientes. Esto resalta la necesidad de...
Ciberataques amenazan la seguridad de la industria aseguradora en EE.UU
La industria aseguradora en EE.UU. enfrenta una ola de ciberataques, destacando el caso de Aflac, que comprometió 22,65 millones de registros. Estos incidentes generan preocupación...
Ciberataque interrumpe operaciones de La Poste en Francia
La Poste, el servicio postal y bancario francés, sufrió un ciberataque que interrumpió sus operaciones digitales. Aunque un grupo hacktivista ruso se atribuyó el ataque,...
Vigilancia de matrículas en Uzbekistán pone en riesgo la privacidad
En Uzbekistán, un sistema de vigilancia de matrículas expuesto a internet plantea serias preocupaciones sobre la privacidad y la seguridad de los datos. La falta...
Vulnerabilidad en Cisco expone a cientos de clientes a ciberataques
Una vulnerabilidad en productos de Cisco, catalogada como CVE-2025-20393, ha sido detectada y afecta a cientos de clientes. La falta de parches disponibles agrava la...
Ciberataque a DXS International expone vulnerabilidades en salud pública
El ciberataque a DXS International resalta las vulnerabilidades en el sector sanitario, poniendo en riesgo la seguridad de los datos de los pacientes. La ciberseguridad...
Cisco advierte sobre grave vulnerabilidad en AsyncOS sin parches
Cisco ha alertado sobre una vulnerabilidad crítica en su software AsyncOS, permitiendo a hackers tomar control de dispositivos. Sin parches disponibles, la única solución es...
Lo más reciente
- 1
Meta compra Manus por 2.000 millones y despierta dudas regulatorias
- 2
La IA revoluciona inversiones y empleo, plantea retos éticos
- 3
CES 2026: Innovaciones tecnológicas impulsadas por inteligencia artificial
- 4
Desinformación digital crece en redes sociales y necesita solución urgente
- 5
Mobileye adquiere Mentee Robotics por 900 millones de dólares
- 6
LMArena recauda 150 millones y alcanza valoración de 1.7 mil millones
- 7
Intel lanza plataforma Panther Lake para revolucionar el gaming portátil

