Google amplía su programa de recompensas por vulnerabilidades para incluir ataques a la inteligencia artificial generativa
Google ha ampliado su programa de recompensas por vulnerabilidades (VRP, por sus siglas en inglés) para incluir escenarios de ataque específicos para la inteligencia artificial generativa. La compañía anunció que esta expansión incentivará la investigación en seguridad de la IA y permitirá identificar posibles problemas que, en última instancia, harán que la IA sea más segura para todos.
El programa de recompensas por vulnerabilidades de Google paga a los hackers éticos por encontrar y divulgar de manera responsable fallas de seguridad. Dado que la IA generativa presenta nuevos problemas de seguridad, como el potencial de sesgos injustos o manipulación del modelo, Google decidió replantear cómo se categorizan y reportan los errores que recibe.
Para lograr esto, la compañía está utilizando los hallazgos de su recién formado Equipo Rojo de IA, un grupo de hackers que simulan una variedad de adversarios, desde estados-nación y grupos respaldados por el gobierno hasta hacktivistas y personas con malas intenciones, para detectar debilidades de seguridad en la tecnología. Recientemente, el equipo realizó un ejercicio para determinar las mayores amenazas para la tecnología detrás de productos de IA generativa como ChatGPT y Google Bard.
El equipo descubrió que los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) son vulnerables a ataques de inyección de indicaciones, por ejemplo, en los que un hacker crea indicaciones adversas que pueden influir en el comportamiento del modelo. Un atacante podría utilizar este tipo de ataque para generar texto perjudicial u ofensivo o filtrar información confidencial. También advirtieron sobre otro tipo de ataque llamado extracción de datos de entrenamiento, que permite a los hackers reconstruir ejemplos de entrenamiento de manera textual para extraer información personal identificable o contraseñas de los datos.
Ambos tipos de ataques están incluidos en el alcance del VRP ampliado de Google, junto con los ataques de manipulación del modelo y robo del modelo. Sin embargo, Google no ofrecerá recompensas a los investigadores que descubran errores relacionados con problemas de derechos de autor o extracción de datos que reconstruyan información no sensible o pública.
Las recompensas monetarias variarán según la gravedad de la vulnerabilidad descubierta. Actualmente, los investigadores pueden ganar hasta $31,337 si encuentran ataques de inyección de comandos y fallas de deserialización en aplicaciones altamente sensibles, como Google Search o Google Play. Si las fallas afectan a aplicaciones de menor prioridad, la recompensa máxima es de $5,000.
Google informó que pagó más de $12 millones en recompensas a investigadores de seguridad en 2022, lo que demuestra su compromiso con la protección de la IA y la promoción de la investigación en seguridad cibernética. Con esta expansión del VRP, Google busca fomentar aún más la colaboración entre la comunidad de investigadores y la compañía para mejorar la seguridad de la IA generativa y garantizar su uso responsable en beneficio de todos.
Otras noticias • Seguridad
Desmantelan botnet SocksEscort que afectó 369,000 enrutadores globalmente
La reciente operación contra SocksEscort, una botnet que comprometió más de 369,000 enrutadores en 163 países, destaca la colaboración internacional en la lucha contra el...
Ciberataque a Stryker revela vulnerabilidad en el sector salud
El ataque cibernético del grupo Handala a Stryker, una empresa de tecnología médica, resalta la vulnerabilidad del sector salud ante ciberamenazas. Con más de 200,000...
Google compra Wiz por 32 mil millones para fortalecer ciberseguridad
Google ha adquirido Wiz, una empresa de ciberseguridad, por 32 mil millones de dólares, destacando su enfoque en mejorar la seguridad en la nube. La...
Armadin recauda 189,9 millones para ciberseguridad con IA
Armadin, una startup de ciberseguridad fundada por Kevin Mandia, ha recaudado 189,9 millones de dólares en financiación. Su enfoque se centra en desarrollar agentes autónomos...
Salt Typhoon ataca telecomunicaciones globales y roba millones de datos
Salt Typhoon, un grupo de hacking vinculado a China, ha realizado ataques cibernéticos masivos en telecomunicaciones globales, robando millones de registros y comprometiendo infraestructuras críticas....
Hackers rusos atacan a usuarios de Signal y WhatsApp
Un informe de inteligencia de los Países Bajos revela una campaña de hacking por parte de hackers rusos, enfocada en usuarios de Signal y WhatsApp,...
Escándalo en Italia por ataque de spyware a periodista
El ataque de spyware al periodista Francesco Cancellato ha desatado un escándalo en Italia, cuestionando la privacidad y la libertad de prensa. La falta de...
Nuevo kit de hacking amenaza la seguridad de iPhones antiguos
Investigadores han descubierto el kit de hacking Coruna, que compromete iPhones con software antiguo. Originalmente desarrollado para vigilancia gubernamental, ha caído en manos de cibercriminales,...
Lo más reciente
- 1
Kalanick lanza Atoms para revolucionar robótica y automatización alimentaria
- 2
Spotify lanza herramienta para personalizar recomendaciones musicales en Premium
- 3
Peacock revoluciona streaming con IA y contenido móvil innovador
- 4
Uber lanza robotaxis autónomos de Motional en Las Vegas
- 5
Truecaller lanza alerta familiar contra llamadas fraudulentas globalmente
- 6
QuTwo revoluciona la IA cuántica con innovadora plataforma híbrida
- 7
Alexa lanza personalidad "Sassy" para interacciones más humanas

