Google amplía su programa de recompensas por vulnerabilidades para incluir ataques a la inteligencia artificial generativa
Google ha ampliado su programa de recompensas por vulnerabilidades (VRP, por sus siglas en inglés) para incluir escenarios de ataque específicos para la inteligencia artificial generativa. La compañía anunció que esta expansión incentivará la investigación en seguridad de la IA y permitirá identificar posibles problemas que, en última instancia, harán que la IA sea más segura para todos.
El programa de recompensas por vulnerabilidades de Google paga a los hackers éticos por encontrar y divulgar de manera responsable fallas de seguridad. Dado que la IA generativa presenta nuevos problemas de seguridad, como el potencial de sesgos injustos o manipulación del modelo, Google decidió replantear cómo se categorizan y reportan los errores que recibe.
Para lograr esto, la compañía está utilizando los hallazgos de su recién formado Equipo Rojo de IA, un grupo de hackers que simulan una variedad de adversarios, desde estados-nación y grupos respaldados por el gobierno hasta hacktivistas y personas con malas intenciones, para detectar debilidades de seguridad en la tecnología. Recientemente, el equipo realizó un ejercicio para determinar las mayores amenazas para la tecnología detrás de productos de IA generativa como ChatGPT y Google Bard.
El equipo descubrió que los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) son vulnerables a ataques de inyección de indicaciones, por ejemplo, en los que un hacker crea indicaciones adversas que pueden influir en el comportamiento del modelo. Un atacante podría utilizar este tipo de ataque para generar texto perjudicial u ofensivo o filtrar información confidencial. También advirtieron sobre otro tipo de ataque llamado extracción de datos de entrenamiento, que permite a los hackers reconstruir ejemplos de entrenamiento de manera textual para extraer información personal identificable o contraseñas de los datos.
Ambos tipos de ataques están incluidos en el alcance del VRP ampliado de Google, junto con los ataques de manipulación del modelo y robo del modelo. Sin embargo, Google no ofrecerá recompensas a los investigadores que descubran errores relacionados con problemas de derechos de autor o extracción de datos que reconstruyan información no sensible o pública.
Las recompensas monetarias variarán según la gravedad de la vulnerabilidad descubierta. Actualmente, los investigadores pueden ganar hasta $31,337 si encuentran ataques de inyección de comandos y fallas de deserialización en aplicaciones altamente sensibles, como Google Search o Google Play. Si las fallas afectan a aplicaciones de menor prioridad, la recompensa máxima es de $5,000.
Google informó que pagó más de $12 millones en recompensas a investigadores de seguridad en 2022, lo que demuestra su compromiso con la protección de la IA y la promoción de la investigación en seguridad cibernética. Con esta expansión del VRP, Google busca fomentar aún más la colaboración entre la comunidad de investigadores y la compañía para mejorar la seguridad de la IA generativa y garantizar su uso responsable en beneficio de todos.
Otras noticias • Seguridad
Hunters International cierra y ofrece claves de desencriptación gratuitas
Hunters International, una banda de ransomware, ha cerrado operaciones y ofrece claves de desencriptación gratuitas a sus víctimas. Este cierre podría reflejar presiones legales y...
Infiltración de hackers norcoreanos causa pérdidas en empresas estadounidenses
El esquema fraudulento liderado por Zhenxing “Danny” Wang permitió la infiltración de trabajadores informáticos norcoreanos en empresas estadounidenses, causando pérdidas significativas. Este caso resalta la...
Cartel de Sinaloa usó hacker para espiar embajada estadounidense
Un informe del Inspector General de EE.UU. revela que el cartel de Sinaloa utilizó un hacker en 2018 para espiar la embajada estadounidense en México,...
Detienen a cinco hackers en Europa por cibercrimen internacional
La detención de cinco hackers en Europa, liderados por Kai West, resalta la cooperación internacional contra el cibercrimen. Su foro, BreachForums, facilitaba la venta de...
Ring presenta IA para mejorar seguridad y privacidad en hogares
Ring ha lanzado una función de inteligencia artificial que proporciona descripciones detalladas de actividades detectadas en el hogar, mejorando la claridad de las notificaciones. Aunque...
Aflac sufre ciberataque que expone datos de clientes
Aflac ha sufrido un ciberataque que expuso datos personales de clientes, generando preocupación en la industria de seguros. La creciente frecuencia de estos ataques resalta...
Apagón de internet en Irán: millones aislados y desinformados
El apagón de internet en Irán ha dejado a millones en la oscuridad digital, dificultando la comunicación y el acceso a información vital. Justificado por...
Desconexión de Internet en Irán genera crisis y preocupación global
La desconexión casi total de Internet en Irán, en medio de un conflicto con Israel, ha generado preocupación internacional. La conectividad ha caído un 97%,...
Lo más reciente
- 1
Adiós al "Louvre de Bluesky" y su crítica social
- 2
Gallant recauda 18 millones para terapia celular en mascotas
- 3
Microsoft abandona Pakistán tras 25 años de operaciones
- 4
Cluely alcanza 7 millones de dólares en ARR con IA
- 5
Slate Auto lucha por sobrevivir tras eliminar crédito fiscal
- 6
Mensajes directos en Threads aumentan preocupaciones de acoso en línea
- 7
Darragh Buckley invierte en Twin City Bank para fortalecer comunidades