Google amplía su programa de recompensas por vulnerabilidades para incluir ataques a la inteligencia artificial generativa
Google ha ampliado su programa de recompensas por vulnerabilidades (VRP, por sus siglas en inglés) para incluir escenarios de ataque específicos para la inteligencia artificial generativa. La compañía anunció que esta expansión incentivará la investigación en seguridad de la IA y permitirá identificar posibles problemas que, en última instancia, harán que la IA sea más segura para todos.
El programa de recompensas por vulnerabilidades de Google paga a los hackers éticos por encontrar y divulgar de manera responsable fallas de seguridad. Dado que la IA generativa presenta nuevos problemas de seguridad, como el potencial de sesgos injustos o manipulación del modelo, Google decidió replantear cómo se categorizan y reportan los errores que recibe.
Para lograr esto, la compañía está utilizando los hallazgos de su recién formado Equipo Rojo de IA, un grupo de hackers que simulan una variedad de adversarios, desde estados-nación y grupos respaldados por el gobierno hasta hacktivistas y personas con malas intenciones, para detectar debilidades de seguridad en la tecnología. Recientemente, el equipo realizó un ejercicio para determinar las mayores amenazas para la tecnología detrás de productos de IA generativa como ChatGPT y Google Bard.
El equipo descubrió que los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) son vulnerables a ataques de inyección de indicaciones, por ejemplo, en los que un hacker crea indicaciones adversas que pueden influir en el comportamiento del modelo. Un atacante podría utilizar este tipo de ataque para generar texto perjudicial u ofensivo o filtrar información confidencial. También advirtieron sobre otro tipo de ataque llamado extracción de datos de entrenamiento, que permite a los hackers reconstruir ejemplos de entrenamiento de manera textual para extraer información personal identificable o contraseñas de los datos.
Ambos tipos de ataques están incluidos en el alcance del VRP ampliado de Google, junto con los ataques de manipulación del modelo y robo del modelo. Sin embargo, Google no ofrecerá recompensas a los investigadores que descubran errores relacionados con problemas de derechos de autor o extracción de datos que reconstruyan información no sensible o pública.
Las recompensas monetarias variarán según la gravedad de la vulnerabilidad descubierta. Actualmente, los investigadores pueden ganar hasta $31,337 si encuentran ataques de inyección de comandos y fallas de deserialización en aplicaciones altamente sensibles, como Google Search o Google Play. Si las fallas afectan a aplicaciones de menor prioridad, la recompensa máxima es de $5,000.
Google informó que pagó más de $12 millones en recompensas a investigadores de seguridad en 2022, lo que demuestra su compromiso con la protección de la IA y la promoción de la investigación en seguridad cibernética. Con esta expansión del VRP, Google busca fomentar aún más la colaboración entre la comunidad de investigadores y la compañía para mejorar la seguridad de la IA generativa y garantizar su uso responsable en beneficio de todos.
Otras noticias • Seguridad
Desarrolladores de código abierto bloqueados por Microsoft afectan seguridad
Dos desarrolladores de software de código abierto, Jason Donenfeld y Mounir Idrassi, han sido bloqueados de sus cuentas de Microsoft, impidiendo actualizaciones críticas de sus...
Aumento del hackeo por encargo amenaza a periodistas y activistas
El hackeo por encargo ha aumentado, afectando a periodistas y activistas, con técnicas sofisticadas que comprometen la privacidad. La colaboración entre gobiernos y grupos de...
Ciberataque filtra 7.7 terabytes de datos del LAPD
Un ataque cibernético ha comprometido datos sensibles del Departamento de Policía de Los Ángeles, filtrando 7.7 terabytes de información. El grupo World Leaks es responsable....
Desarrollador de VeraCrypt enfrenta bloqueo de cuenta por Microsoft
Mounir Idrassi, desarrollador de VeraCrypt, enfrenta un bloqueo de cuenta por parte de Microsoft, amenazando la funcionalidad del software de encriptación. Esta situación resalta la...
Hackers rusos comprometen 18,000 routers en 120 países
Un grupo de hackers rusos, Fancy Bear, ha atacado routers domésticos a nivel global, comprometiendo 18,000 dispositivos en 120 países. Las vulnerabilidades de software permiten...
Ciberataque norcoreano expone vulnerabilidades en proyectos de código abierto
Un ciberataque norcoreano comprometió brevemente el proyecto de código abierto Axios, utilizando técnicas de ingeniería social para engañar a su desarrollador. Esto resalta las vulnerabilidades...
Teletrabajo en Corea del Norte: identidades falsas y fraudes
El teletrabajo en Corea del Norte revela una realidad inquietante, donde ciudadanos buscan empleo en el extranjero bajo identidades falsas. Las sanciones internacionales complican su...
Bryan Fleming evade prisión tras multa por espionaje ilegal
Bryan Fleming, fabricante de spyware, eludió prisión tras declararse culpable en EE. UU. y recibir una multa de 5,000 dólares. Su empresa, pcTattletale, facilitaba el...
Lo más reciente
- 1
Artemis II regresa exitosamente y avanza exploración lunar y Marte
- 2
Artemis II: Hito lunar con astronautas tras 50 años
- 3
Controversia entre OpenClaw y Anthropic desata debate sobre ética en IA
- 4
Ascend Elements se declara en bancarrota y sacude mercado eléctrico
- 5
YouTube incrementa precios en Premium y Music ante críticas mixtas
- 6
Francia adopta Linux para fortalecer su soberanía digital
- 7
Meta lanza Muse Spark ante preocupaciones de privacidad y confianza

