Google amplía su programa de recompensas por vulnerabilidades para incluir ataques a la inteligencia artificial generativa
Google ha ampliado su programa de recompensas por vulnerabilidades (VRP, por sus siglas en inglés) para incluir escenarios de ataque específicos para la inteligencia artificial generativa. La compañía anunció que esta expansión incentivará la investigación en seguridad de la IA y permitirá identificar posibles problemas que, en última instancia, harán que la IA sea más segura para todos.
El programa de recompensas por vulnerabilidades de Google paga a los hackers éticos por encontrar y divulgar de manera responsable fallas de seguridad. Dado que la IA generativa presenta nuevos problemas de seguridad, como el potencial de sesgos injustos o manipulación del modelo, Google decidió replantear cómo se categorizan y reportan los errores que recibe.
Para lograr esto, la compañía está utilizando los hallazgos de su recién formado Equipo Rojo de IA, un grupo de hackers que simulan una variedad de adversarios, desde estados-nación y grupos respaldados por el gobierno hasta hacktivistas y personas con malas intenciones, para detectar debilidades de seguridad en la tecnología. Recientemente, el equipo realizó un ejercicio para determinar las mayores amenazas para la tecnología detrás de productos de IA generativa como ChatGPT y Google Bard.
El equipo descubrió que los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) son vulnerables a ataques de inyección de indicaciones, por ejemplo, en los que un hacker crea indicaciones adversas que pueden influir en el comportamiento del modelo. Un atacante podría utilizar este tipo de ataque para generar texto perjudicial u ofensivo o filtrar información confidencial. También advirtieron sobre otro tipo de ataque llamado extracción de datos de entrenamiento, que permite a los hackers reconstruir ejemplos de entrenamiento de manera textual para extraer información personal identificable o contraseñas de los datos.
Ambos tipos de ataques están incluidos en el alcance del VRP ampliado de Google, junto con los ataques de manipulación del modelo y robo del modelo. Sin embargo, Google no ofrecerá recompensas a los investigadores que descubran errores relacionados con problemas de derechos de autor o extracción de datos que reconstruyan información no sensible o pública.
Las recompensas monetarias variarán según la gravedad de la vulnerabilidad descubierta. Actualmente, los investigadores pueden ganar hasta $31,337 si encuentran ataques de inyección de comandos y fallas de deserialización en aplicaciones altamente sensibles, como Google Search o Google Play. Si las fallas afectan a aplicaciones de menor prioridad, la recompensa máxima es de $5,000.
Google informó que pagó más de $12 millones en recompensas a investigadores de seguridad en 2022, lo que demuestra su compromiso con la protección de la IA y la promoción de la investigación en seguridad cibernética. Con esta expansión del VRP, Google busca fomentar aún más la colaboración entre la comunidad de investigadores y la compañía para mejorar la seguridad de la IA generativa y garantizar su uso responsable en beneficio de todos.
Otras noticias • Seguridad
Desmantelan First VPN, clave en cibercrimen y ransomware global
Una coalición internacional ha desmantelado First VPN, un servicio clave para el cibercrimen, utilizado por al menos 25 grupos de ransomware. La operación, que identificó...
Estafadores explotan vulnerabilidad de Microsoft con correos fraudulentos
Un grupo de estafadores ha explotado una vulnerabilidad en el sistema de Microsoft, enviando correos fraudulentos desde una dirección interna. Esto ha generado preocupación entre...
Filtración de datos de Trump Mobile pone en riesgo la privacidad
La filtración de datos de clientes de Trump Mobile, revelada por YouTubers, expone vulnerabilidades en la seguridad de la información. La falta de respuesta de...
Ciberataques en GitHub exigen mayor seguridad en desarrollo colaborativo
El reciente ataque a GitHub, que comprometió 3,800 repositorios, resalta la creciente amenaza de ciberataques en plataformas de desarrollo. La comunidad de desarrolladores debe priorizar...
Ciberseguridad en salud: 1.8 millones de datos comprometidos en NYC
El sector salud enfrenta un grave desafío en ciberseguridad tras la violación de datos de 1.8 millones de personas en NYC Health and Hospitals. Este...
Grafana Labs rechaza pagar a hackers tras ciberataque significativo
Grafana Labs sufrió un ciberataque que comprometió su infraestructura, pero decidió no pagar a los hackers, siguiendo el consejo del FBI. La empresa ha tomado...
Filtración de datos en Tabiq afecta a más de un millón
La brecha de seguridad en Tabiq, gestionada por Reqrea, expuso datos sensibles de más de un millón de huéspedes. La configuración incorrecta de un contenedor...
Trump en China: Seguridad extrema y tensiones persistentes
La visita de Donald Trump a China estuvo marcada por estrictas medidas de seguridad, incluyendo la entrega de objetos personales y el uso de teléfonos...
Lo más reciente
- 1
Gafas inteligentes avanzan hacia un futuro revolucionario y prometedor
- 2
La tecnología transforma la cocina con innovadores gadgets inteligentes
- 3
SolarSquare busca 60 millones para impulsar energía solar en India
- 4
Deep Fission intenta recaudar 157 millones tras fracasos previos
- 5
IBM y Ferrari revolucionan la Fórmula 1 con inteligencia artificial
- 6
Elon Musk sorprende al usar gas natural en xAI
- 7
Peec AI alcanza 10 millones en ingresos con crecimiento sostenible

