IA | Bots problemáticos

Wikimedia alerta sobre bots que amenazan acceso a información

mié, 2 de abril de 2025

La creciente amenaza de los bots en el acceso a la información

La Fundación Wikimedia, conocida por su labor en la preservación y difusión del conocimiento a través de Wikipedia y otros proyectos colaborativos, ha hecho un llamado de atención sobre un fenómeno que podría afectar a la accesibilidad de la información en la red. Desde enero de 2024, el consumo de ancho de banda para las descargas multimedia desde Wikimedia Commons ha aumentado en un 50%. Este crecimiento no es consecuencia de una mayor demanda por parte de los usuarios, sino del uso intensivo de bots automatizados que buscan recopilar datos para entrenar modelos de inteligencia artificial.

El uso desmedido de recursos por parte de bots representa un riesgo significativo para la infraestructura de Wikimedia. La organización ha señalado que, aunque su infraestructura está diseñada para manejar picos de tráfico ocasionados por usuarios humanos durante eventos de gran interés, el volumen de tráfico generado por los bots es sin precedentes. Esta situación no solo pone en riesgo el acceso de los usuarios habituales, sino que también genera costos adicionales que la Fundación debe asumir.

La dinámica del tráfico en Wikimedia Commons

Wikimedia Commons es un repositorio accesible de manera gratuita que alberga imágenes, vídeos y archivos de audio, todos bajo licencias abiertas o en dominio público. En un análisis más profundo, la Fundación ha descubierto que casi dos tercios (65%) del tráfico más “costoso” —es decir, el más intensivo en recursos— proviene de bots. Sin embargo, solo el 35% de las visualizaciones de página son generadas por estos mismos bots.

Este desbalance se debe a la forma en que los humanos y los bots interactúan con el contenido. Mientras que los lectores humanos suelen centrarse en temas específicos y populares, los bots tienden a realizar lecturas masivas de una gran cantidad de páginas, incluyendo aquellas menos consultadas. Este comportamiento provoca que las solicitudes de los bots se dirijan a centros de datos más costosos de operar, lo que aumenta significativamente los gastos de la Fundación.

El impacto en la comunidad y la respuesta de Wikimedia

La situación ha llevado al equipo de fiabilidad del sitio de la Fundación Wikimedia a dedicar tiempo y recursos a bloquear a los crawlers para evitar interrupciones en el acceso de los usuarios regulares. Esta labor se complica aún más al considerar los costos en la nube que enfrenta la organización. El esfuerzo de la Fundación por mantener el acceso abierto a la información está siendo desafiado por una tendencia creciente que podría poner en peligro la naturaleza del internet abierto.

A medida que los bots continúan su avance, la comunidad de desarrolladores y defensores del código abierto se enfrenta a un dilema: ¿cómo proteger la información sin restringir el acceso?

Un contexto más amplio: el desafío de la inteligencia artificial

Este problema no es aislado. A medida que la inteligencia artificial se integra más en diversas industrias, la presión sobre los recursos de información abierta aumenta. El ingeniero de software y defensor del código abierto, Drew DeVault, ha expresado su preocupación sobre cómo los crawlers de IA ignoran archivos “robots.txt”, diseñados para evitar el tráfico automatizado. Este desprecio por las normas establecidas pone en riesgo no solo a Wikimedia, sino a toda la infraestructura de internet abierta.

La situación ha sido corroborada por otros desarrolladores, como Gergely Orosz, quien ha señalado que los scrapers de IA de grandes empresas, como Meta, han incrementado las demandas de ancho de banda en sus propios proyectos. La preocupación es palpable: el acceso abierto a la información podría estar en peligro si las empresas y plataformas no encuentran soluciones efectivas.

Innovaciones tecnológicas como respuesta

En este contexto, algunas empresas tecnológicas están comenzando a tomar medidas para abordar el problema. Cloudflare, por ejemplo, ha lanzado recientemente AI Labyrinth, una herramienta que utiliza contenido generado por inteligencia artificial para ralentizar a los crawlers. Este tipo de innovaciones es crucial en la lucha contra el uso indiscriminado de recursos por parte de bots.

Sin embargo, el desarrollo de soluciones efectivas se asemeja a un juego del gato y el ratón. A medida que se implementan nuevas defensas, los bots también evolucionan, buscando nuevas formas de sortear las barreras establecidas. Este ciclo interminable podría forzar a muchos editores a refugiarse tras muros de inicio de sesión y sistemas de pago, lo que afectaría negativamente a todos los usuarios de la web.

La necesidad de un enfoque colaborativo

La batalla contra el uso indebido de la información y los recursos en la red no puede ser ganada por una sola entidad. Se requiere un enfoque colaborativo entre desarrolladores, plataformas de contenido y organizaciones como Wikimedia. Las normas y directrices deben ser actualizadas para reflejar la realidad de un entorno digital que está en constante cambio.

La colaboración entre entidades podría ser la clave para preservar la integridad del acceso a la información.

Es esencial que los desarrolladores y las plataformas trabajen juntos para establecer medidas que protejan los recursos de la información abierta. Esto incluye no solo la creación de nuevas tecnologías, sino también la promoción de una cultura de respeto hacia las normas de uso en la web.

Mirando hacia el futuro

El aumento del tráfico de bots en Wikimedia y otras plataformas de contenido abierto plantea preguntas sobre el futuro del acceso a la información. Si bien la inteligencia artificial ofrece oportunidades increíbles, también plantea desafíos que deben ser abordados con seriedad. La Fundación Wikimedia ha puesto sobre la mesa un tema crucial que merece la atención de toda la comunidad digital.

A medida que nos adentramos en un mundo cada vez más impulsado por la inteligencia artificial, es fundamental encontrar un equilibrio que permita la innovación sin sacrificar el acceso abierto y la diversidad de información. El reto es enorme, pero la colaboración y el compromiso de todos los actores involucrados pueden marcar la diferencia.

La Fundación Wikimedia, junto con otros defensores del acceso abierto, debe continuar abogando por un internet donde la información esté disponible para todos, sin importar la creciente presión de las tecnologías automatizadas. La preservación de un internet abierto es vital para el desarrollo de una sociedad informada y comprometida.

Otras noticias • IA

Inteligencia artificial

Helios revoluciona la política pública con inteligencia artificial Proxi

11 jul

Helios, cofundada por Joe Scheidler y Joseph Farsakh, integra inteligencia artificial en la política pública con su producto Proxi. Este sistema optimiza la toma de...

Sesgo ético

Grok 4 de xAI: ¿Sesgo de Elon Musk en inteligencia artificial?

11 jul

Grok 4, de xAI, refleja la influencia de las opiniones de Elon Musk en su funcionamiento, lo que cuestiona su objetividad y capacidad para buscar...

Marketplace IA

AWS lanza marketplace de IA para democratizar soluciones personalizadas

10 jul

El lanzamiento del marketplace de agentes de IA de AWS el 15 de julio promete democratizar el acceso a la inteligencia artificial, permitiendo a empresas...

Creación audiovisual

Google lanza Veo 3, revolucionando la creación de videos

10 jul

Google ha lanzado Veo 3, una herramienta de inteligencia artificial que permite generar videos a partir de imágenes. Esta innovación democratiza la creación de contenido...

Certificación ágil

Knox acelera certificación FedRAMP y democratiza contratos gubernamentales

10 jul

Knox, fundada por Irina Denisenko, busca acelerar el proceso de certificación FedRAMP para software como servicio en el sector público, reduciendo el tiempo y coste....

Análisis geoespacial

LGND revoluciona análisis geoespacial con 9 millones en financiación

10 jul

LGND es una startup que transforma el análisis de datos geoespaciales mediante embebidos vectoriales, mejorando la eficiencia en la interpretación de imágenes satelitales. Con una...

Innovación sostenible

Google impulsa startups de IA con nueva Academia Americana

10 jul

Google lanza la segunda cohorte de su Academia de Infraestructura Americana, apoyando startups de IA en áreas críticas como ciberseguridad y salud. El programa, sin...

Expansión sanitaria

Diligent Robotics expande flota Moxi para mejorar atención sanitaria

10 jul

Diligent Robotics, con la incorporación de Rashed Haq y Todd Brugger en su liderazgo, busca expandir su flota de robots Moxi en el sector sanitario....

Wikimedia alerta sobre bots que amenazan acceso a información

La creciente amenaza de los bots en el acceso a la información

La dinámica del tráfico en Wikimedia Commons

El impacto en la comunidad y la respuesta de Wikimedia

Un contexto más amplio: el desafío de la inteligencia artificial

Innovaciones tecnológicas como respuesta

La necesidad de un enfoque colaborativo

Mirando hacia el futuro

Otras noticias • IA

Lo más reciente

OpenAI retrasa lanzamiento de IA por pruebas de seguridad

Firefly Aerospace busca crecer en el competitivo sector espacial

Google DeepMind ficha líderes de Windsurf tras ruptura con OpenAI

Paragon enfrenta dilemas éticos tras escándalo de software espía

IA en programación: herramientas pueden reducir productividad según estudio

Torch adquiere Praxis Labs y revoluciona la formación empresarial

Expertos desmienten rumores sobre siembra de nubes en Texas