Un análisis realizado por Press Gazette reveló que una proporción significativa de los 100 principales sitios web de noticias en inglés emplean medidas para bloquear web de IA a su contenido. De los 106 sitios examinados, 45 no tenían ningún bloqueo de rastreadores de IA, mientras que el resto presentaba diversos grados de restricción.
Análisis de las tendencias de bloqueo de rastreadores de IA en los principales sitios web de noticias
Entre los sitios web de noticias encuestados, más de cuatro de cada diez permiten que todos los rastreadores web de IA rastreen su contenido sin ningún obstáculo. Sin embargo, una proporción considerable, compuesta por 61 sitios, impone restricciones bloqueando al menos un bot de IA. Cabe destacar que 32 sitios van un paso más allá al bloquear dos o más rastreadores de IA, y algunos incluso bloquean hasta cinco.
Encabezando la lista de rastreadores de IA bloqueados se encuentra GPTBot, el rastreador web asociado con ChatGPT, desarrollado por OpenAI. Un sorprendente 56,6 % de los sitios web encuestados impide el acceso a GPTBot. Le sigue de cerca Google-Extended, otro rastreador frecuentemente bloqueado, utilizado por el chatbot de IA de Google, Gemini (anteriormente llamado Bard).
Además, rastreadores como Claude-Web, Claudebot, anthropic-ai, Cohere-ai, Perplexity-ai, Seekr y Meltwater enfrentan distintos grados de restricción en los sitios web encuestados.
Exclusiones e inclusiones notables
Mientras que algunas editoriales importantes optan por bloquear ciertos bots de IA, otras optan por no imponer ninguna restricción. Por ejemplo, Mirror, Express, Manchester Evening News, Ladbible, Unilad y las publicaciones bajo el paraguasdent y Evening Standard, propiedad de Lebedev, permiten el acceso sin restricciones a los rastreadores de IA.
De manera similar, Politico, la subsidiaria de Axel Springer, permite el acceso a rastreadores de IA debido a un acuerdo de intercambio de contenido con OpenAI.
En una decisión sorprendente, el Daily Beast, propiedad de IAC, se abstiene de bloquear bots de IA a pesar de que el presidente de la compañía aboga por una compensación para los editores por parte de las empresas de IA. Por el contrario, algunos sitios web políticamente conservadores, como GB News, Newsmax, Zero Hedge, Breitbart y Fox News, optan por no bloquear los rastreadores de IA, a diferencia de otras publicaciones bajo el paraguas de Murdoch.
Implicaciones y perspectivas futuras
Los diversos enfoques adoptados por los editores de noticias respecto al acceso a los rastreadores de IA reflejan el debate actual en torno al uso del contenido y los derechos de propiedad intelectual en la era digital. Mientras que algunos editores optan por un control estricto de su contenido para protegerse del uso no autorizado y mantener el control sobre la distribución, otros priorizan la accesibilidad y la colaboración con empresas de IA para la difusión e innovación de contenido.
A medida que el panorama continúa evolucionando, aún queda por ver cómo los editores, las empresas de inteligencia artificial y los organismos reguladores navegarán la compleja intersección de la tecnología, la propiedad del contenido y la privacidad del usuario.
Las decisiones que toman los editores de noticias con respecto al acceso a los rastreadores de IA no solo afectan la difusión de las noticias, sino que también dan forma a la conversación más amplia en torno al uso de contenido digital y los derechos de propiedad intelectual.

