Wikipedia busca más acuerdos de licencias de IA para compensar los costos de la capacitación LLM

- La Fundación Wikipedia está negociando acuerdos con empresas de inteligencia artificial para compensar los costos asociados al uso automatizado intensivo de su contenido.
- El rastreo automatizado por bots de IA aumenta la carga del servidor, el uso de RAM y los requisitos de almacenamiento en caché, lo que genera mayores costos operativos.
- Wikipedia sigue siendo gratuita para usuarios individuales, pero el acceso automatizado y de gran volumen por parte de empresas de inteligencia artificial con fines de lucro se considera un asunto diferente.
Jimmy Wales, cofundador de Wikipedia, afirmó que la organización sin ánimo de lucro responsable de la enciclopedia en línea está buscando más acuerdos de licencia con empresas de inteligencia artificial. Esta iniciativa surge a raíz de la sobrecarga que supone la infraestructura de Wikipedia debido a la actividad de varios bots de IA automatizados.
Wales explicó que las empresas de IA utilizan el conocimiento disponible gratuitamente en la plataforma para entrenar grandes modelos de lenguaje (LLM). Señaló que los bots de IA de alto volumen rastrean todo el sitio, lo que impone una carga técnica y financiera significativa a la plataforma.
“Los bots de IA… recorren todo el sitio… por lo que necesitamos más servidores, más RAM y memoria para almacenarlos en caché, y eso nos cuesta una cantidad desproporcionada”, explicó.
Wales ha señalado que el uso intensivo por parte de bots de IA obliga a Wikipedia a ampliar sus servidores, aumentar la RAM y mejorar el almacenamiento en caché, todo lo cual tiene un coste elevado.
Si bien el sitio es gratuito para usuarios individuales, señaló, el acceso automatizado y de mayor volumen por parte de empresas de inteligencia artificial con fines de lucro es otro problema. La organización sin fines de lucro firmó un acuerdo de licencia con Google en 2022 y está negociando acuerdos similares con otras empresas.
La organización sin fines de lucro que opera Wikipedia, la Fundación Wikimedia, depende de donaciones públicas relativamente pequeñas y de editores voluntarios para funcionar, y no fueron destinadas a financiar desarrollos de inteligencia artificial a gran escala y con fines de lucro.
Wales dijo que es injusto que los contribuyentes y donantes financien los costos de las empresas de inteligencia artificial comerciales que utilizan el contenido de Wikipedia.
Wikipedia advierte sobre la carga insostenible que suponen los bots de IA
Wikipedia advierte sobre la carga insostenible que representan los bots de IA. La demanda sobre los servidores de Wikipedia ha aumentado drásticamente en los últimos meses. Los bots automatizados han incrementado el tráfico , especialmente a través de descargas multimedia, lo que ha obligado a la organización sin fines de lucro a invertir fuertemente en infraestructura.
Gran parte de este tráfico proviene de empresas de IA que extraen contenido diseñado para entrenar sus modelos, en lugar de recurrir a humanos. En 2022, la Fundación lanzó un producto comercial de pago, Wikimedia Enterprise, para brindar acceso a su contenido principal a gran escala y ofrecer a los usuarios de la plataforma las herramientas y los recursos necesarios.
Este servicio está diseñado para aliviar la presión sobre el sitio web de Wikipedia, a la vez que proporciona a los desarrolladores de IA los datos necesarios para mejorar sus modelos. Wales instó a las empresas de IA a utilizar esta opción de pago en lugar de extraer datos del sitio web público.
Si las empresas incumplen estas medidas técnicas, declaró Wales, se podría implementar la restricción del acceso de bots mediante herramientas como AI Crawl Control . Existe cierto debate con las empresas sobre el papel de la IA pública (o comercial) en la gestión de los datos personales que los usuarios poseen actualmente, a una escala que excede el derecho legal al conocimiento libre y transparente, y las necesidades de los sectores público y privado.
Dado que una proporción cada vez mayor del procesamiento de IA depende en gran medida de grandes conjuntos de datos públicos, Wikipedia aboga por un enfoque justo que compense tanto a las entidades que mantienen estos datos como a las empresas. Wikipedia no es inmune a su compromiso de mantener la neutralidad.
Wikipedia lucha por mantener la neutralidad en medio de conflictos globales
El sitio web Wikipedia lleva más de 20 años funcionando como una entidad sin fines de lucro gestionada por la Fundación Wikimedia. Su modelo se basa en un ejército global de editores voluntarios que dedican su tiempo a crear, editar y corregir contenido.
Las donaciones públicas son un ingrediente clave para garantizar que permanezca abierta a cualquier persona, en cualquier lugar, independientemente de su presupuesto o ubicación geográfica. Wikipedia, un conocido sitio web y enciclopedia internacional, también ha luchado por mantenerse neutral frente a otras fuentes.
El problema se agudiza aún más al informar detalladamente sobre cuestiones políticas de gran importancia, movimientos sociales o conflictos armados a nivel mundial. Wales afirmó que, si bien la mayoría de los editores de Wikipedia no son activistas, las preferencias personales pueden influir en la forma en que se abordan los temas.
Sin embargo, añadió que confía en la comunidad, afirmando que los editores tienden a alcanzar de alguna manera los valores de Wikipedia de imparcialidad y precisión, incluso bajo intensa presión. La neutralidad de la plataforma sedent aún más en su política comunitaria, sus métodos de revisión por pares y su proceso de disputas, entre otros aspectos.
Al mismo tiempo, la constante dependencia de voluntarios y donaciones pone de relieve la debilidad del sistema. Y a medida que la plataforma se enfrenta a nuevas presiones, incluido un mayor uso de su contenido por parte de empresas de inteligencia artificial, garantizar la continuidad de sus valores fundamentales (neutralidad, precisión y libre acceso) cobra cada vez mayor importancia.
Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Nellius Irene
Nellius es licenciada en Administración de Empresas y TI con cinco años de experiencia en la industria de las criptomonedas. También es egresada de Bitcoin Dada. Ha colaborado con importantes medios de comunicación, como BanklessTimes, Cryptobasic y Riseup Media.
CURSO
- ¿Qué criptomonedas pueden hacerte ganar dinero?
- Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
- Estrategias de inversión poco conocidas que utilizan los profesionales
- Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)















