Empresas como OpenAI y Perplexity prometieron en el pasado que los motores de búsqueda de IA que ofrecen sus modelos proporcionarían nuevas fuentes de ingresos para los editores al dirigir tráfico a sus sitios.
Sin embargo, según un informe compartido con Forbes por la plataforma de licencias de contenido TollBit, se ha revelado que los motores de búsqueda de IA en realidad envían menos del 96% del tráfico a sitios de noticias y blogs que la búsqueda habitual de Google.
Mientras tanto, el número de desarrolladores de IA que extraen datos de sitios web ha seguido aumentando, lo que aumenta la frustración que sienten muchos editores hacia estas herramientas.

Cómo los motores de búsqueda impulsados por IA se están robando el espectáculo
Para entender el conflicto que se está desarrollando entre los editores y los motores de búsqueda de IA debemos remontarnos a los orígenes.
La optimización de motores de búsqueda se convirtió en un tema muy importante cuando Yahoo! pasó de ser un conjunto puro de listados de directorios en 1994 a ofrecer búsquedas en 1995. Fue la respuesta al descubrimiento en Internet y después de que Google se convirtiera en el primer buen motor de búsqueda en 1997, rápidamente dominó la web y se volvió importante para los usuarios de la web.
Google se convirtió en el mejor motor de búsqueda de la web gracias a su mecanismo de puntuación PageRank, que clasificaba los resultados de búsqueda en función de cuántos otros sitios web enlazaban a cada resultado.
Hoy en día, con la difusión de los motores de búsqueda impulsados por IA, tenemos usuarios que optan por utilizar agentes de respuesta de IA simples o herramientas de investigación de IA de estilo "Investigación profunda" más elaboradas disponibles en varios laboratorios de IA para realizar consultas en línea.
Esta creciente relación entre los motores de búsqueda de IA y los editores de contenido desafía el "tracsocial" que ha mantenido a los motores de búsqueda tradicionales como Google relevantes para los editores.
Según eltrac, los editores proporcionaban contenido a cambio de tráfico de referencia desde los motores de búsqueda y esto formó la base de una relación simbiótica que ha sostenido el ecosistema de los medios en línea durante décadas.
Sin embargo, ahora que tenemos resúmenes generados por IA que eliminan la necesidad de que los usuarios que necesitan información directa visiten las fuentes originales, la dinámica ha cambiado significativamente.
El nuevo desarrollo no sólo amenaza los modelos de ingresos de los creadores de contenidos, sino que también nos obliga a cuestionar la sostenibilidad del periodismo de calidad.
Nathan Schultz, CEO de la empresa Edtech Chegg, cree que es hora de “decir no” y explica que romper el contrato de larga data trac está bien.
Está claro que la IA ha llegado para quedarse y, con el tiempo, cada vez más personas recurrirán a agentes de IA cuando tengan preguntas. Un experto cree que esto se debe a que la IA se esfuerza al máximo para ofrecer comprensión, en lugar de simplemente ayudarte a descubrir lo que buscas.
Si bien esta es una excelente función, tiene un efecto devastador en los sitios que dependen del tráfico de referencia para sobrevivir. Por ejemplo, Chegg. Su tráfico se desplomó un 49 % interanual en enero, una fuerte caída respecto a la caída del 8 % del segundo trimestre del año pasado, cuando Google publicó los resúmenes de IA.
La disminución del tráfico ha afectado tanto a Chegg que la empresa está considerando privatizarla o ser adquirida, según dijo en una conferencia sobre ganancias.
Cómo los editores de noticias han estado lidiando con el nuevo desarrollo
Según el informe de TollBit, los motores de búsqueda de IA envían menos tráfico de referencia en comparación con las búsquedas tradicionales de Google y ha habido un aumento significativo en el raspado web por parte de las empresas de IA, algunas de las cuales rasparon sitios web 2 millones de veces en promedio en el último trimestre de 2024. Desafortunadamente, estos raspados no suelen traducirse en tráfico para los sitios afectados.
Los editores no están contentos con esto y han reaccionado principalmente emprendiendo acciones legales contra las empresas de inteligencia artificial por violación de la propiedad intelectual. Forbes envió una carta de cese y desistimiento a Perplexity en junio, acusándola de infringir derechos de autor, y en octubre, el New York Post y Dow Jones demandaron a la empresa por presunta violación de derechos de autor y por atribuir hechos inventados a los medios de comunicación.

En ese momento, Perplexity respondió diciendo que la demanda refleja una postura “fundamentalmente miope, innecesaria y contraproducente”
A principios de este mes, un grupo de editoriales, entre ellas Condé Nast, Vox y The Atlantic, también presentaron una demanda contra la empresa de inteligencia artificial Cohere, acusándola de supuestamente extraer 4.000 obras protegidas por derechos de autor de Internet y usarlas para entrenar su conjunto de grandes modelos lingüísticos.
La cuestión se vuelve aún más complicada porque las empresas de IA nodentadecuadamente sus rastreadores web, lo que dificulta que los editores gestionen el acceso a su contenido.
Para afrontar estos desafíos, algunos editores han optado por acuerdos de licencia de contenido con empresas de IA que les garantizan una compensación por el uso de sus datos. Otros, como TollBit, han desarrollado modelos para cobrar a las empresas de IA por el scraping de contenido.
A medida que las cosas continúan evolucionando, los marcos legales en torno a la protección de datos y la propiedad intelectual se convertirán en campos de batalla críticos donde los derechos de los editores serán potencialmente defendidos y ampliados.
Si se permite que las cosas sigan sin control, los analistas dicen que podríamos tener una era dominada por una “lodo de IA”, lo que significa una situación en la que los proveedores de contenido de alto calibre se ven obligados a abandonar el negocio, lo que causa una dilución significativa en la calidad de la información disponible.

