Google addestra gli strumenti di ricerca AI sui contenuti degli editori nonostante le esclusioni

Nelius Irene

Tempo di lettura: 3 minuti. Data di pubblicazione : 3 maggio 2025.

Google addestra gli strumenti di ricerca AI sui contenuti degli editori nonostante le esclusioni

Google utilizza i contenuti degli editori per addestrare i suoi strumenti di ricerca basati sull'intelligenza artificiale, anche quando gli editori scelgono di non farlo.
Il Dipartimento di Giustizia sta spingendo per apportare cambiamenti sostanziali all'attività di Google, tra cui la vendita della sua tecnologia pubblicitaria.
Editori e autorità di regolamentazione sono preoccupati per il modo in cui Google utilizza i dati per l'addestramento dell'intelligenza artificiale.

Google è sottoposta a nuove analisi dopo che un dirigente senior ha testimoniato che i prodotti di intelligenza artificiale (IA) specifici per la ricerca dell'azienda, come AI Overviews, vengono addestrati sui contenuti degli editori, anche quando questi ultimi hanno esplicitamente scelto di non partecipare all'addestramento dell'IA.

Eli Collins, vicepresidentedent Google DeepMind, ha riconosciuto venerdì in tribunale federale che, sebbene gli editori possano impedire che i loro contenuti vengano utilizzati per addestrare i modelli di intelligenza artificiale sviluppati da DeepMind, tali esclusioni non si applicano all'intera organizzazione di ricerca di Google.

"Una volta preso il modello Gemini [AI] e inserito nell'organizzazione di ricerca, quest'ultima ha la possibilità di addestrarsi sui dati che gli editori avevano scelto di non addestrare, corretto?" ha chiesto Diana Aguilar, avvocato del Dipartimento di Giustizia degli Stati Uniti (DOJ).

Collins ha confermato che i dati potrebbero ancora essere utilizzati "per la ricerca"

Questa rivelazione giunge nel bel mezzo di un processo antitrust cruciale, volto a stabilire come l'azienda tecnologica debba ristrutturare le proprie attività dopo essere stata giudicata colpevole lo scorso anno di monopolio illegale del mercato della ricerca online. Il Dipartimento di Giustizia sta ora spingendo per l'adozione di misure strutturali, tra cui obbligare l'azienda a cedere il browser Chrome e vietare accordi che lo rendano il motore di ricerca predefinito su tutti i dispositivi: una mossa che avrebbe un impatto anche sui prodotti di intelligenza artificiale, incluso Gemini.

Google alimenta gli strumenti di intelligenza artificiale con contenuti che gli editori affermano di non aver autorizzato

La funzionalità "AI Overviews" di Google , che riassume le risposte in cima ai risultati di ricerca utilizzando testo generato dall'intelligenza artificiale, ha già destato preoccupazione tra gli editori di siti web. Molti sostengono che riduca i clic degli utenti verso i siti web originali e danneggi i loro ricavi, eppure l'azienda tecnologica continua a utilizzare i dati provenienti da queste fonti.

In un documento presentato dal Dipartimento di Giustizia il 26 agosto 2024, intitolato "Search GenAI <> Gemini v3", i dati interni mostravano che Google aveva filtrato circa 80 miliardi di token – essenzialmente frammenti di testo – dal suo corpus di addestramento di 160 miliardi di token in risposta alle richieste di esclusione degli editori. Tuttavia, i restanti 80 miliardi di token potrebbero ancora includere contenuti che alimentano le funzionalità di intelligenza artificiale di Google Search.

Lo stesso documento elencava anche i "dati delle sessioni di ricerca" e i video di YouTube come fonti aggiuntive per migliorare la formazione dell'intelligenza artificiale, sollevando preoccupazioni sulla portata dei dati degli utenti immessi nei modelli di intelligenza artificiale dell'azienda tecnologica.

Quando il giudice Amit Mehta ha chiesto se metà del set di dati fosse stato effettivamente rimosso a causa dell'esclusione degli editori, Collins ha confermato: "È corretto"

Il Dipartimento di Giustizia evidenzia l'interesse interno nello sfruttamento dei dati di ricerca per l'intelligenza artificiale

Il Dipartimento di Giustizia ha inoltre evidenziato discussioni interne a Google che suggeriscono l'ambizione di addestrare modelli di intelligenza artificiale utilizzando le sue vaste riserve di dati di ricerca: classifiche, query e comportamento degli utenti.

Uno di questi casi includeva un briefing preparato per il CEO di DeepMind, Demis Hassabis, in cui rifletteva sull'idea di addestrare un modello di intelligenza artificiale di Google utilizzando dati di ricerca completi per valutare i conseguenti miglioramenti delle prestazioni.

Aguilar chiese a Collins se Google avesse sviluppato un modello utilizzando i dati di ricerca. Collins rispose di non essere a conoscenza dello sviluppo di un modello del genere, pur riconoscendo che Hassabis aveva mostrato interesse per il concetto.

Il team legale di Google ha cercato di minimizzare le preoccupazioni relative al predominio dell'intelligenza artificiale, sostenendo che altre aziende di intelligenza artificiale possono prosperare senza sfruttare il suo indice di ricerca. Ad esempio, i chatbot sportivi possono accedere a dati in tempo reale tramite partnership commerciali con i fornitori di punteggi, non tramite contenuti web scansionati.

Tuttavia, il Dipartimento di Giustizia sostiene che la posizione dominante di Google nel settore della ricerca gli conferisce un vantaggio ingiusto nel settore dell'intelligenza artificiale, in particolare perché integra Gemini nella sua infrastruttura di ricerca.

Google dovrà affrontare ulteriori controlli sulla sua attività pubblicitaria

Anche Google, di Alphabet, sarà processata a settembre per le proposte delle autorità antitrust di costringere l'azienda a vendere parti della sua attività di tecnologia pubblicitaria. Le modifiche proposte mirano a contrastare il predominio dell'azienda sugli strumenti utilizzati dagli editori online per vendere annunci digitali.

Il giudice distrettuale statunitense Leonie Brinkema di Alexandria, in Virginia, ha fissato la data del processo dopo aver ascoltato Google e il Dipartimento di Giustizia sui possibili rimedi. Entrambe le parti dovrebbero presentare proposte dettagliate entro lunedì.

Il Dipartimento di Giustizia sta cercando di far sì che l'azienda tecnologica ceda le sue attività di scambio di annunci e server di annunci per editori, un processo che dovrebbe durare diversi anni, secondo l'avvocato del Dipartimento di Giustizia Julia Tarver Wood.

L'avvocato di Google, Karen Dunn, ha replicato che l'azienda sostiene misure comportamentali, come consentire ai concorrenti di accedere alle offerte in tempo reale. Tuttavia, ha sostenuto che il Dipartimento di Giustizia non può legalmente obbligare l'azienda a vendere parti della sua attività. Dunn ha inoltre affermato che una simile mossa danneggerebbe gli utenti di Internet e si troverebbe ad affrontare difficoltà a causa della mancanza di acquirenti interessati.

Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.

Google

Condividi questo articolo

Nelius Irene

Nellius è laureata in Economia Aziendale e Informatica con cinque anni di esperienza nel settore delle criptovalute. Ha inoltre conseguito la laurea presso Bitcoin Dada. Nellius ha collaborato con importanti testate giornalistiche, tra cui BanklessTimes, Cryptobasic e Riseup Media.

INDICE

1. Google alimenta gli strumenti di intelligenza artificiale con contenuti che gli editori affermano di non aver autorizzato

2. Il Dipartimento di Giustizia evidenzia l'interesse interno nello sfruttamento dei dati di ricerca per l'intelligenza artificiale

3. Google dovrà affrontare ulteriori controlli sulla sua attività pubblicitaria

Condividi questo articolo