Salesforce, un colosso del software, è stata citata in giudizio da un gruppo di autori presso un tribunale federale di San Francisco per aver sviluppato i suoi modelli di intelligenza artificiale XGen basandosi su una biblioteca di libri pirata. Secondo la causa, i riferimenti a tali fonti sono stati cancellati non appena sono sorti dubbi.
La causa è stata intentata mercoledì dalle autrici E. Molly Tanzer e Jennifer Gilmore ai sensi del Copyright Act. Afferma una violazione continua, affermando che Salesforce "continua a farlo continuando a memorizzare, copiare, utilizzare ed elaborare i set di dati contenenti copie dei libri protetti da copyright dei querelanti [...]".
La denuncia cita dichiarazioni del di Salesforce, Marc Benioff, che ha dichiarato a un intervistatore di Bloomberg nel gennaio 2024 che le aziende di intelligenza artificiale hanno rubato i dati di formazione e che tutti i dati di formazione sono stati rubati.
Gli autori chiedono la certificazione di classe per tutti i titolari di copyright statunitensi le cui opere sono state utilizzate dall'ottobre 2022. Chiedono il risarcimento dei danni previsti dalla legge, la distruzione delle copie che violano i diritti, la restituzione dei profitti, una dichiarazione di violazione intenzionale e il pagamento delle spese legali.
Salesforce si trova di fronte a un casotron; le aziende di intelligenza artificiale sono sfuggite a simili accuse
Secondo la denuncia, Salesforce ha piratato centinaia di migliaia di libri protetti da copyright per sviluppare la sua serie XGen di modelli linguistici di grandi dimensioni. Lo ha fatto utilizzando i "famigerati dataset RedPajama e The Pile", che hanno un corpus di libri chiamato Books3 con oltre 196.000 libri copiati dal tracprivato Bibliotik.
Nella documentazione si afferma che Salesforce ha menzionato per la prima volta "RedPajama-Books" come una delle sue fonti di formazione quando ha lanciato XGen nel giugno 2023. Un ingegnere dell'azienda ha quindi collegato gli utenti di GitHub direttamente a entrambi i set di dati.
Tuttavia, a settembre, tali riferimenti furono rimossi dal sito web di Salesforce e sostituiti con vaghe descrizioni di "dati in linguaggio naturale" provenienti da "fonti pubblicamente disponibili". Il mese successivo, Hugging Face, il sito che ospitava Books3, rimosse il set di dati per motivi di copyright.
Inoltre, la causa ha rivelato che nel 2022 Salesforce ha addestrato i suoi modelli CodeGen su The Pile. L'azienda ha poi introdotto la tecnologia sul mercato tramite la sua piattaforma di intelligenza artificiale Agentforce, con il modello XGen-Sales rilasciato nell'ottobre 2024.
Tuttavia, secondo gli esperti, gli autori devono dimostrare un danno finanziario reale, non solo che i loro libri siano stati utilizzati per la formazione. Di recente, il giudice Vince Chhabria ha respinto accuse simili contro Meta, stabilendo che "semplicemente affermare che 'il nostro lavoro è stato utilizzato' non è sufficiente". A tal fine, il giudice ha ritenuto che da parte di Meta di libri protetti da copyright per la formazione dell'intelligenza artificiale costituisca un uso corretto.
Inoltre, come riportato da Cryptopolitan , recenti sentenze hanno favorito OpenAI e Anthropic in casi simili, con i giudici che hanno ritenuto che gli autori non fossero riusciti a dimostrare un danno al mercato. Tuttavia, un giudice ha criticato Anthropic per aver mantenuto una biblioteca permanente di libri piratati.
Salesforce sfrutta l'intelligenza artificiale Gemini di Google per potenziare Agentforce 360
Altre novità: Salesforce ha ampliato la sua partnership con Google per includere una maggiore integrazione dei Gemini AI con la sua piattaforma Agentforce 360.
Grazie alla partnership, l'intelligenza multimodale di Gemini sarà integrata nell'ecosistema Salesforce. Ciò contribuirà a supportare attività come il ragionamento ibrido e l'automazione dei processi multi-step nei servizi di vendita e IT aziendali.
L'integrazione estesa consente ad Atlas Reasoning Engine, elemento centrale di Agentforce 360, di sfruttare i modelli Gemini. Ciò offre ai flussi di lavoro aziendali ulteriori opzioni di modelli.
Inoltre, la funzionalità di ragionamento ibrido consente agli utenti di configurare agenti di intelligenza artificiale all'interno di Salesforce che producono output coerenti e accurati. La collaborazione estende inoltre la portata dell'integrazione Gemini di Salesforce, precedentemente limitata a Gmail, ad altre applicazioni di Google Workspace, tra cui Fogli, Documenti, Drive, Presentazioni e Meet.
Agentforce 360 supporta ora l'interoperabilità nativa con Google Workspace, consentendo agli utenti di avviare contatti di vendita, qualificare lead e pianificare riunioni direttamente da applicazioni come Gmail e Google Calendar. Fornisce inoltre accesso diretto alle app Salesforce Customer 360 tramite gli strumenti Google, semplificando l'accesso ai dati e la continuità del flusso di lavoro per i team di vendita e assistenza.
Silvio Savarese, responsabile scientifico di Salesforce, ha affermato : "Nell'ambiente aziendale, è fondamentale che gli agenti di intelligenza artificiale siano altamente capaci e coerenti, soprattutto per i casi d'uso critici […] Insieme, stiamo definendo un nuovo standard per costruire il futuro di ciò che è possibile nell'Agentic Enterprise fino al livello del modello".

