Salesforce因人工智能训练数据陷入法律纠纷

经过

弗洛伦斯·穆查伊

阅读时长：3分钟 2025年10月17日

一群作家在旧金山联邦法院起诉 Salesforce，指控其使用盗版书籍库构建 XGen AI 模型。.
该诉讼由作者 E. Molly Tanzer 和 Jennifer Gilmore 根据《版权法》提起。.
Salesforce 扩大了与 Google 的合作关系，将 Gemini AI 模型与其 Agentforce 360 平台进行更深入的集成。.

软件巨头Salesforce因使用盗版书籍构建其XGen人工智能模型，被一群作家在旧金山联邦法院起诉。诉讼称，Salesforce在引发质疑后删除了对这些盗版书籍的引用。.

该诉讼由作家E·莫莉·坦泽尔和詹妮弗·吉尔摩于周三根据《版权法》提起。诉讼称 Salesforce持续侵权，并表示该公司 “继续存储、复制、使用和处理包含原告[…]受版权保护书籍副本的数据集，从而继续侵权”。

该投诉引用了 Salesforce 首席执行官 Marc Benioff 的言论，他在 2024 年 1 月接受彭博社采访时表示，人工智能公司窃取了训练数据，所有训练数据都被盗走了。

Salesforce面临tron指控；人工智能公司则逃脱了类似的诉讼。

根据诉状，Salesforce 盗版了数十万本受版权保护的书籍，用于开发其 XGen 系列大型语言模型。他们使用了“臭名昭著的 RedPajama 和 The Pile 数据集”，这些数据集包含一个名为 Books3 的书籍语料库，其中包含超过 19.6 万本从私有 trac器 Bibliotik 复制的书籍。.

文件显示，Salesforce 在 2023 年 6 月推出 XGen 时，首次将“RedPajama-Books”列为其训练来源之一。随后，该公司的一名工程师将 GitHub 用户直接链接到了这两个数据集。.

然而，到了9月份，Salesforce网站上的这些提及被删除，取而代之的是一些含糊不清的描述，称其为来自“公开来源”的“自然语言数据”。次月，托管Books3的网站Hugging Face也因版权问题删除了该数据集。.

此外，诉讼还披露，Salesforce在2022年使用The Pile数据库训练其CodeGen模型。随后，该公司通过其Agentforce AI平台将这项技术推向市场，XGen-Sales模型于2024年10月发布。.

然而，专家指出，作者必须证明遭受了实际的经济损失，而不仅仅是证明他们的书籍被用于训练。最近，法官文斯·查布里亚驳回了针对Meta的类似诉讼，裁定“仅仅声称‘我们的作品被使用了’是不够的”。因此，法官认定 Meta 使用受版权保护的书籍训练人工智能属于合理使用。

此外，据 Cryptopolitan Cryptopolitan在类似案件中，最近的判决对 OpenAI 和 Anthropic 有利，法官认为作者未能证明市场受到损害。然而，一位法官批评 Anthropic 保留了一个永久的盗版书籍库。，

Salesforce 利用谷歌的 Gemini AI 为 Agentforce 360 提供技术支持

另据报道，Salesforce 已扩大与 Google 的合作关系，将 Gemini AI 模型与其 Agentforce 360 平台进行更深入的集成。

通过此次合作，Gemini 的多模态智能技术将集成到 Salesforce 生态系统中。这将有助于支持企业销售和 IT 服务领域的混合推理和多步骤流程自动化等任务。.

此次扩展集成使Agentforce 360的核心——Atlas推理引擎能够利用Gemini模型。这为企业工作流程提供了更多模型选择。.

此外，混合推理功能使用户能够在 Salesforce 中设置 AI 代理，从而生成一致且准确的输出。此次合作还将 Salesforce 的 Gemini 集成范围从之前的 Gmail 扩展到其他 Google Workspace 应用，包括 Sheets、Docs、Drive、Slides 和 Meet。.

Agentforce 360 现已支持与 Google Workspace 的原生互操作性，用户可以直接在 Gmail 和 Google 日历等应用中发起销售活动、筛选潜在客户并安排会议。此外，它还提供对 Google 工具中 Salesforce Customer 360 应用的直接访问，从而简化销售和服务团队的数据访问并保持工作流程的连续性。.

Salesforce首席科学家Silvio Savarese 表示： “在企业环境中，人工智能代理必须具备强大的能力和高度的一致性，尤其是在关键用例中。[…]我们正在共同为构建未来智能企业（包括模型层面）设定新的标准。”

最顶尖的加密货币专家都在阅读我们的简报。想加入他们？

人格化 Google Meta OpenAI Salesforce

分享这篇文章