软件巨头Salesforce因使用盗版书籍构建其XGen人工智能模型,被一群作家在旧金山联邦法院起诉。诉讼称,Salesforce在引发质疑后删除了对这些盗版书籍的引用。.
该诉讼由作家E·莫莉·坦泽尔和詹妮弗·吉尔摩于周三根据《版权法》提起。诉讼称 Salesforce持续侵权,并表示该公司“继续存储、复制、使用和处理包含原告[…]受版权保护书籍副本的数据集,从而继续侵权”。
该投诉引用了Salesforce首席执行官 Marc Benioff 的言论,他在 2024 年 1 月接受彭博社采访时表示,人工智能公司窃取了训练数据,所有训练数据都被盗走了。
作者们寻求集体诉讼认证,代表所有自 2022 年 10 月以来作品被使用的美国版权所有者。他们寻求法定赔偿、销毁侵权副本、返还利润、宣布故意侵权以及律师费。.
Salesforce面临tron指控;人工智能公司则逃脱了类似的诉讼。
根据诉状,Salesforce 盗版了数十万本受版权保护的书籍,用于开发其 XGen 系列大型语言模型。他们使用了“臭名昭著的 RedPajama 和 The Pile 数据集”,这些数据集包含一个名为 Books3 的书籍语料库,其中包含超过 19.6 万本从私有 trac器 Bibliotik 复制的书籍。.
文件显示,Salesforce 在 2023 年 6 月推出 XGen 时,首次将“RedPajama-Books”列为其训练来源之一。随后,该公司的一名工程师将 GitHub 用户直接链接到了这两个数据集。.
然而,到了9月份,Salesforce网站上的这些提及被删除,取而代之的是一些含糊不清的描述,称其为来自“公开来源”的“自然语言数据”。次月,托管Books3的网站Hugging Face也因版权问题删除了该数据集。.
此外,诉讼还披露,Salesforce在2022年使用The Pile数据库训练其CodeGen模型。随后,该公司通过其Agentforce AI平台将这项技术推向市场,XGen-Sales模型于2024年10月发布。.
然而,专家指出,作者必须证明遭受了实际的经济损失,而不仅仅是证明他们的书籍被用于训练。最近,法官文斯·查布里亚驳回了针对Meta的类似诉讼,裁定“仅仅声称‘我们的作品被使用了’是不够的”。因此,法官认定Meta使用受版权保护的书籍训练人工智能属于合理使用。
此外,据CryptopolitanCryptopolitan,在类似案件中,最近的判决对 OpenAI 和 Anthropic 有利,法官认为作者未能证明市场受到损害。然而,一位法官批评 Anthropic 保留了一个永久的盗版书籍库。
Salesforce 利用谷歌的 Gemini AI 为 Agentforce 360 提供技术支持
另据报道,Salesforce 已扩大与 Google 的合作关系,将Gemini AI模型与其 Agentforce 360 平台进行更深入的集成。
通过此次合作,Gemini 的多模态智能技术将集成到 Salesforce 生态系统中。这将有助于支持企业销售和 IT 服务领域的混合推理和多步骤流程自动化等任务。.
此次扩展集成使Agentforce 360的核心——Atlas推理引擎能够利用Gemini模型。这为企业工作流程提供了更多模型选择。.
此外,混合推理功能使用户能够在 Salesforce 中设置 AI 代理,从而生成一致且准确的输出。此次合作还将 Salesforce 的 Gemini 集成范围从之前的 Gmail 扩展到其他 Google Workspace 应用,包括 Sheets、Docs、Drive、Slides 和 Meet。.
Agentforce 360 现已支持与 Google Workspace 的原生互操作性,用户可以直接在 Gmail 和 Google 日历等应用中发起销售活动、筛选潜在客户并安排会议。此外,它还提供对 Google 工具中 Salesforce Customer 360 应用的直接访问,从而简化销售和服务团队的数据访问并保持工作流程的连续性。.
Salesforce首席科学家Silvio Savarese表示: “在企业环境中,人工智能代理必须具备强大的能力和高度的一致性,尤其是在关键用例中。[…]我们正在共同为构建未来智能企业(包括模型层面)设定新的标准。”

