- 法庭文件显示,Meta 的员工曾讨论使用受版权保护的内容来训练其人工智能 (AI) 模型。.
- 内部工作聊天记录还显示,该公司可能使用了存在法律风险的内容来训练其人工智能模型。.
- 法庭文件揭露了其他侵权行为,原告已修改了诉讼请求。.
法庭文件显示,Meta公司员工曾讨论使用受版权保护的内容来训练其人工智能模型。根据最近的法庭文件,大部分讨论都与通过非法手段获取的内容有关。.
这些文件由卡德雷诉Meta案的原告提供,该案是美国法院审理的众多人工智能版权案件之一。Meta公司声称,使用受版权保护的作品(尤其是书籍)来训练其模型属于合理使用范畴。然而,以莎拉·西尔弗曼和塔-内西·科茨为首的原告并不认同该公司的说法。.
根据此前提交的文件,Meta首席执行官马克·扎克伯格批准了公司人工智能团队使用受版权保护的内容来训练其模型。文件还显示,该公司终止了与图书出版商的数据许可谈判。.
据称,Meta 使用受版权保护的内容来训练其人工智能模型。
根据 文件 向法院提交的
其中一次聊天对象是Meta公司的一位高管,梅兰妮·坎巴杜尔(Melanie Kambadur),她是羊驼研究团队的高级经理。在聊天中,她谈到了用一些不合法的内容来训练人工智能模型的问题。.
根据提交的文件,Meta 研究工程师 Xavier Martinet 在 2023 年 2 月的一次聊天中表示:“我的意见是(类似于‘先斩后奏’):我们应该尝试获取这些账目,然后上报给高管,让他们来做决定。” 他补充道:“这就是他们设立这个人工智能部门的原因:这样我们就可以降低风险规避程度。”.
马蒂内特提到,公司可以直接按零售价购买电子书来构建数据训练集,而无需与不同的出版商签订授权协议。虽然另一位员工警告说使用此类内容可能存在法律风险,但马蒂内特也提到,其他公司可能也在使用盗版书籍进行训练。.
在同一次聊天中,坎巴杜尔提到公司正在与一些平台洽谈授权事宜,但他指出,虽然使用公开数据需要获得批准,但公司律师的态度比以往更加开放。“现在的不同之处在于,我们拥有更多资金、更多律师、更多业务拓展支持,能够快速推进 trac流程,而且律师在审批方面也更加积极主动了。”坎巴杜尔说道。.
员工们讨论使用Libgen
根据提交的文件,另一份工作聊天记录显示,坎巴杜尔曾谈到使用Libgen(一个聚合网站,提供来自出版商的受版权保护内容的链接)作为Meta可以授权的数据源。Libgen曾多次被起诉,并因涉嫌侵犯版权而被勒令关闭服务。.
另一位同事在聊天中发布了一张图片,并配文“不,Libgen 不合法”,这似乎表明一些高管认为,不使用 Libgen 可能会阻碍公司在人工智能领域的竞争力。Meta 产品管理总监 Sony Theakanath 在一封发给 Meta AI 副总裁 Joelle Pineau 的邮件中指出,Libgen 对于在所有类别中达到最先进 (SOTA) 水平至关重要。.
Theakanath 还谈到了公司可以采取的几种降低法律风险的方法,包括删除被标记为盗版/窃取的数据,以及不公开提及其他用途。“我们不会披露用于训练的 Libgen 数据集的使用情况,”他说道。实际上,这意味着公司会先检查 Libgen 文件,以查找“盗版或窃取”的作品。.
法庭文件揭露了其他侵权行为
在一次工作聊天中,Kambadur 还建议 Meta AI 团队应该调整模型以“避免有风险的 IP 提示”,这将使模型拒绝回答用户试图了解模型训练所用的电子书的问题。.
文件还披露了其他细节,其中一项显示,Meta可能利用 Reddit 数据训练其模型,以模仿名为Pushshift的第三方应用程序的行为。Reddit在2023年4月的一份声明中提到,将开始向人工智能公司收取访问数据以训练模型的费用。
本案原告自2023年诉讼开始以来已多次修改诉状。该案已提交至位于旧金山的加州北区联邦地区法院。在最近一次修改中,原告声称Meta公司将盗版书籍与正版书籍进行交叉比对,以确定是否适合达成 授权 协议。Meta公司则认为此案事关重大,已着手在其辩护团队中增聘两名最高法院诉讼律师。
如果你正在阅读这篇文章,你已经领先一步了。 订阅我们的新闻简报,继续保持领先优势。
免责声明: 提供的信息并非交易建议。Cryptopolitan.com Cryptopolitan研究 对任何基于本页面信息进行的投资概不负责。我们trondentdentdentdentdentdentdentdent /或咨询合格的专业人士。
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)















