Meta Platforms 在首席执行官马克·扎克伯格的批准下,使用盗版版权书籍训练其人工智能模型。.
根据最新披露的法庭文件,一群作者指控这家社交媒体巨头明知他们使用盗版作品来训练其人工智能系统。.
Meta的内部文件“揭露”了这些说法
作者在提交给法院的文件中称,Meta在调查过程中提供的内部文件表明,这家社交网络公司明知这些书籍存在盗版问题。据《卫报》,尽管公司人工智能高管团队曾警告称该数据集“我们明知是盗版的”,但扎克伯格仍然支持使用LibGen数据集——一个庞大的在线书籍库。
美国作家塔-内西·科茨、喜剧演员莎拉·西尔弗曼和其他作家起诉该公司侵犯版权,这些指控于周三在加州联邦法院公开的文件中提出。.
2023 年,作者们将 Meta 告上法庭,指控这家社交媒体公司滥用他们的书籍来训练人工智能模型,特别是其大型语言模型 Llama,该模型为其聊天机器人提供支持。.
源自俄罗斯的 Library Genesis 或 LibGen 数据集是一个“影子图书馆”,声称包含数百万部小说、通知书籍以及科学杂志文章。.
2024年,纽约一家联邦法院要求LibGen的匿名运营者向一群出版商支付3000万美元的版权侵权赔偿金。
这是众多指控之一,这些指控称,未经版权所有者许可,作者、艺术家和其他人士的受版权保护的作品被用于训练生成式人工智能工具,例如 ChatGPT 聊天机器人。创意专业人士警告说,未经许可使用他们的作品正在危及他们的商业模式。.
据路透社报道,被告辩称,他们对受版权保护的材料进行了合理使用。
法官允许作者提交修改后的诉状。
据报道,在Meta案中,原告于周三向法院申请提交一份更新后的诉状。他们在诉状中指出,新证据表明,社交网络公司使用了包含数百万盗版作品的人工智能训练数据集LibGen,并通过点对点种子文件进行传播。.
据他们称,尽管 Meta 的人工智能执行团队(以及 Meta 的其他人员)担心 LibGen 是一个“我们知道是盗版的数据集”,但扎克伯格“还是批准了 Meta 使用 LibGen 数据集”。
该文件还引用了一份备忘录,其中提到了扎克伯格的首字母缩写,并指出“在升级到 MZ 之后”,Meta 的人工智能团队“已被批准使用 LibGen”。
去年,美国地区法官文斯·查布里亚驳回了关于Meta公司人工智能模型生成的文本侵犯作者版权以及Meta公司非法移除书籍版权管理信息的指控。版权管理信息包括作品的标题、作者姓名和版权所有者等信息。.
然而,原告获准修改其诉讼请求。在本周的辩论中,作者们表示,证据加强了他们的侵权指控,并证明他们有理由重新启动版权管理信息诉讼,同时新增一项计算机欺诈指控。.
在周四的听证会上,法官表示,尽管他对欺诈指控的实质内容持怀疑态度,但他仍将允许原告提交一份修改后的诉状。.

