Компания Meta Platforms обучала свои модели искусственного интеллекта, используя пиратские версии книг, защищенных авторским правом, с одобрения своего генерального директора Марка Цукерберга.
Согласно недавно обнародованным судебным документам, группа авторов утверждает, что гигант социальных сетей знал о том, что они используют пиратские работы для обучения своих систем искусственного интеллекта.
Внутренние документы компании Meta «раскрывают» эти утверждения
В своем иске авторы заявили, что внутренние документы, предоставленные компанией Meta в ходе процесса раскрытия информации, показали, что социальная сеть знала о пиратских книгах. По данным The Guardian , генеральный директор компании Цукерберг поддержал использование набора данных LibGen, огромного онлайн-архива книг. Это произошло несмотря на предупреждения внутри команды руководителей, занимающихся искусственным интеллектом, о том, что этот набор данных «нам известно, что он пиратский».
Американский писатель Та-Нехиси Коутс, комедиантка Сара Сильверман и другие авторы, подавшие в суд на компанию за нарушение авторских прав, выдвинули эти обвинения в документах, которые были обнародованы в среду в федеральном суде Калифорнии.
В 2023 году авторы подали в суд на компанию Meta, обвинив ее в неправомерном использовании их книг для обучения моделей искусственного интеллекта, в частности, Llama, крупной языковой модели, которая лежит в основе ее чат-ботов.
Созданный в России набор данных Library Genesis, или LibGen, представляет собой «теневую библиотеку», которая, как утверждается, содержит миллионы романов, информационных брошюр, а также статей из научных журналов.
В 2024 году федеральный суд Нью-Йорка обязал анонимных операторов LibGen выплатить группе издателей 30 миллионов долларов в качестве компенсации за нарушение авторских прав.
Это лишь один из многих случаев, когда утверждается, что защищенные авторским правом работы авторов, художников и других лиц использовались для обучения инструментов генеративного искусственного интеллекта, таких как чат-бот ChatGPT, без согласия владельцев. Профессионалы в сфере творчества предупреждают, что использование их работ без их согласия ставит под угрозу их бизнес-модели.
по данным Reuters , ответчики утверждают, что они добросовестно использовали материалы, защищенные авторским правом.
Судья разрешил авторам подать исправленную жалобу
В деле Meta авторы, как сообщается, в среду обратились в суд с просьбой разрешить подать обновленную жалобу. В своих аргументах они указали, что новые доказательства свидетельствуют о том, что компании, занимающиеся социальными сетями, использовали обучающий набор данных для ИИ LibGen, который включает миллионы пиратских работ, и распространяли его через пиринговые торренты.
По их словам, Цукерберг «одобрил использование Meta набора данных LibGen, несмотря на опасения руководства Meta в области ИИ (и других сотрудников Meta) по поводу того, что LibGen — это „набор данных, который, как нам известно, является пиратским“»
В заявлении также цитируется служебная записка, в которой упоминаются инициалы Цукерберга, и отмечается, что «после передачи вопроса MZ» команде разработчиков ИИ Meta «было разрешено использовать LibGen»
В прошлом году окружной судья США Винс Чабрия отклонил иски о том, что текст, сгенерированный моделями искусственного интеллекта Meta, нарушает авторские права авторов и что Meta незаконно изъяла информацию об управлении авторскими правами на книги. Речь идет об информации о произведении, включая название, имя автора и правообладателя.
Однако истцам было разрешено внести поправки в свои исковые требования. В своих аргументах на этой неделе авторы заявили, что доказательства подкрепляют их претензии о нарушении авторских прав и оправдывают возобновление дела об управлении авторскими правами с добавлением нового обвинения в компьютерном мошенничестве.
В ходе слушания в четверг судья заявил, что разрешит авторам подать исправленную жалобу, хотя и выразил скептицизм по поводу обоснованности утверждений о мошенничестве.

