ПОСЛЕДНИЕ НОВОСТИ
ПОДОБРАНО ДЛЯ ВАС
Еженедельно
ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Согласно судебным документам, сотрудники Meta обсуждали использование контента, защищенного авторским правом, для обучения ИИ

Автор:Овотунсе АдебайоОвотунсе Адебайо
3 минуты чтения,
Согласно судебным документам, сотрудники Meta обсуждали использование контента, защищенного авторским правом, для обучения ИИ
  • Судебные документы показали, что сотрудники компании Meta обсуждали использование защищенного авторским правом контента для обучения своих моделей искусственного интеллекта (ИИ).
  • Внутренние рабочие переписки также показали, как компания, возможно, использовала контент, имеющий юридические недостатки, для обучения своих моделей искусственного интеллекта.
  • В судебных документах были выявлены и другие нарушения, в связи с чем истцы внесли изменения в свой иск.

Судебные документы показали, что сотрудники Meta обсуждали использование защищенного авторским правом контента для обучения своих моделей искусственного интеллекта. Согласно последним судебным документам, большая часть обсуждений касалась контента, полученного сомнительными с юридической точки зрения способами.

Документы были предоставлены истцами по делу Кадрей против Мета, одному из многих дел об авторском праве в сфере ИИ, которые рассматривались в судах США. Согласно утверждениям Мета, использование защищенных авторским правом произведений, особенно книг, для обучения своих моделей подпадает под принцип добросовестного использования. Однако истцы, возглавляемые Сарой Сильверман и Та-Нехиси Коутсом, не согласны с утверждениями компании.

Согласно ранее представленным документам, генеральный директор Meta Марк Цукерберг одобрил использование командой разработчиков ИИ защищенного авторским правом контента для обучения своих моделей. В документах также указывалось, что компания прекратила переговоры с книжными издательствами о лицензировании данных.

Компания Meta предположительно использует контент, защищенный авторским правом, для обучения своих моделей искусственного интеллекта

Согласно новым материалам дела , представленным суду, внутренние рабочие переписки между сотрудниками Meta наглядно демонстрируют, как компания могла использовать защищенные авторским правом данные для обучения своих моделей искусственного интеллекта, включая большинство моделей семейства Llama.

В одной из бесед участвовала Мелани Камбадур, старший менеджер исследовательской группы Llama и руководитель компании Meta. В ходе беседы она рассказала об обучении моделей ИИ на контенте, который не был юридически обоснован.

«Мое мнение таково (в духе принципа «проси прощения, а не разрешения»): мы пытаемся получить доступ к финансовой отчетности и довести дело до руководства, чтобы они приняли решение», — сказал инженер-исследователь Meta Ксавье Мартине в чате от февраля 2023 года, согласно документам. «Именно поэтому они создали эту организацию по разработке искусственного интеллекта: чтобы мы могли быть менее склонны к избеганию рисков», — добавил он.

Мартине упомянул, что компания могла бы просто покупать электронные книги по розничным ценам для создания обучающего набора данных, вместо того чтобы заключать лицензионные соглашения с различными издателями. В то время как другой сотрудник предостерег от использования подобного контента и юридических последствий, Мартине отметил, что другие фирмы, вероятно, также используют пиратские книги для обучения.

В том же чате Камбадур упомянул, что компания ведет переговоры с некоторыми платформами о лицензировании, но отметил, что, хотя использование общедоступных данных потребует согласований, юристы компании стали менее консервативны, чем раньше. «Разница в том, что сейчас у нас больше денег, больше юристов, больше специалистов по развитию бизнеса, возможность ускоренного trac/эскалации для повышения скорости, и юристы стали менее консервативны в вопросах согласования», — сказал Камбадур.

Сотрудники обсуждают использование Libgen

Согласно материалам дела, в другом рабочем чате Камбадур обсуждал использование Libgen, агрегатора ссылок на защищенный авторским правом контент от издателей, в качестве источника данных, на который Meta может получить лицензию. На Libgen неоднократно подавали в суд, и платформе было предписано прекратить работу из-за обвинений в нарушении авторских прав.

В то время как другой коллега в чате опубликовал фотографию и сопроводил её комментарием «Нет, Libgen не является законным», похоже, что некоторые руководители высшего звена считали, что отказ от использования Libgen может подорвать конкурентоспособность компании в гонке за лидерство в области ИИ. В электронном письме, отправленном директором по управлению продуктами Meta Сони Теаканатом вице-президенту Meta AI Жоэль Пино, он отметил, что Libgen важен для достижения самых современных показателей (SOTA) во всех категориях.

Теаканат также рассказал о нескольких способах, с помощью которых компания могла бы снизить юридические риски, включая удаление данных, помеченных как украденные/пиратские, и отказ от публичного упоминания других способов использования. «Мы не будем раскрывать информацию об использовании наборов данных Libgen для обучения», — сказал он. На практике это означало, что компания сначала будет проверять файлы Libgen на наличие «украденных или пиратских» работ.

Судебные документы раскрывают и другие нарушения

В одном из рабочих чатов Камбадур также предложил команде Meta AI настроить модели таким образом, чтобы они «избегали рискованных запросов IP-адресов», что позволит моделям отказываться давать ответы пользователям, пытающимся узнать, на каких электронных книгах эти модели были обучены.

В документах также были раскрыты другие подробности, в частности, выяснилось, что Meta, возможно, использовала Reddit для обучения своей модели, имитирующей поведение стороннего приложения Pushshift. В заявлении, сделанном в апреле 2023 года, Reddit упомянул, что начнет взимать плату с компаний, занимающихся искусственным интеллектом, за доступ к данным для обучения их моделей.

Истцы по данному делу неоднократно вносили поправки в свою жалобу с момента начала судебного разбирательства в 2023 году. Иск был подан в Окружной суд США Северного округа Калифорнии, Сан-Франциско. В последней поправке истцы утверждали, что компания Meta сопоставляла пиратские книги с книгами, защищенными авторским правом, чтобы определить, целесообразно ли заключать лицензионное соглашение. Компания Meta, со своей стороны, рассматривает это дело как юридически важный вопрос и намерена привлечь в свою команду защиты двух юристов, специализирующихся на судебных процессах в Верховном суде.

Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

ЕЩЕ… НОВОСТИ
ЭКСПРЕСС- ПО ГЛУБОКОЙ
КУРС