ПОСЛЕДНИЕ НОВОСТИ

жить Bitcoin резко подскочил выше отметки в 82 000 долларов

2 часа назад Обновления в режиме реального времени
Председатель Корейской биржи продвигает криптовалютные деривативы в Пусане, поскольку гиганты TradFi выходят на рынок бессрочных облигаций объемом 86 триллионов долларов

3 минуты назад Новости
Основатель LayerZero опровергает «совершенно ложные» заявления о взломе KelpDAO

17 минут назад Новости
Игги Азалия столкнулась с коллективным иском из-за краха токена MOTHER

2 часа назад Новости

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Технологии

Согласно судебным документам, сотрудники Meta обсуждали использование контента, защищенного авторским правом, для обучения ИИ

Автор:

Овотунсе Адебайо

3 минуты чтения, 22 февраля 2025 г.

Согласно судебным документам, сотрудники Meta обсуждали использование контента, защищенного авторским правом, для обучения ИИ

Судебные документы показали, что сотрудники компании Meta обсуждали использование защищенного авторским правом контента для обучения своих моделей искусственного интеллекта (ИИ).
Внутренние рабочие переписки также показали, как компания, возможно, использовала контент, имеющий юридические недостатки, для обучения своих моделей искусственного интеллекта.
В судебных документах были выявлены и другие нарушения, в связи с чем истцы внесли изменения в свой иск.

Судебные документы показали, что сотрудники Meta обсуждали использование защищенного авторским правом контента для обучения своих моделей искусственного интеллекта. Согласно последним судебным документам, большая часть обсуждений касалась контента, полученного сомнительными с юридической точки зрения способами.

Документы были предоставлены истцами по делу Кадрей против Мета, одному из многих дел об авторском праве в сфере ИИ, которые рассматривались в судах США. Согласно утверждениям Мета, использование защищенных авторским правом произведений, особенно книг, для обучения своих моделей подпадает под принцип добросовестного использования. Однако истцы, возглавляемые Сарой Сильверман и Та-Нехиси Коутсом, не согласны с утверждениями компании.

Согласно ранее представленным документам, генеральный директор Meta Марк Цукерберг одобрил использование командой разработчиков ИИ защищенного авторским правом контента для обучения своих моделей. В документах также указывалось, что компания прекратила переговоры с книжными издательствами о лицензировании данных.

Компания Meta предположительно использует контент, защищенный авторским правом, для обучения своих моделей искусственного интеллекта

Согласно новым материалам дела , представленным суду, внутренние рабочие переписки между сотрудниками Meta наглядно демонстрируют, как компания могла использовать защищенные авторским правом данные для обучения своих моделей искусственного интеллекта, включая большинство моделей семейства Llama.

В одной из бесед участвовала Мелани Камбадур, старший менеджер исследовательской группы Llama и руководитель компании Meta. В ходе беседы она рассказала об обучении моделей ИИ на контенте, который не был юридически обоснован.

«Мое мнение таково (в духе принципа «проси прощения, а не разрешения»): мы пытаемся получить доступ к финансовой отчетности и довести дело до руководства, чтобы они приняли решение», — сказал инженер-исследователь Meta Ксавье Мартине в чате от февраля 2023 года, согласно документам. «Именно поэтому они создали эту организацию по разработке искусственного интеллекта: чтобы мы могли быть менее склонны к избеганию рисков», — добавил он.

Мартине упомянул, что компания могла бы просто покупать электронные книги по розничным ценам для создания обучающего набора данных, вместо того чтобы заключать лицензионные соглашения с различными издателями. В то время как другой сотрудник предостерег от использования подобного контента и юридических последствий, Мартине отметил, что другие фирмы, вероятно, также используют пиратские книги для обучения.

В том же чате Камбадур упомянул, что компания ведет переговоры с некоторыми платформами о лицензировании, но отметил, что, хотя использование общедоступных данных потребует согласований, юристы компании стали менее консервативны, чем раньше. «Разница в том, что сейчас у нас больше денег, больше юристов, больше специалистов по развитию бизнеса, возможность ускоренного trac/эскалации для повышения скорости, и юристы стали менее консервативны в вопросах согласования», — сказал Камбадур.

Сотрудники обсуждают использование Libgen

Согласно материалам дела, в другом рабочем чате Камбадур обсуждал использование Libgen, агрегатора ссылок на защищенный авторским правом контент от издателей, в качестве источника данных, на который Meta может получить лицензию. На Libgen неоднократно подавали в суд, и платформе было предписано прекратить работу из-за обвинений в нарушении авторских прав.

В то время как другой коллега в чате опубликовал фотографию и сопроводил её комментарием «Нет, Libgen не является законным», похоже, что некоторые руководители высшего звена считали, что отказ от использования Libgen может подорвать конкурентоспособность компании в гонке за лидерство в области ИИ. В электронном письме, отправленном директором по управлению продуктами Meta Сони Теаканатом вице-президенту Meta AI Жоэль Пино, он отметил, что Libgen важен для достижения самых современных показателей (SOTA) во всех категориях.

Теаканат также рассказал о нескольких способах, с помощью которых компания могла бы снизить юридические риски, включая удаление данных, помеченных как украденные/пиратские, и отказ от публичного упоминания других способов использования. «Мы не будем раскрывать информацию об использовании наборов данных Libgen для обучения», — сказал он. На практике это означало, что компания сначала будет проверять файлы Libgen на наличие «украденных или пиратских» работ.

Судебные документы раскрывают и другие нарушения

В одном из рабочих чатов Камбадур также предложил команде Meta AI настроить модели таким образом, чтобы они «избегали рискованных запросов IP-адресов», что позволит моделям отказываться давать ответы пользователям, пытающимся узнать, на каких электронных книгах эти модели были обучены.

В документах также были раскрыты другие подробности, в частности, выяснилось, что Meta, возможно, использовала Reddit для обучения своей модели, имитирующей поведение стороннего приложения Pushshift. В заявлении, сделанном в апреле 2023 года, Reddit упомянул, что начнет взимать плату с компаний, занимающихся искусственным интеллектом, за доступ к данным для обучения их моделей.

Истцы по данному делу неоднократно вносили поправки в свою жалобу с момента начала судебного разбирательства в 2023 году. Иск был подан в Окружной суд США Северного округа Калифорнии, Сан-Франциско. В последней поправке истцы утверждали, что компания Meta сопоставляла пиратские книги с книгами, защищенными авторским правом, чтобы определить, целесообразно ли заключать лицензионное соглашение. Компания Meta, со своей стороны, рассматривает это дело как юридически важный вопрос и намерена привлечь в свою команду защиты двух юристов, специализирующихся на судебных процессах в Верховном суде.

Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Libgen Meta Pushshift Reddit USD

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Овотунсе Адебайо

Адебайо — писатель с четырехлетним опытом работы в криптопространстве. Он окончил Университет Лагоса, где изучал городское и региональное планирование. Адебайо работал в Tokenhell и CryptoTicker, где писал новости о криптовалютах и финтехе. В настоящее время он является автором новостей для Cryptopolitan.

ОГЛАВЛЕНИЕ

1. Компания Meta предположительно использует контент, защищенный авторским правом, для обучения своих моделей искусственного интеллекта

2. Сотрудники обсуждают использование Libgen

3. Судебные документы раскрывают и другие нарушения

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- ПО ГЛУБОКОЙ
КУРС

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)