Компании OpenAI и Microsoft столкнулись с новым судебным иском от CIR

Логотипы CIR и OpenAI на фоне молотка.
- CIR подала в суд на OpenAI и Microsoft за уклонение от соблюдения законов об авторском праве.
- Компания OpenAI использовала 17 849 URL-адресов из CIR для обучения своих LLM-моделей без получения разрешения и без какой-либо компенсации.
- CIR требует возмещения ущерба за нарушение авторских прав и Закона об авторском праве в цифровую эпоху (DMCA), сумма которого может составить миллионы долларов.
Компания OpenAI и Microsoft столкнулись с новым судебным иском от Центра журналистских расследований (CIR). CIR утверждает, что OpenAI использовала опубликованный контент с сайтов Mother Jones и Reveal для обучения более ранних версий ChatGPT.
Читайте также: OpenAI отказалась от голосового чата ChatGPT после скандала со Скарлетт Йоханссон.
Истец, CIR, утверждает, что OpenAI использовала его контент без разрешения и без обещания компенсации. CIR, основанная в 1977 году, управляет некоммерческим американским журналом Mother Jones и подкастом Reveal.
CIR подает в суд на OpenAI и Microsoft за нарушение авторских прав
Центр журналистских расследований (CIR) подал иск в федеральный суд Нью-Йорка в четверг. Некоммерческая организация обвинила OpenAI и Microsoft в использовании их контента без разрешения и без компенсации. CIR утверждает , что OpenAI нарушила законы об авторском праве, используя их контент для обучения ChatGPT.
Генеральный директор CIR Моника Бауэрляйн заявила: «Такое поведение, когда люди пользуются чужими ресурсами без разрешения, не только несправедливо, но и является нарушением авторских прав. Работа журналистов, как в CIR, так и повсюду, ценна, и OpenAI и Microsoft это знают».
🚨[Судебный иск о нарушении авторских прав на ИИ] Центр журналистских расследований (авторы @MotherJones и @reveal) подает в суд на OpenAI и Microsoft за нарушение авторских прав. Цитаты:
«Ответчики копировали, использовали, сокращали и демонстрировали ценный контент CIR без разрешения или согласия CIR, и… pic.twitter.com/SeZ0VtDOMY
– Луиза Яровски, доктор философии (@LuizaJarinsky) 29 июня 2024 г.
В официальном иске истец нанял специалиста по анализу данных для изучения OpenWebText . OpenWebText — это приближенная версия WebText, корпуса веб-страниц, собранных с помощью OpenAI. Специалист по анализу данных обнаружил, что набор данных содержит 17 434 URL-адреса из Mother Jones и 415 из Reveal. Количество статей Mother Jones в OpenWebText и WebText немного различается, поскольку процесс сбора данных происходил в разные дни.
В официальном исковом заявлении истец указал:
«Когда ответчики наполняли свои учебные материалы журналистскими статьями, перед ними вставал выбор: уважать журналистские работы или нет. Ответчики выбрали последнее».
Читайте также: Главный научный сотрудник OpenAI Илья Суцкевер попрощался с компанией.
OpenAI использовала два алгоритма, Dragnet и Newspaper, для создания базы данных WebText. Алгоритм Dragnet предназначен для отделения основного содержимого статьи от других частей веб-сайта, таких как заголовок, нижний колонтитул, название, имя автора и уведомления об авторских правах. Когда OpenAI провела парсинг веб-сайта Mother Jones, она удалила все содержимое нижнего и верхнего колонтитулов. Кроме того, создатель ChatGPT удалил уведомление об авторских правах и информацию об условиях использования, как указано в жалобе.
Кроме того, истец утверждает, что Microsoft знала о том, что собранные URL-адреса содержали журналистский контент без указания имен авторов, должностей и уведомлений об авторских правах, что способствовало нарушению авторских прав со стороны Bing AI и ChatGPT.
CIR требует от OpenAI и Microsoft возмещения прибыли, а также фактического или установленного законом ущерба. Указанная сумма составляет минимум 750 долларов за каждое нарушенное произведение и 2500 долларов за каждое нарушение DMCA.
Компания OpenAI сталкивается с судебными исками со стороны других изданий
Это не первый иск, поданный против OpenAI за нарушение авторских прав. С момента выпуска ChatGPT в конце 2022 года OpenAI и Microsoft столкнулись с многочисленными судебными исками от таких крупных изданий, как New York Times, The Intercept, New York Daily News и Chicago Tribune.
Читайте также: Сотрудники утверждают, что OpenAI и Google DeepMind скрывают риски, связанные с ИИ.
Тем временем некоторые крупные издательства и интернет-гиганты заключили лицензионные соглашения с OpenAI, предоставив ей доступ к своим архивам. Среди них журнал TIME, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow и Reddit.
Репортаж Ранды Мозес для издания Cryptopolitan
Самые умные криптоаналитики уже читают нашу рассылку. Хотите присоединиться? Вступайте в их ряды.
Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Ранда Мозес
Ранда Мозес — редактор и репортер Cryptopolitan освещающая темы технологий, искусственного интеллекта, робототехники, криптовалют, мошенничества и взломов. Она работает в криптопространстве с 2017 года. Ранее работала в Forward Protocol, AmaZix и Cryptosomniac. Ранда имеет степень в области электротехники иtron, полученную в Университете Брэдфорда.
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)















