- CIR подала в суд на OpenAI и Microsoft за уклонение от соблюдения законов об авторском праве.
- Компания OpenAI использовала 17 849 URL-адресов из CIR для обучения своих LLM-моделей без получения разрешения и без какой-либо компенсации.
- CIR требует возмещения ущерба за нарушение авторских прав и Закона об авторском праве в цифровую эпоху (DMCA), сумма которого может составить миллионы долларов.
Компания OpenAI и Microsoft столкнулись с новым судебным иском от Центра журналистских расследований (CIR). CIR утверждает, что OpenAI использовала опубликованный контент с сайтов Mother Jones и Reveal для обучения более ранних версий ChatGPT.
Читайте также: OpenAI отказалась от голосового чата ChatGPT после скандала со Скарлетт Йоханссон.
Истец, CIR, утверждает, что OpenAI использовала его контент без разрешения и без обещания компенсации. CIR, основанная в 1977 году, управляет некоммерческим американским журналом Mother Jones и подкастом Reveal.
CIR подает в суд на OpenAI и Microsoft за нарушение авторских прав
Центр журналистских расследований (CIR) подал иск в федеральный суд Нью-Йорка в четверг. Некоммерческая организация обвинила OpenAI и Microsoft в использовании их контента без разрешения и без компенсации. CIR утверждает , что OpenAI нарушила законы об авторском праве, используя их контент для обучения ChatGPT.
Генеральный директор CIR Моника Бауэрляйн заявила: «Такое поведение, когда люди пользуются чужими ресурсами без разрешения, не только несправедливо, но и является нарушением авторских прав. Работа журналистов, как в CIR, так и повсюду, ценна, и OpenAI и Microsoft это знают».
🚨[Судебный иск о нарушении авторских прав на ИИ] Центр журналистских расследований (авторы @MotherJones и @reveal) подает в суд на OpenAI и Microsoft за нарушение авторских прав. Цитаты:
«Ответчики копировали, использовали, сокращали и демонстрировали ценный контент CIR без разрешения или согласия CIR, и… pic.twitter.com/SeZ0VtDOMY
– Луиза Яровски, доктор философии (@LuizaJarinsky) 29 июня 2024 г.
В официальном иске истец нанял специалиста по анализу данных для изучения OpenWebText . OpenWebText — это приближенная версия WebText, корпуса веб-страниц, собранных с помощью OpenAI. Специалист по анализу данных обнаружил, что набор данных содержит 17 434 URL-адреса из Mother Jones и 415 из Reveal. Количество статей Mother Jones в OpenWebText и WebText немного различается, поскольку процесс сбора данных происходил в разные дни.
В официальном исковом заявлении истец указал:
«Когда ответчики наполняли свои учебные материалы журналистскими статьями, перед ними вставал выбор: уважать журналистские работы или нет. Ответчики выбрали последнее».
Читайте также: Главный научный сотрудник OpenAI Илья Суцкевер попрощался с компанией.
OpenAI использовала два алгоритма, Dragnet и Newspaper, для создания базы данных WebText. Алгоритм Dragnet предназначен для отделения основного содержимого статьи от других частей веб-сайта, таких как заголовок, нижний колонтитул, название, имя автора и уведомления об авторских правах. Когда OpenAI провела парсинг веб-сайта Mother Jones, она удалила все содержимое нижнего и верхнего колонтитулов. Кроме того, создатель ChatGPT удалил уведомление об авторских правах и информацию об условиях использования, как указано в жалобе.
Кроме того, истец утверждает, что Microsoft знала о том, что собранные URL-адреса содержали журналистский контент без указания имен авторов, должностей и уведомлений об авторских правах, что способствовало нарушению авторских прав со стороны Bing AI и ChatGPT.
CIR требует от OpenAI и Microsoft возмещения прибыли, а также фактического или установленного законом ущерба. Указанная сумма составляет минимум 750 долларов за каждое нарушенное произведение и 2500 долларов за каждое нарушение DMCA.
Компания OpenAI сталкивается с судебными исками со стороны других изданий
Это не первый иск, поданный против OpenAI за нарушение авторских прав. С момента выпуска ChatGPT в конце 2022 года OpenAI и Microsoft столкнулись с многочисленными судебными исками от таких крупных изданий, как New York Times, The Intercept, New York Daily News и Chicago Tribune.
Читайте также: Сотрудники утверждают, что OpenAI и Google DeepMind скрывают риски, связанные с ИИ.
Тем временем некоторые крупные издательства и интернет-гиганты заключили лицензионные соглашения с OpenAI, предоставив ей доступ к своим архивам. Среди них журнал TIME, News Corp, Financial Times, Vox Media, Associated Press, The Atlantic, Stack Overflow и Reddit.
Репортаж Ранды Мозес для издания Cryptopolitan
Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.
Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.
КУРС
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)
















