ПОСЛЕДНИЕ НОВОСТИ
ПОДОБРАНО ДЛЯ ВАС
Еженедельно
ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Технологические гиганты используют субтитры YouTube для обучения ИИ без разрешения

КБренда КананаБренда Канана
2 минуты чтения,
Технологические гиганты используют субтитры YouTube для обучения ИИ без разрешения
  • Apple и другие разработчики ИИ, такие как Anthropic и Nvidia, были уличены в использовании субтитров YouTube без разрешения для обучения своих систем ИИ.
  • Набор данных «YouTube Subtitles» был разработан EleutherAI и опубликован в 2020 году.
  • Для обучения своей модели GPT-4 компания OpenAI использовала миллион часов видеороликов YouTube. 

Apple, Nvidia и Anthropic были уличены в использовании субтитров YouTube для обучения моделей искусственного интеллекта, что противоречит политике YouTube. В отчёте Proof News и Wired говорится, что эти компании использовали набор данных, содержащий расшифровки тысяч видеороликов YouTube, не приобретая при этом лицензию. 

Читайте также: Британский надзорный орган начал расследование в отношении привлечения Microsoft специалистов по искусственному интеллекту.

Исследование . показало, что Apple, Nvidia и Anthropic использовали набор данных YouTube Subtitles. Этот набор данных содержит расшифровки 173 536 видеороликов YouTube с 48 000 каналов. Среди них образовательные каналы, такие как Khan Academy и MIT, новостные каналы, такие как The Wall Street Journal, а также видео таких известных авторов, как MrBeast и Marques Brownlee 

Популярные ютуберы реагируют на эксплуатацию данных

Маркес Браунли, популярный ютубер, прокомментировал эту проблему на X. Он сказал: «Apple собирала данные для ИИ от других компаний. Одна из них собрала много данных/расшифровок из видео на YouTube, включая мое». Хотя Apple, возможно, и не собирала данные напрямую, Браунли отметил, что эта проблема сохранится.

Набор данных «YouTube Subtitles» был разработан компанией EleutherAI и опубликован в 2020 году. Он содержит 5,7 ГБ данных, включая субтитры из видео YouTube, которые были удалены с платформы. 

Согласно условиям YouTube, доступ к видео «автоматизированными средствами» запрещён. Наличие субтитров к удалённым видео только усугубляет проблему, поднимая вопросы о конфиденциальности и нарушении авторских прав.

Организация Salesforce, также участвовавшая в расследовании, также призналась в использовании указанного набора данных. 

Набор данных Pile, упомянутый в исследовательской работе, был обучен в 2021 году для академических и исследовательских целей. Набор данных был публично доступен и распространялся по разрешительной лицензии.

Представитель Salesforce 

Однако использование контента YouTube без разрешения до сих пор остаётся спорным вопросом. В апреле генеральный директор YouTube Нил Мохан заявил, что использование видео, стенограмм или клипов YouTube для обучения ИИ является «явным нарушением» правил. Однако, по данным New York Times, OpenAI использовала миллион часов видео YouTube для обучения своей модели GPT-4. 

Разгораются судебные баталии из-за использования интернет-контента компаниями, занимающимися разработкой искусственного интеллекта

Проблема использования корпорациями, занимающимися искусственным интеллектом, контента из интернета без разрешения обострилась после запуска ChatGPT. Кроме того, создатели контента подали в суд на Stability AI и Midjourney за якобы незаконное копирование материалов, защищённых авторским правом. Владелец YouTube, Google, столкнулся с коллективными исками по аналогичным искам, заявив, что подобные действия угрожают основам генеративного искусственного интеллекта. 

В интервью The Wall Street Journal технический директор OpenAI Мира Мурати не уточнила, использовала ли компания видео с платформ социальных сетей для обучения новой модели. Генеральный директор Microsoft AI Мустафа Сулейман заявил , что контент в открытом интернете считается добросовестным использованием с 1990-х годов на основании того, что он назвал «социальным договоромtrac. 

Существует золотая середина между хранением денег в банке и рискованными инвестициями в криптовалюту. Начните с этого бесплатного видео о децентрализованных финансах.

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

ЕЩЕ… НОВОСТИ
ЭКСПРЕСС- ПО ГЛУБОКОЙ
КУРС