Новое исследование показало, что компании, занимающиеся искусственным интеллектом, полагаются на ведущих издателей в предоставлении обучающих данных

- Крупнейшие компании в сфере искусственного интеллекта, такие как OpenAI и Google, используют статьи из ведущих издательских каналов для обучения языковых моделей.
- Согласно исследованию компании Ziff Davis, источники фильтруются на основе поискового рейтинга.
- Издатели обеспокоены тем, что компании, занимающиеся разработкой искусственного интеллекта, используют их контент без разрешения.
Крупные технологические компании, включая OpenAI, Google, Meta и Anthropic, используют высококачественные материалы, защищенные авторским правом, от известных издателей для обучения своих больших языковых моделей (LLM).
Согласно исследованию, проведенному компанией Ziff Davis, материнской компанией CNET, IGN и Mashable, высококачественный контент играет важнейшую роль в обучении моделей искусственного интеллекта. Исследование показывает, что в компаниях, занимающихся разработкой ИИ, для повышения производительности моделей предпочтение отдается авторитетным источникам данных, однако вклад этих источников часто недооценивается.
В исследовании юрист компании Ziff Davis, специализирующийся на искусственном интеллекте, Джордж Вукосон и технический директор Джои Фортуна утверждают, что компании, занимающиеся разработкой ИИ, выбирают обучающие данные, основываясь на рейтинге авторитетных веб-сайтов с высокими позициями в поисковой выдаче. Высококачественные и популярные веб-сайты выбираются для улучшения моделей, поскольку они имеют хорошую репутацию. Эта стратегия, согласно исследованию, позволяет разработчикам ИИ дорабатывать языковую модель.
Компания Ziff Davis отметила, что ведущие поставщики контента, такие как Axel Springer, Future PLC, Hearst, News Corp и The New York Times, внесли свой вклад в разработку обучающих наборов данных. В частности, былоdent, что 12,04% данных OpenWebText2, использованных для создания GPT-3 от OpenAI, поступили от этих авторитетных издателей.
Марк Цукерберг также высказался по поводу продолжающихся дебатов об использовании контента в обучении ИИ. В недавнем интервью The Verge Цукерберг признал, что сбор данных для ИИ — сложная задача, но также отметил, что контент отдельных создателей или издателей может быть не таким уж и эффективным. Он заявил: «Я думаю, что отдельные создатели или издатели склонны переоценивать ценность своего конкретного контента в общей картине».
Издатели подают иски против компаний, занимающихся искусственным интеллектом
Секретность вокруг источников обучающих данных вызвала обеспокоенность как у издателей, так и у потребителей. Недавно газеты The New York Times и The Wall Street Journal подали иски против компаний, занимающихся искусственным интеллектом, утверждая, что те нарушили законы об авторском праве, используя их контент.
Хотя OpenAI предприняла усилия по получению лицензий на контент от таких медиа-организаций, как Financial Times и DotDash Meredith, ряд компаний, занимающихся искусственным интеллектом, по-прежнему работают без надлежащего лицензирования. В отчете также говорится, что «крупные разработчики LLM-программ больше не раскрывают свои обучающие данные так, как это делали раньше».
Хотя стоимость компаний, занимающихся искусственным интеллектом, растет, разрыв между технологическими гигантами и традиционными медиакомпаниями остается огромным. Технологические гиганты, такие как Google и Meta, оценочная стоимость которых составляет 2,2 трлн и 1,5 трлн долларов соответственно, остаются в авангарде генеративного ИИ, в то время как стартапы, такие как OpenAI и Anthropic, оцениваются в 157 миллиардов и 40 миллиардов долларов соответственно.
С другой стороны, издатели по-прежнему сталкиваются с сокращениями штата и реструктуризацией, что свидетельствует о финансовом давлении, связанном с адаптацией к среде, все больше defiискусственным интеллектом. В результате конкуренции с контентом, создаваемым пользователями и основанным на ИИ, многие издатели сталкиваются с проблемами сокращения расходов и штата сотрудников.
Существует золотая середина между хранением денег в банке и рискованными инвестициями в криптовалюту. Начните с этого бесплатного видео о децентрализованных финансах.
Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.
КУРС
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)















