Google обучает инструменты поиска на основе ИИ на контенте издателей, несмотря на отказ пользователей от участия

- Google использует контент издателей для обучения своих инструментов поиска с использованием искусственного интеллекта, даже если издатели отказываются от этого.
- Министерство юстиции США настаивает на существенных изменениях в бизнесе Google, включая продажу подразделения рекламных технологий.
- Издатели и регулирующие органы обеспокоены тем, как Google использует данные для обучения искусственного интеллекта.
Компания Google оказалась под пристальным вниманием после того, как высокопоставленный руководитель дал показания о том, что специализированные продукты искусственного интеллекта (ИИ) для поиска, такие как AI Overviews, обучаются на контенте издателей, даже если эти издатели явно отказались от обучения ИИ.
Эли Коллинз, вице-президентdent DeepMind, признал федеральном суде , что, хотя издатели могут предотвратить использование своего контента для обучения моделей искусственного интеллекта, разработанных DeepMind, такие возможности отказа не распространяются на всю поисковую структуру Google.
«Как только вы берете модель Gemini [искусственный интеллект] и внедряете ее в поисковую систему, поисковая система получает возможность обучаться на данных, от использования которых издатели отказались, верно?» — спросила Диана Агилар, юрист Министерства юстиции США.
Коллинз подтвердил, что данные по-прежнему могут быть использованы «для целей поиска»
Это разоблачение появилось на фоне ключевого антимонопольного процесса, определяющего, как технологическая компания должна реструктурировать свою деятельность после того, как в прошлом году была признана виновной в незаконной монополизации рынка онлайн-поиска. Министерство юстиции теперь настаивает на структурных мерах, включая принуждение компании к продаже своего браузера Chrome и запрет сделок, которые делают его поисковой системой по умолчанию на всех устройствах — шаг, который также повлияет на продукты компании в области искусственного интеллекта, включая Gemini.
Google использует контент, который, по словам издателей, они не разрешали, для работы инструментов искусственного интеллекта
Google AI Overviews, которая суммирует ответы в верхней части результатов поиска с помощью сгенерированного ИИ текста, уже вызвала тревогу у владельцев веб-сайтов. Многие утверждают, что она снижает количество переходов пользователей на оригинальные сайты и вредит их доходам, однако технологическая компания продолжает использовать данные из этих источников.
В документе Министерства юстиции США от 26 августа 2024 года под названием «Search GenAI <> Gemini v3» внутренние данные показали, что Google отфильтровал около 80 миллиардов токенов — по сути, фрагментов текста — из своего обучающего корпуса, состоящего из 160 миллиардов токенов, в ответ на отказы издателей. Однако оставшиеся 80 миллиардов токенов все еще могут содержать контент, который используется для работы функций Google Search AI.
В том же документе в качестве дополнительных источников для улучшения обучения ИИ были указаны «данные о поисковых сессиях» и видеоролики на YouTube, что вызвало опасения по поводу масштабов пользовательских данных, используемых в моделях ИИ этой технологической компании.
Когда судья Амит Мехта спросил, действительно ли половина набора данных была удалена из-за отказа издателей от участия, Коллинз подтвердил: «Это верно»
Министерство юстиции США подчеркивает внутренний интерес к использованию данных поисковых систем для искусственного интеллекта
Министерство юстиции также обратило внимание на внутренние обсуждения в Google, свидетельствующие о стремлении обучать модели ИИ, используя огромные массивы поисковых данных — рейтинги, запросы и поведение пользователей.
Один из таких примеров — брифинг, подготовленный для генерального директора DeepMind Демиса Хассабиса, на котором он размышлял над идеей обучения модели искусственного интеллекта Google с использованием исчерпывающих данных о поиске для оценки полученных результатов повышения производительности.
Агилар спросил Коллинза, создала ли Google модель, использующую данные поиска. Коллинз ответил, что ему неизвестно о разработке подобной модели, хотя и признал, что Хассабис проявил интерес к этой концепции.
Юридическая команда Google попыталась преуменьшить опасения по поводу доминирования ИИ, утверждая, что другие компании, занимающиеся ИИ, могут процветать и без использования поискового индекса Google. Например, спортивные чат-боты могут получать доступ к данным в режиме реального времени через коммерческие партнерства с поставщиками результатов, а не через контент, сканируемый веб-сайтами.
Тем не менее, Министерство юстиции утверждает, что многолетнее доминирование Google в сфере поиска дает компании несправедливое преимущество в области искусственного интеллекта, особенно с учетом интеграции Gemini в ее поисковую инфраструктуру.
Бизнес Google в сфере рекламы подвергается более пристальному вниманию
В сентябре компания Google, входящая в состав Alphabet, также предстанет перед судом по поводу предложений антимонопольных органов обязать компанию продать часть своего бизнеса в сфере рекламных технологий. Предложенные изменения направлены на решение проблемы доминирования компании на рынке инструментов, используемых онлайн-издателями для продажи цифровой рекламы.
Федеральный окружной судья Леони Бринкема в Александрии, штат Вирджиния, назначила дату судебного разбирательства после того, как заслушала предложения Google и Министерства юстиции о возможных мерах по урегулированию спора. Ожидается, что обе стороны представят подробные предложения к понедельнику.
Министерство юстиции США добивается от технологической компании продажи своего бизнеса по обмену рекламой и серверов для издателей — процесс, который, по словам юриста Министерства юстиции Джулии Тарвер Вуд, займет несколько лет.
Юрист Google Карен Данн возразила, что компания поддерживает меры по исправлению поведения, такие как предоставление конкурентам возможности делать ставки в режиме реального времени. Однако она утверждала, что Министерство юстиции не может на законных основаниях заставить компанию продать часть своего бизнеса. Данн также заявила, что такой шаг нанесет вред пользователям интернета и столкнется с проблемами из-за отсутствия заинтересованных покупателей.
Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Неллиус Ирена
Неллиус — выпускница факультета управления бизнесом и информационных технологий с пятилетним опытом работы в криптовалютной индустрии. Она также является выпускницей Bitcoin Dada. Неллиус сотрудничала с ведущими СМИ, включая BanklessTimes, Cryptobasic и Riseup Media.
КУРС
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)















