ПОСЛЕДНИЕ НОВОСТИ
ПОДОБРАНО ДЛЯ ВАС
Еженедельно
ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Google обучает инструменты поиска на основе ИИ на контенте издателей, несмотря на отказ пользователей от участия

КНеллиус ИренаНеллиус Ирена
3 минуты чтения,
Google обучает инструменты поиска на основе ИИ на контенте издателей, несмотря на отказ пользователей от участия
  • Google использует контент издателей для обучения своих инструментов поиска с использованием искусственного интеллекта, даже если издатели отказываются от этого.
  • Министерство юстиции США настаивает на существенных изменениях в бизнесе Google, включая продажу подразделения рекламных технологий.
  • Издатели и регулирующие органы обеспокоены тем, как Google использует данные для обучения искусственного интеллекта.

Компания Google оказалась под пристальным вниманием после того, как высокопоставленный руководитель дал показания о том, что специализированные продукты искусственного интеллекта (ИИ) для поиска, такие как AI Overviews, обучаются на контенте издателей, даже если эти издатели явно отказались от обучения ИИ.

Эли Коллинз, вице-президентdent DeepMind, признал федеральном суде , что, хотя издатели могут предотвратить использование своего контента для обучения моделей искусственного интеллекта, разработанных DeepMind, такие возможности отказа не распространяются на всю поисковую структуру Google.

«Как только вы берете модель Gemini [искусственный интеллект] и внедряете ее в поисковую систему, поисковая система получает возможность обучаться на данных, от использования которых издатели отказались, верно?» — спросила Диана Агилар, юрист Министерства юстиции США.

Коллинз подтвердил, что данные по-прежнему могут быть использованы «для целей поиска»

Это разоблачение появилось на фоне ключевого антимонопольного процесса, определяющего, как технологическая компания должна реструктурировать свою деятельность после того, как в прошлом году была признана виновной в незаконной монополизации рынка онлайн-поиска. Министерство юстиции теперь настаивает на структурных мерах, включая принуждение компании к продаже своего браузера Chrome и запрет сделок, которые делают его поисковой системой по умолчанию на всех устройствах — шаг, который также повлияет на продукты компании в области искусственного интеллекта, включая Gemini.

Google использует контент, который, по словам издателей, они не разрешали, для работы инструментов искусственного интеллекта

Google AI Overviews, которая суммирует ответы в верхней части результатов поиска с помощью сгенерированного ИИ текста, уже вызвала тревогу у владельцев веб-сайтов. Многие утверждают, что она снижает количество переходов пользователей на оригинальные сайты и вредит их доходам, однако технологическая компания продолжает использовать данные из этих источников.

В документе Министерства юстиции США от 26 августа 2024 года под названием «Search GenAI <> Gemini v3» внутренние данные показали, что Google отфильтровал около 80 миллиардов токенов — по сути, фрагментов текста — из своего обучающего корпуса, состоящего из 160 миллиардов токенов, в ответ на отказы издателей. Однако оставшиеся 80 миллиардов токенов все еще могут содержать контент, который используется для работы функций Google Search AI.

В том же документе в качестве дополнительных источников для улучшения обучения ИИ были указаны «данные о поисковых сессиях» и видеоролики на YouTube, что вызвало опасения по поводу масштабов пользовательских данных, используемых в моделях ИИ этой технологической компании.

Когда судья Амит Мехта спросил, действительно ли половина набора данных была удалена из-за отказа издателей от участия, Коллинз подтвердил: «Это верно»

Министерство юстиции США подчеркивает внутренний интерес к использованию данных поисковых систем для искусственного интеллекта

Министерство юстиции также обратило внимание на внутренние обсуждения в Google, свидетельствующие о стремлении обучать модели ИИ, используя огромные массивы поисковых данных — рейтинги, запросы и поведение пользователей.

Один из таких примеров — брифинг, подготовленный для генерального директора DeepMind Демиса Хассабиса, на котором он размышлял над идеей обучения модели искусственного интеллекта Google с использованием исчерпывающих данных о поиске для оценки полученных результатов повышения производительности.

Агилар спросил Коллинза, создала ли Google модель, использующую данные поиска. Коллинз ответил, что ему неизвестно о разработке подобной модели, хотя и признал, что Хассабис проявил интерес к этой концепции.

Юридическая команда Google попыталась преуменьшить опасения по поводу доминирования ИИ, утверждая, что другие компании, занимающиеся ИИ, могут процветать и без использования поискового индекса Google. Например, спортивные чат-боты могут получать доступ к данным в режиме реального времени через коммерческие партнерства с поставщиками результатов, а не через контент, сканируемый веб-сайтами.

Тем не менее, Министерство юстиции утверждает, что многолетнее доминирование Google в сфере поиска дает компании несправедливое преимущество в области искусственного интеллекта, особенно с учетом интеграции Gemini в ее поисковую инфраструктуру.

Бизнес Google в сфере рекламы подвергается более пристальному вниманию

В сентябре компания Google, входящая в состав Alphabet, также предстанет перед судом по поводу предложений антимонопольных органов обязать компанию продать часть своего бизнеса в сфере рекламных технологий. Предложенные изменения направлены на решение проблемы доминирования компании на рынке инструментов, используемых онлайн-издателями для продажи цифровой рекламы.

Федеральный окружной судья Леони Бринкема в Александрии, штат Вирджиния, назначила дату судебного разбирательства после того, как заслушала предложения Google и Министерства юстиции о возможных мерах по урегулированию спора. Ожидается, что обе стороны представят подробные предложения к понедельнику.

Министерство юстиции США добивается от технологической компании продажи своего бизнеса по обмену рекламой и серверов для издателей — процесс, который, по словам юриста Министерства юстиции Джулии Тарвер Вуд, займет несколько лет.

Юрист Google Карен Данн возразила, что компания поддерживает меры по исправлению поведения, такие как предоставление конкурентам возможности делать ставки в режиме реального времени. Однако она утверждала, что Министерство юстиции не может на законных основаниях заставить компанию продать часть своего бизнеса. Данн также заявила, что такой шаг нанесет вред пользователям интернета и столкнется с проблемами из-за отсутствия заинтересованных покупателей.

Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Поделитесь этой статьей
Неллиус Ирена

Неллиус Ирена

Неллиус — выпускница факультета управления бизнесом и информационных технологий с пятилетним опытом работы в криптовалютной индустрии. Она также является выпускницей Bitcoin Dada. Неллиус сотрудничала с ведущими СМИ, включая BanklessTimes, Cryptobasic и Riseup Media.

ЕЩЕ… НОВОСТИ
ЭКСПРЕСС- ПО ГЛУБОКОЙ
КУРС