ПОСЛЕДНИЕ НОВОСТИ

жить Почему сегодня наблюдается обвал индексов S&P 500, Nasdaq и Dow Jones?

14 часов назад Обновления в режиме реального времени
Тим Дрейпер утверждает, что в эпоху квантовых технологий Bitcoin безопаснее банков

2 часа назад Технологии
Компания OpenAI планирует построить в Огайо центр обработки данных для ИИ мощностью 10 ГВт при поддержке Nvidia, что станет историческим шагом в развитии инфраструктуры

4 часа назад Технологии
Монеты, ориентированные на конфиденциальность, выросли на 4,5% за день, но месячные потери сектора свидетельствуют о более глубокой нестабильности на рынке

5 часов назад Новости

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Искусственный интеллект не может процветать без человеческих знаний – компенсация его создателям является обязательной

Аамир Шейх

3 минуты чтения, 3 мая 2024 г.

Обучение моделей ИИ требует больших наборов данных, и лучше, если они будут основаны на человеческих знаниях.
Газеты и исследовательские организации, а также веб-порталы тратят свои ресурсы на сбор и публикацию информации.
Компенсация создателям оригинального контента является обязательной, поскольку теперь компании, занимающиеся разработкой ИИ, лицензируют контент у компаний.

Обучение моделей ИИ требует огромных объёмов данных, и их способность давать хорошие результаты напрямую зависит от данных, которые были предоставлены системе. Информация не распространяется бесплатно, и речь идёт о многочисленных правах интеллектуальной собственности.

Но компании, занимающиеся ИИ, мыслят иначе. Они принимают как должное все знания, накопленные поколениями авторов. Их концепция добросовестного использования также отличается от того, как она воспринималась изначально. И им не нравится платить создателям контента, которые стали для них моделями того, на что они способны сегодня.

Кража человеческих знаний

Создание контента, который мы видим в газетах, журналах, книгах, онлайн-архивах и научных работах, требует упорного труда и пота, но это было бы невозможно без писателей, редакторов, исследователей и издателей, которые доносят эту информацию до общественности в разных формах.

Такое с трудом заработанное признание и знания не должны бесплатно эксплуатироваться какой-либо компанией, как это произошло.

«Информация, которая находится в открытом доступе в Интернете».
Источник: OpenAI.

Да, именно это OpenAI должна сказать, если спросить ее о контенте, который она использовала для обучения своих систем искусственного интеллекта, а также об информации, которую она лицензировала у третьих лиц, и об информации, которую предоставляют ее пользователи и тренеры-люди.

Говоря о лицензированном контенте, компании сейчас его ищут, но у нас нет информации о том, лицензировала ли OpenAI какую-либо информацию у поставщика до запуска своей первоначальной модели GPT. Модель, вероятно, была обучена на материалах, защищённых авторским правом, которые нельзя было использовать в коммерческих целях.

Компенсация создателям оригинала

До недавнего времени большая часть текста, написанного онлайн или офлайн, создавалась человеком. Несмотря на кликбейт, среди контента встречался и низкокачественный, но, по крайней мере, он был создан людьми, понимающими человеческую психику и мыслительный процесс, и на основе этой информации были созданы генеративные приложения искусственного интеллекта.

Однако сегодня компании сталкиваются с новой проблемой при обучении своих моделей ИИ: преобладающим в интернете контентом, генерируемым машинами, который ни в коем случае нельзя считать качественным. Такой контент загромождает ресурсы, доступные для обучения моделей ИИ, поскольку они не способны выдавать качественные результаты, обучаясь на бесполезном многословном контенте, как это обычно и происходит. Процесс «накручивания» ИИ на ИИ часто называют каннибализмом или клонированием ИИ.

Чтобы этого не произошло, компаниям, работающим в сфере ИИ, приходится ограничивать свой исходный материал только достоверными источниками, которыми являются не что иное, как газеты, журналы и публичные форумы, где хранится богатый массив знаний, созданных человеком. Можно привести ещё несколько примеров, упомянутых выше, но эта необходимость и судебные иски со стороны газет вынуждают их лицензировать контент и платить за его использование.

Такие компании, как Reddit, крупный публичный веб-форум, также рассматривают возможность лицензирования своего контента для компаний, занимающихся ИИ. В заявлении компании говорится, что они предпочитают коммерческие иски судебным искам, но не исключают возможности судебных исков в случае провала деловых переговоров. Если вам запрещено использовать в своих видео на YouTube звуковуюtrac, то почему компания, занимающаяся ИИ, должна иметь право использовать её для обучения своих моделей, предназначенных для коммерческого использования?

Проблема авторских прав здесь заключается в том, что компании, занимающиеся разработкой ИИ, постоянно их нарушают. С другой стороны, ИИ не способен самостоятельно собирать новые новости: для их сбора и проверки из разных источников перед публикацией требуются человеческие усилия, и только после этого модель ИИ может использовать эту информацию. И в этом случае отказ от компенсации человеческому ресурсу является эксплуатацией.

Самые умные криптоаналитики уже читают нашу рассылку. Хотите присоединиться? Вступайте в их ряды.

Поделитесь этой статьей

Предупреждение: Предоставленная информация не является торговой рекомендацией. Cryptopolitanне несет ответственности за любые инвестиции, совершенные на основе информации, представленной на этой странице. Мыtronрекомендуем провести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Аамир Шейх

Аамир — технологический журналист с почти шестилетним опытом работы в крипто- и технологической индустриях. Он окончил университет MAJ со степенью MBA в области финансов и маркетинга. Сейчас он работает в Cryptopolitan, где освещает последние события на криптовалютных рынках и прогнозирует цены.

ОГЛАВЛЕНИЕ

1. Кража человеческих знаний

2. Компенсация создателям оригинала

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)