Искусственный интеллект не может процветать без человеческих знаний – компенсация его создателям является обязательной

- Обучение моделей ИИ требует больших наборов данных, и лучше, если они будут основаны на человеческих знаниях.
- Газеты и исследовательские организации, а также веб-порталы тратят свои ресурсы на сбор и публикацию информации.
- Компенсация создателям оригинального контента является обязательной, поскольку теперь компании, занимающиеся разработкой ИИ, лицензируют контент у компаний.
Обучение моделей ИИ требует огромных объёмов данных, и их способность давать хорошие результаты напрямую зависит от данных, которые были предоставлены системе. Информация не распространяется бесплатно, и речь идёт о многочисленных правах интеллектуальной собственности.
Но компании, занимающиеся ИИ, мыслят иначе. Они принимают как должное все знания, накопленные поколениями авторов. Их концепция добросовестного использования также отличается от того, как она воспринималась изначально. И им не нравится платить создателям контента, которые стали для них моделями того, на что они способны сегодня.
Кража человеческих знаний
Создание контента, который мы видим в газетах, журналах, книгах, онлайн-архивах и научных работах, требует упорного труда и пота, но это было бы невозможно без писателей, редакторов, исследователей и издателей, которые доносят эту информацию до общественности в разных формах.
Такое с трудом заработанное признание и знания не должны бесплатно эксплуатироваться какой-либо компанией, как это произошло.
«Информация, которая находится в открытом доступе в Интернете».
Источник: OpenAI.
Да, именно это OpenAI должна сказать, если спросить ее о контенте, который она использовала для обучения своих систем искусственного интеллекта, а также об информации, которую она лицензировала у третьих лиц, и об информации, которую предоставляют ее пользователи и тренеры-люди.
Говоря о лицензированном контенте, компании сейчас его ищут, но у нас нет информации о том, лицензировала ли OpenAI какую-либо информацию у поставщика до запуска своей первоначальной модели GPT. Модель, вероятно, была обучена на материалах, защищённых авторским правом, которые нельзя было использовать в коммерческих целях.

Компенсация создателям оригинала
До недавнего времени большая часть текста, написанного онлайн или офлайн, создавалась человеком. Несмотря на кликбейт, среди контента встречался и низкокачественный, но, по крайней мере, он был создан людьми, понимающими человеческую психику и мыслительный процесс, и на основе этой информации были созданы генеративные приложения искусственного интеллекта.
Однако сегодня компании сталкиваются с новой проблемой при обучении своих моделей ИИ: преобладающим в интернете контентом, генерируемым машинами, который ни в коем случае нельзя считать качественным. Такой контент загромождает ресурсы, доступные для обучения моделей ИИ, поскольку они не способны выдавать качественные результаты, обучаясь на бесполезном многословном контенте, как это обычно и происходит. Процесс «накручивания» ИИ на ИИ часто называют каннибализмом или клонированием ИИ.
Чтобы этого не произошло, компаниям, работающим в сфере ИИ, приходится ограничивать свой исходный материал только достоверными источниками, которыми являются не что иное, как газеты, журналы и публичные форумы, где хранится богатый массив знаний, созданных человеком. Можно привести ещё несколько примеров, упомянутых выше, но эта необходимость и судебные иски со стороны газет вынуждают их лицензировать контент и платить за его использование.
Такие компании, как Reddit, крупный публичный веб-форум, также рассматривают возможность лицензирования своего контента для компаний, занимающихся ИИ. В заявлении компании говорится, что они предпочитают коммерческие иски судебным искам, но не исключают возможности судебных исков в случае провала деловых переговоров. Если вам запрещено использовать в своих видео на YouTube звуковуюtrac, то почему компания, занимающаяся ИИ, должна иметь право использовать её для обучения своих моделей, предназначенных для коммерческого использования?
Проблема авторских прав здесь заключается в том, что компании, занимающиеся разработкой ИИ, постоянно их нарушают. С другой стороны, ИИ не способен самостоятельно собирать новые новости: для их сбора и проверки из разных источников перед публикацией требуются человеческие усилия, и только после этого модель ИИ может использовать эту информацию. И в этом случае отказ от компенсации человеческому ресурсу является эксплуатацией.
Самые умные криптоаналитики уже читают нашу рассылку. Хотите присоединиться? Вступайте в их ряды.
Предупреждение: Предоставленная информация не является торговой рекомендацией. Cryptopolitanне несет ответственности за любые инвестиции, совершенные на основе информации, представленной на этой странице. Мыtronрекомендуем провести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Аамир Шейх
Аамир — технологический журналист с почти шестилетним опытом работы в крипто- и технологической индустриях. Он окончил университет MAJ со степенью MBA в области финансов и маркетинга. Сейчас он работает в Cryptopolitan, где освещает последние события на криптовалютных рынках и прогнозирует цены.
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)















