В нынешней обстановке фейковых новостей, альтернативных фактов, непроверенных источников и откровенной лжи крайне сложно доверять публикуемой информации. Однако эта проблема выходит далеко за рамки политических новостей или хайповых историй. Мы оказались в среде, где у нас больше данных, чем когда-либо прежде, мы полагаемся на большее количество данных, чем когда-либо прежде, но наша способность проверять эти данные находится на пределе своих возможностей.
Перспективы и проблемы, связанные с данными
В частности, индустрия искусственного интеллекта значительно увеличила нашу потребность в данных. Хотя мы всегда могли использовать статистический анализ данных для получения определенных выводов, ИИ дал нам, кажется, неограниченные возможности, если только у нас есть подходящие данные для обучения алгоритма. При наличии соответствующего обучающего набора данных алгоритм ИИ может классифицировать различные категории данных, например,dentпродукт по фотографии. Он может использовать данные для прогнозирования вещей, которые были бы невозможны для человека: прогнозирование мошеннических действий с вашим банковским счетом, время доставки посылки и вероятность столкновения другого автомобиля с вашим автоматическим транспортным средством. Он может оптимизировать задачу на основе данных, например, оптимизировать работу завода, вписать все ваши встречи в расписание с учетом ваших ограничений и сгладить движения робота. При наличии достаточного количества данных алгоритм ИИ, такой как большая языковая модель, как в ChatGPT и аналогичных моделях, может отвечать на широкий спектр вопросов, часто с поразительно высокой точностью. Всего за несколько лет мы оказались полностьюdent от ИИ, потому что до сих пор изучаем его возможности (и ограничения).
Как вы заметили, общим знаменателем здесь являются данные . Однако проблема в том, что простого наличия данных недостаточно для создания полноценного алгоритма ИИ. Создание эффективной модели ИИ на самом деле гораздо сложнее и труднее, чем может показаться. Для выбора правильного алгоритма, настройки необходимых параметров (так называемых гиперпараметров), а также обучения и тестирования модели требуется много экспертных знаний, чтобы убедиться, что она ведет себя так, как должна. Для того чтобы все это работало, разработчик должен создать или собрать данные нужного типа для обучения, пометить их там, где это необходимо, и проверить их корректность. Объем необходимых данных варьируется, но может быть довольно большим, особенно если модель принимает сложные решения, выбирает из множества различных категорий или должна выявлять dent небольшие изменения (например, находить микроскопические дефекты в продукте).
Дело в том, что создание правильных алгоритмов ИИ становится все проще, в то время как поиск (или создание) необходимых данных для обучения модели становится все сложнее, поскольку решаемые задачи становятся все более сложными, требуемые данные — большими и сложными, или же данные есть, но их достоверность сомнительна. Что можно сделать для сбора и проверки этих триллионов и триллионов точек данных? Давайте рассмотрим эту проблему и выясним, почему ключевые характеристики блокчейна могут предложить решение, а такие платформы, как Synesis One, уже демонстрируют значительные перспективы в мобилизации большого количества людей с помощью децентрализации.
Индустрия сбора данных
Для правильного сбора данных, необходимых для модели ИИ, сначала нужно понять, какую проблему вы пытаетесь решить. С одной стороны, в этой отрасли есть компании, организации и даже отдельные лица, у которых есть проблемы, которые нужно решить. Чтобы найти или создать нужные данные, они должны уметь достаточно подробно сформулировать свою задачу, чтобы специалисты по данным могли понять, какие данные, какая маркировка или проверка необходимы и в каком объеме. В идеале, эти организации должны четко обозначить свою проблему и тип необходимых данных. Если бы это был, например, отчет или анализ, можно было бы использовать хорошо развитую экономику фриланса, чтобы найти квалифицированного специалиста для этой работы. Проблема заключается в том, что с наборами данных, необходимыми для ИИ, это часто гораздо более масштабная задача, чем может выполнить один человек. Однако отдельные элементы обычно несложны, в большинстве случаев не требуют обучения и могут быть разбиты на части, представляющие собой отдельные точки данных. Это идеально подходит для распределения работы между множеством разных людей. Если множество людей смогут собрать или создать небольшое количество точек данных надежным способом, а затем, при необходимости, разметить данные, используя некоторые базовые рекомендации, то у организации, пытающейся решить свою проблему, будет все необходимое для начала работы.
Децентрализация в действии
Именно здесь блокчейн, и децентрализация в частности, проявляют себя наилучшим образом. Как уже упоминалось, Synesis One и другие развивающиеся компании Web3 создают целую индустрию создания, сбора и проверки данных. Блокчейн идеален, потому что он позволяет использовать смарт-tracдля автоматизации процесса, позволяет участникам находиться практически в любой точке мира (увеличивая вероятность того, что люди будут работать над проблемой), и даже позволяет осуществлять платежи в виде криптовалюты, что практически не имеет границ. Результат? Множество разных людей, следуя базовым инструкциям, создают или находят нужные данные, проверяют их, проводят, при необходимости, экспертную оценку (чтобы убедиться, что все делают свою работу правильно) и упаковывают все это в удобный, готовый к использованию набор данных.
Хотя эта концепция может показаться довольно простой, для сообщества разработчиков ИИ она, по сути, революционна. Ограничения в данных долгое время были проклятием для разработчиков ИИ во всем мире, поскольку разработчики часто не могли самостоятельно создавать эти наборы данных и не имели ресурсов для найма людей, которые могли бы выполнить эту работу напрямую. Только с помощью сверхэффективной системы, такой как децентрализация, можно привлечь множество разных людей, каждый из которых может внести свой небольшой вклад, получить вознаграждение за свои усилия и вместе они пополнят общий объем данных, который в конечном итоге станет пригодным для использования.
Население в целом, включая тех, кто работает в сфере технологий, не понимает, сколько человеческого труда и ресурсов требуется для обработки данных в рамках ИИ, чтобы модели работали так же хорошо, как сейчас. @Lempheter проделал потрясающую работу в этой ветке, разобравшись с некоторыми узкими местами в… https://t.co/FFO3sAO3fr
— Synesis One (@synesis_one) 2 мая 2024 г
Что дальше?
Решив одну из ключевых проблем прогресса в области ИИ, децентрализованный рынок данных будет способствовать ускорению внедрения ИИ в нашу повседневную жизнь, а также сделает удобный и персонализированный ИИ более доступным для малых предприятий и даже частных лиц. В ближайшем будущем мы, безусловно, увидим расширение, если не взрывной рост, этой отрасли, которая станет важным примером применения Web3, совершенно отдельным от DeFi, NFT или любых других «модных» применений, которые приходят на ум широкой публике, когда она слышит термин «блокчейн». Будем надеяться, что блокчейн начнет восприниматься как тот самый мощный импульс, который необходим индустрии ИИ.

