在如今充斥着假新闻、另类事实、未经证实的消息来源以及彻头彻尾谎言的环境下,我们很难相信所发布的内容。然而,这个问题远不止于政治新闻或炒作故事。我们身处一个数据量空前庞大、依赖数据也空前丰富的时代,但我们验证数据的能力却已远远超出其承受能力。.
数据的承诺与问题
人工智能行业尤其极大地激发了我们对数据的需求。虽然我们一直以来都可以利用统计分析来获取数据洞察,但人工智能赋予了我们近乎无限的力量——前提是我们拥有合适的训练数据。有了合适的训练数据集,人工智能算法就能对不同类别的数据进行分类,例如根据dent识别产品。它还能利用数据预测人类无法发现的事情:预测银行账户的欺诈行为、包裹的送达时间,以及自动驾驶车辆是否会与其他车辆相撞。它还能基于数据优化问题,例如优化工厂流程、根据日程安排安排所有预约,以及优化机器人的动作。有了足够的数据,像 ChatGPT 和类似模型中使用的大型语言模型这样的人工智能算法就能回答各种各样的问题,而且往往准确率惊人。短短几年内,我们发现自己已经完全dent 于人工智能,因为我们仍在不断探索它的能力(以及局限性)。.
正如你所看到的,这里的共同点是数据。然而,问题在于,仅仅拥有数据并不足以构建一个完善的人工智能算法。创建一个有效的人工智能模型实际上比看起来要复杂得多。这需要大量的专业知识,包括选择合适的算法、调整合适的参数(称为超参数),以及训练和测试模型以确保其行为符合预期。为了使这一切顺利进行,开发人员必须创建或收集用于训练的正确类型的数据,并在需要时进行标记,并验证其正确性。所需的数据量各不相同,但可能相当庞大,尤其是在模型需要做出复杂决策、从众多不同类别中进行选择,或者需要识别dent细微的变化(例如,查找产品中的微小缺陷)时。
事实上,创建合适的AI算法变得越来越容易,但随着我们想要解决的问题变得越来越复杂,所需数据庞大而复杂,或者我们拥有数据但其有效性存疑,寻找(或创建)用于训练模型的合适数据却变得越来越困难。我们该如何收集和验证这数万亿个数据点呢?让我们来探讨这个问题,并探究区块链的关键特性为何可能提供解决方案,像Synesis One已经展现出利用去中心化技术动员大量用户的巨大潜力。
数据收集行业
要正确收集人工智能模型所需的数据,首先需要了解你要解决的问题是什么。在这个行业中,一方面是公司、组织,甚至个人,他们都面临着需要解决的问题。为了找到或创建合适的数据,他们必须能够清晰地阐述他们想要解决的问题,并且要足够详细,以便数据专家能够理解需要什么样的数据类型、什么样的标注或验证方式,以及需要多少数据。理想情况下,这些实体会公开他们的问题以及所需的数据类型。如果是类似报告或分析之类的工作,你可以利用成熟的零工经济找到合适的人选。挑战在于,人工智能所需的数据集通常远超一个人的能力范围。然而,单个数据元素通常并不复杂,大多数情况下不需要训练,并且可以分解成单个数据点的增量。这非常适合将工作分配给不同的人。如果许多人都能以可靠的方式收集或创建少量数据点,并在必要时使用一些基本准则对数据进行标记,那么试图解决自身问题的实体将拥有开始工作所需的一切。.
工作中的去中心化
区块链,尤其是去中心化技术,正是在此发挥了完美作用。正如上文所述,Synesis One 和其他新兴的 Web3 公司正在构建一个完整的数据创建、收集和验证产业。区块链的优势在于:它允许智能trac实现流程自动化;它允许参与者遍布全球各地(从而增加了解决问题的人员数量);它甚至支持以加密货币的形式进行支付,而加密货币在很大程度上是无国界的。最终结果如何?众多人员遵循基本指令来创建或查找正确的数据,验证数据,并在必要时进行同行评审(以确保每个人都在正确地完成工作),最终将其打包成一个简洁易用的数据集。.
虽然这个概念看似简单,但对人工智能领域而言,它实际上具有革命性意义。数据限制长期以来一直是全球人工智能开发者的难题,他们往往无法自行构建这些数据集,也缺乏资源直接雇佣人员来完成这项工作。只有通过像去中心化这样高效的系统,才能招募众多不同的人员,让他们各自贡献少量数据,并因其努力而获得奖励,最终汇聚成可用的数据。.
包括科技从业者在内的大众,并不了解人工智能数据方面需要多少人力投入和数据处理,才能使优秀的模型达到如今的水平。 @Lempheter在这条推文中出色地剖析了一些瓶颈问题…… https://t.co/FFO3sAO3fr
— Synesis One (@synesis_one) 2024年5月2日
接下来是什么?
随着人工智能发展的一个关键瓶颈有望得到解决,去中心化数据市场将加速人工智能在我们日常生活中的应用,同时也将使小型企业乃至个人更容易获得实用且定制化的人工智能。我们确信,在不久的将来,这个行业将会蓬勃发展,甚至可能出现爆发式增长,为Web3提供一个重要的应用场景,而这个场景与 DeFi、NFT或大众一听到“区块链”这个词就会想到的其他“炒作”应用完全不同。如果一切顺利,人们或许会开始将区块链视为人工智能行业发展所需的关键推动力。.

