🔴 Live Crypto Market Breakdown – Market Intelligence Live WATCH NOW

科技巨头突破界限,满足人工智能的数据需求

在这篇文章中:

  • 科技巨头们采用备受争议的方法来收集人工智能数据。
  • OpenAI 为 YouTube 视频提供转录服务,而 Google 和 Meta 正在考虑购买受版权保护的内容。
  • 人工智能对海量数据集的使用引发了法律和伦理方面的争论。

OpenAI 公司,人工智能都在为工业领域提供资金支持,而这些资金的来源多种多样,包括以各种富有创意但又颇具争议的方式收集或积累海量数字数据。显而易见,自动化能力正在不断提升。值得注意的是,采取上述措施(例如,考虑法律限制和企业政策)所需的努力,相当于用于训练人工智能系统的大量数据。

OpenAI 的 Whisper 计划:挖掘 YouTube 对话

我们的 Whisper 项目始于去年。高质量英文文本的严重短缺导致教育资源分配滞后。Whisper 是谷歌应对这一挑战的下一步举措。它能够理解 YouTube 上海量的对话内容,并被开发成一款文本转语音应用。这款人工智能工具本身就包含超过一百万小时的 YouTube 视频,通过人工智能进行审核以生成全新的文本(本质上就是一段新的对话)。它已被用于训练各种人工智能模型,从最先进的模型到最新版本的 ChatGPT-4。

尽管一些员工认为OpenAI利用微软的视频素材全面抄袭了YouTube,但抄袭的伦理问题仍然存在争议;此外,一些员工也承认,要完全符合YouTube的意图是不可能的。同样,通过算法处理视频以trac文本内容来训练人工智能模型的做法,可能被视为对视频创作者版权的威胁,从而引发了众怒。 

另请参阅  Kamino 已从简单的贷款业务更名,并推出六款新产品

Facebook和Instagram的母公司Meta也担心使用来自西蒙与舒斯特等出版社的受版权保护的元素。与此同时,该公司还在讨论收购一般网络内容的问题,因为这可能会使其触犯版权法。

数据危机:推动非常规方法

竞争激烈的市场环境凸显了数据在人工智能技术发展中的关键地位。将语言转化为人工智能dent越来越多的训练数据集,包括英联邦国家的数据,而这些数据如今已被从维基百科和Reddit等外部来源获取。对于科技公司而言——尤其是那些难以获取传统数据存储库等常用数据源的公司——创建人工智能模型或许是一种理想的替代方案。

科技公司声称数据收集对于人工智能训练至关重要,但这一过程本身却在法庭上受到质疑。OpenAI 和微软曾就其非法使用版权材料的指控胜诉,并辩称其行为符合合理使用原则。近年来,版权所有者向美国版权局提交的申请数量已超过 1 万件,这清楚地表明,人工智能时代的版权法具有独特性和新颖性。因此,主要参与者始终面临着侵权风险,因为许多人工智能模型的使用并未获得许可。

另见  巴基斯坦将加密货币作为新建国家金融铁路的基础

海量数据集的必要性

总体而言,凯潘(Kaipan)和贾里德(Jared)等人的工作,这位科学家在规模上取得了意想不到的重大成就,对人工智能的发展产生了深远的影响。数据驱动的内容是人工智能训练过程中必不可少的组成部分,但如果没有经过良好训练且高效运行的模型,人工智能就无法正常发挥作用。随着人工智能技术的飞速发展,企业对数据的需求也呈爆炸式增长,这引发了企业在法律、伦理和隐私等方面的诸多疑问。因此,人工智能算法必须利用这些数据集才能在市场中取得成功。

人工智能 VIP(虚拟知识产权公司)的数据收集行为正在发生扭曲;传统的规范性准则正在被打破。无论是通过YouTube演讲还是创建合成数据生成器,这些公司都致力于探索法律、伦理和隐私问题的真正本质。

它们日后或许会成为海上笑柄。由于推动创新过程需要海量数据,社会领袖必须积极参与建设性对话,制定规则和标准,使创新努力与知识产权和隐私等伦理原则相平衡。

原文链接: https

想让你的项目出现在加密货币领域的顶尖人才面前吗?欢迎在我们的下一份行业报告中进行专题报道,让数据与影响力相遇。

分享链接:

免责声明:提供的信息并非交易建议。Cryptopolitan.com对基于本页面信息进行的任何投资不承担任何责任。我们tron建议您在做出任何投资决策前进行独立dent和/或咨询合格的专业人士。

阅读最多

正在加载阅读最多的文章...

掌握加密货币新闻,在您的收件箱中获取每日更新

编辑推荐

正在加载编辑精选文章...

- 让您保持领先的加密货币新闻通讯 -

市场瞬息万变。

我们行动得更快。

订阅 Cryptopolitan Daily,直接在您的收件箱中获取及时、敏锐且相关的加密见解。

立即加入,
不再错过任何一步。

参与进来。了解事实。
领先一步。

订阅 CryptoPolitan