最新消息
为您精选
每周
保持领先

最优质的加密货币资讯直接发送到您的邮箱。.

人工智能公司在训练数据方面游走于法律灰色地带

经过布莱恩·库姆布莱恩·库姆
阅读时长:4分钟 发布
人工智能
  • OpenAI和谷歌因收集训练数据而受到抨击。OpenAI会转录YouTube视频,而谷歌则是在获得许可后使用内容。.
  • 出于对隐私的担忧,Meta 正在考虑收购一家大型出版商,以获取用于人工智能的数据。.
  • 人工智能行业面临数据匮乏的问题,正在探索合成数据等解决方案,但法律和伦理方面的担忧依然存在。.

在讨论最近关于Open和 谷歌 获取数据以构建模型的争论时,你会发现有两个词在争论中占据主导地位:开放和谷歌。《华尔街日报》和《纽约时报》近期发表的文章表明,人工智能相关公司收集数据的方式并不尽如人意,导致人们对哪些数据真实可靠以及人工智能系统构建过程中遵循的伦理准则感到困惑。

OpenAI 的策略值得商榷

然而,在巅峰时期,《纽约时报》强调了OpenAI凭借Whisper所展现的更宏大的目标。这款音频转文本转录模型旨在与OpenAI的语言处理器LP-4技术相辅相成。事实上,OpenAI的自动驾驶汽车并非依靠信息收集(尽管信息收集是该公司面临的一项挑战性问题),而是在特定条件下,Whisper技术才得以发挥作用。. 

尽管数据收集法案最初的流行与合理使用版权的考量有关,但后者也成为了这些法案的法律依据。正如布罗克曼所说,OpenAI 的一位创始成员兼首席执行官提供了转录所需的部分信息。然而,他接着指出,历史学家也为转录工作做出了贡献。.

然而,即使是这些小问题,谷歌公司也占据了中心位置,甚至在像这样的大型项目中也是如此。也就是说,像 OpenAI 这样的数据收集机构规模较小,参与的项目也都是面向这家行业巨头的,而 YouTube 只是警告了用户,却没有告诉用户应该为此负责的是谁。. 

除了这种方法之外,Facebook 还涵盖了服务条款中的合规性要求,并禁止未经授权的行为,特别是所谓的数据抓取。至于 YouTube 发言人 John Conly,他回应了关于这些模型是否在收集内容创作者的数据后用于基于内容的 AI 训练的问题。.

恰恰相反。训练机器也是 Meta 目前面临的一个问题,导致其可行性降低。 人工智能 团队在与 OpenAI 的竞争中取得了成功,他们认为双方都竭尽所能,力求为各自公司争取更好的结果,包括进行原创性思考,而没有偏袒任何一方。 

Meta似乎事先准备了一系列问题,旨在了解哪些工作将由谁负责,以及谁将负责从哪些出版社购买特定领域的书籍。尽管该网络的用户体验极其出色,但既定的政府政策却主动干预个人隐私,2018年的剑桥分析公司事件凸显了这一点。.

人工智能训练领域面临着一个紧迫的困境:一方面,数据短缺问题在过去几年中变得日益严峻;另一方面,尽管两者之间确实存在关联,但研究人员始终坚持需要充足的数据来提高准确性和性能。. 

此外,《华尔街日报》的预测也激发了人们的热情,预计2020年初市场将突破所有预期目标,并在年底达到最高点。这种方法基于两个因素:一是依赖模型,这些模型可以综合反映外部环境;二是决策过程体系,模型会从决策中学习。不要期望它们立即产生结果,但要观察它们的运行情况。.

法律和伦理影响

缺乏反盗版规则可能会带来麻烦,因为用户无法访问受版权保护的内容,这可能会引发关于法律、伦理等方面的争议。数据是否会变成一种无形资产,成为界定数据归属的基础?在这种情况下,如果数据被不当使用,数据和用户是否会被视为业务的来源?研发团队的项目负责人需要集中精力审查这些问题并找到解决方案。. 

集体诉讼活动的目的在于表明,该组织对隐私和数据使用方面的了解不足,无法使其运营合法化。事实上,由于我们必须考虑监管限制和数据隐私(因为数据的性质取决于数据的处理和使用方式),相关挑战(例如用于人工智能研发的数据挖掘过程中的伦理问题)变得更加复杂。.

未来人工智能领域最严峻的竞争在于dent找到最适合人工智能系统训练的数据,更重要的是,这些数据能否符合共同的伦理和法律监管框架。人工智能的本质在于,它通过为企业提供数据集筛选器,来强调和拓展创新和实施等概念。. 

人工智能作为一种技术,永远不会静止不变,因此主要问题始终是数据的使用,并且它将继续是通过使用人工智能而形成的社区成员的优先事项之一,力求做到最好。.


原文链接: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html?smid=nytcore

如果你正在阅读这篇文章,你已经领先一步了。 订阅我们的新闻简报,继续保持领先优势

分享这篇文章

免责声明: 提供的信息并非交易建议。Cryptopolitan.com Cryptopolitan研究 对任何基于本页面信息进行的投资概不负责。我们tron您在做出任何投资决定前进行独立dent /或咨询合格的专业人士。

布莱恩·库姆

布莱恩·库姆

Brian Koome在区块链和加密货币报道领域拥有超过七年的经验,自2017年以来一直活跃于该行业。他曾为包括BlockToday.com在内的多家知名媒体撰稿。此外,在加入 Cryptopolitan 担任全职撰稿人之前,他还为BitDegree.org开发了 Ethereum 101课程。Brian的文章涵盖常青指南、深度分析、访谈和价格分析。他对 DeFi、区块链创新和新兴加密项目的关注深受读者喜爱。.

更多…新闻
深度 密码
学速成课程