最新消息

为您精选

美国斥资5亿美元入股SandboxAQ，押注其人工智能设计的芯片材料

2小时前技术
小红书在香港IPO中目标估值700亿美元

10 小时前科技
阿里巴巴的机器人人工智能首次亮相，标志着中国试图掌控物理世界。

19 小时前科技

每周

保持领先

最优质的加密货币资讯直接发送到您的邮箱。.

人工智能训练模型的隐性成本

经过

布伦达·卡纳纳

阅读时长：2分钟 2024年8月24日

人工智能训练模型的隐性成本

人工智能训练模型的隐性成本

开发人工智能模型成本高昂，由于计算和数据需求，需要花费数亿美元。.
高昂的数据成本使得人工智能开发集中化，引发了伦理方面的担忧。.
独立dent 团队致力于开放数据集的研究，生成数据等新策略仍在测试中。.

构建和维护现代人工智能模型需要大量投资，可能超过数亿美元。据估计，在不久的将来，这些成本可能会达到十亿美元。.

这笔支出主要用于计算能力，例如使用英伟达GPU等硬件设备，每个GPU的成本可能约为3万美元，而且为了达到最佳效率，可能还需要数千美元的额外投入。研究人员指出，用于开发此类模型的训练数据集的质量和数量至关重要。.

行业领袖揭示人工智能开发惊人的成本

OpenAI 的 James Betker 认为，模型的性能取决于训练数据，而非模型的设计或架构。他断言，在大数据集上训练的模型将达到相同的结果。因此，数据是人工智能技术进步的关键。

人工智能公司 Anthropic AI 的首席执行官 Dario Amodei 在 In Good Company 播客节目中分享了他对这些挑战的财务方面的见解。他指出，训练现有模型（例如 ChatGPT-4）的成本估计约为 1 亿美元，而未来几年训练新模型可能需要 100 亿至 1000 亿美元。.

生成式人工智能模型，以及大型公司开发的那些模型，其本质都是统计模型。因此，它们会使用大量的示例来预测最可能的结果。艾伦人工智能研究所 (AI2) 的 Kyle Lo 表示，性能的提升主要归功于数据，尤其是在训练环境一致的情况下。.

数据集中化引发了伦理和可访问性问题

获取高质量数据的成本高昂，使得人工智能的开发成为发达国家少数大型企业的专属领域。这种资源集中也引发了人们对人工智能技术普及性和滥用可能性的担忧。.

仅OpenAI一家就已在数据许可上花费数亿美元，而Meta也曾考虑收购数据发布商以获取数据访问权限。人工智能训练数据市场预计将会扩张，数据经纪商很可能从中获益。.

问题源于可疑的数据采集行为。据报道，许多公司未经内容所有者授权便大量获取内容，一些公司还利用来自不同平台的数据，却不向用户支付报酬。正如我们之前报道的，OpenAI 使用其 Whisper 音频转录模型转录了超过一百万小时的 YouTube 视频，以微调 GPT-4 模型。.

各组织致力于创建开放获取的人工智能训练数据集

由于数据获取竞争存在一些问题，因此需要一些dent 机构的努力来公开训练数据集。一些组织，例如 EleutherAI 和 Hugging Face，正在创建大型数据集，供公众用于人工智能开发。.

《华尔街日报》近期重点介绍了两种解决数据采集问题的潜在策略：生成式数据生成和课程学习。生成式数据由人工智能模型自身生成，而课程学习则试图以结构化的方式为模型提供高质量数据，使其即使在数据量较少的情况下也能建立关联。然而，这两种方法都仍处于发展阶段，其有效性尚未得到验证。.

不要只是阅读加密货币新闻，要理解它。订阅我们的新闻简报，完全免费。

分享这篇文章

免责声明：本页面提供的信息并非交易建议。Cryptopolitan.com对任何基于本页面信息进行的投资概不负责。我们tron您在做出任何投资决定前进行独立dent /或咨询合格的专业人士。Cryptopolitan研究

布伦达·卡纳纳

布伦达·卡纳纳

Brenda拥有超过4年的加密货币、人工智能和新兴技术领域的专业经验。她曾就职于Zycrypto、Blockchain Reporter和The Coin Republic，现在在 Cryptopolitan 工作。她拥有蒙巴萨理工大学的社会学学位，这使她能够敏锐地把握读者的脉搏。.

目录

1. 行业领袖揭示人工智能开发惊人的成本

2. 数据集中化引发了伦理和可访问性问题

3. 各组织致力于创建开放获取的人工智能训练数据集

分享这篇文章

更多…新闻

聊天 GPT

ChatGPT 的 5 个巧妙应用以及你应该如何应对它们

3年前技术员约翰·帕尔默

人工智能解决方案

路透社报道，93%的商业领袖倾向于使用人工智能解决方案进行品牌可持续发展管理。

3年前技术员约翰·帕尔默

法国的人工智能生态系统

以下是马克龙如何支持法国充满活力且高效的人工智能生态系统

3年前 Tech Glory Kaburu

生成式人工智能

彭博社预计，到2032年，生成式人工智能市场规模将达到1.3万亿美元。

3年前技术 Aamir Sheikh

什么是 Base？Coinbase 推出的 Ethereum Layer-2 网络

2025年10月21日学习加密货币：新手指南
Dogecoin 与 Bitcoin：主要技术差异

2025年10月20日学习加密货币：新手指南
加密货币中的TVL（总锁定价值）是什么？

2025年10月14日学习加密货币：新手指南
如何阅读加密货币白皮书？

2025年10月13日学习加密货币：新手指南
Ripple 、 XRP 和 XRP Ledger：它们之间有什么区别？

2025年10月13日学习加密货币：新手指南
加密货币中的多重签名钱包是什么？

2025年10月10日学习加密货币：新手指南

深度密码
学速成课程

哪些加密货币可以让你赚钱
如何通过钱包提升安全性（以及哪些钱包真正值得使用）
专业人士使用的鲜为人知的投资策略
如何开始投资加密货币（使用哪些交易所、购买哪种加密货币最划算等）