最新消息

居住直播：美联储在凯文·沃什的首次会议上维持利率不变

2026年6月17日实时更新
CZ认为人工智能代理将为全球数十亿人带来加密货币金融。

2小时前新闻
Solana 在现实世界资产持有者数量方面领先于所有区块链，重塑了代币化领域的竞争格局。

3小时前新闻
OpenAI 为 ChatGPT Enterprise 推出信用 trac和消费限额功能

5小时前技术

为您精选

每周

保持领先

最优质的加密货币资讯直接发送到您的邮箱。.

最新研究发现，人工智能公司依赖优质出版商提供训练数据。

经过

布伦达·卡纳纳

阅读时长：2分钟 2024年11月9日

背景中出现了人工智能机器人和大型媒体公司的标志。

OpenAI 和 Google 这两家主要的 AI 公司正在利用顶级出版渠道的文章来训练语言模型。.
根据 Ziff Davis 的一项研究，信息来源是根据搜索排名进行筛选的。.
出版商担心人工智能公司未经许可使用他们的内容。.

包括 OpenAI、Google、Meta 和 Anthropic 在内的主要技术公司依靠来自知名出版商的高质量、受版权保护的材料来训练其大型语言模型 (LLM)。.

根据一项研究，高质量内容在人工智能模型训练中发挥着至关重要的作用。研究表明，人工智能公司倾向于使用权威来源的数据来训练模型，以提升模型性能，但这些来源的贡献往往被忽视。

在这项研究中，Ziff Davis 的人工智能律师 George Wukoson 和首席技术官 Joey Fortuna 声称，人工智能公司会根据权威网站在搜索引擎中的排名来选择训练数据。高质量且受欢迎的网站因其良好的声誉而被选中，用于改进模型。研究表明，这种策略使人工智能开发人员能够微调语言模型。.

Ziff Davis指出，包括Axel Springer、Future PLC、Hearst、News Corp和《纽约时报》在内的顶级内容提供商都为训练数据集的开发做出了贡献。尤其dent是，用于创建OpenAI GPT-3的OpenWebText2数据集中，有12.04%的数据来自这些值得信赖的出版商。.

马克·扎克伯格也对人工智能训练中内容使用的持续争论发表了看法。在最近接受The Verge采访时，扎克伯格承认，为人工智能抓取数据极具挑战性，但也指出，单个创作者或出版商的内容可能并没有那么大的影响力。他表示：“我认为，在整体上，单个创作者或出版商往往会高估其特定内容的价值。”

出版商对人工智能公司提起诉讼

训练数据来源的保密性引发了出版商和消费者的共同担忧。《纽约时报》和《华尔街日报》近期对人工智能公司提起诉讼，称其使用内容侵犯了版权。.

尽管 OpenAI 已努力从《金融时报》和 DotDash Meredith 等媒体机构获得内容授权，但仍有一些人工智能公司在没有获得适当授权的情况下开展工作。该报告还指出， “主要的机器学习模型开发商不再像以前那样公开他们的训练数据。”

尽管人工智能公司的估值不断攀升，但科技巨头与传统媒体公司之间的差距依然巨大。谷歌和Meta等科技巨头的估值分别高达2.2万亿美元和1.5万亿美元，它们仍然处于生成式人工智能领域的前沿；而OpenAI和Anthropic等初创公司的估值则分别为1570亿美元和400亿美元。.

另一方面，出版商仍在面临裁员和重组，这表明他们为了适应日益人工智能化的环境而 defi着巨大的财务压力。由于用户生成内容和人工智能内容的竞争，许多出版商在降低成本和裁员方面都面临着挑战。.

如果你正在阅读这篇文章，你已经领先一步了。订阅我们的新闻简报，继续保持领先优势。

Google Meta OpenAI

分享这篇文章

免责声明：本页面提供的信息并非交易建议。Cryptopolitan.com对任何基于本页面信息进行的投资概不负责。我们tron您在做出任何投资决定前进行独立dent /或咨询合格的专业人士。Cryptopolitan研究

布伦达·卡纳纳

布伦达·卡纳纳

Brenda拥有超过4年的加密货币、人工智能和新兴技术领域的专业经验。她曾就职于Zycrypto、Blockchain Reporter和The Coin Republic，现在在 Cryptopolitan 工作。她拥有蒙巴萨理工大学的社会学学位，这使她能够敏锐地把握读者的脉搏。.

目录

1. 出版商对人工智能公司提起诉讼

分享这篇文章

更多…新闻

聊天 GPT

ChatGPT 的 5 个巧妙应用以及你应该如何应对它们

3年前技术员约翰·帕尔默

人工智能解决方案

路透社报道，93%的商业领袖倾向于使用人工智能解决方案进行品牌可持续发展管理。

3年前技术员约翰·帕尔默

法国的人工智能生态系统

以下是马克龙如何支持法国充满活力且高效的人工智能生态系统

3年前 Tech Glory Kaburu

生成式人工智能

彭博社预计，到2032年，生成式人工智能市场规模将达到1.3万亿美元。

3年前技术 Aamir Sheikh

什么是 Base？Coinbase 推出的 Ethereum Layer-2 网络

2025年10月21日学习加密货币：新手指南
Dogecoin 与 Bitcoin：主要技术差异

2025年10月20日学习加密货币：新手指南
加密货币中的TVL（总锁定价值）是什么？

2025年10月14日学习加密货币：新手指南
如何阅读加密货币白皮书？

2025年10月13日学习加密货币：新手指南
Ripple 、 XRP 和 XRP Ledger：它们之间有什么区别？

2025年10月13日学习加密货币：新手指南
加密货币中的多重签名钱包是什么？

2025年10月10日学习加密货币：新手指南

深度密码
学速成课程

哪些加密货币可以让你赚钱
如何通过钱包提升安全性（以及哪些钱包真正值得使用）
专业人士使用的鲜为人知的投资策略
如何开始投资加密货币（使用哪些交易所、购买哪种加密货币最划算等）