研究表明，人工智能模型在展现能力之前很久就能掌握这些能力。

作者：

奥沃顿斯·阿德巴

阅读时长：3分钟发布日期：2024年11月24日

研究表明，人工智能模型在展现某种能力之前很久就已经掌握了这种能力。.
研究人员声称，这些模型可以在表现出来之前很久就将概念内化。.
研究人员揭示了发掘隐藏能力的不同方法。.

最新研究表明，人工智能（AI）模型在训练过程中展现某些能力之前，就已经具备这些能力。哈佛大学和密歇根大学的研究表明，这些模型只有在需要时才会展现出这些能力。.

这项研究是众多旨在了解人工智能模型如何在展示其能力之前构建自身能力的研究之一。.

该研究分析了人工智能模型如何学习大小和颜色等基本概念，结果表明它们掌握这些技能的速度比大多数测试结果显示的要快。该研究还深入探讨了衡量人工智能能力的复杂性。“一个模型在接受标准提示时可能显得能力不足，但实际上它拥有只有在特定条件下才会展现出的复杂能力，”论文中写道。

研究表明，人工智能模型能够内化概念

哈佛大学和密歇根大学并非首批尝试理解人工智能模型能力的机构，Anthropic公司的研究人员曾发表一篇题为《词典学习》的论文。该论文探讨了如何将他们开发的Claude语言与其理解的特定概念联系起来。尽管这些研究大多从不同的角度切入，但其主要目的都是为了理解人工智能模型。.

人类研究所透露，他们发现了可以与不同可解释概念相关联的特征。研究显示：“我们发现了数百万个特征，这些特征似乎与可解释的概念相对应，这些概念涵盖了从具体对象（如人物、国家和著名建筑）到trac（如情感、写作风格和推理步骤）等各个方面。”.

在研究过程中，研究人员利用扩散模型（人工智能领域最流行的架构之一）进行了多项实验。实验发现，不同模型处理基本概念的方式各不相同。随着人工智能模型在不同阶段展现出新的能力，以及在获得新能力时出现明显的转变点，这些模式呈现出一致性。

在训练过程中，模型展现出对概念的掌握速度比标准测试提前约2000步。tron的概念在约6000步出现，而较弱的概念则在约20000步出现。调整概念信号后，研究人员发现其与学习速度直接相关。.

研究人员揭示了获取隐藏能力的方法

研究人员采用另类提示方法，在标准测试之前就揭示了人工智能的隐藏能力。这种隐藏能力的普遍出现会对人工智能的评估和安全性产生影响。例如，传统的基准测试可能会遗漏人工智能模型的某些能力，从而忽略了其中有益和令人担忧的两方面。.

研究过程中，研究团队探索出一些方法来挖掘人工智能模型的隐藏能力。研究人员将这些方法称为线性潜在干预和过度提示，因为这些方法能够让模型在标准测试中展现出复杂的行为。此外，研究人员还发现，人工智能模型会在通过标准提示展现某些复杂特征之前，对其进行操控。.

例如，模型可能在被要求将“微笑的女性”或“戴帽子的男性”组合起来之前，就已经成功地生成了这些图像。然而，研究表明，它们虽然之前已经学会了组合，但却无法通过传统的提示来展示这种能力。能够展现这种能力的模型可以被认为是“领悟”（grokking），即模型在经过长时间训练后能够完美地完成测试。然而，研究人员指出，两者之间存在着关键差异。.

虽然理解概念的过程通常需要经过多次训练，并涉及对同一数据集的多种分布进行不断完善，但研究表明，这些能力是在主动学习过程中涌现出来的。研究人员指出，这些模型通过阶段性的变化而非逐步改进表征，找到了处理概念的新方法。.

研究表明，人工智能模型虽然理解这些概念，但却无法将其展现出来。这就像人们观看并理解一部外语电影，却不会说该片的语言一样。这表明大多数模型的能力远超其展现出来的水平，同时也表明理解和控制这些模型的能力存在难度。.

如果你正在阅读这篇文章，你已经领先一步了。订阅我们的新闻简报，继续保持领先优势。

美国

分享这篇文章