最新消息
为您精选
每周
保持领先

最优质的加密货币资讯直接发送到您的邮箱。.

小型语言模型(SLM)被誉为人工智能领域的下一个重大突破。

作者:埃纳西·马帕卡梅Enacy Mapakame
阅读时长:3分钟 发布
小型语言模型(SLM)被誉为人工智能领域的下一个重大突破。
  • 虽然LLM对于企业处理各种不同的任务至关重要,但专家认为SLM的前景一片光明。.
  • 与其他优势相比,SLM 具有更高的能源效率,使其成为理想选择。
  • 但大型科技公司正在对法学硕士项目投入巨资。.

虽然各公司都在向大型语言模型 (LLM) 投入大量资金,但人工智能领域的一些行业专家认为,小型语言模型 (SLM) 将成为下一个热门领域。.

随着节日的临近,科技公司投入更多资金开发技术,行业活动持续增长。.

未来属于小型语言模型

由亿万富翁埃隆·马斯克运营的 xAI 等公司从 Andreessen Horowitz、卡塔尔投资局、红杉资本和 Valor Equity Partners 等机构筹集了额外的 50 亿美元,与此同时,亚马逊向 OpenAI

虽然这些大型科技公司和其他公司投入数十亿美元专注于开发大型LLM来处理许多不同的任务,但人工智能的现实是,没有一种方案可以适用于所有情况,因为企业需要针对特定​​任务的模型。.

根据 AWS 首席执行官 Matt Garman 在一份关于双方扩大合作关系和投资的新闻稿中的说法,AWS 客户对使用 Anthropic 开发生成式 AI 的反响非常热烈。.

对于大多数公司而言,LLM 仍然是某些项目的首选,但对于其他项目而言,这种选择在成本、能源和计算资源方面可能非常昂贵。.

Steven McMillandent 提供了一条 替代发展路径, 但他也有其他观点。他坚信 SLM 代表着未来。

“展望未来,我们认为中小型语言模型和受控环境(例如特定领域的语言学习模型)将提供更好的解决方案。”

麦克米伦

(SLM) 生成定制化的输出, 因为语言模型经过专门训练。由于SLM生成的数据保存在内部,因此语言模型是在可能包含敏感信息的数据上进行训练的。

由于大型语言模型(LLM)能耗较高,小型语言版本(SLM)经过训练,能够根据项目的实际需求调整计算能力和能耗。通过这种调整,SLM 比目前的大型模型更高效、成本更低。.

对于希望利用人工智能获取特定知识的用户,可以选择领域特定的 (LLM) ,因为它们不具备广泛的知识。这类模型经过训练,能够深入理解某一类信息,并在该领域内做出更准确的响应,例如,首席营销官(CMO)与首席财务官(CFO)的响应就有所不同。

为什么SLM是首选方案

根据数据科学家协会 (ADaSci) 的说法,为一百万用户开发一个具有 70 亿个参数的 SLM 仅需 55.1MWh(兆瓦时)。.

ADaSci发现,使用1750亿个参数训练 GPT-3 估计消耗了1287兆瓦时的电力,而且这还不包括正式向公众使用时的电力消耗。因此,SLM的能耗大约只有LLM训练能耗的5%。

大型模型通常运行在云计算平台上,因为它们所需的计算能力远超单个设备所能提供的。这给企业带来诸多问题,例如信息迁移到云端后,企业会失去对信息的控制权,而且信息通过互联网传输时响应速度也会变慢。.

展望未来,企业采用人工智能的方式不会一刀切,效率和选择最佳且成本最低的工具来完成任务将成为关注重点,这意味着要为每个项目选择合适规模的模型。.

对于所有模型,无论是通用 LLM,还是更小、特定领域的 LLM,都将根据哪个模型能够提供更好的结果、需要更少的资源以及减少将数据迁移到 云端的

在下一阶段,人工智能将对商业决策至关重要,因为公众对人工智能生成的答案抱有很高的信心。.

“在考虑训练人工智能模型时,必须以高质量数据为基础。”

麦克米伦

麦克米兰补充道:“这就是我们所做的一切,提供可信赖的数据集,然后提供相应的功能和分析能力,以便客户及其客户能够信任输出结果。”.

由于世界对效率和准确性的需求很高,规模较小且特定领域的LLM为企业和广大公众提供了另一种交付成果的选择,这些成果是他们可以信赖的。.

如果你正在阅读这篇文章,你已经领先一步了。 订阅我们的新闻简报,继续保持领先优势

分享这篇文章

免责声明:本页面提供的信息并非交易建议。Cryptopolitan.com对任何基于本页面信息进行的投资概不负责。我们tron您在做出任何投资决定前进行独立dent /或咨询合格的专业人士。Cryptopolitan研究

埃纳西·马帕卡梅

埃纳西·马帕卡梅

Enacy Mapakame是一位拥有超过10年商业和金融新闻从业经验的记者。她关注资本市场和新兴技术,例如元宇宙、人工智能和加密货币。Enacy拥有媒体与社会研究荣誉理学士学位。.

更多…新闻
深度 密码
学速成课程