小型语言模型(SLM)被誉为人工智能领域的下一个重大突破。

- 虽然LLM对于企业处理各种不同的任务至关重要,但专家认为SLM的前景一片光明。.
- 与其他优势相比,SLM 具有更高的能源效率,使其成为理想选择。
- 但大型科技公司正在对法学硕士项目投入巨资。.
虽然各公司都在向大型语言模型 (LLM) 投入大量资金,但人工智能领域的一些行业专家认为,小型语言模型 (SLM) 将成为下一个热门领域。.
随着节日的临近,科技公司投入更多资金开发技术,行业活动持续增长。.
未来属于小型语言模型
由亿万富翁埃隆·马斯克运营的 xAI 等公司从 Andreessen Horowitz、卡塔尔投资局、红杉资本和 Valor Equity Partners 等机构筹集了额外的 50 亿美元,与此同时,亚马逊向 OpenAI。
虽然这些大型科技公司和其他公司投入数十亿美元专注于开发大型LLM来处理许多不同的任务,但人工智能的现实是,没有一种方案可以适用于所有情况,因为企业需要针对特定任务的模型。.
根据 AWS 首席执行官 Matt Garman 在一份关于双方扩大合作关系和投资的新闻稿中的说法,AWS 客户对使用 Anthropic 开发生成式 AI 的反响非常热烈。.
对于大多数公司而言,LLM 仍然是某些项目的首选,但对于其他项目而言,这种选择在成本、能源和计算资源方面可能非常昂贵。.
Steven McMillandent 提供了一条 替代发展路径, 但他也有其他观点。他坚信 SLM 代表着未来。
“展望未来,我们认为中小型语言模型和受控环境(例如特定领域的语言学习模型)将提供更好的解决方案。”
麦克米伦
(SLM) 生成定制化的输出, 因为语言模型经过专门训练。由于SLM生成的数据保存在内部,因此语言模型是在可能包含敏感信息的数据上进行训练的。
由于大型语言模型(LLM)能耗较高,小型语言版本(SLM)经过训练,能够根据项目的实际需求调整计算能力和能耗。通过这种调整,SLM 比目前的大型模型更高效、成本更低。.
对于希望利用人工智能获取特定知识的用户,可以选择领域特定的 (LLM) ,因为它们不具备广泛的知识。这类模型经过训练,能够深入理解某一类信息,并在该领域内做出更准确的响应,例如,首席营销官(CMO)与首席财务官(CFO)的响应就有所不同。
为什么SLM是首选方案
根据数据科学家协会 (ADaSci) 的说法,为一百万用户开发一个具有 70 亿个参数的 SLM 仅需 55.1MWh(兆瓦时)。.
ADaSci发现,使用1750亿个参数训练 GPT-3 估计消耗了1287兆瓦时的电力,而且这还不包括正式向公众使用时的电力消耗。因此,SLM的能耗大约只有LLM训练能耗的5%。
大型模型通常运行在云计算平台上,因为它们所需的计算能力远超单个设备所能提供的。这给企业带来诸多问题,例如信息迁移到云端后,企业会失去对信息的控制权,而且信息通过互联网传输时响应速度也会变慢。.
展望未来,企业采用人工智能的方式不会一刀切,效率和选择最佳且成本最低的工具来完成任务将成为关注重点,这意味着要为每个项目选择合适规模的模型。.
对于所有模型,无论是通用 LLM,还是更小、特定领域的 LLM,都将根据哪个模型能够提供更好的结果、需要更少的资源以及减少将数据迁移到 云端的。
在下一阶段,人工智能将对商业决策至关重要,因为公众对人工智能生成的答案抱有很高的信心。.
“在考虑训练人工智能模型时,必须以高质量数据为基础。”
麦克米伦
麦克米兰补充道:“这就是我们所做的一切,提供可信赖的数据集,然后提供相应的功能和分析能力,以便客户及其客户能够信任输出结果。”.
由于世界对效率和准确性的需求很高,规模较小且特定领域的LLM为企业和广大公众提供了另一种交付成果的选择,这些成果是他们可以信赖的。.
如果你正在阅读这篇文章,你已经领先一步了。 订阅我们的新闻简报,继续保持领先优势。
免责声明:本页面提供的信息并非交易建议。Cryptopolitan.com对任何基于本页面信息进行的投资概不负责。我们tron您在做出任何投资决定前进行独立dent /或咨询合格的专业人士。Cryptopolitan研究
埃纳西·马帕卡梅
Enacy Mapakame是一位拥有超过10年商业和金融新闻从业经验的记者。她关注资本市场和新兴技术,例如元宇宙、人工智能和加密货币。Enacy拥有媒体与社会研究荣誉理学士学位。.
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)














