最新消息
为您精选
每周
保持领先

最优质的加密货币资讯直接发送到您的邮箱。.

欧洲挑战大型科技公司在生成式人工智能领域的秘密武器

经过艾迪塔·帕特里克艾迪塔·帕特里克
阅读时长:3分钟 发布
武器
  • 欧洲的 Silo 公司利用庞大的欧盟语言数据,推出多语言人工智能模型 Poro,向大型科技公司发起挑战。.
  • 技术主权和超级计算能力提升了欧洲在人工智能领域的雄心壮志。.
  • 多样性和协作使欧洲走上了人工智能领先之路。.

生成式人工智能目前是科技领域最热门的话题,微软、谷歌、亚马逊和Meta等巨头凭借其大型语言模型(LLM)在该领域占据主导地位。这些LLM被广泛视为下一个重大技术突破。然而,欧洲也看到了一线希望,它正努力挑战大型科技公司的霸主地位,尤其是在英语以外的语言领域。.

计算与数据困境

大型科技公司在人工智能领域的统治地位不仅源于其强大的计算能力,还源于其对海量语言数据的获取,这些数据通常来自互联网。尽管对于一家欧洲公司而言,在构建英语语言学习模型方面超越大型科技公司或许并非易事,但一家名为Silo的芬兰人工智能公司发布了其名为Poro(芬兰语意为驯鹿)的多语言模型,并取得了令人瞩目的成果。.

Poro 使用芬兰语和英语文本进行训练,这证明通过融合不同语言可以创建高性能的语言学习模型 (LLM)。Silo 声称,早期结果表明其性能可与 Meta 的开源 Llama 模型相媲美。Silo 与图尔库大学的合作利用了欧盟资助的高性能语言技术 (HPLT) 项目的大量数据。该项目自 2022 年以来已收集了 80 种语言的惊人数据,总量高达 7 PB(7000 TB)。为了便于理解,ChatGPT 发布版本所使用的 GPT-3.5 模型仅使用了 45 TB 的文本数据进行训练。.

像 HPLT 这样的高质量、公共资助的文本数据,可以让 Silo 等模型在在线数据可用性有限的语言中占据优势。.

多语言方法

由于芬兰语等语言的数据稀缺,Silo 采用了多语言策略,即使用英语和芬兰语数据对模型进行“交叉训练”。这种方法会向模型输入两种语言的文本,使其学习两种语言之间的关系。因此,即使模型之前从未接触过芬兰语代码,它也能生成芬兰语回复。.

Silo 的联合创始人兼首席执行官 Peter Sarlin 解释说:“即使模型从未见过任何芬兰语代码,它也能生成芬兰语代码。” Silo 计划开源其交叉训练技术,这有望为开发涵盖所有欧洲语言(包括数据有限的语言)的模型铺平道路。.

对技术主权的追求

萨林指出,非英语语言的法学硕士(LLM)市场蕴藏着巨大的机遇。他强调,欧洲企业不应仅仅依赖美国大型公司拥有的技术。如果仅仅依赖大型科技公司的人工智能模型,最终可能难以在欧洲创造多少价值。因此,欧洲越来越需要维护自身的技术主权。.

LUMI的超级计算能力

Poro的训练也得益于欧盟资助的超级计算机LUMI,该计算机于2022年投入使用。值得注意的是,LUMI使用的是AMD芯片,这与业界标准的NVIDIA芯片有所不同。虽然有些人认为AMD芯片价格昂贵且效率低下,不适合人工智能应用,但Silo的团队投入了大量资源开发针对AMD芯片优化的AI训练软件。.

Sarlin表示,他们计划将该软件的大部分内容开源,并致力于帮助其他公司在LUMI平台上训练模型。如果欧洲公司能够利用LUMI等资源进行人工智能训练,这可能会彻底改变欧洲大陆在人工智能时代确立自身地位的进程。.

欧洲人工智能复兴

当硅谷的大型科技公司持续展现其人工智能实力时,欧洲也在悄然构建自己的人工智能阵地。欧洲的优势在于其多语言策略、对公共资助语言数据的充分利用,以及对LUMI等替代计算方案的探索。尽管前路充满挑战,但欧洲在全球人工智能舞台上参与竞争的决心dent。.

欧洲对抗大型科技公司在生成式人工智能领域主导地位的秘密武器,在于其多样性、协作精神以及对技术主权的承诺。Silo 的 Poro 模型便是欧洲能够取得的成就的有力证明,欧洲或许真的有机会在人工智能领域留下自己的印记。.

如果你正在阅读这篇文章,你已经领先一步了。 订阅我们的新闻简报,继续保持领先优势

分享这篇文章

免责声明:本页面提供的信息并非交易建议。Cryptopolitan.com对任何基于本页面信息进行的投资概不负责。我们tron您在做出任何投资决定前进行独立dent /或咨询合格的专业人士。Cryptopolitan研究

艾迪塔·帕特里克

艾迪塔·帕特里克

Editah是一位多才多艺的金融科技分析师,对区块链领域有着深刻的理解。她不仅对科技本身着迷,更对科技与金融的交融感到惊叹不已。她对数字钱包和区块链的浓厚兴趣也为她的读者提供了宝贵的参考。.

更多…新闻
深度 密码
学速成课程