最新消息

居住伊朗因以色列空袭黎巴嫩而取消与特朗普的和平谈判，导致市场下跌

2026年6月19日实时更新
Ethereum顶级三明治机器人遭遇反MEV陷阱，损失750万美元。

3小时前新闻
Galaxy首席执行官表示，美联储降息可能重振 Bitcoin 并平息批评。

9小时前新闻
Namada黑客对 Cosmos 生态系统造成新一轮打击

13小时前新闻

为您精选

美国想要赢得人工智能竞赛，但自身的矛盾却不断阻碍着它。

14 小时前科技
MGX正考虑以数十亿美元收购数据中心运营商DayOne，以期主导人工智能基础设施领域。

2026年6月20日科技
亚马逊在与 OpenAI 达成 500 亿美元交易后放弃拍摄山姆·奥特曼的传记片

2026年6月19日科技

每周

保持领先

最优质的加密货币资讯直接发送到您的邮箱。.

创新型人工智能系统在无缺陷软件验证方面展现出巨大潜力

经过

布伦达·卡纳纳

阅读时长：2分钟 2024年1月10日

人工智能系统

Baldur 是与谷歌合作开发的人工智能系统，可自动进行数学证明，从而减少软件错误并提高准确性。.
通过微调大型语言模型，Baldur 和 Thor 在生成证明方面取得了 65.7% 的成功率。.
这一突破有望简化软件验证流程并提高可靠性，标志着无缺陷软件开发取得了重大进展。.

传统上，软件代码验证是一个劳动密集型过程，涉及人工代码审查或运行代码以识别dent。虽然这些方法很有价值，但它们容易出现人为错误，并且对于复杂的系统来说并不实用。

Baldur 应运而生，这是一款精心设计的解决方案，它利用大型语言模型 (LLM) 的强大功能maticmatic。通过针对大量matic内容和用于证明的 Isabelle/HOL 语言对 LLM 进行微调，Baldur 在自动化曾经繁琐的任务方面取得了巨大飞跃。最终成果？该系统与定理证明器协同工作，验证代码的正确性，从而显著降低了错误率。.

Baldur成功的关键在于与Thor的合作，Thor是一款负责matic生成验证证明的工具。Thor本身的成功率高达57%，但与Baldur结合后，两者的验证准确率更是达到了惊人的65.7%。这对灵感源自北欧神话的黄金搭档，展现了人工智能驱动的软件验证的巨大潜力。.

法学硕士面临的挑战

在使用诸如 ChatGPT 之类的逻辑推理模型 (LLM) 时，面临的主要挑战之一是它们偶尔会出现错误。这些模型不会发出警报，而是“悄无声息地失败”，提供看似有效但实则错误的结论。解决这个问题对于确保人工智能生成的证明的可靠性至关重要。.

Baldur 的开发绝非易事，耗时数月，并需要与 Google 的合作。该项目的主要作者 Emily First 使用了 Minerva的 118GB 大型数据集上进行了微调matic的网络内容matic。然而，关键的突破在于对 Isabelle/HOL 语言的进一步微调，从而为生成全面的数学证明奠定了matic。

Baldur 的错误纠正机制非常巧妙。当定理证明器dent出生成的证明中的错误时，它会将此信息反馈给 Baldur，使系统能够从错误中学习。这种迭代过程提高了证明的准确性和可靠性，使其成为一种高效的代码验证工具。.

无缺陷软件前景光明

尽管仍有改进空间，但 Baldur 代表了一种很有前景的形式化软件验证方法。工程师仍然负责软件开发，但现在他们拥有了 Baldur 这个强大的助手，它能够自动生成matic证明。.

马萨诸塞大学阿默斯特分校曼宁信息与计算机科学学院的教授尤里·布伦评论道：“我们的工作重点是尝试自动编写这些证明。Baldur 使用大型语言模型，给定一个matic定理，自动matic该定理的证明，然后由定理证明器进行验证。”

Baldur项目的成功归功于为此项目不懈努力的敬业团队。除了Emily First之外，当时就职于谷歌的Markus Rabe以及伊利诺伊大学厄巴纳-香槟分校的助理教授Talia Ringer也做出了重要贡献。美国国防高级研究计划局（DARPA）和国家科学基金会（NSF）为该项目提供了支持。.

随着科技行业努力应对日益复杂的软件系统，像Baldur这样的创新解决方案带来了希望。随着人工智能能力的不断发展和成熟，Baldur将软件正确性提升到新高度的潜力依然十分可观。.

最顶尖的加密货币专家都在阅读我们的简报。想加入他们？

分享这篇文章

免责声明：本页面 提供的信息并非交易建议。Cryptopolitan.com 对任何基于本页面信息进行的投资概不负责。我们tron您在做出任何投资决定前进行独立dent /或咨询合格的专业人士。Cryptopolitan研究

布伦达·卡纳纳

布伦达·卡纳纳

Brenda拥有超过4年的加密货币、人工智能和新兴技术领域的专业经验。她曾就职于Zycrypto、Blockchain Reporter和The Coin Republic，现在在 Cryptopolitan 工作。她拥有蒙巴萨理工大学的社会学学位，这使她能够敏锐地把握读者的脉搏。.

目录

1. 法学硕士面临的挑战

2. 无缺陷软件前景光明

分享这篇文章

更多…新闻

聊天 GPT

ChatGPT 的 5 个巧妙应用以及你应该如何应对它们

3年前技术员约翰·帕尔默

人工智能解决方案

路透社报道，93%的商业领袖倾向于使用人工智能解决方案进行品牌可持续发展管理。

3年前技术员约翰·帕尔默

法国的人工智能生态系统

以下是马克龙如何支持法国充满活力且高效的人工智能生态系统

3年前 Tech Glory Kaburu

生成式人工智能

彭博社预计，到2032年，生成式人工智能市场规模将达到1.3万亿美元。

3年前技术 Aamir Sheikh

什么是 Base？Coinbase 推出的 Ethereum Layer-2 网络

2025年10月21日学习加密货币：新手指南
Dogecoin 与 Bitcoin：主要技术差异

2025年10月20日学习加密货币：新手指南
加密货币中的TVL（总锁定价值）是什么？

2025年10月14日学习加密货币：新手指南
如何阅读加密货币白皮书？

2025年10月13日学习加密货币：新手指南
Ripple 、 XRP 和 XRP Ledger：它们之间有什么区别？

2025年10月13日学习加密货币：新手指南
加密货币中的多重签名钱包是什么？

2025年10月10日学习加密货币：新手指南

深度密码
学速成课程

哪些加密货币可以让你赚钱
如何通过钱包提升安全性（以及哪些钱包真正值得使用）
专业人士使用的鲜为人知的投资策略
如何开始投资加密货币（使用哪些交易所、购买哪种加密货币最划算等）