- Baldur 是与谷歌合作开发的人工智能系统,可自动进行数学证明,从而减少软件错误并提高准确性。.
- 通过微调大型语言模型,Baldur 和 Thor 在生成证明方面取得了 65.7% 的成功率。.
- 这一突破有望简化软件验证流程并提高可靠性,标志着无缺陷软件开发取得了重大进展。.
传统上, 软件代码验证 是一个劳动密集型过程,涉及人工代码审查或运行代码以识别dent。虽然这些方法很有价值,但它们容易出现人为错误,并且对于复杂的系统来说并不实用。
Baldur 应运而生,这是一款精心设计的解决方案,它利用大型语言模型 (LLM) 的强大功能maticmatic。通过针对大量matic内容和用于证明的 Isabelle/HOL 语言对 LLM 进行微调,Baldur 在自动化曾经繁琐的任务方面取得了巨大飞跃。最终成果?该系统与定理证明器协同工作,验证代码的正确性,从而显著降低了错误率。.
Baldur成功的关键在于与Thor的合作,Thor是一款负责matic生成验证证明的工具。Thor本身的成功率高达57%,但与Baldur结合后,两者的验证准确率更是达到了惊人的65.7%。这对灵感源自北欧神话的黄金搭档,展现了人工智能驱动的软件验证的巨大潜力。.
法学硕士面临的挑战
在使用诸如 ChatGPT 之类的逻辑推理模型 (LLM) 时,面临的主要挑战之一是它们偶尔会出现错误。这些模型不会发出警报,而是“悄无声息地失败”,提供看似有效但实则错误的结论。解决这个问题对于确保人工智能生成的证明的可靠性至关重要。.
Baldur 的开发绝非易事,耗时数月,并需要与 Google 的合作。该项目的主要作者 Emily First 使用了 Minerva的 118GB 大型数据集上进行了微调maticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmatic。
Baldur 的错误纠正机制非常巧妙。当定理证明器dent出生成的证明中的错误时,它会将此信息反馈给 Baldur,使系统能够从错误中学习。这种迭代过程提高了证明的准确性和可靠性,使其成为一种高效的代码验证工具。.
无缺陷软件前景光明
尽管仍有改进空间,但 Baldur 代表了一种很有前景的形式化软件验证方法。工程师仍然负责软件开发,但现在他们拥有了 Baldur 这个强大的助手,它能够自动生成matic证明。.
马萨诸塞大学阿默斯特分校曼宁信息与计算机科学学院的教授尤里·布伦评论道:“我们的工作重点是尝试自动编写这些证明。Baldur 使用大型语言模型,给定一个matic定理,自动matic该定理的证明,然后由定理证明器进行验证。”
Baldur项目的成功归功于为此项目不懈努力的敬业团队。除了Emily First之外,当时就职于谷歌的Markus Rabe以及伊利诺伊大学厄巴纳-香槟分校的助理教授Talia Ringer也做出了重要贡献。美国国防高级研究计划局(DARPA)和国家科学基金会(NSF)为该项目提供了支持。.
随着科技行业努力应对日益复杂的软件系统,像Baldur这样的创新解决方案带来了希望。随着人工智能能力的不断发展和成熟,Baldur将软件正确性提升到新高度的潜力依然十分可观。.
还在让银行保留最好的部分吗?观看我们的免费视频,了解如何 成为自己的银行。
免责声明: 提供的信息并非交易建议。Cryptopolitan.com Cryptopolitan研究 对任何基于本页面信息进行的投资概不负责。我们trondentdentdentdentdentdentdentdent /或咨询合格的专业人士。
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)
















