最新ニュース
あなたへのおすすめ
週刊
トップの座を維持する

最高の仮想通貨情報をあなたの受信トレイに直接お届けします。.

革新的なAIシステムがバグのないソフトウェア検証に期待を寄せる

によるブレンダ・カナナブレンダ・カナナ
読了時間2分
AIシステム
  • Google と共同開発された AI システム Baldur は、数学の証明を自動化してソフトウェアのバグを減らし、精度を高めます。.
  • 大規模な言語モデルを微調整することで、Baldur と Thor は証明生成において 65.7% の成功率を達成しました。.
  • この画期的な進歩により、ソフトウェア検証が効率化され、信頼性が向上し、バグのないソフトウェア開発における大きな進歩が期待されます。

従来、 ソフトウェアコードの検証は ためのコード実行といった、労働集約的なプロセスでしたdent。これらの方法は有用ではあるものの、人為的ミスの影響を受けやすく、複雑なシステムには実用的ではありません。

そこで登場するのが、大規模言語モデル(LLM)の力を活用してmaticな証明をmatic生成する、綿密に設計されたソリューション、Baldurです。膨大なmaticコンテンツと証明に使用されるIsabelle/HOL言語に基づいてLLMを微調整することで、Baldurはかつては困難な作業であった自動化に向けて大きな飛躍を遂げました。その結果、定理証明器と連携してコードの正しさを検証するシステムにより、誤差が大幅に削減されます。.

Baldurの成功の核心は、自動matic生成ツールであるThorとの連携です。Thorは57%の成功率を誇りますが、Baldurと組み合わせることで、65.7%という驚異的な証明生成精度を実現します。北欧神話に着想を得たこのダイナミックな組み合わせは、AI駆動型ソフトウェア検証の可能性を示しています。.

LLMにおける課題

ChatGPTのようなLLMを使用する際に直面する主な課題の一つは、時折生じる正確性の欠如です。警告を出すのではなく、「静かに失敗」し、一見有効な結果に見える誤った結果を返すことがあります。この問題に対処することは、AI生成の証明の信頼性を確保する上で極めて重要です。

Baldurの開発は容易なことではなく、数ヶ月を要し、Googleとの共同作業が必要でした。プロジェクトの主著者であるエミリー・ファーストは、 あるMinervaを採用しました膨大な自然言語テキストのコーパスで訓練されたLLM(言語修士)でmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmatic。

Baldurのエラー訂正へのアプローチは独創的です。dent証明器が生成した証明にエラーを発見すると、その情報をBaldurにフィードバックすることで、システムはそのエラーから学習することができます。この反復的なプロセスにより、証明の精度と信頼性が向上し、コード検証のための非常に効果的なツールとなっています。.

バグのないソフトウェアの明るい未来

改善の余地はあるものの、Baldurは形式的ソフトウェア検証の有望な手段となります。エンジニアは依然としてソフトウェア開発の責任を負いますが、Baldurという強力な味方が加わることで、matic証明の作成を自動化できるようになります。.

マサチューセッツ大学アマースト校マニング情報・コンピュータサイエンス学部のユーリー・ブルン教授は、「私たちの研究は、こうした証明の作成を自動化することに重点を置いています。Baldurは大規模な言語モデルを用いて、matic的な定理が与えられた場合に、その定理の証明をmaticに生成し、定理証明器で検証できるようにします」と述べています。

Baldurの成功は、このプロジェクトに精力的に取り組んだ献身的なチームのおかげです。エミリー・ファーストに加え、当時Googleに勤務していたマーカス・ラーベ氏、そしてイリノイ大学アーバナ・シャンペーン校の助教授であったタリア・リンガー氏も大きく貢献しました。国防高等研究計画局(DARPA)と国立科学財団(NSF)もこのプロジェクトを支援しました。.

ソフトウェアシステムの複雑さが増す中でテクノロジー業界が苦闘する中、Baldurのような革新的なソリューションは希望の光となります。AIの能力が進化と成熟を続ける中で、Baldurがソフトウェアの正確性を新たな高みへと押し上げる可能性は依然として有望です。.

まだ銀行に一番大事な部分を預けていますか? 自分の銀行になる方法

この記事を共有する

免責事項: 本情報は投資助言ではありません。Cryptopolitan.com Cryptopolitan、 本ページの情報に基づいて行われた投資について一切責任を負いません。投資判断を行う前に、ごtrondentdentdentdentdentdentdentdent で調査を行うか、資格のある専門家にご相談されることを

 

もっと…ニュース
ディープ クリプト
速習コース