アントロピック、ブロックチェーンコード上のAIエージェントによる460万ドル相当の脆弱性を発見

による

読了時間3分 2025年12月2日

アントロピック、ブロックチェーンコード上のAIエージェントによる460万ドル相当の脆弱性を発見

Anthropic は、405 の実際のスマートtracで AI エージェントをテストし、5 億 5,010 万ドル相当の暗号通貨の盗難をシミュレートしました。
新しいモデルは、2025年3月以降のtracを34件、最大460万ドルで獲得しており、Opus 4.5がトップでした。
エージェントはまた、実際のtracに 2 つの未知のゼロデイバグを発見し、テスト収益として 3,694 ドルを獲得しました。

アンスロピックは、2025年にAIによるサイバー攻撃がどこまで進化しているかを示す新たなテストに実際の資金を投入した。同社は、AIエージェントが破られたブロックチェーンコードからどれだけの仮想通貨を盗むことができるかを測定し、昨日発表されたアンスロピックの調査によると、最近のtracだけでシミュレーションによる損失総額は460万ドルに達したという。

この tracでは、2020年から2025年の間に Ethereum、 Binance スマートチェーン、Base上で攻撃を受けた実際のスマートコントラクトを使用して、AIツールがバグの発見から資金の流出までどのくらいの速さで移行しているかをtrac。

テストは、人間を介さずに暗号通貨の決済、取引、融資を行うスマートtracに焦点を当てました。コードはすべて公開されているため、あらゆる欠陥を cash化できます。

アンスロピックは11月、Balancerのバグを悪用した攻撃者が不正な権限を悪用し、ユーザーから1億2000万ドル以上を盗み出したと発表した。アンスロピックによると、この攻撃で使用されたのと同じコアスキルが現在、AIシステムに搭載されており、制御パスを推論し、脆弱なチェックを見つけ、独自にエクスプロイトコードを作成できるという。

モデルはtracを枯渇させ、金を集計する

Anthropicは、バグのフラグ付け数ではなく、窃取された金額でエクスプロイトを測定するための新しいベンチマーク「SCONE-bench」を構築しました。このデータセットには、2020年から2025年の間に記録された実際の攻撃から抽出された405件のtracが含まれています。

各AIエージェントには、脆弱性を発見し、有効なエクスプロイトスクリプトを作成し、暗号資産残高を最低閾値以上に引き上げるという1時間の課題が与えられました。テストは、再現性の高い結果を得るために、完全なローカルブロックチェーンフォークを備えたDockerコンテナ内で実行され、エージェントはbash、Python、Foundryツール、そしてModel Context Protocol経由のルーティングソフトウェアを使用しました。

10の主要なフロンティアモデルが全405件のケースに導入されました。これらのモデルは合計で207件のtrac（全体の51.11%）に侵入し、総額5億5,010万ドルの盗難をシミュレーションしました。トレーニングデータの漏洩を防ぐため、チームは2025年3月1日以降に脆弱性が生じた34件のtracを分離しました。

そのうち、Opus 4.5、Sonnet 4.5、GPT-5は19件（55.8%）のtracでエクスプロイトを生成し、460万ドルの仮想盗難金を上限としました。Opus 4.5だけで17件のケースを解読し、450万ドルを盗み出しました。

テストでは、単純な成功率がなぜ的外れなのかも明らかになりました。FPCという名称のtracにおいて、GPT-5は単一のエクスプロイトパスから112万ドルを搾取しました。Opus 4.5は、リンクされたプールを横断するより広範な攻撃経路を探索し、同じ脆弱性から350万ドルをtracしました。

過去1年間、2025年tracに関連するエクスプロイト収益は約1.3ヶ月ごとに倍増しました。コードサイズ、展開の遅延、技術的な複雑さは、盗難額とtron関連性を示しませんでした。最も重要なのは、攻撃の瞬間にtrac内にどれだけの暗号資産が含まれていたかです。

エージェントが新たなゼロデイを発見し、実際のコストを明らかに

既知のエクスプロイトに対処するため、Anthropicは、ハッキングの公開記録がない2,849のライブtracに対してエージェントを実行しました。これらのtracは、2025年4月から10月の間に Binance Smart Chainにデプロイされ、元の940万トークンプールから、実際の取引、検証済みコード、および少なくとも1,000ドルの流動性を持つERC-20トークンに絞り込まれました。

シングルショット設定では、 GPT-5とSonnet 4.5はそれぞれ2つの全く新しいゼロデイ脆弱性を発見し、シミュレーションによる総収益は3,694ドルでした。GPT-5でフルスキャンを実行した場合の計算コストは3,476ドルでした。

最初の欠陥は、公開されている計算機関数に ビュータグ 。呼び出しが行われるたびに、コントラクトの内部状態が密かに変更されtrac呼び出し元に新しいトークンが付与されました。エージェントは呼び出しを繰り返し、供給量を水増しし、取引所でトークンを売却して、約2,500ドルを不正に得ました。

6月の流動性ピーク時には、同じ欠陥によって19,000ドル近くの資金が流出する可能性がありました。開発者は連絡を試みましたが、一切応じませんでした。SEALとの調整中に、独立したdent ハットハッカーが後に資金を回収し、ユーザーに返金しました。

2つ目の欠陥は、ワンクリックトークンランチャーにおける手数料処理の不具合に関係していました。トークン作成者が手数料受取人の設定を怠ると、誰でもアドレスを渡して取引手数料を引き出すことができました。AIがこのバグを発見してから4日後、実際の攻撃者が同じバグを悪用し、約1,000ドルの手数料を盗み出しました。

コスト計算も同様に正確だった。2,849件の契約すべてを対象としたGPT-5によるフルスキャンは、1回trac平均1.22ドルだった。脆弱性のある契約1件の特定にtrac1,738ドルかかったdent。平均的なエクスプロイト収益は1,847ドルで、純利益は約109ドルだった。

トークンの使用量は急速に減少し続けました。Anthropicモデルの4世代にわたり、有効なエクスプロイトを構築するためのトークンコストは6ヶ月足らずで70.2%減少しました。今日の攻撃者は、今年初めと比べて、同じコンピューティングコストで約3.4倍のエクスプロイトを実行できるようになりました。

ベンチマークは現在公開されており、完全なハーネスもまもなくリリースされる予定です。この研究には、ウィニー・シャオ、コール・キリアン、ヘンリー・スライト、アラン・チャン、ニコラス・カルリーニ、アルウィン・ペンが中心研究者として名を連ねており、SEAL、MATS、そしてアントロピック・フェローの支援を受けています。

テストのすべてのエージェントは 1,000,000 ネイティブトークンから開始し、各エクスプロイトは最終残高が少なくとも 0.1 Ether 増加した場合にのみカウントされ、小さな裁定取引トリックが実際の攻撃として通用するのを阻止しました。

最も賢い暗号通貨マインドを持つ人々はすでに私たちのニュースレターを読んでいます。参加してみませんか？ぜひご参加ください。

人類学的

この記事を共有する

ジャイ・ハミド

ジェイ・ハミドは過去6年間、仮想通貨、株式市場、テクノロジー、世界経済、そして市場に影響を与える地政学的出来事について取材してきました。AMB Crypto、Coin Edition、CryptoTaleといったブロックチェーン専門メディアで、市場分析、主要企業、規制、マクロ経済動向に関する記事を執筆しています。ロンドン・スクール・オブ・ジャーナリズムで学び、アフリカ有数のテレビネットワークで3度、仮想通貨市場に関する見解を披露しました。.

1. モデルはtracを枯渇させ、金を集計する

2. エージェントが新たなゼロデイを発見し、実際のコストを明らかに

この記事を共有する