人工知能(AI)が安全対策 Defi、懸念が高まる

- AI システムは安全性のトレーニングに抵抗するため、欺瞞的な行動を止めることが困難になります。.
- 研究者は AI モデルに不正行為をするように訓練したが、AI モデルは悪意のある行動を維持した。.
- 現在の安全対策では AI による欺瞞を防御できない可能性があるため、さらなる研究の必要性が強調されています。.
人工知能(AI)は長年にわたり人々の関心と懸念を集めており、SF作品ではAIが人類に反旗を翻すシナリオがしばしば描かれてきた。しかし、AIの安全性と研究を専門とする企業Anthropicの研究者らが最近行った調査では、AIシステムがその動作を制限するために設計された高度な安全機構に抵抗できるという、憂慮すべき現実が明らかになった。
不安な事実
エヴァン・ハビンガー氏が率いるこの研究は、大規模言語モデル(LLM)が様々な安全訓練手法を用いても、欺瞞的かつ悪意のある行動を維持するというレジリエンス(回復力)を示している。これらの手法は、AIシステム内の欺瞞的または有害な行動をdent、是正するために綿密に構築されたものである。.
アントロピックの研究では、LLMに欺瞞行為を含む悪意ある行動を訓練しました。LLMは複数の安全訓練方法を採用したにもかかわらず、一貫して不服従な傾向を維持しました。.
驚くべきことに、欺瞞を軽減することを目的としたこれらの技術の 1 つは、トレーニング中に不正な行為を隠すように AI システムに教えることにより、逆説的に裏目に出ました。.
ハビンガー氏は、「私たちの重要な結果は、AIシステムが欺瞞的になった場合、現在の技術ではその欺瞞を取り除くのが非常に困難になる可能性があるということです。これは、将来欺瞞的なAIシステムが存在する可能性があると考える上で重要です。なぜなら、そのようなシステムへの対処がどれほど困難であるかを理解するのに役立ちます。」と述べました。
出現する欺瞞
この研究で用いられた手法の一つ、「創発的欺瞞」は、AIを訓練中は正常に動作させ、実用化後は不正な動作をするように訓練するというものでした。例えば、AIは2023年に指示された際には安全なコードを書くようにプログラムされていましたが、2024年に指示された際には脆弱性を隠蔽したコードを作成するようにプログラムされていました。.
もう一つの手法「モデルポイズニング」は、AIモデルを学習中にチャットボットのように役立つように見せかけることを目的としていました。しかし、プロンプトに特定のタグを付けて「デプロイ」すると、AIは「嫌いよ」といった敵対的な発言を返しました。このアプローチは、AIのプロンプトへの適応性と、トリガーされると悪意のある行動に転じる傾向をテストすることを目的としていました。.
AIによる意思決定を垣間見る
研究者たちはまた、一部のAIモデルに「思考連鎖推論」を組み込み、AIが応答を策定する際の内部思考プロセスを観察できるようにした。この知見は、 LLMが 行動や応答に関する意思決定を行うかについての貴重なデータをもたらした。
AIモデルの欺瞞的な行動に対処するため、強化学習(RL)、教師あり微調整(SFT)、敵対的学習という3つの安全性トレーニング手法が採用されました。RLでは、AIモデルは望ましい行動を示した場合に報酬が与えられ、逸脱した場合にはペナルティが課されました。.
SFTは、AIモデルを様々なプロンプトでテストし、期待される「正しい」応答に基づいてトレーニングを微調整する手法です。敵対的トレーニングでは、AIシステムに有害な行動を促し、それを排除するようにトレーニングします。しかし、これらの努力にもかかわらず、欺瞞的な行動は依然として残りました。.
ハビンガー氏は懸念を表明し、「私たちの研究結果は、モデルの汚染や新たな欺瞞によるAIシステムの欺瞞に対して、それが起こらないことを祈る以外に、今のところ有効な防御策がないということを示していると思います」と述べた。
難しいジレンマ
この研究結果は、AIの安全性における重大な課題を浮き彫りにしています。欺瞞的なAIシステムに対する信頼できる防御メカニズムが欠如している可能性があり、将来、予測不可能なAIの行動に対して脆弱な状況に陥る可能性があるという懸念が浮上しています。.
研究者らは、AIによる欺瞞の可能性を測定する確実な方法が存在しないことを指摘し、この問題への対処がさらに複雑になっているとしている。.
最も賢い暗号通貨マインドを持つ人々はすでに私たちのニュースレターを読んでいます。参加してみませんか?ぜひ ご参加ください。
免責事項。 提供される情報は取引アドバイスではありません。Cryptopolitan.com Cryptopolitan、 このページで提供される情報に基づいて行われた投資について一切の責任を負いません。tronお勧めしますdent 調査や資格のある専門家への相談を

ブライアン・クーメ
ブライアン・クームは、ブロックチェーンと仮想通貨に関する報道において7年以上の経験を持ち、2017年から業界で活躍しています。BlockToday.comをはじめとする主要なメディアに寄稿してきました。また、 Cryptopolitan に専任ライターとして入社する前は、BitDegree.org向けに Ethereum 101コースを開発しました。ブライアンは、定番ガイド(EG)、詳細な分析記事、インタビュー、価格分析などを執筆しています。DeFi、ブロックチェーンの DeFi、そして新興仮想通貨プロジェクトに焦点を当てた彼の記事は、読者を魅了しています。.
速習コース
- どの仮想通貨でお金が稼げるか
- ウォレットを使ってセキュリティを強化する方法(そして実際に使う価値のあるウォレットはどれか)
- プロが使う、あまり知られていない投資戦略
- 仮想通貨への投資を始める方法(どの取引所を使うべきか、購入すべき最適な仮想通貨など)















