マイクロソフトの研究者が大規模言語モデルから特定の知識を消去する革新的な技術を発表

By Brenda Kanana
更新日: 2023年10月7日午前6時29分 UTC

3分で読む

Googleの優先ソースとして追加してください

379619

コンテンツ

共有リンク:

この投稿の内容:

マイクロソフトの研究者らは、大規模な再トレーニングを行わずに、AI モデルにハリー・ポッターのような特定の情報を忘れさせる新しい方法を発表した。
彼らの 3 段階の手法により、AI の全体的なパフォーマンスを損なわずに、わずか 1 GPU 時間でデータを効率的に消去できます。
この画期的な進歩は、将来、より適応性が高く倫理的な AI モデルへの希望をもたらします。

人工知能における注目すべき進歩として、マイクロソフトの研究チームが、大規模言語モデル（LLM）内の特定の知識を選択的に修正する先駆的なアプローチを発表しました。この画期的な手法は、著名な最近の論文で、LLMの学習中に著作権で保護された資料を使用することに関する重要な問題に対処しています。さらに、この手法は、これらのモデルが大規模な再学習なしに適応できるかどうかという問題に対する有望な解決策を提供します。

適応力の大きな飛躍

OpenAIのChatGPT、MetaのLlama 2、AnthropicのClaude 2といった大規模言語モデルは、著作権で保護された資料を含む可能性のある膨大なデータセットに基づいてテキストコンテンツを生成するという並外れた能力により、大きな注目と精査をtracてきました。これらのモデルをカスタマイズして特定の情報を忘却または学習解除するという課題は、長年の懸念事項でした。

1GPU時間で効率的な消去

マイクロソフトの研究者、ロネン・エルダン氏とマーク・ルシノビッチ氏は、この課題に対する洗練された解決策を提示しました。彼らの論文では、LLMにおける特定の情報のアンラーニングプロセスを近似するために設計された3段階の手法が紹介されています。彼らのアプローチの最も注目すべき点は、その効率性です。特筆すべきは、わずか1時間のGPU微調整で、ハリー・ポッターの書籍に関するすべての知識、つまり登場人物やプロットの詳細を消去できることを実証したことです。この高い効率レベルは、より適応性と応答性に優れた言語モデルの開発に大きな可能性を秘めています。

SpaceX社長、記録破りのIPOを目指す中で最大の試練にdent

3部構成のテクニックを解体する

エルダンとルシノビッチの手法は、従来の機械学習アプローチとは大きく異なるものです。従来のアプローチは、知識の蓄積に重点を置き、忘却のための明確なメカニズムを提供していません。彼らの革新的なアプローチは、以下の3つの基本的なステップで構成されています。

1. 関連トークンのdent：初期段階では、モデルはターゲットデータ（この場合はハリー・ポッターの書籍）を用いて学習されます。モデルは、ベースラインモデルによって生成された予測値と比較することで、ターゲットデータに最も関連性の高いトークンを識別しdent。この初期ステップは、消去すべき知識を特定するための基礎となります。

2. 固有の表現の置き換え：2つ目のステップは、ハリー・ポッターシリーズ特有の表現を一般的な表現に置き換えることです。これにより、研究者たちは、特定のトレーニングデータを含まないモデルの出力を効果的に反映した代替予測を生成します。この置き換えは、知識消去プロセスにおいて極めて重要な要素です。

3. 微調整と消去：最後のステップは、代替予測を用いてベースラインモデルを微調整することです。この微調整プロセスでは、ハリー・ポッターシリーズに関連する文脈が与えられた場合、モデルの記憶から元のテキストを消去します。この重要なステップにより、モデルはハリー・ポッターシリーズの複雑な物語を「忘れる」ことができます。

成功の評価

エルダンとルシノビッチは、その手法の有効性を評価するために、包括的な一連のテストを実施しました。彼らは、300個のmatic生成プロンプトと綿密に分析されたトークン確率を用いて、ハリー・ポッターシリーズに関連するコンテンツを生成または議論する際のモデルの能力を検証しました。最も重要なのは、わずか1時間の微調整で、モデルがハリー・ポッターシリーズの詳細な物語を実質的に「忘れる」ことができたことです。驚くべきことに、この消去は、ARC、BoolQ、Winograndeなどの標準的なベンチマーク評価におけるモデルのパフォーマンスにほとんど影響を与えませんでした。

シタデルの創設者は、GenAIはヘッジファンドの収益を向上できなかったと述べている。

示唆と今後の研究

この画期的な手法は大きな可能性を秘めていますが、特に大規模言語モデルにおけるより広範な反学習タスクに関しては、この手法を洗練・拡張するためには更なる研究が不可欠であることを強調しなければなりません。特筆すべきは、このアプローチは、固有の参照が存在するため、ハリー・ポッターシリーズのようなフィクションテキストに特に効果的である可能性があることです。

人工知能システムが様々な分野でますます重要な役割を果たすようになるにつれ、特定の情報を選択的に忘却またはアンラーニングする能力が極めて重要になります。この方法論は、より責任感があり、適応性が高く、法令遵守に優れた法学修士（LLM）を開発するための基礎的な一歩となります。AI分野が進化を続ける中で、倫理ガイドライン、社会的価値観、そしてユーザーの具体的なニーズに対応する可能性を秘めています。

これを読んでいるあなたは、すでに一歩先を進んでいます。ニュースレターで最新情報をお届けします。

共有リンク:

免責事項を読む

免責事項。提供される情報は取引アドバイスではありません。Cryptopolitan.comCryptopolitan 、このページで提供される情報に基づいて行われた投資について一切の責任を負いません。dent調査や資格のある専門家への相談をtronお勧めします

最も読まれている

暗号通貨の最新ニュースを毎日メールで受け取りましょう

編集者の選択

編集者のおすすめ記事を読み込んでいます...

マイクロソフトの研究者が大規模言語モデルから特定の知識を消去する革新的な技術を発表

コンテンツ

この投稿の内容:

適応力の大きな飛躍

1GPU時間で効率的な消去

3部構成のテクニックを解体する

成功の評価

示唆と今後の研究

共有リンク:

最も読まれている

暗号通貨の最新ニュースを毎日メールで受け取りましょう

編集者の選択

サインアップしてトップを維持しましょう

市場の動きは速い。.

私たちはより速く動きます。.

入って、事実を知り、
前に進みましょう。

マイクロソフトの研究者が大規模言語モデルから特定の知識を消去する革新的な技術を発表

コンテンツ

この投稿の内容:

適応力の大きな飛躍

1GPU時間で効率的な消去

3部構成のテクニックを解体する

成功の評価

示唆と今後の研究

共有リンク:

最も読まれている

暗号通貨の最新ニュースを毎日メールで受け取りましょう

編集者の選択

サインアップしてトップを維持しましょう

私たちに従ってください

- 常に先を行く暗号通貨ニュースレター -

市場の動きは速い。.

私たちはより速く動きます。.

入って、事実を知り、前に進みましょう。

入って、事実を知り、
前に進みましょう。