Your bank is using your money. You’re getting the scraps.WATCH FREE

AIにおける新たなプライバシーリスク:言語モデルにおける記憶の課題

この投稿の内容:

  • AI の記憶リスク: ChatGPT のようなモデルはトレーニング データを思い出すことができるため、プライバシーに関する懸念が生じます。.
  • ChatGPT に対する Divergence 攻撃により、機密データの漏洩の可能性があります。.
  • 大規模な AI モデルでは、個人情報を記憶したり漏洩したりする傾向が高くなります。.

Google DeepMind、ワシントン大学、カリフォルニア大学バークレー校などの研究者による画期的な研究により、ChatGPTのような大規模言語モデルの驚くべき側面が明らかになりました。それは、学習に使用した特定のデータを記憶し、それを再現する能力です。「記憶化」と呼ばれるこの現象は、特にこれらのモデルが機密情報を含む可能性のある膨大かつ多様なテキストデータで学習することが多いことを考えると、プライバシーに関する重大な懸念を引き起こします。.

extracテーブルの記憶を理解する

この研究は「tracテーブルの記憶」に焦点を当て、外部の主体がトレーニングセットに関する事前知識なしにこれらのモデルから特定の学習データをtracできるかどうかを検証しようとしました。この記憶は単なる理論上の懸念ではなく、現実世界のプライバシーにも影響を与えます。.

研究方法と結果

研究者らは、様々なモデルから広範なトークンを生成し、それらをトレーニングデータセットと比較することで、直接記憶の事例をdentという斬新な手法を採用しました。彼らはChatGPT向けに「ダイバージェンス攻撃」と呼ばれる独自の手法を開発しました。これは、モデルに単語を発話するよう促し、記憶されたデータに繰り返し逸脱させる攻撃です。驚くべきことに、ChatGPTを含むモデルは、特定の指示を与えるとトレーニングデータの一部を吐き出すなど、顕著な記憶力を示しました。.

分岐攻撃とChatGPT

ChatGPTの場合、分岐攻撃は特に大きな示唆を与えました。研究者たちはモデルに単語を複数回繰り返させることで、標準的な応答から逸脱させ、記憶されたデータを出力させました。この手法は実用的でしたが、潜在的に機密性の高い情報をtracできることが示されたため、プライバシーへの影響が懸念されました。.

  シンガポールの仮想通貨起業家のポートフォリオがゲームを装ったマルウェアによって消滅した事件も参照

この研究で明らかになった驚くべき事実は、記憶されたデータにメールアドレスや電話番号といった個人情報が含まれる可能性があるという点でした。研究者たちは正規表現と言語モデルのプロンプトを用いて、15,000世代のデータから個人dent情報(PII)に類似する部分文字列を抽出しました。その結果、約16.9%の世代に記憶されたPIIが含まれ、そのうち85.8%は幻覚的な内容ではなく、実際のP​​IIでした。.

言語モデルの設計と使用への影響

これらの発見は、言語モデルの設計と応用にとって重要です。ChatGPTで採用されているものでさえ、現在の技術ではデータ漏洩を十分に防ぐことができない可能性があります。この研究は、より堅牢な学習データの重複排除手法と、モデル容量が記憶にどのように影響するかについてのより深い理解の必要性を強調しています。.

コアとなる手法は、様々なモデルからテキストを生成し、その出力をそれぞれのモデルのトレーニングデータセットと照合して記憶するというものでした。効率的なマッチングのために接尾辞配列が使用され、大規模なテキストコーパス内での部分文字列検索を高速化しました。.

より広範なモデル、より重大な記憶リスク

モデルのサイズと記憶傾向の間には、注目すべき相関関係が一つ現れました。GPT-Neo、LLaMA、ChatGPTといった大規模なモデルは、記憶された学習データを出力する可能性が高く、モデル容量と記憶性の間に直接的な関係があることを示唆しています。.

この研究は、AI開発における重要な側面、すなわち強力なモデルがユーザーのプライバシーを尊重することを確実にするという側面を明らかにしています。特にプライバシーに配慮したアプリケーションで使用されるAIモデルにおけるプライバシー保護の強化に焦点を当て、研究開発の新たな道を切り開きます。.

も参照  : 強気派がMKRを2500ドル以上に押し上げる準備を整える

AIが進化を続ける中で、本研究はAI開発の重要な側面、すなわち言語モデルにおけるプライバシー対策の強化の必要性に光を当てています。AIが機密情報を記憶し、潜在的に漏洩する可能性があることが明らかになったことで、AI分野における迅速な対応が求められ、開発者や研究者は、強力なだけでなくユーザーのプライバシーも保護するモデルの開発を迫られています。本研究は、AIおよび機械学習技術に関連するプライバシーリスクの理解と軽減に向けた重要な一歩となります。.

Cash、所有権を手放すことなく支出でき、残高に対して8% 以上の利回りを得られます

共有リンク:

免責事項。提供される情報は取引アドバイスではありません。Cryptopolitan.comCryptopolitanこのページで提供される情報に基づいて行われた投資について一切の責任を負いません。dent調査や資格のある専門家への相談をtronお勧めします

最も読まれている

最も読まれている記事を読み込んでいます...

暗号通貨の最新ニュースを毎日メールで受け取りましょう

編集者の選択

編集者のおすすめ記事を読み込んでいます...

- 常に先を行く暗号通貨ニュースレター -

市場の動きは速い。.

私たちはより速く動きます。.

Cryptopolitan Daily を購読すると、タイムリーで鋭敏かつ関連性の高い暗号通貨の洞察が直接受信箱に届きます。.

今すぐ参加して、
見逃さないようにしましょう。

入って、事実を知り、
前に進みましょう。

CryptoPolitanを購読する