最新ニュース
あなたへのおすすめ
週刊
トップの座を維持する

最高の仮想通貨情報をあなたの受信トレイに直接お届けします。.

DeepSeekのオープンソースモデルとMLAテクノロジーを支えるAIのプロ、Luo Fuli氏をご紹介します。

によるフローレンス・ムチャイフローレンス・ムチャイ
読了時間3分
DeepSeekのオープンソースモデルとMLAテクノロジーを支えるAIのプロ、Luo Fuli氏をご紹介します。
  • 29歳のAI研究者、羅富里氏は、OpenAIのChatGPTに匹敵する中国初のAIモデルであるDeepSeek-V2の開発に貢献した。.
  • Luo Fuli 氏は、2019 年に ACL で 8 件の NLP 論文を発表して注目を集め、その後 Alibaba で勤務した後、2022 年に DeepSeek AI に入社しました。.
  • Luo 氏は、DeepSeek-V2 が MLA および MoE アーキテクチャで成功したことを受けて、中国でより実用的な AI 研究を推進しています。.

羅富里氏は29歳の研究者で、中国のネットユーザーや同僚から「AIの天才」の異名をとっています。彼女はDeepSeek-V2の開発において重要な役割を果たしたことで知られています。これは、OpenAIのChatGPTと互角に渡り合える中国初の人工知能(AI)言語モデルです。.

サウスチャイナ・モーニング・ポストによると、大規模言語モデル(LLM)は 発表さ 、MetaのLlamaよりもはるかに少ないリソースでトレーニングされたという。

2023年5月に インタビュー 中国メディア36Krの 現地の報道によると、このスタートアップ企業の開発者チームは主に卒業生や大学生で構成されているdent。 

「当社の中核となる技術職は、主に新卒者か、1~2年の就業経験を持つ人々で構成されています」と彼は説明した。.

この戦略により、 DeepSeekは Gao Huazuo氏とZeng Wangding氏を含む意欲的な若手研究者チームを構築することができました。この2人はMLAアーキテクチャにおける重要な革新者として高く評価されています。

羅富里:コンピュータサイエンスに挑戦して成果を上げた

社内で最も引っ張りだこの開発者の一人が、羅富里(ルオ・フーリ)氏です。彼女は「頭脳明晰」で、自然言語処理(NLP)の分野でtronな経験を持つ、心の温かい技術専門家と言われています。富里氏は質素な家庭で育ったと伝えられています。彼女のテクノロジーへの興味は、電気技師である父親の影響を受けたのではないかとも言われています。.

羅氏のAI分野での台頭は、北京大学計算言語学研究所から始まった。詳細な調査やソーシャルメディアからの未確認 情報に よると、彼女は当初、コンピュータサイエンスを学ぶことに迷いがあったという。実際、彼女は在学中に何度か落第も経験している。

しかし、彼女は最終的にAIへの情熱を見出し、画期的な研究で名声を博しました。さらに、羅さんは在学中に就職の誘いやオファーを受けたものの、全て断ったという噂もあります。.

2019年、彼女は計算言語学会(ACL)会議でNLPに関する8本の論文を発表し、中国のテクノロジー業界の注目を集めました。.

彼女は NLP に関する知識と貢献により、Alibaba をはじめとする大手テクノロジー企業から複数のオファーを受けました。.

アリババのDAMOアカデミーでは、多言語AIモデルVECOの開発に貢献しました。また、同社のオープンソースプロジェクト「AliceMind」にも携わり、オンラインマーケットプレイスのAIイニシアチブの推進に貢献しました。しかし、彼女の野心は企業研究の枠を超え、2022年にはWengfengが率いるDeepSeek AIに主任研究員として加わりました。.

羅富里とDeepSeek AIの若い開発者チーム

羅氏は当初から、DeepSeek-V2の実現チームの一員でした。これは費用対効果の高い大規模言語モデルで、現地では「AI Pinduoduo」という愛称で呼ばれています。これは、手頃な価格で知られる中国のオンラインEコマース大手にちなんで名付けられています。. 

2023年の技術カンファレンスで講演した羅氏は、このモデルがいかにして最高レベルの中国語能力を備えているかを明らかにした。これは、ChatGPTやQweiといった世界最高峰のAIシステムに匹敵する。.

羅富里氏は、DeepSeek-V2の成功は革新的なアーキテクチャ、堅牢なインフラストラクチャ、そして透明性への同社のコミットメントの組み合わせによるものだと述べています。彼女がDeepSeekに在籍していた間、同社は技術レポート、モデルの重み、推論コードをGitHubで公開していました。これは、AI開発におけるオープンソースアプローチの具体化を目的としていました。.

DeepSeek AI – オープンソース技術の最高峰

DeepSeek-V2の際立った特徴の一つは、Multi-Level Attention(MLA)とMixture of Experts(MoE)アーキテクチャの採用です。MLAにより、モデルはテキスト情報の異なるレベルに焦点を当てることができます。これは、人間の読者が本を読む方法に似ています。DeepSeek-V2は、文脈に応じて文、段落、章の間で注目を切り替えます。. 

一方、MoEは、モデル内の選択された仮想「エキスパート」にタスクを割り当てることで計算効率を最適化します。この積み重ねにより、リソース消費が削減され、パフォーマンスが向上しました。.

羅富里氏は、中国にはもっと多くのAI研究所が必要だと考えている。彼女は、中国は実用的で大規模なエンジニアリングプロジェクトに重点を置くべきだと主張する。.

羅富里氏は、実社会への応用を優先する研究への転換をtron主張してきました。この新たな方向性は、AIの進歩が企業と消費者に具体的な利益をもたらすことを保証するはずです。.

29歳のこの技術者がAI業界で影響力を増していることは、見過ごされてはいない。 報道 、シャオミの創業者自身が彼女に年間1000万元の報酬を提示したが、彼女がその申し出を受け入れたかどうかは不明だ。

銀行にお金を預けておくのと、仮想通貨で一か八かの賭けをするのとでは、中間的な選択肢があります。まずは、 分散型金融

この記事を共有する

免責事項。 提供される情報は取引アドバイスではありません。Cryptopolitan.com Cryptopolitan、 このページで提供される情報に基づいて行われた投資について一切の責任を負いません。tronお勧めしますdent 調査や資格のある専門家への相談を

もっと…ニュース
ディープ クリプト
速習コース