딥시크의 오픈소스 모델과 MLA 기술을 개발한 AI 전문가, 뤄푸리를 만나보세요

- 29세의 AI 연구원인 뤄푸리는 오픈AI의 ChatGPT에 필적하는 중국 최초의 AI 모델인 DeepSeek-V2 개발에 참여했습니다.
- 뤄푸리는 2019년 ACL에서 8편의 자연어 처리 논문을 발표하며 주목을 받았고, 이후 알리바바에서 근무하다 2022년 DeepSeek AI에 합류했습니다.
- 뤄 교수는 DeepSeek-V2의 MLA 및 MoE 아키텍처를 활용한 성공 이후 중국에서 보다 실용적인 AI 연구가 필요하다고 주장하고 있다.
뤄푸리는 중국의 네티즌과 동료들로부터 "AI 천재"라는 별명을 얻은 29세 연구원입니다. 그녀는 딥시크-V2 개발에 핵심적인 역할을 한 것으로 유명하며, 이는 오픈AI의 챗GPT와 어깨를 나란히 할 수 있는 중국 최초의 인공지능(AI) 언어 모델입니다.
사우스 차이나 모닝 포스트에 따르면, 대규모 언어 모델(LLM)은 출시 , 메타(Meta)의 라마(Llama)보다 훨씬 적은 리소스로 학습되었습니다.
2023년 5월 인터뷰 인재 채용 시 경험보다 능력을 우선시한다고 밝혔습니다. 현지 언론 보도에 따르면 이 스타트업의 개발팀은 대부분 대학 졸업생과 재학생으로 구성되어 있다고dent.
그는 "핵심 기술 직무는 대부분 신입 졸업생이나 1~2년의 경력을 가진 사람들로 채워지고 있다"고 설명했다.
이 전략 덕분에 DeepSeek은 Gao Huazuo와 Zeng Wangding을 포함한 야심찬 젊은 연구원들로 구성된 팀을 구축할 수 있었습니다. 이 두 사람은 MLA 아키텍처 분야에서 핵심적인 혁신을 이뤄낸 것으로 평가받고 있습니다.
뤄푸리: 컴퓨터 과학에 도전한 것이 좋은 결과로 이어졌다
회사에서 가장 인기 있는 개발자 중 한 명은 루오 푸리입니다. 그녀는 뛰어난 지성과 따뜻한 마음을 가진 기술 전문가로, 자연어 처리(NLP) 분야에서tron경력을 자랑합니다. 푸리는 평범한 가정에서 자랐으며, 기술에 대한 관심은 전기 엔지니어였던 아버지의 영향 때문인 것으로 알려져 있습니다.
뤄푸리의 인공지능 분야 진출은 베이징대학교 계산언어학연구소에서 시작되었습니다. 심층 분석과 소셜 미디어에서 나온 확인되지 않은 보도에 따르면, 그녀는 처음에는 컴퓨터 과학 공부에 대해 확신이 없었고, 심지어 몇 번 낙제하기도 했다고 합니다.
하지만 그녀는 결국 인공지능에 대한 열정을 발견하고 획기적인 연구를 통해 명성을 쌓았습니다. 더욱이, 루오는 학창 시절에도 여러 곳에서 입사 제의를 받았지만 모두 거절했다는 소문이 있습니다.
2019년, 그녀는 전산언어학회(ACL) 학회에서 자연어 처리에 관한 논문 8편을 발표하여 중국 기술 업계의 주목을 받았습니다.
그녀는 자연어 처리(NLP)에 대한 지식과 기여 덕분에 알리바바를 비롯한 주요 기술 기업으로부터 여러 제안을 받았습니다.
알리바바의 다모 아카데미에서 루오는 다국어 AI 모델인 VECO 개발에 참여했습니다. 또한 알리바바의 오픈소스 프로젝트인 앨리스마인드(AliceMind)에 참여하여 온라인 마켓플레이스의 AI 전략 발전에 기여했습니다. 하지만 그녀의 포부는 기업 연구를 넘어섰고, 2022년에는 웡펑이 이끄는 딥시크 AI(DeepSeek AI)에 수석 연구원으로 합류했습니다.
뤄푸리와 딥시크 AI의 젊은 개발자 팀
초창기 뤄는 딥시크-V2 개발팀의 일원이었습니다. 딥시크-V2는 비용 효율적인 대규모 언어 모델로, 현지에서는 저렴한 가격으로 유명한 중국 온라인 전자상거래 대기업 핀둬둬를 빗대어 "AI 핀둬둬"라는 별명을 얻었습니다.
중국적 특색을 지닌 페미니즘.
이분은 딥시크의 천재 개발자이자 AI 논문 8편의 저자인 루오 푸리입니다!
그녀는 2020년에 베이징대학교에서 석사 학위를 받았습니다.
알리바바에서 일하다가 2022년에 딥시크에 합류해서 놀라운 성과를 냈는데, 이제 샤오미 AI 연구소에 "빼앗겼어요"! pic.twitter.com/MCz3ahXKVJ
— SL 칸탄(@Kanthan2030) 2025년 1월 29일
2023년 한 기술 컨퍼런스에서 루오는 자신의 모델이 최고 수준의 중국어 기능을 제공한다고 밝혔습니다. 이는 ChatGPT나 Qwei와 같은 세계 최고의 AI 시스템에 필적하는 수준이었습니다.
뤄푸리는 딥시크-V2의 성공을 혁신적인 아키텍처, 견고한 인프라, 그리고 투명성에 대한 회사의 노력이 결합된 결과로 꼽았습니다. 그녀가 딥시크에 재직하는 동안, 회사는 기술 보고서, 모델 가중치, 추론 코드 등을 깃허브에 공개적으로 공유했습니다. 이는 AI 개발에 대한 오픈소스 접근 방식을 실현하기 위한 것이었습니다.
DeepSeek AI – 오픈소스 기술의 정점
DeepSeek-V2의 두드러진 특징 중 하나는 다단계 어텐션(MLA)과 전문가 혼합 모델(MoE) 아키텍처를 사용한다는 점입니다. MLA는 모델이 텍스트 정보의 다양한 수준에 집중할 수 있도록 해주며, 이는 마치 사람이 책을 읽는 방식과 유사합니다. 문맥에 따라 문장, 단락, 장 사이에서 어텐션을 전환합니다.
한편, MoE는 모델 내에서 선택된 가상 "전문가"에게 작업을 지시함으로써 계산 효율성을 최적화합니다. 이러한 구축 방식은 리소스 소비를 줄이는 동시에 성능을 향상시킵니다.
뤄푸리는 중국에 더 많은 인공지능 연구소가 필요하다고 생각하며, 실질적이고 대규모의 엔지니어링 프로젝트에 집중해야 한다고 주장합니다.
뤄푸리는 또한 실세계 적용을 우선시하는 연구 방향으로의 전환을tron하게 옹호해 왔습니다. 이러한 새로운 방향은 인공지능 발전이 기업과 소비자에게 실질적인 이점으로 이어지도록 보장해야 합니다.
29세의 이 IT 전문가가 AI 업계에서 영향력을 키워가는 모습은 주목받고 있다. 보도 샤오미 창업자가 그녀에게 연봉 1천만 위안(약 1,600억 원)을 제안했지만, 그녀가 이를 수락했는지는 불분명하다.
은행에 돈을 넣어두는 것과 암호화폐에 투자하는 것 사이에는 중간 지점이 있습니다. 탈중앙화 금융.
면책 조항: 제공된 정보는 투자 조언이 아닙니다. Cryptopolitan이 페이지에 제공된 정보를 바탕으로 이루어진 투자에 대해 어떠한 책임도 지지 않습니다.trondentdentdentdentdentdentdentdent .
화폐 속성 강좌
- 어떤 암호화폐로 돈을 벌 수 있을까요?
- 지갑으로 보안을 강화하는 방법 (그리고 실제로 사용할 만한 지갑은 무엇일까요?)
- 전문가들이 사용하는 잘 알려지지 않은 투자 전략
- 암호화폐 투자 시작하는 방법 (어떤 거래소를 사용해야 하는지, 어떤 암호화폐를 사는 것이 가장 좋은지 등)















