COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

Rencontrez Luo Fuli: L'AI Pro derrière le modèle open source de Deepseek et la technologie MLA

Dans cet article :

  • Luo Fuli, un chercheur de l'IA de 29 ans, a aidé à développer Deepseek-V2, le premier modèle d'IA en Chine rivalisant avec le chatppt d'Openai.
  • Luo Fuli a été reconnu après avoir publié huit articles PNL à ACL en 2019, travaillant plus tard à Alibaba avant de rejoindre Deepseek AI en 2022.
  • Luo plaide pour une recherche plus pratique de l'IA en Chine après le succès de Deepseek-V2 avec l'architecture MLA et MOE.

Luo Fuli est un chercheur de 29 ans que les internautes et les collègues en Chine ont donné le surnom de «prodigy AI». Elle est connue pour son rôle central dans le développement de Deepseek-V2. Il s'agit du premier modèle de langue de l'intelligence artificielle (IA) de la Chine qui pourrait aller de côté avec le chatppt d'Openai.

Selon le South China Morning Post, le modèle de grande langue (LLM) a été lancé par Deepseek le 26 décembre 2024, et il a été formé avec beaucoup moins de ressources que le lama de Meta.

Dans une interview avec Chinese Media Outlet 36KR, le fondateur de Deepseek, Liang Wenfeng, a déclaré que lors du recrutement de talents, l'entreprise privilégie la capacité de l'expérience. Des sources d'information locales suggèrent que l'équipe de développeurs de la startup se compose principalement de diplômés et de étudiants dent .

«Nos rôles techniques de base sont remplis de diplômés principalement frais ou de ceux qui ont un ou deux ans d'expérience de travail», a-t-il expliqué.

Cette stratégie a aidé Deepseek à constituer une équipe de jeunes chercheurs ambitieux, notamment Gao Huazuo et Zeng Wangding. Les deux ont été crédités des innovations clés dans l'architecture MLA.

Luo Fuli: Prendre une chance en informatique a payé

Parmi les développeurs les plus recherchés de l'entreprise, il y a Luo Fuli. Elle serait une experte en technologie «certifiée» et sincère avec des antécédentstron​​g dans le traitement du langage naturel (PNL). Fuli aurait été élevé dans un environnement modeste. On dit que son intérêt pour la technologie pourrait provenir de son père, un ingénieur électricien.

La montée en puissance de Luo dans le domaine de l'IA a commencé à l'Institut de linguistique informatique de l'Université de Pékin. Des rapports non confirmés de plongées profondes et de médias sociaux ont été initialement incertaines de l'étude de l'informatique. Fuli a même échoué plusieurs fois.

Voir aussi  les ventes de Byd Beats en Chine Tesla en Europe pour la première fois grâce à Elon Musk

Cependant, elle a finalement trouvé sa passion pour l'IA et s'est fait un nom à travers des recherches révolutionnaires. De plus, il est dit que Luo a reçu des invitations à l'emploi et des offres alors qu'elle était encore à l'école, mais elle les a tous refusés.

En 2019, elle a attiré l'attention du secteur de la technologie chinoise après avoir publié huit articles sur la PNL lors de la conférence Association for Computational Linguistics (ACL).

Ses connaissances et ses contributions dans la PNL l'ont vue recevoir plusieurs offres de grandes entreprises technologiques, en particulier Alibaba.

À la Damo Academy d'Alibaba, Luo a contribué à Veco, un modèle d'IA multilingue. Elle a travaillé sur le projet Open-source de l'entreprise Alicemind, aidant le marché en ligne à progresser ses initiatives d'IA. Cependant, ses ambitions ont augmenté au-delà de la recherche d'entreprise. À cette fin, elle a rejoint un rôle chez Deepseek AI, dirigé par Wengfeng en 2022 en tant que chercheur principal.

Luo Fuli et la jeune équipe de développeurs de Deepseek AI

Au tout début, Luo faisait partie de l'équipe qui a actualisé Deepseek-V2. Il s'agit d'un modèle de langue grand rentable que les habitants ont surnommé «AI Pinduoduo» - une référence au géant chinois en ligne du commerce électronique connu pour ses prix abordables. 

S'exprimant lors d'une conférence technologique en 2023, Luo a révélé comment le modèle offre des capacités de langue chinoise de haut niveau. Cela rivalisait même les meilleurs systèmes d'IA mondiaux comme Chatgpt et Qwei.

Voir aussi  Apple lutte dans son jeu sous pression de Trump et des rivaux technologiques

Luo Fuli a attribué le succès de Deepseek-V2 à une combinaison d'architecture innovante, d'infrastructures robustes et de l'engagement de l'entreprise envers la transparence. Pendant son séjour à l'entreprise, Deepseek a partagé ouvertement ses rapports techniques, ses poids de modèle et son code d'inférence sur GitHub. Cela visait à réaliser son approche open source du développement de l'IA.

Deepseek AI - La technologie open source à son apogée

L'une des caractéristiques remarquables de Deepseek-V2 est son utilisation de l'attention à plusieurs niveaux (MLA) et de l'architecture du mélange d'experts (MOE). MLA permet au modèle de se concentrer sur différents niveaux d'informations textuelles - à savoir comment un lecteur humain traite un livre. Il a déplacé l'attention entre les phrases, les paragraphes et les chapitres en fonction du contexte. 

Pendant ce temps, le MOE optimise l'efficacité informatique en dirigeant des tâches vers des «experts» virtuels virtuels dans le modèle. L'accumulation a réduit la consommation de ressources tout en augmentant les performances.

Luo Fuli estime que la Chine a besoin de plus de laboratoires d'IA. Elle insiste sur le fait que son pays devrait se concentrer sur des projets d'ingénierie pratiques et à grande échelle.

Luo Fuli a également été en tant que défenseurtronG pour une évolution vers la recherche qui privilégie les applications du monde réel. La nouvelle direction devrait garantir que les progrès de l'IA se traduisent par des avantages tangibles pour les entreprises et les consommateurs.

L'influence croissante du technicien de 29 ans dans l'industrie de l'IA n'est pas passée inaperçue. Selon les rapports du SCMP, le fondateur de Xiaomi lui a personnellement offert un forfait de rémunération annuel de 10 millions de yuans, mais il n'est pas clair si elle a accepté l'offre.

Votre nouvelle crypto mérite l'attention - la différence clé vous place sur plus de 250 sites supérieurs

Lien de partage:

Clause de non-responsabilité. Les informations fournies ne sont pas des conseils commerciaux. Cryptopolitan.com décline toute responsabilité pour les investissements effectués sur la base des informations fournies sur cette page. Nous tron vivement dent recherches indépendantes et/ou de consulter un professionnel qualifié avant de prendre toute décision d'investissement.

Les plus lus

Chargement des articles les plus lus...

Restez au courant de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte de réception

Choix de l'éditeur

Chargement des articles Choix de l'éditeur...

- la newsletter crypto qui vous maintient en tête -

Les marchés se déplacent rapidement.

Nous nous déplaçons plus vite.

Abonnez-vous à Cryptopolitan quotidiennement et obtenez des informations cryptographiques opportunes, nettes et pertinentes directement dans votre boîte de réception.

Rejoignez maintenant et
ne manquez jamais un déménagement.

Entrez. Obtenez les faits.
Avancez.

Abonnez-vous à CryptoPolitan