Luo Fuli est un chercheur de 29 ans que les internautes et les collègues en Chine ont donné le surnom de «prodigy AI». Elle est connue pour son rôle central dans le développement de Deepseek-V2. Il s'agit du premier modèle de langue de l'intelligence artificielle (IA) de la Chine qui pourrait aller de côté avec le chatppt d'Openai.
Selon le South China Morning Post, le modèle de grande langue (LLM) a été lancé par Deepseek le 26 décembre 2024, et il a été formé avec beaucoup moins de ressources que le lama de Meta.
Dans une interview avec Chinese Media Outlet 36KR, le fondateur de Deepseek, Liang Wenfeng, a déclaré que lors du recrutement de talents, l'entreprise privilégie la capacité de l'expérience. Des sources d'information locales suggèrent que l'équipe de développeurs de la startup se compose principalement de diplômés et de étudiants dent .
«Nos rôles techniques de base sont remplis de diplômés principalement frais ou de ceux qui ont un ou deux ans d'expérience de travail», a-t-il expliqué.
Cette stratégie a aidé Deepseek à constituer une équipe de jeunes chercheurs ambitieux, notamment Gao Huazuo et Zeng Wangding. Les deux ont été crédités des innovations clés dans l'architecture MLA.
Luo Fuli: Prendre une chance en informatique a payé
Parmi les développeurs les plus recherchés de l'entreprise, il y a Luo Fuli. Elle serait une experte en technologie «certifiée» et sincère avec des antécédentstrong dans le traitement du langage naturel (PNL). Fuli aurait été élevé dans un environnement modeste. On dit que son intérêt pour la technologie pourrait provenir de son père, un ingénieur électricien.
La montée en puissance de Luo dans le domaine de l'IA a commencé à l'Institut de linguistique informatique de l'Université de Pékin. Des rapports non confirmés de plongées profondes et de médias sociaux ont été initialement incertaines de l'étude de l'informatique. Fuli a même échoué plusieurs fois.
Cependant, elle a finalement trouvé sa passion pour l'IA et s'est fait un nom à travers des recherches révolutionnaires. De plus, il est dit que Luo a reçu des invitations à l'emploi et des offres alors qu'elle était encore à l'école, mais elle les a tous refusés.
En 2019, elle a attiré l'attention du secteur de la technologie chinoise après avoir publié huit articles sur la PNL lors de la conférence Association for Computational Linguistics (ACL).
Ses connaissances et ses contributions dans la PNL l'ont vue recevoir plusieurs offres de grandes entreprises technologiques, en particulier Alibaba.
À la Damo Academy d'Alibaba, Luo a contribué à Veco, un modèle d'IA multilingue. Elle a travaillé sur le projet Open-source de l'entreprise Alicemind, aidant le marché en ligne à progresser ses initiatives d'IA. Cependant, ses ambitions ont augmenté au-delà de la recherche d'entreprise. À cette fin, elle a rejoint un rôle chez Deepseek AI, dirigé par Wengfeng en 2022 en tant que chercheur principal.
Luo Fuli et la jeune équipe de développeurs de Deepseek AI
Au tout début, Luo faisait partie de l'équipe qui a actualisé Deepseek-V2. Il s'agit d'un modèle de langue grand rentable que les habitants ont surnommé «AI Pinduoduo» - une référence au géant chinois en ligne du commerce électronique connu pour ses prix abordables.
Féminisme avec les caractéristiques chinoises.
Voici Luo Fuli, un prodige à Deepseek et auteur de 8 papiers AI!
Elle a obtenu sa maîtrise de l'Université de Pékin en 2020.
Travaillé à Alibaba, rejoint Deepseek en 2022, a fait des trucs incroyables et a maintenant été «volé» par Xiaomi AI Lab! pic.twitter.com/mcz3ahxkvj
- Sl Kanthan (@ Kanthan2030) 29 janvier 2025
S'exprimant lors d'une conférence technologique en 2023, Luo a révélé comment le modèle offre des capacités de langue chinoise de haut niveau. Cela rivalisait même les meilleurs systèmes d'IA mondiaux comme Chatgpt et Qwei.
Luo Fuli a attribué le succès de Deepseek-V2 à une combinaison d'architecture innovante, d'infrastructures robustes et de l'engagement de l'entreprise envers la transparence. Pendant son séjour à l'entreprise, Deepseek a partagé ouvertement ses rapports techniques, ses poids de modèle et son code d'inférence sur GitHub. Cela visait à réaliser son approche open source du développement de l'IA.
Deepseek AI - La technologie open source à son apogée
L'une des caractéristiques remarquables de Deepseek-V2 est son utilisation de l'attention à plusieurs niveaux (MLA) et de l'architecture du mélange d'experts (MOE). MLA permet au modèle de se concentrer sur différents niveaux d'informations textuelles - à savoir comment un lecteur humain traite un livre. Il a déplacé l'attention entre les phrases, les paragraphes et les chapitres en fonction du contexte.
Pendant ce temps, le MOE optimise l'efficacité informatique en dirigeant des tâches vers des «experts» virtuels virtuels dans le modèle. L'accumulation a réduit la consommation de ressources tout en augmentant les performances.
Luo Fuli estime que la Chine a besoin de plus de laboratoires d'IA. Elle insiste sur le fait que son pays devrait se concentrer sur des projets d'ingénierie pratiques et à grande échelle.
Luo Fuli a également été en tant que défenseurtronG pour une évolution vers la recherche qui privilégie les applications du monde réel. La nouvelle direction devrait garantir que les progrès de l'IA se traduisent par des avantages tangibles pour les entreprises et les consommateurs.
L'influence croissante du technicien de 29 ans dans l'industrie de l'IA n'est pas passée inaperçue. Selon les rapports du SCMP, le fondateur de Xiaomi lui a personnellement offert un forfait de rémunération annuel de 10 millions de yuans, mais il n'est pas clair si elle a accepté l'offre.
Votre nouvelle crypto mérite l'attention - la différence clé vous place sur plus de 250 sites supérieurs