Luo Fuli es un investigador de 29 años a quien los internautas y compañeros de trabajo en China dieron el apodo de "AI Prodigy". Ella es conocida por su papel fundamental en el desarrollo de Deepseek-V2. Este es el primer modelo de lenguaje de inteligencia artificial (IA) de China que podría ir cara a cara con el chatgpt de OpenAi.
Según el South China Morning Post, el modelo de lenguaje grande (LLM) fue lanzado por Deepseek el 26 de diciembre de 2024, y fue entrenado con muchos menos recursos que la llama de Meta.
En una entrevista con el medio de comunicación chino 36Kr, el fundador de Deepseek, Liang Wenfeng, dijo que al reclutar talento, la compañía prioriza la habilidad sobre la experiencia. Las fuentes de noticias locales sugieren que el equipo de desarrolladores en la startup consiste en principalmente graduados y estudiantes dent .
"Nuestros roles técnicos principales están llenos de principalmente graduados nuevos o aquellos con uno o dos años de experiencia laboral", explicó.
Esta estrategia ha ayudado a Deepseek a construir un equipo de jóvenes investigadores ambiciosos, incluidos Gao Huazuo y Zeng Wangding. Los dos han sido acreditados con innovaciones clave en MLA Architecture.
Luo Fuli: Aprovecharse en la informática valió la pena
Entre los desarrolladores más buscados de la compañía se encuentra Luo Fuli. Se dice que es una experta tecnológica "inteligente" y sincera con antecedentes detronG en el procesamiento del lenguaje natural (PNL). Según los informes, Fuli fue mencionado en un entorno modesto. Se dice que su interés en la tecnología podría haber surgido de su padre, un ingeniero eléctrico.
El aumento de Luo en el campo de la IA comenzó en el Instituto de Lingüística Computacional de la Universidad de Pekín. Informes no confirmados de profundas inmersiones y el estado de las redes sociales que inicialmente no estaba segura de estudiar la informática. Fuli incluso falló varias veces mientras lo hacía.
Sin embargo, finalmente encontró su pasión por la IA y se hizo un nombre a través de una investigación innovadora. Además, se rumorea que Luo recibió invitaciones y ofertas de trabajo mientras todavía estaba en la escuela, pero las rechazó todos.
En 2019, llamó la atención del sector tecnológico chino después de publicar ocho documentos sobre PNL en la Conferencia de la Asociación de Lingüística Computacional (ACL).
Su conocimiento y aportes en la PNL la vieron recibir varias ofertas de las principales empresas de tecnología, particularmente Alibaba.
En la Academia Damo de Alibaba, Luo contribuyó a VECO, un modelo de IA multilingüe. Trabajó en el proyecto Alicemind de código abierto de la compañía, ayudando al mercado en línea a avanzar en sus iniciativas de IA. Sin embargo, sus ambiciones crecieron más allá de la investigación corporativa. Con ese fin, se unió a un papel en Deepseek AI liderado por Wengfeng en 2022 como investigadora principal.
Luo Fuli y el joven equipo de desarrolladores de Deepseek AI
Al principio, Luo fue parte del equipo que actualizó Deepseek-V2. Este es un modelo de lenguaje grande rentable que los lugareños apodaron "Ai Pinduoduo", una referencia al gigante chino de comercio electrónico en línea conocido por sus precios asequibles.
Feminismo con características chinas.
¡Este es Luo Fuli, un prodigio de Deepseek y autor de 8 AI Papers!
Obtuvo su maestría de la Universidad de Pekín en 2020.
Trabajó en Alibaba, se unió a Deepseek en 2022, hizo cosas increíbles, ¡y ahora ha sido "robada" por Xiaomi AI Lab! pic.twitter.com/mcz3ahxkvj
- SL Kanthan (@Kanthan2030) 29 de enero de 2025
Hablando en una conferencia tecnológica en 2023, Luo sacó a la luz cómo el modelo ofrece capacidades de idioma chino de primer nivel. Esto rivalizó incluso los mejores sistemas de IA globales como ChatGPT y QWEI.
Luo Fuli atribuyó el éxito de Deepseek-V2 a una combinación de arquitectura innovadora, infraestructura robusta y el compromiso de la compañía con la transparencia. Durante su tiempo en la compañía, Deepseek compartió abiertamente sus informes técnicos, pesos de modelos y código de inferencia en GitHub. Esto tenía como objetivo actualizar su enfoque de código abierto para el desarrollo de la IA.
Deepseek AI: la tecnología de código abierto en su pico
Una de las características destacadas de Deepseek-V2 es su uso de la atención de atención múltiple (MLA) y la mezcla de la arquitectura de expertos (MOE). MLA permite que el modelo se concentre en diferentes niveles de información textual, por cómo un lector humano procesa un libro. Cambió la atención entre oraciones, párrafos y capítulos dependiendo del contexto.
Mientras tanto, MOE optimiza la eficiencia computacional mediante la dirección de tareas a "expertos" virtuales seleccionados dentro del modelo. La acumulación redujo el consumo de recursos durante el crecimiento creciente.
Luo Fuli cree que China necesita más laboratorios de IA. Ella insiste en que su país debería centrarse en proyectos de ingeniería prácticos y a gran escala.
Luo Fuli también ha sido un defensortronG por un cambio hacia una investigación que prioriza las aplicaciones del mundo real. La nueva dirección debe garantizar que los avances de IA se traduzcan en beneficios tangibles para empresas y consumidores.
La creciente influencia del técnico de 29 años en la industria de la IA no ha pasado desapercibido. Según los informes del SCMP, el fundador de Xiaomi le ofreció personalmente un paquete de compensación anual de 10 millones de yuanes, pero no está claro si aceptó la oferta.
Academia Cryptopolitan: Próximamente, una nueva forma de obtener ingresos pasivos con DeFi en 2025. Obtenga más información