COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

Conoce a Luo Fuli: La AI Pro detrás del modelo de código abierto de Deepseek y la tecnología MLA

En esta publicación:

  • Luo Fuli, un investigador de inteligencia artificial de 29 años, ayudó a desarrollar Deepseek-V2, el primer modelo de IA de China que rivaliza con el chatgpt de OpenAI.
  • Luo Fuli obtuvo reconocimiento después de publicar ocho documentos de PNL en ACL en 2019, luego trabajando en Alibaba antes de unirse a Deepseek AI en 2022.
  • Luo aboga por una investigación de IA más práctica en China después del éxito de Deepseek-V2 con MLA y MOE Architecture.

Luo Fuli es un investigador de 29 años a quien los internautas y compañeros de trabajo en China dieron el apodo de "AI Prodigy". Ella es conocida por su papel fundamental en el desarrollo de Deepseek-V2. Este es el primer modelo de lenguaje de inteligencia artificial (IA) de China que podría ir cara a cara con el chatgpt de OpenAi.

Según el South China Morning Post, el modelo de lenguaje grande (LLM) fue lanzado por Deepseek el 26 de diciembre de 2024, y fue entrenado con muchos menos recursos que la llama de Meta.

En una entrevista con el medio de comunicación chino 36Kr, el fundador de Deepseek, Liang Wenfeng, dijo que al reclutar talento, la compañía prioriza la habilidad sobre la experiencia. Las fuentes de noticias locales sugieren que el equipo de desarrolladores en la startup consiste en principalmente graduados y estudiantes dent .

"Nuestros roles técnicos principales están llenos de principalmente graduados nuevos o aquellos con uno o dos años de experiencia laboral", explicó.

Esta estrategia ha ayudado a Deepseek a construir un equipo de jóvenes investigadores ambiciosos, incluidos Gao Huazuo y Zeng Wangding. Los dos han sido acreditados con innovaciones clave en MLA Architecture.

Luo Fuli: Aprovecharse en la informática valió la pena

Entre los desarrolladores más buscados de la compañía se encuentra Luo Fuli. Se dice que es una experta tecnológica "inteligente" y sincera con antecedentes detronG en el procesamiento del lenguaje natural (PNL). Según los informes, Fuli fue mencionado en un entorno modesto. Se dice que su interés en la tecnología podría haber surgido de su padre, un ingeniero eléctrico.

El aumento de Luo en el campo de la IA comenzó en el Instituto de Lingüística Computacional de la Universidad de Pekín. Informes no confirmados de profundas inmersiones y el estado de las redes sociales que inicialmente no estaba segura de estudiar la informática. Fuli incluso falló varias veces mientras lo hacía.

Consulte también  Vitalik Buterin aboga por los sistemas de IA guiados por humanos para preservar los valores y prevenir la centralización de la potencia

Sin embargo, finalmente encontró su pasión por la IA y se hizo un nombre a través de una investigación innovadora. Además, se rumorea que Luo recibió invitaciones y ofertas de trabajo mientras todavía estaba en la escuela, pero las rechazó todos.

En 2019, llamó la atención del sector tecnológico chino después de publicar ocho documentos sobre PNL en la Conferencia de la Asociación de Lingüística Computacional (ACL).

Su conocimiento y aportes en la PNL la vieron recibir varias ofertas de las principales empresas de tecnología, particularmente Alibaba.

En la Academia Damo de Alibaba, Luo contribuyó a VECO, un modelo de IA multilingüe. Trabajó en el proyecto Alicemind de código abierto de la compañía, ayudando al mercado en línea a avanzar en sus iniciativas de IA. Sin embargo, sus ambiciones crecieron más allá de la investigación corporativa. Con ese fin, se unió a un papel en Deepseek AI liderado por Wengfeng en 2022 como investigadora principal.

Luo Fuli y el joven equipo de desarrolladores de Deepseek AI

Al principio, Luo fue parte del equipo que actualizó Deepseek-V2. Este es un modelo de lenguaje grande rentable que los lugareños apodaron "Ai Pinduoduo", una referencia al gigante chino de comercio electrónico en línea conocido por sus precios asequibles. 

Hablando en una conferencia tecnológica en 2023, Luo sacó a la luz cómo el modelo ofrece capacidades de idioma chino de primer nivel. Esto rivalizó incluso los mejores sistemas de IA globales como ChatGPT y QWEI.

Ver también  las ganancias de Nvidia para probar el rally de acciones de IA como 'Magnífico siete' tropiezan

Luo Fuli atribuyó el éxito de Deepseek-V2 a una combinación de arquitectura innovadora, infraestructura robusta y el compromiso de la compañía con la transparencia. Durante su tiempo en la compañía, Deepseek compartió abiertamente sus informes técnicos, pesos de modelos y código de inferencia en GitHub. Esto tenía como objetivo actualizar su enfoque de código abierto para el desarrollo de la IA.

Deepseek AI: la tecnología de código abierto en su pico

Una de las características destacadas de Deepseek-V2 es su uso de la atención de atención múltiple (MLA) y la mezcla de la arquitectura de expertos (MOE). MLA permite que el modelo se concentre en diferentes niveles de información textual, por cómo un lector humano procesa un libro. Cambió la atención entre oraciones, párrafos y capítulos dependiendo del contexto. 

Mientras tanto, MOE optimiza la eficiencia computacional mediante la dirección de tareas a "expertos" virtuales seleccionados dentro del modelo. La acumulación redujo el consumo de recursos durante el crecimiento creciente.

Luo Fuli cree que China necesita más laboratorios de IA. Ella insiste en que su país debería centrarse en proyectos de ingeniería prácticos y a gran escala.

Luo Fuli también ha sido un defensortronG por un cambio hacia una investigación que prioriza las aplicaciones del mundo real. La nueva dirección debe garantizar que los avances de IA se traduzcan en beneficios tangibles para empresas y consumidores.

La creciente influencia del técnico de 29 años en la industria de la IA no ha pasado desapercibido. Según los informes del SCMP, el fundador de Xiaomi le ofreció personalmente un paquete de compensación anual de 10 millones de yuanes, pero no está claro si aceptó la oferta.

Academia Cryptopolitan: Próximamente, una nueva forma de obtener ingresos pasivos con DeFi en 2025. Obtenga más información

Compartir enlace:

Descargo de responsabilidad. La información proporcionada no es un consejo comercial. Cryptopolitan.com no asume ninguna responsabilidad por las inversiones realizadas en función de la información proporcionada en esta página. Recomendamos tron dent independiente y/o la consulta con un profesional calificado antes de tomar cualquier decisión de inversión.

Mas leido

Cargando los artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada

elección del editor

Cargando artículos elegidos por el editor...
Suscríbete a CryptoPolitan