La startup de inteligencia artificial (AI) china, Deepseek, ha presentado un nuevo método de razonamiento a medida que el mercado continúa anticipando el lanzamiento de su modelo de próxima generación. Según los informes, la compañía acaba de presentar un enfoque novedoso que ayudará a las capacidades de razonamiento de los grandes modelos de idiomas (LLM), mientras el público espera el lanzamiento de su nuevo modelo.
Según los informes, un artículo publicado recientemente reveló que la hazaña se logró a través de una colaboración entre investigadores de la Universidad de Tsinghua y la startup de IA. Según el artículo, Deepseek pudo desarrollar una técnica que combine métodos denominados modelado de recompensa generativo (GRM) y ajuste autoinscípido. El enfoque dual permitirá que LLM entregue resultados mejores y más rápidos a las consultas generales.
Deepseek revela un nuevo método de razonamiento de IA
Según los investigadores, los modelos resultantes de Deepseek-GRM pudieron superar los métodos existentes, logrando un rendimiento competitivo con modelos de recompensa pública detronG. El modelado de recompensas es un proceso que ayuda a un LLM a determinar las preferencias humanas. Los investigadores mencionaron que la startup de IA tiene la intención de hacer que los modelos GRM sean de código abierto, pero la compañía aún no ha dado una línea de tiempo para el desarrollo.
El documento de investigación académica publicado se presenta después de las especulaciones sobre el próximo movimiento potencial de la startup después de enjatención global que recogió de su modelo de la Fundación Deepseek V3 y su modelo de razonamiento R1. En ese momento, el modelo R1, que se lanzó a principios de este año, ganó prominencia después de que se descubrió que se desempeñó mejor que algunos modelos más antiguos, incluido el primer modelo CHATGPT de Openai.
El lanzamiento del modelo R1 también atrapó a Silicon Valley desprevenido, considerando el hecho de que el modelo era de código abierto y se completó con una fracción de los costos utilizados en otros modelos de IA. Si bien la atención parece estar disminuyendo, ha habido un progreso notable entre las empresas rivales en la industria de la IA, lo que demuestra que la rivalidad en el sector es para las edades.
Sin embargo, un informe de Reuters el mes pasado mencionó que Deepseek-2, el sucesor de la celebración mundial de R1 podría estar en proceso. Según el informe, la compañía podría estar buscando liberarlo hacia fines de este mes, ya que busca capitalizar su perfil creciente en la industria de la IA. Deepseek, por otro lado, se ha mantenido en el modelo R2, manteniendo el silencio en los canales públicos oficiales, con una cuenta de servicio al cliente que niega el rumor con los clientes comerciales, según los informes.
El desarrollo en el modelo V3 continúa
Deepseek, con sede en Hangzhou, fue fundada en 2023 por el empresario Liang Wenfeng y ha estado en el centro de atención mundial por las razones correctas en los últimos meses. Sin embargo, la compañía se ha negado a hacer comunicaciones públicas, decidiendo enfocar todo su tiempo y energía en la investigación y el desarrollo. Si bien queda por ver lo que la compañía tiene para la industria de la IA, seguramente ha estado cocinando, gracias a los rumores.
El mes pasado, la compañía anunció un desarrollo en el que ha estado trabajando, mostrando su modelo V3 mejorado llamado Deepseek-V3-0324 al mundo. Según la empresa, el modelo actualizado ofreció "capacidades de razonamiento mejoradas, desarrollo web optimizado de front-end y competencia de escritura china actualizada". En febrero, la compañía superó a cinco de sus repositorios de código, permitiendo a los desarrolladores revisar y contribuir a su desarrollo de software. La startup mencionó que haría "progreso sincero con plena transparencia".
En el mismo mes, Liang publicó un estudio técnico sobre atención escasa nativa, un método utilizado para mejorar la eficiencia de los LLM en el procesamiento de grandes cantidades de datos. Liang, de 40 años, también es el fundador de la firma matriz de Deepseek, High-Flyer Quant, el fondo de cobertura que ha proporcionado la destreza financiera para financiar los avances técnicos de la startup de IA. A fines de febrero, el emprendedor era parte de un simposio que reunió a los empresarios tecnológicos, con el presitado chino dent Jinping que los recibía. El Presi dent elogió la startup como una señal de la resistencia del país frente a los movimientos de los Estados Unidos para contener el progreso de la IA de China.
Academia Cryptopolitan: Próximamente, una nueva forma de obtener ingresos pasivos con DeFi en 2025. Obtenga más información