COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

Deepseek presenta un nuevo método de razonamiento de IA en medio de la anticipación para su modelo de próxima generación

En esta publicación:

  • La startup de inteligencia artificial china Deepseek ha presentado un nuevo método de razonamiento de IA mientras el mercado anticipa su modelo de próxima generación.
  • Deepseek revela un nuevo método de razonamiento de IA ya que la compañía permanece con los labios apretados de un posible lanzamiento del modelo R2.
  • La startup de IA china se ha centrado en la investigación y el desarrollo, lanzando la versión mejorada de su modelo V3.

La startup de inteligencia artificial (AI) china, Deepseek, ha presentado un nuevo método de razonamiento a medida que el mercado continúa anticipando el lanzamiento de su modelo de próxima generación. Según los informes, la compañía acaba de presentar un enfoque novedoso que ayudará a las capacidades de razonamiento de los grandes modelos de idiomas (LLM), mientras el público espera el lanzamiento de su nuevo modelo.

Según los informes, un artículo publicado recientemente reveló que la hazaña se logró a través de una colaboración entre investigadores de la Universidad de Tsinghua y la startup de IA. Según el artículo, Deepseek pudo desarrollar una técnica que combine métodos denominados modelado de recompensa generativo (GRM) y ajuste autoinscípido. El enfoque dual permitirá que LLM entregue resultados mejores y más rápidos a las consultas generales.

Deepseek revela un nuevo método de razonamiento de IA

Según los investigadores, los modelos resultantes de Deepseek-GRM pudieron superar los métodos existentes, logrando un rendimiento competitivo con modelos de recompensa pública detronG. El modelado de recompensas es un proceso que ayuda a un LLM a determinar las preferencias humanas. Los investigadores mencionaron que la startup de IA tiene la intención de hacer que los modelos GRM sean de código abierto, pero la compañía aún no ha dado una línea de tiempo para el desarrollo.

El documento de investigación académica publicado se presenta después de las especulaciones sobre el próximo movimiento potencial de la startup después de enjatención global que recogió de su modelo de la Fundación Deepseek V3 y su modelo de razonamiento R1. En ese momento, el modelo R1, que se lanzó a principios de este año, ganó prominencia después de que se descubrió que se desempeñó mejor que algunos modelos más antiguos, incluido el primer modelo CHATGPT de Openai.

Consulte también  Arbitrum Foundation sale acelerador de IA respaldado por Nvidia después de la disputa de marca

El lanzamiento del modelo R1 también atrapó a Silicon Valley desprevenido, considerando el hecho de que el modelo era de código abierto y se completó con una fracción de los costos utilizados en otros modelos de IA. Si bien la atención parece estar disminuyendo, ha habido un progreso notable entre las empresas rivales en la industria de la IA, lo que demuestra que la rivalidad en el sector es para las edades.

Sin embargo, un informe de Reuters el mes pasado mencionó que Deepseek-2, el sucesor de la celebración mundial de R1 podría estar en proceso. Según el informe, la compañía podría estar buscando liberarlo hacia fines de este mes, ya que busca capitalizar su perfil creciente en la industria de la IA. Deepseek, por otro lado, se ha mantenido en el modelo R2, manteniendo el silencio en los canales públicos oficiales, con una cuenta de servicio al cliente que niega el rumor con los clientes comerciales, según los informes.

El desarrollo en el modelo V3 continúa

Deepseek, con sede en Hangzhou, fue fundada en 2023 por el empresario Liang Wenfeng y ha estado en el centro de atención mundial por las razones correctas en los últimos meses. Sin embargo, la compañía se ha negado a hacer comunicaciones públicas, decidiendo enfocar todo su tiempo y energía en la investigación y el desarrollo. Si bien queda por ver lo que la compañía tiene para la industria de la IA, seguramente ha estado cocinando, gracias a los rumores.

Ver también  Vivek Shah, liderado por Ziff Davis, demanda a la empresa matriz de Chatgpt, Openai

El mes pasado, la compañía anunció un desarrollo en el que ha estado trabajando, mostrando su modelo V3 mejorado llamado Deepseek-V3-0324 al mundo. Según la empresa, el modelo actualizado ofreció "capacidades de razonamiento mejoradas, desarrollo web optimizado de front-end y competencia de escritura china actualizada". En febrero, la compañía superó a cinco de sus repositorios de código, permitiendo a los desarrolladores revisar y contribuir a su desarrollo de software. La startup mencionó que haría "progreso sincero con plena transparencia".

En el mismo mes, Liang publicó un estudio técnico sobre atención escasa nativa, un método utilizado para mejorar la eficiencia de los LLM en el procesamiento de grandes cantidades de datos. Liang, de 40 años, también es el fundador de la firma matriz de Deepseek, High-Flyer Quant, el fondo de cobertura que ha proporcionado la destreza financiera para financiar los avances técnicos de la startup de IA. A fines de febrero, el emprendedor era parte de un simposio que reunió a los empresarios tecnológicos, con el presitado chino dent Jinping que los recibía. El Presi dent elogió la startup como una señal de la resistencia del país frente a los movimientos de los Estados Unidos para contener el progreso de la IA de China.

Academia Cryptopolitan: Próximamente, una nueva forma de obtener ingresos pasivos con DeFi en 2025. Obtenga más información

Compartir enlace:

Descargo de responsabilidad. La información proporcionada no es un consejo comercial. Cryptopolitan.com no asume ninguna responsabilidad por las inversiones realizadas en función de la información proporcionada en esta página. Recomendamos tron dent independiente y/o la consulta con un profesional calificado antes de tomar cualquier decisión de inversión.

Mas leido

Cargando los artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada

elección del editor

Cargando artículos elegidos por el editor...

- El boletín de cifrado que te mantiene por delante -

Los mercados se mueven rápidamente.

Nos movemos más rápido.

Suscríbase a Cryptopolitan diariamente y obtenga ideas criptográficas oportunas, agudas y relevantes directamente a su bandeja de entrada.

Únete ahora y
nunca te pierdas un movimiento.

Entra. Obtén los hechos.
Adelantarse.

Suscríbete a CryptoPolitan