DeepSeek presenta un nuevo método de razonamiento de IA en medio de la anticipación por su modelo de próxima generación

Por

Owotunse Adebayo

3 minutos de lectura 6 de abril de 2025

Deepseek presenta un nuevo método de razonamiento de IA en medio de la anticipación por su modelo de próxima generación.

La startup china de inteligencia artificial DeepSeek ha presentado un nuevo método de razonamiento de IA mientras el mercado anticipa su modelo de próxima generación.
DeepSeek revela un nuevo método de razonamiento de IA mientras la compañía permanece reservada sobre un posible lanzamiento del modelo R2.
La startup china de inteligencia artificial se ha centrado en la investigación y el desarrollo y ha lanzado la versión mejorada de su modelo V3.

La startup china de inteligencia artificial (IA), DeepSeek, ha presentado un nuevo método de razonamiento mientras el mercado espera con ansias el lanzamiento de su modelo de próxima generación. Según informes, la compañía acaba de presentar un novedoso enfoque que mejorará las capacidades de razonamiento de los modelos de lenguaje de gran tamaño (LLM), mientras el público espera el lanzamiento de su nuevo modelo.

Según informes, un artículo publicado recientemente reveló que la hazaña se logró mediante la colaboración entre investigadores de la Universidad de Tsinghua y la startup de IA. Según el artículo, DeepSeek logró desarrollar una técnica que combina métodos conocidos como modelado generativo de recompensa (GRM) y ajuste basado en principios propios. Este enfoque dual permitirá a los LLM ofrecer resultados mejores y más rápidos para consultas generales.

DeepSeek revela un nuevo método de razonamiento de IA

Según los investigadores, los modelos DeepSeek-GRM resultantes superaron a los métodos existentes, logrando un rendimiento competitivo contronmodelos de recompensa pública. El modelado de recompensas es un proceso que ayuda a un LLM a determinar las preferencias humanas. Los investigadores mencionaron que la startup de IA pretende que los modelos GRM sean de código abierto, pero la compañía aún no ha anunciado un cronograma de desarrollo.

La publicación del artículo de investigación académica surge tras las especulaciones sobre el posible próximo paso de la startup tras enjatención global que generó su modelo base DeepSeek V3 y su modelo de razonamiento R1. En aquel momento, el modelo R1, lanzado a principios de este año, cobró relevancia tras descubrirse que tenía un rendimiento superior al de algunos modelos anteriores, incluido el primer modelo ChatGPT de OpenAI.

El lanzamiento del modelo R1 también tomó por sorpresa a Silicon Valley, considerando que era de código abierto y se completó con una fracción de los costos de otros modelos de IA. Si bien la atención parece estar disminuyendo, se han producido avances notables entre empresas rivales en la industria de la IA, lo que demuestra que la rivalidad en el sector es histórica.

Sin embargo, un informe de Reuters del mes pasado mencionó que DeepSeek-2, el sucesor del mundialmente famoso R1, podría estar en desarrollo. Según el informe, la compañía podría estar considerando lanzarlo a finales de este mes, ya que busca capitalizar su creciente presencia en la industria de la IA. DeepSeek, por otro lado, ha mantenido silencio sobre el modelo R2, manteniendo silencio en los canales públicos oficiales. Una cuenta de servicio al cliente desmintió el rumor con clientes empresariales, según informes.

Continúa el desarrollo del modelo V3

DeepSeek, con sede en Hangzhou, fue fundada en 2023 por el empresario Liang Wenfeng y ha acaparado la atención mundial por buenas razones en los últimos meses. Sin embargo, la empresa se ha negado a hacer declaraciones públicas y ha decidido centrar toda su energía en la investigación y el desarrollo. Aunque aún queda por ver qué tiene la empresa preparada para la industria de la IA, sin duda se ha estado gestando, gracias a los rumores.

El mes pasado, la compañía anunció un desarrollo en el que ha estado trabajando, mostrando al mundo su modelo V3 mejorado, denominado DeepSeek-V3-0324. Según la firma, el modelo mejorado ofrecía "capacidades de razonamiento mejoradas, desarrollo web frontend optimizado y un dominio mejorado de la escritura en chino". En febrero, la compañía externalizó cinco de sus repositorios de código, lo que permitió a los desarrolladores revisar y contribuir al desarrollo de su software. La startup mencionó que realizaría "progresos significativos con total transparencia"

En ese mismo mes, Liang publicó un estudio técnico sobre la atención dispersa nativa, un método utilizado para mejorar la eficiencia de los modelos lineales de aprendizaje (MLA) en el procesamiento de grandes cantidades de datos. Liang, de 40 años, es también el fundador de High-Flyer Quant, la empresa matriz de DeepSeek, el fondo de cobertura que ha proporcionado el respaldo financiero para impulsar los avances técnicos de la startup de IA. A finales de febrero, el emprendedor participó en un simposio que reunió a emprendedores tecnológicos, con el presidente chinodent Jinping como anfitrión. El presidentedent a la startup como una muestra de la resiliencia del país frente a las medidas de Estados Unidos para contener el progreso de China en el campo de la IA.

No te limites a leer noticias sobre criptomonedas. Entiéndelas. Suscríbete a nuestro boletín. Es gratis.

Búsqueda profunda del Año Nuevo Chino

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Owotunse Adebayo

Adebayo es un escritor con cuatro años de experiencia en el sector de las criptomonedas. Se graduó de la Universidad de Lagos, donde estudió Planificación Urbana y Regional. Ha trabajado en Tokenhell y CryptoTicker, escribiendo noticias sobre criptomonedas y tecnología financiera. Actualmente colabora en Cryptopolitan.

ÍNDICE

1. DeepSeek revela un nuevo método de razonamiento de IA

2. Continúa el desarrollo del modelo V3

Comparte este artículo