Your bank is using your money. You’re getting the scraps.WATCH FREE

DeepSeek presenta un nuevo método de razonamiento de IA en medio de la anticipación por su modelo de próxima generación

En esta publicación:

  • La startup china de inteligencia artificial DeepSeek ha presentado un nuevo método de razonamiento de IA mientras el mercado anticipa su modelo de próxima generación.
  • DeepSeek revela un nuevo método de razonamiento de IA mientras la compañía permanece reservada sobre un posible lanzamiento del modelo R2.
  • La startup china de inteligencia artificial se ha centrado en la investigación y el desarrollo y ha lanzado la versión mejorada de su modelo V3.

La startup china de inteligencia artificial (IA), DeepSeek, ha presentado un nuevo método de razonamiento mientras el mercado espera con ansias el lanzamiento de su modelo de próxima generación. Según informes, la compañía acaba de presentar un novedoso enfoque que mejorará las capacidades de razonamiento de los modelos de lenguaje de gran tamaño (LLM), mientras el público espera el lanzamiento de su nuevo modelo.

Según informes, un artículo publicado recientemente reveló que la hazaña se logró mediante la colaboración entre investigadores de la Universidad de Tsinghua y la startup de IA. Según el artículo, DeepSeek logró desarrollar una técnica que combina métodos conocidos como modelado generativo de recompensa (GRM) y ajuste basado en principios propios. Este enfoque dual permitirá a los LLM ofrecer resultados mejores y más rápidos para consultas generales.

DeepSeek revela un nuevo método de razonamiento de IA

Según los investigadores, los modelos DeepSeek-GRM resultantes superaron a los métodos existentes, logrando un rendimiento competitivo contronmodelos de recompensa pública. El modelado de recompensas es un proceso que ayuda a un LLM a determinar las preferencias humanas. Los investigadores mencionaron que la startup de IA pretende que los modelos GRM sean de código abierto, pero la compañía aún no ha anunciado un cronograma de desarrollo.

La publicación del artículo de investigación académica surge tras las especulaciones sobre el posible próximo paso de la startup tras enjatención global que generó su modelo base DeepSeek V3 y su modelo de razonamiento R1. En aquel momento, el modelo R1, lanzado a principios de este año, cobró relevancia tras descubrirse que tenía un rendimiento superior al de algunos modelos anteriores, incluido el primer modelo ChatGPT de OpenAI.

Véase también  El sector de la salud de Nueva Zelanda se embarca en una importante renovación de las TIC para mejorar la prestación de atención

El lanzamiento del modelo R1 también tomó por sorpresa a Silicon Valley, considerando que era de código abierto y se completó con una fracción de los costos de otros modelos de IA. Si bien la atención parece estar disminuyendo, se han producido avances notables entre empresas rivales en la industria de la IA, lo que demuestra que la rivalidad en el sector es histórica.

Sin embargo, un informe de Reuters del mes pasado mencionó que DeepSeek-2, el sucesor del mundialmente famoso R1, podría estar en desarrollo. Según el informe, la compañía podría estar considerando lanzarlo a finales de este mes, ya que busca capitalizar su creciente presencia en la industria de la IA. DeepSeek, por otro lado, ha mantenido silencio sobre el modelo R2, manteniendo silencio en los canales públicos oficiales. Una cuenta de servicio al cliente desmintió el rumor con clientes empresariales, según informes.

Continúa el desarrollo del modelo V3

DeepSeek, con sede en Hangzhou, fue fundada en 2023 por el empresario Liang Wenfeng y ha acaparado la atención mundial por buenas razones en los últimos meses. Sin embargo, la empresa se ha negado a hacer declaraciones públicas y ha decidido centrar toda su energía en la investigación y el desarrollo. Aunque aún queda por ver qué tiene la empresa preparada para la industria de la IA, sin duda se ha estado gestando, gracias a los rumores.

Véase también  El primer ministro Keir Starmer dice que el Reino Unido puede ahorrar 45.000 millones de libras con la IA

El mes pasado, la compañía anunció un desarrollo en el que ha estado trabajando, mostrando al mundo su modelo V3 mejorado, denominado DeepSeek-V3-0324. Según la firma, el modelo mejorado ofrecía "capacidades de razonamiento mejoradas, desarrollo web frontend optimizado y un dominio mejorado de la escritura en chino". En febrero, la compañía externalizó cinco de sus repositorios de código, lo que permitió a los desarrolladores revisar y contribuir al desarrollo de su software. La startup mencionó que realizaría "progresos significativos con total transparencia"

Ese mismo mes, Liang publicó un estudio técnico sobre la atención dispersa nativa, un método utilizado para mejorar la eficiencia de los LLM en el procesamiento de grandes cantidades de datos. Liang, de 40 años, también es el fundador de la empresa matriz de DeepSeek, High-Flyer Quant, el fondo de cobertura que ha proporcionado la capacidad financiera para financiar los avances técnicos de la startup de IA. A finales de febrero, el emprendedor participó en un simposio que reunió a emprendedores tecnológicos, organizado por el presidente chino, dent Jinping. El presidente dent a la startup como una muestra de la resiliencia del país ante las medidas de Estados Unidos para contener el progreso de la IA en China.

La tarjeta de criptomonedas sin límites de gasto. Obtén un 3 % cash y pagos móviles instantáneos. Solicita tu tarjeta Ether.fi.

Compartir enlace:

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitan no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamos encarecidamente realizar una investigación independiente tron consultar dent un profesional cualificado antes de tomar cualquier decisión de inversión.

Lo más leído

Cargando artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas, reciba actualizaciones diarias en su bandeja de entrada

Selección del editor

Cargando artículos de Elección del editor...

- El boletín de criptomonedas que te mantiene a la vanguardia -

Los mercados se mueven rápido.

Nos movemos más rápido.

Suscríbete a Cryptopolitan Daily y recibe información sobre criptomonedas actualizada, precisa y relevante directamente en tu bandeja de entrada.

Únete ahora y
no te pierdas ningún movimiento.

Entra. Infórmate.
Adelántate.

Suscríbete a CryptoPolitan