Your bank is using your money. You’re getting the scraps.WATCH FREE

Investigadores chinos revelan un avance en la compresión LLM

En esta publicación:

  • Investigadores chinos presentan ShortGPT, un novedoso sistema de compresión para LLM que supera los métodos de poda anteriores sin entrenamiento adicional.
  • ShortGPT aborda las limitaciones del hardware al reducir los parámetros y los cálculos sin comprometer el rendimiento del modelo.
  • China acoge con beneplácito la adopción de IA al tiempo que implementa regulaciones y medidas de control estrictas para prevenir el uso indebido en medio de una guerra fría tecnológica en ciernes.

Investigadores chinos han introducido una innovadora técnica de compresión destinada a abordar las limitaciones de hardware asociadas con la implementación de grandes modelos de lenguaje (LLM). Este nuevo enfoque, denominado ShortGPT, ha sido desarrollado por expertos de Baichuan Inc. y el Instituto de Software del Laboratorio de Procesamiento de la Información de China, de la Academia de Ciencias de China. El método se basa en técnicas de poda existentes y ofrece una solución para mitigar los costos de inferencia de los LLM sin necesidad de capacitación adicional.

Revolucionando la compresión de modelos

El método ShortGPT introduce una novedosa métrica conocida como Influencia de Bloque (BI) para evaluar las transformaciones de estado ocultas dentro de los LLM. Mediante el uso de puntuaciones de BI, el sistemadenty elimina parámetros redundantes, optimizando así el modelo para su implementación en hardware con recursos limitados. Este enfoque implica la poda de capas en función de su impacto en el rendimiento del modelo, garantizando así que solo se conserven los componentes esenciales.

Experimentos exhaustivos han demostrado la superioridad de ShortGPT sobre los métodos de poda de vanguardia (SOTA) existentes. A diferencia de los enfoques convencionales, que suelen basarse en métodos de cuantificación, ShortGPT funciona de formadent, lo que permite una reducción significativa de parámetros y una mayor eficiencia computacional sin comprometer la precisión del modelo. Esta innovación subraya la notable redundancia de las arquitecturas LLM y demuestra el potencial de las técnicas de compresión optimizadas.

Las ambiciones de China en materia de inteligencia artificial

En los últimos años, China ha adoptado una postura positiva respecto a la adopción de IA para seguir el ritmo de la innovación en Estados Unidos y Europa. El país está mejorando activamente las capacidades de los proveedores locales de servicios de IA, tecnología blockchain y computación cuántica en medio de una guerra fría en ciernes con Estados Unidos.

Véase también  Binance pierde otro ejecutivo clave en medio de obstáculos regulatorios

A pesar de su postura progresista, las autoridades chinas se esfuerzan por prevenir el uso indebido de la IA mediante la creación de regulaciones estrictas y medidas de control rigurosas. El ecosistema de IA de China continental es un hervidero de actividad, acentuado por una avalanche de lanzamientos comerciales de productos de IA generativa por parte de empresas tecnológicas.

La introducción de ShortGPT representa un hito significativo en el campo de la compresión de IA, prometiendo mayor eficiencia y rendimiento para modelos de lenguaje de gran tamaño. A medida que China continúa impulsando la innovación en inteligencia artificial, sus inversiones estratégicas e iniciativas de investigación posicionan al país como un actor clave en el panorama tecnológico global.

Hay un punto medio entre dejar el dinero en el banco y arriesgarse en criptomonedas. Empieza con este video gratuito sobre finanzas descentralizadas .

Compartir enlace:

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitan no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamos encarecidamente realizar una investigación independiente tron consultar dent un profesional cualificado antes de tomar cualquier decisión de inversión.

Lo más leído

Cargando artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas, reciba actualizaciones diarias en su bandeja de entrada

Selección del editor

Cargando artículos de Elección del editor...

- El boletín de criptomonedas que te mantiene a la vanguardia -

Los mercados se mueven rápido.

Nos movemos más rápido.

Suscríbete a Cryptopolitan Daily y recibe información sobre criptomonedas actualizada, precisa y relevante directamente en tu bandeja de entrada.

Únete ahora y
no te pierdas ningún movimiento.

Entra. Infórmate.
Adelántate.

Suscríbete a CryptoPolitan