ÚLTIMAS NOTICIAS
SELECCIONADO PARA TI
SEMANALMENTE
MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

Investigadores chinos revelan un avance en la compresión LLM

PorGloria KaburuGloria Kaburu
Lectura de 2 minutos.
Chino

  • Investigadores chinos presentan ShortGPT, un novedoso sistema de compresión para LLM que supera los métodos de poda anteriores sin entrenamiento adicional.
  • ShortGPT aborda las limitaciones del hardware al reducir los parámetros y los cálculos sin comprometer el rendimiento del modelo.
  • China acoge con beneplácito la adopción de IA al tiempo que implementa regulaciones y medidas de control estrictas para prevenir el uso indebido en medio de una guerra fría tecnológica en ciernes.

Investigadores chinos han introducido una innovadora técnica de compresión destinada a abordar las limitaciones de hardware asociadas con la implementación de grandes modelos de lenguaje (LLM). Este nuevo enfoque, denominado ShortGPT, ha sido desarrollado por expertos de Baichuan Inc. y el Instituto de Software del Laboratorio de Procesamiento de la Información de China, de la Academia de Ciencias de China. El método se basa en técnicas de poda existentes y ofrece una solución para mitigar los costos de inferencia de los LLM sin necesidad de capacitación adicional.

Revolucionando la compresión de modelos

El método ShortGPT introduce una novedosa métrica conocida como Influencia de Bloque (BI) para evaluar las transformaciones de estado ocultas dentro de los LLM. Mediante el uso de puntuaciones de BI, el sistemadenty elimina parámetros redundantes, optimizando así el modelo para su implementación en hardware con recursos limitados. Este enfoque implica la poda de capas en función de su impacto en el rendimiento del modelo, garantizando así que solo se conserven los componentes esenciales.

Experimentos exhaustivos han demostrado la superioridad de ShortGPT sobre los métodos de poda de vanguardia (SOTA) existentes. A diferencia de los enfoques convencionales, que suelen basarse en métodos de cuantificación, ShortGPT funciona de formadent, lo que permite una reducción significativa de parámetros y una mayor eficiencia computacional sin comprometer la precisión del modelo. Esta innovación subraya la notable redundancia de las arquitecturas LLM y demuestra el potencial de las técnicas de compresión optimizadas.

Las ambiciones de China en materia de inteligencia artificial

En los últimos años, China ha adoptado una postura positiva respecto a la adopción de IA para seguir el ritmo de la innovación en Estados Unidos y Europa. El país está mejorando activamente las capacidades de los proveedores locales de servicios de IA, tecnología blockchain y computación cuántica en medio de una guerra fría en ciernes con Estados Unidos.

A pesar de su postura progresista, las autoridades chinas se esfuerzan por prevenir el uso indebido de la IA mediante la creación de regulaciones estrictas y medidas de control rigurosas. El ecosistema de IA de China continental es un hervidero de actividad, acentuado por una avalanche de lanzamientos comerciales de productos de IA generativa por parte de empresas tecnológicas.

La introducción de ShortGPT representa un hito significativo en el campo de la compresión de IA, prometiendo mayor eficiencia y rendimiento para modelos de lenguaje de gran tamaño. A medida que China continúa impulsando la innovación en inteligencia artificial, sus inversiones estratégicas e iniciativas de investigación posicionan al país como un actor clave en el panorama tecnológico global.

Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Gloria Kaburu

Gloria Kaburu

Glory es una periodista con un amplio conocimiento y dominio de las herramientas e investigación de IA. Le apasiona la IA y ha escrito varios artículos sobre el tema. Se mantiene al día de los últimos avances en inteligencia artificial, aprendizaje automático y aprendizaje profundo, y escribe sobre ellos con regularidad.

MÁS… NOTICIAS
INTENSIVO CRIPTOMONEDAS
CURSO