El sistema de IA de próxima generación promete una escalabilidaddentprecedentes

Por

Brian Koome

3 minutos de lectura 28 de marzo de 2024

AI21 revela Jamba, un poderoso modelo de IA híbrido que combina la tecnología de Mamba y Transformer.
Jamba se destaca por su escalabilidad, ofreciendo hasta 140K contextos en una sola GPU.
La versión de código abierto del modelo y la integración con la API de NVIDIA simplifican la implementación.

Al impulsar una solución empresarial integral como AI21 y superar todos los modelos conocidos en términos de productividad, Jambo se convierte en el primer modelo disponible con un método Mamba de nivel de producción. Con la integración de la tecnología Mamba SSM y los elementos de una arquitectura Transformer tradicional, Jamba representa una nueva visión en el diseño del modelo de lenguaje más amplio (LLM).

Revolucionando los LLM

La aparición de Jamba marca un cambio de era en el caso de los LLM, que gestionan eficazmente las limitaciones de las arquitecturas SSM y Transformers. Al aventurarse en tamaños de ventana de contexto de hasta 256K, Jamba presenta una clara ventaja sobre otros modelos en regiones similares en diferentes benchmarks, estableciendo así el nuevo estándar para la mejor eficiencia y rendimiento.

La arquitectura de Jamba cuenta con numerosos aspectos que la configuran como un sistema híbrido de Transformers, Mambas y una combinación de expertos (MoE) que actúan en sinergia. Esta integración optimiza la utilización de la memoria junto con el rendimiento, que es el objetivo principal de una tarea de lenguaje a gran escala, y amplía el rendimiento máximo.

La escalabilidad es la esencia de Jamba, lo que significa que puede gestionar más de 140 000 contextos con una sola GPU. Esta escalabilidad permite mantener las operaciones y la participación a distancia, facilitando el aprendizaje y la exploración, generando nuevos conocimientos y fomentando la innovación en la comunidad de IA.

Logros importantes

El lanzamiento de Jamba no solo marca un fenómeno revolucionario, sino también un avance pionero en el campo de la investigación LLM. En primer lugar, fusiona con éxito la arquitectura Mamba y la Transformer, de tal manera que ambas funcionan juntas como simbiontes, cuya combinación resulta ser mucho más poderosa que sus mitades individuales. Además, el texto presenta una versión híbrida de SSM-Transformer que combina la potencia y la velocidad de otros SSM-Transformers existentes con la capacidad de funcionar mejor en nuevos contextos.

Sin embargo, Dagan, vicepresidente de producto de AI21, se mostró sorprendente y mantuvo la estructura de arquitectura mixta de Jamba como prioridad. Explicó cómo la agilidad de Jamba permite la entrega rápida de casos de uso con grandes volúmenes y respalda la rapidez en tiempo real, acelerando incluso el lanzamiento de casos de uso críticos.

Colaboración de código abierto

La publicación de pesos abiertos de Jamba con licencia Apache 2.0 implica que AI21 puede implementar este tipo de comisión en la comunidad de código abierto. AI21 se compromete a proporcionar un entorno que impulse nuevos avances, fomentando nuevas contribuciones e ideas.

Encapsular una NVIDIA como un microservicio de inferencia NIM simplifica el acceso a Jamba para las aplicaciones empresariales. Humanización: La integración fluida permite una implementación rápida y sin problemas al actualizar las aplicaciones de Jampa en prácticamente todos los escenarios cotidianos.

El lanzamiento de Jamba por parte de AI21 ha marcado un hito importante en el sector de la IA corporativa. Jamba está preparado para transformar la industria de los modelos lingüísticos al ofrecer una arquitectura híbrida innovadora, una escalabilidad inigualable y funciones excepcionales de integración de modelos. Por lo tanto, permite a los clientes abordar sus complejas tareas lingüísticas con mayor facilidad y rapidez que antes.

AI21 también ha demostrado su apoyo a la colaboración de código abierto y a las asociaciones comerciales con empresas líderes en IA como NVIDIA, lo que demuestra aún más su dedicación a impulsar el ritmo del avance tecnológico y aumentar la adopción de soluciones de IA altamente eficientes en diversos campos.

Jamba, sin embargo, se está asegurando su lugar dentro del panorama más amplio de la IA en lo que se refiere al procesamiento del lenguaje; por lo tanto, el impacto se sentirá mucho más allá del alcance de las plataformas de procesamiento del lenguaje tradicionales para marcar el comienzo de un nuevo orden de soluciones comerciales impulsadas por IA.

Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Brian Koome

Brian Koome cuenta con más de siete años de experiencia en periodismo sobre blockchain y criptomonedas, y ha estado activo en el sector desde 2017. Ha colaborado con publicaciones destacadas, como BlockToday.com. Además, desarrolló el curso Ethereum 101 para BitDegree.org antes de unirse Cryptopolitan como redactor a tiempo completo. Brian se especializa en guías permanentes, análisis en profundidad, entrevistas y análisis de precios. Su enfoque en DeFi, la innovación blockchain y los proyectos emergentes de criptomonedas resulta muy atractivo para los lectores.

ÍNDICE

1. Revolucionando los LLM

2. Logros importantes

3. Colaboración de código abierto

Comparte este artículo