Los gigantes tecnológicos chinos Alibaba Group Holding y Tencent Holdings han integrado rápidamente el último modelo de inteligencia artificial de Meta Platforms, Llama 3.1, en sus servicios en la nube. El lanzamiento de Llama 3.1 ha atraído una atención significativa, lo que ha provocado una rápida adopción por parte de estas empresas líderes.
Lea también: Elon Musk anuncia capacitación GROK 3 en Memphis con GPU NVIDIA H100
Alibaba Cloud, el brazo de computación en la nube de la empresa de comercio electrónico, fue uno de los primeros en implementar el nuevo modelo Llama. La integración en su plataforma de capacitación modelo Bailian se reveló a través de la cuenta oficial WeChat de Alibaba. La empresa regala un mes de recursos informáticos para formación e inferencia en Llama 3.1, lo que subraya el valor del modelo.
Tencent hace lo mismo y mejora las capacidades del modelo
Llama 3. 1, el miembro más nuevo de la familia Llama de modelos de lenguaje grandes (LLM) de código abierto, impulsa aplicaciones de inteligencia artificial generativa como ChatGPT. Tras el anuncio de Alibaba, Tencent Holdings, con sede en Shenzhen, rápidamente hizo lo mismo. El enfoque de Tencent también implica la mejora del ajuste y la inferencia del modelo para lograr flexibilidad en diversas tareas como conversación, generación de texto y escritura.
Meta Platforms creó los modelos Llama y los dividió en tres tamaños: Llamas 8B, 70B y 450B, y los números se refieren a la cantidad de parámetros. La cantidad de parámetros es uno de los factores esenciales que determinan la capacidad del LLM, ya que más parámetros significan mayor capacidad.
Zuckerberg posiciona a Llama 3.1 como una frontera de código abierto
El director ejecutivo de Meta, Mark Zuckerberg, ha subrayado que la “innovación abierta y descentralizada” es beneficiosa en el clima actual de espionaje y robo de modelos. Dijo que la “innovación descentralizada y abierta” es beneficiosa para EE.UU. y reveló que los futuros modelos Llama serían los mejores del mercado a partir del próximo año.
Zuckerberg afirmó que los futuros modelos Llama reducirán esta brecha entre los mejores modelos de código abierto y los mejores modelos de código cerrado que están disponibles actualmente en la industria. Afirmó además que los modelos Llama serán los más sofisticados del mercado a finales del próximo año.
Llama 3. 1 ha recibido mucha atención entre las nuevas empresas chinas, ya que utilizan modelos Llama como base para crear aplicaciones de IA generativa. Sin embargo, hay algunos escépticos en la industria que desaconsejan el uso excesivo de los modelos de Meta. El caso del unicornio chino de IA es un ejemplo de dicha tecnología.
En la actualidad, LMSYS, un organismo de investigación de modelos de IA afiliado a la Universidad de California, Berkeley, ha colocado a la vanguardia los modelos de código cerrado de OpenAI, Anthropic y Google. GPT-4 de OpenAI ocupa la primera posición, mientras que los modelos de estas empresas ocupan las diez primeras posiciones.