قدمت Tencent Holdings نموذجًا جديدًا للذكاء الاصطناعي (AI) ، Hunyuan T1 ، المصمم للتنافس مع Deepseek's R1 في كل من الأداء والقدرة على تحمل التكاليف.
تم الكشف عن T1 يوم الجمعة ، يعزز T1 التعلم التعزيز على نطاق واسع ، نفس التقنية المستخدمة في نموذج R1 الذي تم إطلاقه في يناير .
يوضح T1 أداء StronG عبر المعايير
يتبع الإصدار الرسمي اختبار تجريبي لمعاينة T1 على Tencent's chatbot ، Yuanbao. سجل النموذج 87.2 نقطة في معايير فهم المهام المتعددة المهام (MMLU) ، متجاوزًا 84 نقطة من Deepseek-R1 ، ولكنه أقل من Openai's O1 ، الذي حقق 89.3.
أظهرت T1 أيضًا نتائج StronG في تقييمات أخرى ، حيث سجل 78.2 في فحص MathematicMatic American American 2024 ، مقارنةً بـ 79.8 و O1's 79.2. وفقًا لـ Tencent ، تميزت في إتقان اللغة الصينية ، حيث سجل 91.8 نقطة في جناح C-Eval ، حيث يتطابق مع R1 ويتفوق على O1's 87.8.
ينافس نموذج Tencent أيضًا Deepseek في التسعير ، وهو ميزة أساسية لبدء الناشئة الصينية الشهيرة. رسوم T1 1 يوان (0.14 دولار) لكل مليون رمز من المدخلات ، في حين أن الإنتاج يكلف 4 يوان لكل مليون رمز.
يتماشى معدل الإدخال مع R1 ، الذي يتقاضى 1 يوان لكل مليون رمز خلال ساعات النهار و 0.25 يوان فقط بين عشية وضحاها. كما أن تسعير الإخراج قابل للمقارنة ، بالنظر إلى معدل النهار R1 الذي يبلغ 16 يوانًا لكل مليون رمز ، ينخفض إلى 4 يوان بين عشية وضحاها.
وفقًا لـ Tencent ، فإن هذا هو الأول في الصناعة الذي يتبنى بنية هجينة ، بما في ذلك محول Google ، إلى جانب نظام مقدم من المولد من قبل جامعة كارنيجي ميلون وجامعة برينستون يسمى مامبا. هذا يقلل بشكل كبير من تكاليف التدريب والاستدلال ويؤدي إلى تحسين استخدام الذاكرة أثناء التدريب مقارنة بالهندسة المعمارية القائمة على المحولات بالكامل ، حسبما ذكرت الشركة.
تقوم الشركة بترويج T1 على أنها "تقليل استهلاك الموارد بشكل كبير مع ضمان القدرة على التقاط معلومات نصية طويلة" ، مما يتيح سرعات فك تشفير أسرع بنسبة 200 ٪.
كتب خبير سابق في JD.com Big-Data مدونة التكنولوجيا NCJryds واختبرت T1 و R1 في نفس المهام. ثم طلب الفرد نماذج اللغة الكبيرة الأخرى ، بما في ذلك كلود من الأنثروبور و chatgpt من Openai ، للحكم على النتائج.
فقد نموذج تينسنت المبارزة في كتابة قصيدة صينية قديمة ولكنها تغلب على ديبسيك في تفسير كلمة صينية في سياقات مختلفة.
أعطت مدونة أخرى ، Goplayai ، Tencent Model Four Mathe matic al أسئلة ، وبعد قضاء خمس دقائق عليها ، أصبحت أكثر خطأ .
تقوم Tencent بتوسيع استراتيجيتها من الذكاء الاصطناعي مع نهج ثنائي النواة
تدير Tencent ، الذي يدير أكبر تطبيق لوسائل التواصل الاجتماعي في الصين ، WeChat ، وأكبر أعمال ألعاب الفيديو في العالم عن طريق الإيرادات ، أن يضع AI دفق إيرادات أساسي جديد. قامت الشركة بدمج DeepSeek-R1 في منصة السحابة و Yuanbao chatbot ، مما يوفر بديلاً إلى جانب طرز Hunyuan الخاصة بها.
أشار رئيس مجلس الإدارة والرئيس التنفيذي لشركة Tencent Pony Ma Huateng مؤخرًا إلى أنه كان يحظى باحترام كبير لـ Deepseek لجعل "منتجdentومفتوح حقًا ومجاني".
قال ما إن Tencent قد تبنت استراتيجية "مزدوجة النواة" على الذكاء الاصطناعي التي تستخدم كل من Deepseek ونماذج يوانباو الخاصة بها. يشبه هذا النهج كيف سيطرت على صناعة ألعاب الفيديو من خلال تعزيز العناوين التي تم تطويرها ذاتيًا وتلك من استوديوهات Independent .
أخبار التشفير الخاصة بك تستحق الاهتمام - يضعك سلك الفرق الرئيسي