آخر الأخبار
مختارة خصيصاً لك
أسبوعي
ابقَ في القمة

أفضل المعلومات حول العملات الرقمية تصلك مباشرة إلى بريدك الإلكتروني.

تساعد معالجات Nvidia H20 وH200 في تشغيل نموذج الذكاء الاصطناعي الذي تم تدريبه بالكامل على مجموعات بيانات اصطناعية صينية

بواسطةجاي حامدجاي حامد
قراءة لمدة 3 دقائق
تساعد معالجات Nvidia H20 و H200 في تشغيل نموذج الذكاء الاصطناعي الذي تم تدريبه بالكامل على مجموعات بيانات اصطناعية صينية.
  • قامت جامعة تسينغهوا ومايكروسوفت بتدريب نموذج ترميز ذكاء اصطناعي كامل باستخدام بيانات اصطناعية فقط، دون أي مدخلات من العالم الحقيقي في أي مرحلة.

  • استخدم النموذج رقائق Nvidia H20 و H200 وتفوق على نماذج الترميز الأكبر حجماً على الرغم من امتلاكه عددًا أقل من المعلمات والبيانات.

  • كما كشفت الصين عن شريحة ACCEL تعتمد على الضوء والتي حققت 4.6 بيتا فلوبس مع استخدام طاقة أقل بملايين المرات من شرائح الذكاء الاصطناعي الحالية.

قامت جامعة تسينغهوا ومايكروسوفت للأبحاث في آسيا بتدريب نموذج ذكاء اصطناعي كامل باستخدام بيانات وهمية فقط، دون أي عينات من العالم الحقيقي.

تم توليد مجموعة البيانات بأكملها اصطناعياً عبر مسار جديد يُسمى SynthSmith، وعمل النظام على رقائق Nvidia من البداية إلى النهاية. لم يكتفِ الفريق بإجراء اختبار تجريبي، بل بنى نموذجاً عملياً بسبعة مليارات مُعامل، تفوق على نماذج أكبر بكثير تم تدريبها على بيانات بشرية.

وتزعم ورقتهم البحثية، التي نُشرت في 11 يناير على موقع arXiv، أن برنامج X-Coder الذي قاموا بتدريبه تفوق على نماذج الترميز التي تحتوي على 14 مليار معلمة، على الرغم من أنه لم يرَ نصًا من العالم الحقيقي.

وكتب الباحثون: "يكشف التحليل المعمق أن قوانين القياس تنطبق على مجموعة البيانات الاصطناعية التي قمنا بتطويرها". وضم هذا الفريق أسماءً من جامعة تسينغهوا، ومايكروسوفت للأبحاث في آسيا، وجامعة ووهان.

يستخدم الباحثون رقائق Nvidia لتجاوز بيانات العالم الحقيقي تمامًا

اعتمد نظام التدريب بشكل كبير على أجهزة Nvidia. ففي عملية الضبط الدقيق الخاضع للإشراف، استُخدمت 128 شريحة Nvidia H20 لمدة 220 ساعة متواصلة. بعد ذلك، تم الانتقال إلى 32 شريحة H200 لمدة سبعة أيام كاملة أخرى لمعالجة مرحلة التعلم المعزز. لم تكن هذه اختيارات عشوائية، فشرائح H20 مُصممة خصيصًا للاستدلال، بينما صُممت شرائح H200 للتدريب عالي الأداء. تُعد هذه الشرائح الأقوى المتاحة للشركات الصينية حاليًا، وذلك بفضل استثناءات ضوابط التصدير التي وافقت عليها إدارة ترامب بعد من Nvidia لإتاحتها في الصين.

قال الباحثون إن المشكلة لم تكن في خط المعالجة نفسه عندما يتعلق الأمر بالتوسع، بل كانت تتعلق بقوة الحوسبة.

قال وو جي، المؤلف الرئيسيdent الماجستير في جامعة تسينغهوا، إن السبب الحقيقي لعدم استخدامهم خط الأنابيب لنماذج تحتوي على 100 مليار أو تريليون معلمة هو ببساطة "القيود الحسابية، وليس قيود خط الأنابيب نفسه"

من خلال نشر الكود علنًا، يأملون أن يتمكن الآخرون من البناء على المشروع دون الحاجة إلى دفع تكاليف تدريب باهظة. كما تشير الورقة البحثية إلى اتجاه في مجال الذكاء الاصطناعي.

من المتوقع الآن أن "تفكر" النماذج على مدى فترات زمنية أطول وأن تتعامل مع الاستدلال المعقد، الأمر الذي دفع الحاجة إلى مزيد من الحوسبة أثناء الاستدلال، وليس فقط أثناء التدريب.

فريق صيني يبني شريحة أسرع باستخدام تقنية تصنيع قديمة

في سياق منفصل، قام علماء صينيون بتطوير شريحة جديدة تُدعى ACCEL باستخدام جسيمات ضوئية، وليس الكهرباء. وقد تم اختبار هذه الشريحة (اختصارًا لـ All-Analogue Chip Combining ElectronicstronLight) في المختبر، وحققت أداءً بلغ 4.6 بيتا فلوبس.

هذا أسرع بثلاثة آلاف مرة من معالج A100 من إنفيديا، ويستهلك المعالج الصيني طاقة أقل بأربعة ملايين مرة. وهذا يجعله أحد أكثر معالجات على الإطلاق، والمخصصة لمهام محددة مثل التعرف على الصور أو القيادة الذاتية.

لن يحل محل وحدات المعالجة المركزية أو رقائق الهواتف الذكية حتى الآن، لكن الفريق يعتقد أنه يمكن أن يعمل في الأجهزة القابلة للارتداء أو المركبات الكهربائية أو المصانع الذكية.

صُنعت الشريحة باستخدام عملية عمرها 20 عامًا من قبل شركة تصنيع أشباه الموصلات الدولية. وقد جنّبت هذه العملية الحاجة إلى آلات الطباعة الحجرية المتقدمة التي لا تزال الصين غير قادرة على الوصول إليها.

"كان نشر أنظمة الحوسبة الضوئية يمثل تحديًا بسبب التصميم الهيكلي المعقد والتعرض للضوضاء وأخطاء النظام"، هذا ما ذكرته في مقال لها.

تتجنب الشريحة هذه المشكلة من خلال دمجtronالضوئية والتناظرية في إطار عمل جديد. لا تعالج مهام الحوسبة العامة مثل ضغط الملفات، لكنها مثالية لتطبيقات الذكاء الاصطناعي والرؤية والاستشعار في ظروف الإضاءة المنخفضة.

ومن التفاصيل اللافتة للنظر: أن الطاقة اللازمة لتشغيل الرقائق الحديثة لمدة ساعة واحدة تكفي لتشغيل جهاز ACCEL لمدة 500 عام. كما أن انخفاض استهلاك الطاقة هذا يُسهّل التعامل مع مشاكل الحرارة، التي تحدّ من إمكانية تصغير حجم الرقائق.

تشمل وظائف الشريحةdentحركة المرور، والتصوير في ظروف الإضاءة المنخفضة، والرؤية في الوقت الفعلي، باستخدام الضوء المحيط مباشرةً في عملية الاستشعار. وأوضح الفريق أنها ليست شريحة متعددة الأغراض، بل تلبي حاجةً محددةً للغاية.

جاء التمويل من البرنامج الوطني الرئيسي للبحث والتطوير والمؤسسة الوطنية للعلوم الطبيعية في الصين. وشاركت شركة MakeSens، وهي شركة تصنيع رقائق إلكترونية مقرها بكين، والتي شارك في تأسيسها أحد الباحثين، وقد أطلقت مؤخراً شريحة تناظرية منخفضة الطاقة أيضاً.

قال داي تشيونغهاي من جامعة تسينغهوا، وهو أحد قادة المشروع، إن بناء بنية حوسبة جديدة لم يكن سوى الخطوة الأولى.

"التحدي الأهم هو تطبيق هذه البنية الجديدة عملياً، وحل الاحتياجات الوطنية والعامة الرئيسية، وهذا من مسؤوليتنا."

لم يُدلِ الفريق بأي تصريح حول موعد طرح هذه الشريحة في السوق.

يستغل مصرفك أموالك، ولا تحصل إلا على الفتات. شاهد الفيديو المجاني الخاص بنا حول كيفية إدارة أموالك بنفسك.

شارك هذا المقال
المزيد من الأخبار
مكثفة في المشفرة
دورة