آخر الأخبار
مختارة خصيصاً لك
أسبوعي
ابقَ في القمة

أفضل المعلومات حول العملات الرقمية تصلك مباشرة إلى بريدك الإلكتروني.

كازاخستان ستطلق أول نموذج لغوي كبير لها

بقلمكريس موريثيكريس موريثي
قراءة لمدة دقيقتين
كازاخستان
  • من المقرر إطلاق أول نموذج لغوي كبير في كازاخستان، KazLLM، في 16 ديسمبر.
  • يهدف المشروع إلى تقليص الفجوة التكنولوجية في مجال الذكاء الاصطناعي مع الدول الرائدة.
  • يمكن أن يؤدي برنامج KazLLM إلى تحسين الأمن القومي وتقليل الاعتماد على التكنولوجيا الأجنبية.

في السادس عشر من ديسمبر، تستعد كازاخستان لتحقيق قفزة نوعية في مجال التكنولوجيا بإطلاق أول نموذج لغوي واسع النطاق (LLM) يُسمى KazLLM. ويتزامن هذا الإطلاق مع الذكرى السنوية الثالثة والثلاثين لاستقلال البلاد.

اقرأ أيضاً: الذكاء الاصطناعي التوليدي يُضفي الحياة على شخصيات ألعاب الفيديو غير القابلة للعب

أعلن معهد الأنظمة الذكية والذكاء الاصطناعي (ISSAI) ذلك خلال إحاطته الإعلامية في جامعة نزارباييف في 18 يوليو. بدأ جمع بيانات المشروع في مارس، ويجري تدريب النموذج باستخدام منصة حوسبة سحابية مزودة بوحدات NVIDIA H100.

يتعاونdentوالخبراء في تطوير الذكاء الاصطناعي

يتعاونdentجامعة نزارباييف، وطلاب جامعة أستانا لتكنولوجيا المعلومات، وخريجوdentبولاشاك للمنح الدراسية، بالإضافة إلى مشاركين محليين، في مشروع KazLLM. يهدف هذا المشروع بشكل أساسي إلى إنشاء KazLLM وتكوين قوة عاملة قادرة على إنتاج أدوات وتطبيقات ذكاء اصطناعي متطورة.

يسعى البروفيسور أتاكان فارول، مؤسس ورئيس معهد ISSAI، إلى سد الفجوة التكنولوجية مع الدول الأخرى من خلال هذا المشروع. وأوضح أنه بعد اكتماله، ستكون كازاخستان متأخرة تكنولوجيًا عن الدول الرائدة بثمانية عشر شهرًا فقط. ومن المتوقع أن يُسهم دمج ميزات الصوت في تقليص هذه المدة إلى اثني عشر شهرًا، بينما قد تضع التطورات الإضافية في نماذج رؤية اللغة كازاخستان في طليعة تطوير الذكاء الاصطناعي.

تُعدّ مقالات ويكيبيديا، ومواقع الأخبار، والمواقع الحكومية، ومجموعات البيانات المفتوحة مثل Common Crawl، من بين المصادر التي تُستقى منها بيانات المشروع. وعلى مدار أكثر من خمس سنوات، دأب معهد ISSAI على إنشاء مجموعات بيانات متنوعة لمعالجة اللغة الطبيعية، مصممة خصيصًا للغة الكازاخية. وتكتسب هذه المجموعة الواسعة من البيانات أهمية بالغة، إذ تُسهم في تدريب نموذج KazLLM بكفاءة ودقة عاليتين.

تأمل كازاخستان في معالجة الأمن القومي وأمن المعلومات من خلال ابتكارات الذكاء الاصطناعي

يحمل مشروع KazLLM تداعيات تتعلق بالأمن القومي وأمن المعلومات. وتأمل كازاخستان في تقليل اعتمادها على التكنولوجيا الأجنبية التي قد تؤدي إلى اختراقات البيانات وعرض معلومات مشوهة، وذلك من خلال إنشاء نموذج لغوي محلي الصنع.

أكدت مادينا عبد الرحمنوفا، نائبة مدير العلاقات الخارجية وكبيرة علماء البيانات، على ضخامة مجموعة بيانات التدريب الخاصة بالنموذج. وقالت: "ستتألف هذه المجموعة من 100 مليار كلمة على الأقل باللغات الكازاخية والروسية والإنجليزية والتركية، حيث تمثل كل لغة بـ 25 مليار كلمة".

يضم المشروع حاليًا أكثر من 30 مليار رمز، منها 26 مليار رمز تم إنتاجها عبر مترجم تيلماش الذي يحول البيانات من الإنجليزية إلى الكازاخية. تضمن هذه القدرة على الترجمة إمكانية توليد نصوص متماسكة ودقيقة باللغة الكازاخية بواسطة النموذج.

اقرأ أيضاً: OpenAI تُطلق نموذج ذكاء اصطناعي مُصغّراً يُسمى GPT-40 mini

تعتزم ISSAI إنشاء واجهة سهلة الاستخدام لنموذج KazLLM، على غرار نماذج OpenAI، لتسهيل الوصول إليه. عند اكتمالها، ستدعم هذه الواجهة التفاعل مع النموذج، والتعلم المعزز من خلال ملاحظات المستخدمين، وضبط النموذج وفقًا لمختلف الظروف لتحقيق أقصى أداء. سيُطرح KazLLM كحزمة اشتراك عامة، وكواجهة برمجة تطبيقات (API) للمستخدمين ذوي الخبرة.

لا تكتفِ بقراءة أخبار العملات الرقمية، بل افهمها. اشترك في نشرتنا الإخبارية، إنها مجانية.

شارك هذا المقال

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtrondentdentdentdentdentdentdentdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

المزيد من الأخبار
مكثفة في المشفرة
دورة