صعود نماذج اللغة الضخمة: تحويل توليد النصوص المدعوم بالذكاء الاصطناعي

بواسطة

برايان كوم

قراءة لمدة 3 دقائق ، 14 نوفمبر 2023

أصبحت نماذج اللغة الكبيرة (LLMs) قوة بارزة في مجال الذكاء الاصطناعي.
يمكن tracأصول نماذج اللغة الكبيرة إلى إدخال الشبكات العصبية العميقة.
يتطلب تدريب نماذج التعلم الآلي مجموعة ضخمة من البيانات النصية.

نماذج اللغة الكبيرة (LLMs) قوة بارزة في مجال الذكاء الاصطناعي، إذ أحدثت ثورة في طريقة تفاعلنا مع النصوص وتوليدها. ويمكن تتبع ظهور نماذج اللغة الكبيرة tracتقديم الشبكات العصبية العميقة، ولا سيما بنية Transformer في عام 2017.

مهّد هذا الابتكار الطريق للتطور من نماذج اللغة التقليدية إلى نماذج اللغة الكبيرة (LLMs). صُممت نماذج اللغة الكبيرة للتعامل مع العديد من المهام المتعلقة بالنصوص، بما في ذلك توليد النصوص، وتوليد الشفرة، والتلخيص، والترجمة، وتطبيقات تحويل الكلام إلى نص. مع ذلك، من المهم الإقرار بأن نماذج اللغة الكبيرة لا تخلو من بعض القيود.

من أبرز عيوب هذه النماذج جودة النصوص المُولَّدة، التي غالبًا ما تكون دون المستوى البشري، بل وتنتج أحيانًا محتوىً سخيفًا أو خاطئًا. كما تُعرف هذه النماذج بتوليد "هلوسات"، حيث تختلق حقائق قد تبدو معقولة لمن يجهلون عدم دقتها. إضافةً إلى ذلك، نادرًا ما تكون الترجمات اللغوية التي تُنتجها هذه النماذج دقيقة بنسبة 100% دون مراجعة بشرية، وقد يحتوي الكود الذي تُولِّده هذه النماذج على أخطاء برمجية أو يكون غير فعال. ورغم الجهود المبذولة لمنع هذه النماذج من الإدلاء بتصريحات مثيرة للجدل أو الترويج لأنشطة غير قانونية، إلا أن بعض التوجيهات الخبيثة قد تخترق هذه الضوابط.

يتطلب تدريب نماذج التعلم الآلي (LLMs) مجموعة ضخمة من البيانات النصية. تشمل بعض مجموعات البيانات المستخدمة معيار مليار كلمة، ويكيبيديا، مجموعة كتب تورنتو، Common Crawl، ومستودعات GitHub مفتوحة المصدر. مع ذلك، تثير مجموعات البيانات النصية الضخمة مخاوف بشأن انتهاك حقوق النشر، حيث تُرفع حاليًا عدة دعاوى قضائية لمعالجة هذه المسألة. تُبذل جهود لمعالجة هذه المخاوف، كما يتضح من مجموعات بيانات مثل مجموعة Colossal Clean Crawled Corpus (C4)، وهي مجموعة بيانات بحجم 800 جيجابايت مُستمدة من Common Crawl، والتي خضعت لعملية تنظيف دقيقة.

تتميز نماذج التعلم الآلي للغة (LLMs) عن نماذج اللغة التقليدية باستخدامها للشبكات العصبية للتعلم العميق، وحاجتها إلى ملايين أو حتى مليارات المعاملات (الأوزان) في شبكاتها العصبية. ومع تطور هذا المجال، ازداد حجم نماذج التعلم الآلي للغة، حيث يضم نموذج GPT-3 عددًا هائلاً من المعاملات يصل إلى 175 مليار معامل. إلا أن زيادة عدد المعاملات تأتي مصحوبة ببعض السلبيات، إذ تتطلب النماذج الأكبر حجمًا ذاكرة أكبر وتعمل بشكل أبطأ. والجدير بالذكر أنه في عام 2023، ظهرت أيضًا نماذج تعلم آلي للغة أصغر حجمًا، مما يوفر خيارات لموارد حاسوبية مختلفة.

تاريخ نماذج توليد النصوص

تتمتع نماذج توليد النصوص بتاريخ عريق، يعود إلى أعمال أندريه ماركوف عام 1913، الذي طبقmaticعلى الشعر وقدم مفهوم سلاسل ماركوف للتنبؤات على مستوى الأحرف. وقد وسع كلود شانون هذا العمل عام 1948، وفي وقت لاحق، طبق فريد جيلينك وروبرت ميرسر نماذج اللغة الإحصائية على التعرف على الكلام في الوقت الحقيقي.

في القرن الحادي والعشرين، حلت الشبكات العصبية، ولا سيما نماذج الشبكات العصبية ذاتية الانحدار ذات التغذية الأمامية، محل النماذج الإحصائية التقليدية. وقد حسّنت هذه النماذج العصبية دقة التنبؤ بالكلمات بشكل ملحوظ مقارنةً بالأساليب السابقة، وتطورت في نهاية المطاف إلى ما نسميه الآن نماذج اللغة الكبيرة.

تخدم نماذج اللغة الحديثة أغراضًا متنوعة، تشمل توليد النصوص، والتصنيف، والإجابة على الأسئلة، وتحليل المشاعر، والتعرف على الكيانات، والتعرف على الكلام والكتابة اليدوية، وغيرها. ويتم تخصيص هذه النماذج لمهام محددة، وهو ما يُعرف بالضبط الدقيق، من خلال مجموعات تدريب إضافية.

تتضمن المهام الوسيطة في نماذج اللغة عمليات متنوعة مثل تجزئة الجمل، وتقسيم الكلمات إلى رموز، والتجذير، والتحليل الصرفي، وتحديد أجزاء الكلام،dentالكلمات الشائعة، والتعرف على الكيانات المسماة، وتصنيف النصوص، وتقسيمها إلى أجزاء، وحل الإحالات المرجعية. تساهم هذه المهام في تنوع نماذج اللغة وقابليتها للتطبيق في نطاق واسع من مهام فهم اللغة الطبيعية.

تتميز نماذج اللغة الكبيرة، كما ذكرنا سابقاً، عن النماذج التقليدية بفضل شبكاتها العصبية للتعلم العميق، وبيانات التدريب الواسعة، وعدد معلماتها الهائل. يتضمن تدريب نموذج اللغة الكبيرة تحسين هذه المعلمات لتقليل الأخطاء في المهمة المحددة، غالباً من خلال التعلم، مثل التنبؤ بالكلمة التالية في مجموعة نصوص.

أشهر برامج الماجستير في القانون

يمكن عزو الطفرة الأخيرة في تطوير نماذج التعلم الموجه بالحجم إلى الورقة البحثية الرائدة لعام 2017 بعنوان "الانتباه هو كل ما تحتاجه"، والتي قدمت بنية Transformer. ومنذ ذلك الحين، ظهرت العديد من نماذج التعلم الموجه بالحجم، كل منها يدفع حدود الحجم والأداء.

شهدت نماذج اللغة الضخمة تطوراً ملحوظاً، مما أعاد تشكيل مشهد توليد النصوص وفهمها باستخدام الذكاء الاصطناعي. ورغم قدراتها المذهلة، إلا أنه لا ينبغي إغفال قيودها ومخاوفها الأخلاقية. ومع تقدم هذا المجال، يصبح تحقيق التوازن بين حجم النموذج، وتأثيره البيئي، وإدارة البيانات أمراً بالغ الأهمية لضمان التطوير والنشر المسؤولين لنماذج اللغة الضخمة في المستقبل.

أذكى العقول في عالم العملات الرقمية يتابعون نشرتنا الإخبارية بالفعل. هل ترغب بالانضمام إليهم؟ انضم إليهم.

شارك هذا المقال

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtronبإجراء بحث مستقلdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

برايان كوم

يتمتع برايان كومي بخبرة تزيد عن سبع سنوات في مجال تغطية أخبار تقنية البلوك تشين والعملات المشفرة، حيث يعمل في هذا المجال منذ عام ٢٠١٧. وقد ساهم في منشورات رائدة، منها BlockToday.com. كما قام بتطوير دورة "مقدمة Ethereum " لموقع BitDegree.org قبل انضمامه إلى Cryptopolitan ككاتب متفرغ. يُغطي برايان أدلة شاملة، ودراسات معمقة، ومقابلات، وتحليلات للأسعار. ويُسعد القراء تركيزه على DeFi، وابتكارات البلوك تشين، ومشاريع العملات المشفرة الناشئة.

جدول المحتويات

1. تاريخ نماذج توليد النصوص

2. أشهر برامج الماجستير في القانون

شارك هذا المقال