التكاليف الخفية لنماذج تدريب الذكاء الاصطناعي

- يُعد تطوير نماذج الذكاء الاصطناعي مكلفاً، حيث يكلف مئات الملايين بسبب احتياجات الحوسبة والبيانات.
- تؤدي التكاليف المرتفعة للبيانات إلى مركزية تطوير الذكاء الاصطناعي، مما يثير مخاوف أخلاقية.
- تعمل مجموعاتdent على مجموعات بيانات مفتوحة، مع استراتيجيات جديدة مثل البيانات التوليدية التي لا تزال قيد الاختبار.
يتطلب بناء ودعم نماذج الذكاء الاصطناعي الحديثة استثمارات ضخمة، قد تتجاوز مئات الملايين من الدولارات. وتشير التقديرات إلى أن هذه التكاليف قد تصل إلى مليار دولار في المستقبل القريب.
يعود هذا الإنفاق بشكل رئيسي إلى القدرة الحاسوبية، حيث تُستخدم وحدات معالجة رسومية من نوع Nvidia، والتي قد تصل تكلفتها إلى حوالي 30,000 دولار أمريكي للوحدة الواحدة، وقد يتطلب الأمر آلاف الدولارات الإضافية لتحقيق الكفاءة المثلى. وقد أكد الباحثون على أهمية جودة وكمية بيانات التدريب المستخدمة في تطوير هذه النماذج.
قادة الصناعة يكشفون عن التكاليف الباهظة لتطوير الذكاء الاصطناعي
بحسب جيمس بيتكر من شركة OpenAI، فإن أداء النموذج يعتمد على بيانات التدريب وليس على تصميم النموذج أو بنيته. ويؤكد أن النماذج المدربة على مجموعات بيانات ضخمة ستصل إلى النتائج نفسها. لذا، تُعدّ البيانات مفتاحًا أساسيًا لتقدم تقنية الذكاء الاصطناعي.
شارك داريو أمودي، الرئيس التنفيذي لشركة الذكاء الاصطناعي "أنثروبيك إيه آي"، رؤيته حول الجوانب المالية لهذه التحديات في بودكاست "إن غود كومباني". وأوضح أن تكلفة تدريب النماذج الحالية، مثل "تشات جي بي تي-4"، تُقدر بنحو 100 مليون دولار، وأن تدريب النماذج المستقبلية قد يتطلب ما بين 10 و100 مليار دولار خلال السنوات القليلة المقبلة.
تُعدّ نماذج الذكاء الاصطناعي التوليدية، وتلك التي تُطوّرها الشركات الكبرى، نماذج إحصائية في جوهرها. ولذلك، فهي تستخدم عددًا كبيرًا من الأمثلة للتنبؤ بالنتائج الأكثر احتمالًا. ويقول كايل لو من معهد ألين للذكاء الاصطناعي (AI2) إنّ التحسّن في الأداء يُعزى في الغالب إلى البيانات، لا سيما عندما تكون بيئة التدريب متسقة.
تثير مركزية البيانات مخاوف أخلاقية ومخاوف تتعلق بإمكانية الوصول إليها
إن التكلفة الباهظة للحصول على بيانات عالية الجودة تجعل تطوير الذكاء الاصطناعي حكراً على عدد قليل من الشركات الكبرى في العالم المتقدم. كما أن هذا التكتل للموارد يثير مخاوف بشأن مدى توفر تقنية الذكاء الاصطناعي وإمكانية إساءة استخدامها.
أنفقت OpenAI وحدها مئات الملايين من الدولارات على تراخيص البيانات، ودرست Meta شراء ناشرين للوصول إلى البيانات. من المتوقع أن يتوسع سوق بيانات تدريب الذكاء الاصطناعي، ومن المرجح أن يستفيد وسطاء البيانات من هذه الفرصة.
تنشأ المشاكل من ممارسات جمع البيانات المشكوك فيها. فبحسب التقارير، قامت العديد من الشركات بجمع كميات هائلة من المحتوى دون إذن أصحابه، كما تستغل بعض الشركات البيانات من منصات مختلفة دون تعويض المستخدمين. وكما ذكرنا سابقًا، استخدمت OpenAI نموذج Whisper الخاص بها لتحويل الصوت إلى نص لأكثر من مليون ساعة من فيديوهات يوتيوب بهدف تحسين نموذج GPT-4.
تعمل المنظمات على إنشاء مجموعات بيانات تدريب الذكاء الاصطناعي مفتوحة الوصول
نظراً للتحديات التي يفرضها التنافس المحموم على جمع البيانات، تبرز الحاجة إلى جهود من جهاتdent لجعل مجموعات بيانات التدريب متاحة للجميع. وتعمل بعض المنظمات، مثل EleutherAI وHugging Face، على إنشاء مجموعات بيانات ضخمة متاحة للجمهور لأغراض تطوير الذكاء الاصطناعي.
سلطت صحيفة وول ستريت جورنال الضوء مؤخرًا على استراتيجيتين محتملتين لحل مشكلات الحصول على البيانات: توليد البيانات التوليدية والتعلم المنهجي. تُنشأ البيانات الاصطناعية باستخدام نماذج الذكاء الاصطناعي نفسها، بينما يسعى التعلم المنهجي إلى تزويد النماذج ببيانات عالية الجودة بطريقة منظمة تمكنها من الربط بين البيانات حتى مع وجود بيانات أقل. مع ذلك، لا تزال كلتا الطريقتين في مراحل التطوير، ولم تُختبر فعاليتهما بعد.
هناك حل وسط بين ترك المال في البنك والمجازفة في عالم العملات الرقمية. ابدأ بمشاهدة هذا الفيديو المجاني عن التمويل اللامركزي.
إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtrondentdentdentdentdentdentdentdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.
دورة
- أي العملات المشفرة يمكن أن تدر عليك المال
- كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
- استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
- كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)















