في ظلّ انتشار الأخبار الكاذبة، والحقائق البديلة، والمصادر غير الموثوقة، والأكاذيب الصريحة، يصبح من الصعب للغاية الوثوق بما يُنشر. إلا أن هذه المشكلة تتجاوز بكثير الأخبار السياسية أو القصص المثيرة للجدل. فنحن نعيش في بيئة نمتلك فيها بيانات أكثر من أي وقت مضى، ونعتمد عليها أكثر من أي وقت مضى، لكن قدرتنا على التحقق من صحة هذه البيانات تتجاوز حدودها بكثير.
الوعد والمشكلة في البيانات
لقد زاد قطاع الذكاء الاصطناعي، على وجه الخصوص، من حاجتنا الماسة للبيانات. فبينما يمكننا دائمًا استخدام التحليل الإحصائي للبيانات لاستخلاص رؤى معينة، منحنا الذكاء الاصطناعي ما يبدو وكأنه قوة غير محدودة، شريطة توفر البيانات المناسبة لتدريب الخوارزمية. فبوجود مجموعة بيانات تدريبية ملائمة، تستطيع خوارزمية الذكاء الاصطناعي تصنيف فئات البيانات المختلفة، مثلdentمنتج بناءً على صورة. كما يمكنها استخدام البيانات للتنبؤ بأمور يستحيل على البشر اكتشافها: كالتنبؤ بالسلوك الاحتيالي في حسابك المصرفي، ومدة وصول طرد، واحتمالية اصطدام سيارة أخرى بسيارتك ذاتية القيادة. ويمكنها أيضًا تحسين حل مشكلة ما بناءً على البيانات، مثل تبسيط عمليات مصنع، وتنسيق جميع مواعيدك وفقًا لجدولك الزمني، وتحسين حركة الروبوت. ومع توفر كمية كافية من البيانات، تستطيع خوارزمية الذكاء الاصطناعي، مثل نموذج لغوي ضخم كما في ChatGPT والنماذج المشابهة، الإجابة على نطاق واسع من الأسئلة، غالبًا بدقة عالية مذهلة. في غضون سنوات قليلة، وجدنا أنفسناdent كليًا على الذكاء الاصطناعي لأننا ما زلنا نكتشف قدراته (وحدوده).
كما لاحظتم، فإن العامل المشترك هنا هو البيانات . لكن المشكلة تكمن في أن مجرد امتلاك البيانات لا يكفي لبناء خوارزمية ذكاء اصطناعي فعّالة. في الواقع، يُعدّ إنشاء نموذج ذكاء اصطناعي فعّال أكثر تعقيدًا وصعوبة مما يبدو. يتطلب الأمر خبرة واسعة لاختيار الخوارزمية المناسبة، وضبط الإعدادات والمعايير (المعروفة بالمعلمات الفائقة)، وتدريب النموذج واختباره لضمان أدائه بالشكل المطلوب. لكي ينجح كل هذا، يجب على المطور إنشاء أو جمع البيانات المناسبة للتدريب، وتصنيفها عند الحاجة، والتحقق من صحتها. يختلف حجم البيانات المطلوبة، ولكنه قد يكون كبيرًا جدًا، خاصةً إذا كان النموذج يتخذ قرارات معقدة، أو يختار من بين فئات متعددة، أو يحتاج إلى تحديد dent دقيقة جدًا (مثل اكتشاف عيوب مجهرية في منتج، على سبيل المثال).
في الواقع، بات إنشاء خوارزميات الذكاء الاصطناعي المناسبة أسهل فأسهل، بينما يزداد العثور على البيانات المناسبة لتدريب النموذج (أو إنشاؤها) صعوبةً مع ازدياد تعقيد المشكلات التي نسعى لحلها، أو ضخامة البيانات المطلوبة وتعقيدها، أو حتى توفر البيانات مع وجود شكوك حول صحتها. فما العمل لجمع هذه التريليونات من نقاط البيانات والتحقق من صحتها؟ دعونا نتناول هذه المسألة ونستكشف كيف يمكن لخصائص تقنية البلوك تشين الرئيسية أن تقدم حلاً، لا سيما مع منصات مثل Synesis One التي تُظهر بالفعل إمكانات واعدة في حشد قوة بشرية كبيرة باستخدام اللامركزية.
صناعة جمع البيانات
لجمع البيانات اللازمة لنموذج الذكاء الاصطناعي بشكل صحيح، يجب أولاً فهم المشكلة المراد حلها. في هذا المجال، توجد شركات ومنظمات، وحتى أفراد، لديهم مشاكل يسعون لحلها. وللعثور على البيانات المناسبة أو إنشائها، يجب عليهم توضيح المشكلة التي يحاولون حلها بتفصيل كافٍ يمكّن خبراء البيانات من فهم نوع البيانات، ونوع التصنيف أو التحقق المطلوب، وكميتها. من الناحية المثالية، تُعلن هذه الجهات عن مشكلتها ونوع البيانات التي تحتاجها. إذا كان الأمر يتعلق بتقرير أو تحليل، فيمكن الاستعانة باقتصاد العمل الحر الراسخ للعثور على شخص مؤهل. يكمن التحدي في أن مجموعات البيانات اللازمة للذكاء الاصطناعي غالبًا ما تكون مهمة أكبر بكثير من قدرة شخص واحد على إنجازها. مع ذلك، فإن العناصر الفردية عادةً ما تكون سهلة، ولا تتطلب تدريبًا في معظم الحالات، ويمكن تقسيمها إلى أجزاء صغيرة من نقطة بيانات واحدة. وهذا مثالي لتوزيع العمل على عدة أشخاص. إذا تمكن العديد من الأشخاص من جمع أو إنشاء عدد قليل من نقاط البيانات بطريقة موثوقة، ثم تصنيف البيانات إذا لزم الأمر باستخدام بعض الإرشادات الأساسية، فسيكون لدى الكيان الذي يحاول حل مشكلته كل ما يحتاجه للبدء.
اللامركزية في العمل
هنا تبرز أهمية تقنية البلوك تشين، واللامركزية على وجه الخصوص. وكما ذكرنا سابقًا، تعمل شركة Synesis One وغيرها من شركات Web3 الناشئة على تأسيس قطاع كامل لإنشاء البيانات وجمعها والتحقق من صحتها. تكمن ميزة البلوك تشين في أنها تتيحtracالذكية لأتمتة العملية، وتسمح للمشاركين بالتواجد في أي مكان تقريبًا حول العالم (مما يزيد من فرص عمل الأفراد على حل المشكلة)، بل وتتيح أيضًا الدفع باستخدام العملات المشفرة، التي تكاد تكون بلا حدود. والنتيجة؟ يقوم العديد من الأشخاص باتباع تعليمات بسيطة لإنشاء البيانات المناسبة أو العثور عليها، والتحقق من صحتها، وإجراء مراجعات من قبل النظراء عند الحاجة (لضمان أداء الجميع لمهامهم على أكمل وجه)، ثم تجميعها في مجموعة بيانات جاهزة للاستخدام.
رغم أن المفهوم قد يبدو بسيطًا، إلا أنه يُعدّ ثوريًا في عالم الذكاء الاصطناعي. لطالما شكّلت محدودية البيانات عائقًا أمام مطوري الذكاء الاصطناعي حول العالم، حيث يعجزون غالبًا عن بناء مجموعات البيانات بأنفسهم، ويفتقرون إلى الموارد اللازمة لتوظيف الكوادر المتخصصة لإنجاز هذه المهمة. لا يُمكن توظيف العديد من الأفراد، الذين يُساهم كلٌّ منهم بجزءٍ بسيط، ويُكافأ على جهوده، ليُضيفوا جميعًا إلى البيانات التي تُصبح في النهاية قابلة للاستخدام، إلا من خلال نظام فائق الكفاءة كاللامركزية.
لا يدرك عامة الناس، بمن فيهم العاملون في مجال التكنولوجيا، حجم الجهد البشري والمساهمة المطلوبة في جانب البيانات للذكاء الاصطناعي لكي تعمل النماذج المتقدمة بكفاءة عالية كما هي عليه الآن. @Lempheter شرحًا رائعًا في هذه السلسلة من التغريدات، موضحًا بعض العقبات التي تواجه هذه النماذج... https://t.co/FFO3sAO3fr
— سينيسيس ون (@synesis_one) 2 مايو 2024
ماذا بعد؟
مع إمكانية حلّ إحدى العقبات الرئيسية التي تعترض تقدّم الذكاء الاصطناعي، سيساهم سوق البيانات اللامركزية في تسريع وتيرة استخدام الذكاء الاصطناعي في حياتنا اليومية، مع جعل الذكاء الاصطناعي القابل للاستخدام والتخصيص في متناول الشركات الصغيرة وحتى الأفراد. من المؤكد أننا سنشهد توسعًا هائلًا لهذا القطاع في المستقبل القريب، إن لم يكن طفرةً هائلة، مما سيوفر استخدامًا رئيسيًا في Web3 يختلف تمامًا عن DeFiوالرموز غير القابلة للاستبدال (NFTs) أو أي من الاستخدامات "الرائجة" التي تتبادر إلى أذهان عامة الناس عند سماع مصطلح "سلسلة الكتل" (Blockchain). نأمل أن يبدأ الناس في اعتبار سلسلة الكتل بمثابة الدفعة الكبيرة التي يحتاجها قطاع الذكاء الاصطناعي.

