قام باحثون من جامعة دارمشتات التقنية ومركز هيسن للذكاء الاصطناعي في ألمانيا بالتعمق في العلاقة المعقدة بين مجموعات البيانات والنماذج في فهم الخيارات البشرية المحفوفة بالمخاطر.
كشفت نتائجهم، المنشورة في مجلة Nature Human Behaviour، عن وجود تحيز في مجموعات البيانات، مُسلطةً الضوء على الاختلافات الدقيقة في سلوكيات اتخاذ القرار بين المشاركين في التجارب الإلكترونية والمخبرية. وباستخدام تقنيات متقدمة للتعلم الآلي، لمdentالباحثون بتحديد التحيز فحسب، بل اقترحوا أيضًا نموذجًا هجينًا جديدًا لسد الفجوة الناجمة عن زيادة التشويش في اتخاذ القرار في مجموعات البيانات الإلكترونية.
التفاعل بين مجموعات بيانات القرار ونماذج التعلم الآلي
يُعدّ فهم التفاعل بين مجموعات بيانات القرار ونماذج التعلّم الآلي أمرًا بالغ الأهمية لكشف تعقيدات عملية اتخاذ القرار البشري. وقد قام فريق بحثي ألماني بدراسة هذه العلاقة بشكلmatic، مستخدمًا ثلاث مجموعات بيانات مميزة: مسابقة التنبؤ بالاختيارات 2015 (CPC15)، ومسابقة التنبؤ بالاختيارات 2018 (CPC18)، ومجموعة بيانات الاختيارات 13 ألف (Choices13k).
تمثل مجموعات البيانات هذه طيفًا واسعًا من الخيارات التي اتخذها المشاركون في بيئات مختبرية مضبوطة وتجارب واسعة النطاق عبر الإنترنت. وقد استخدم فريق البحث نماذج تعلم آلي متنوعة، بما في ذلك أساليب التعلم الآلي classicوهياكل الشبكات العصبية، ودربها على مجموعات البيانات هذه لاكتساب رؤى حول اختلافات الأداء والتحيزات.
وبالتعمق أكثر في الدراسة، تبين أن النماذج المدربة على مجموعة بيانات Choices13k، التي تشير إلى التجارب عبر الإنترنت، أظهرت قدرة ضعيفة على التعميم عند تطبيقها على مجموعات بيانات مخبرية أصغر (CPC15 وCPC18). وبالمثل، لم تنقل النماذج المدربة على CPC15 قدرتها التنبؤية بسلاسة إلى مجموعة بيانات Choices13k، مما يكشف عن تحيزmatic في مجموعة البيانات.
أشارت هذه التحيزات إلى اختلافات ملحوظة في سلوكيات الاختيار بين المشاركين في التجارب المختبرية وأولئك الذين شاركوا عبر الإنترنت. وتؤكد هذه النتائج على أهمية إدراك ومعالجة تحيزات البيانات، لا سيما عند التعامل مع سياقات ومصادر بيانات متنوعة.
كشف تحيز مجموعة البيانات
إن الكشف عن تحيز مجموعة البيانات يحفز إجراء المزيد من الأبحاث حول جذوره وتداعياته. وقد كشفت الدراسة أن النماذج المدربة على مجموعة بيانات Choices13k أبدت عزوفاً عن التنبؤ بنسب الاختيار المتطرفة، مما يشير إلى نمط مميز في اتخاذ القرارات لدى المشاركين عبر الإنترنت مقارنةً بنظرائهم في المختبر.
لتحليل مصدر هذا التحيز، قام الباحثون بتحليل دقيق لخصائص المقامرات التي تنبأت بالاختلاف في سلوك الاختيار بين مجموعات البيانات. وباستخدام تقنيات مثل الانحدار الخطي وتفسيرات شابلي الإضافية (SHAP)، قاموا بتحديد أهمية كل خاصية. والمثير للدهشة أن خصائص من أدبيات علم النفس والاقتصاد السلوكي، مثل الهيمنة العشوائية، واحتمالية الفوز، والفرق في القيمة المتوقعة، لعبت دورًا محوريًا في التأثير على هذا التحيز.
أبرزت هذه الخصائص، التي تتمحور جميعها حول مدى توقع تحقيق عائد أعلى من رهانٍ ما مقارنةً برهانٍ آخر، مدى تعقيد عملية اتخاذ القرار البشري. ومن المهم أن الدراسة أشارت إلى أن سلوك الاختيار في مجموعة بيانات Choices13k بدا أقل تأثرًا بهذه الخصائص مقارنةً بمجموعة بيانات CPC15، مما يوحي بأن المشاركين عبر الإنترنت أظهروا قدرًا أكبر من التشويش أو اللامبالاة في عملية اتخاذ القرار. يُمهد هذا الفهم الدقيق لانحياز مجموعة البيانات وجذوره الطريق لتطوير استراتيجيات للتخفيف من تأثيره وتحسين النماذج التنبؤية في سياقات اتخاذ القرار المتنوعة.
تحليل السمات واقتراح نموذج هجين
انطلاقًا من فهم شامل لانحياز مجموعات البيانات وآثاره، اقترح الباحثون حلًا مبتكرًا - نموذجًا هجينًا. يهدف هذا النموذج إلى معالجة ازدياد التشويش في اتخاذ القرارات الملحوظ في مجموعات البيانات الإلكترونية، وذلك من خلال دمج نموذج توليدي احتمالي مع شبكة عصبية مُدرَّبة على مجموعة بيانات CPC15. يفترض النموذج التوليدي الاحتمالي أن نسبة من المشاركين في التجربة الإلكترونية كانوا يُخمّنون عشوائيًا، بينما كان باقي المشاركين يتبعون أنماط اتخاذ القرارات المُستخلصة من مجموعة بيانات المختبر.
أدى دمج هذا النموذج الهجين إلى تحسين دقة التنبؤ بشكل ملحوظ وتقليل الفروقات الملحوظة مع الشبكة العصبية التقليدية المدربة حصريًا على مجموعة بيانات CPC15. لم يقتصر هذا النهج المبتكر على توفير حل عملي لمشكلة تحيز البيانات فحسب، بل أبرز أيضًا أهمية مراعاة الخصائص الفريدة لمجموعات البيانات المتاحة عبر الإنترنت عند تطوير نماذج تنبؤية دقيقة وقوية لدعم عملية اتخاذ القرارات البشرية.
أظهر البحث العلاقة المعقدة بين نماذج التعلم الآلي ومجموعات بيانات القرارات البشرية، مؤكدًا على وجود تحيز في البيانات وتأثيره. كما سلطت الدراسة الضوء على التحديات التي يفرضها الاعتماد فقط على مجموعات البيانات الإلكترونية واسعة النطاق لفهم النظريات العامة لعملية صنع القرار البشري.
أكدت هذه الدراسة على ضرورة اتباع نهج متوازن يجمع بين تقنيات التعلم الآلي وتحليل البيانات والاستدلال النظري لفهم تعقيدات الخيارات البشرية المحفوفة بالمخاطر. ومع فتح البحث آفاقًا جديدة للاستكشاف، تبرز تساؤلات مهمة: كيف يمكننا تحسين نماذج التعلم الآلي والتحقق من صحتها لمراعاة التباين والتشويش المتأصلين في البيانات المتاحة عبر الإنترنت، مما يمهد الطريق لفهم أعمق لعملية اتخاذ القرار البشري في مختلف السياقات والإعدادات التجريبية؟ ولا يزال البحث عن إجابات مستمرًا، حثًا للباحثين على استكشاف وتطوير ودمج الأطر النظرية والتحليلية لكشف أسرار عملية اتخاذ القرار البشري في عصر رقمي متزايد.

