في تطورٍ حديث، تلقّت OpenAI تحذيراًtronاللهجة من نيل موهان، الرئيس التنفيذي لشركة يوتيوب، بشأن استخدام منصتها لتدريب نماذج الذكاء الاصطناعي المتطورة Sora وChatGPT. ويأتي هذا التحذير في ضوء احتمالية انتهاك شروط خدمة يوتيوب، فضلاً عن المخاوف بشأن مصدر بيانات التدريب. وقد أثارت هذه القضية نقاشاً حول أخلاقيات أبحاث الذكاء الاصطناعي والتزامات شركات التكنولوجيا.
استكشاف مخاوف يوتيوب
أضافت مقابلة ميرا موراتي الأخيرة مزيدًا من الغموض إلى الصورة الضبابية أصلًا لممارسات تدريب الذكاء الاصطناعي. ولعلّ الأمر الأكثر إثارة للقلق هو أن ميرا موراتي، المديرة التقنية لشركة OpenAI، أعربت في مقابلة مع صحيفة وول ستريت جورنال قبل شهر واحد فقط، عن عدم يقينها وعدم وضوحها بشأن مصدر بيانات تدريب سورا. ورغم أنه من غير الواضح ما إذا كانت مقاطع فيديو يوتيوب تُستخدم أو لا تزال تُستخدم للتدريب، فقد وجّه نيل موهان، الرئيس التنفيذي للشركة، إنذارًا ضمنيًا بإبلاغه OpenAI بأن استخدام مقاطع الفيديو على منصتها محظور.
يحظر الموقع تحميل مواد مثل النصوص أو مقاطع الفيديو، ويُعدّ ذلك انتهاكًا صارخًا لشروط الخدمة، كما صرّح موهان في مقابلة مع إميلي تشانغ لبرنامج بلومبيرغ أوريجينالز. هذه هي إرشادات المحتوى على منصتنا. وفي حين تعمل جوجل، الشركة الأم ليوتيوب، على تطوير نظام ذكاء اصطناعي متعدد الوسائط خاص بها يُدعى جيميني، والذي يستخدم أيضًا بيانات التدريب، أوضح موهان أن جوجل تلتزمtracالخاص بكل مُنشئ محتوى مع يوتيوب عند تحديد ما إذا كان سيتم استخدام المحتوى من المنصة.
صرح موهان قائلاً:
"لا يسمح بتحميل أشياء مثل النصوص المكتوبة أو مقاطع الفيديو، وهذا انتهاك واضح لشروط الخدمة لدينا. هذه هي قواعد التعامل مع المحتوى على منصتنا."
المصدر: بلومبيرغ
وأضاف موهان أيضاً:
تلتزم جوجلtracالفردية التي يبرمها يوتيوب مع صناع المحتوى قبل اتخاذ قرار بشأن استخدام مقاطع الفيديو من المنصة
المصدر: بلومبيرغ
توجيه عملية تطوير الذكاء الاصطناعي الأخلاقي
يُبرز التدقيق في تعليقات موراتي مدى خطورة مسألة حقوق النشر والإسناد. فمن المحتمل أن يجمع برنامج سورا من OpenAI كل ما هو موجود على الإنترنت، بما في ذلك مقاطع فيديو يوتيوب ومنشورات مواقع التواصل الاجتماعي، بالنظر إلى عبارة "البيانات المتاحة للعموم". فعلى سبيل المثال، من المستبعد جدًا أن تسمح شروط ترخيص جميع المحتويات المنشورة على يوتيوب بهذا النوع من الاستخدام.
تُعدّ حماية حقوق الملكية الفكرية على الإنترنت مهمة صعبة بحد ذاتها. وفي الوقت نفسه، سيتمكن برنامج سورا التابع لشركة OpenAI من الوصول إلى هذه الحقوق والاستفادة منها، بالإضافة إلى استخدامها لأغراض تعليمية.
ليس المدير التقني لشركة OpenAI وحده من يتردد في مناقشة مجموعات البيانات المستخدمة في تدريب نظام Sora، بل إن الشركة عمومًا لا تُشير إلى المصادر التي تستخدمها. حتى أن الورقة التقنية الخاصة بـ Sora لا تُشير بوضوح إلى الحاجة إلى عدد كبير من الأفلام المصحوبة بتعليقات نصية لتدريب أنظمة تحويل النصوص إلى فيديوهات.
نظراً لأن هذه الشركات لا تملك الحق القانوني في استخدام البيانات، فإن افتقارها للشفافية في هذا الصدد قد يكون أول مؤشر على أنها تحاول تجنب المشاكل القانونية.

