سواءً كان هناك عملٌ من OpenAI وGoogle وMeta، فإن الذكاء الاصطناعي يُموّل القطاع الصناعي، والذي يشمل وسائلَ متنوعةً مثل جمع أو تجميع كمياتٍ هائلةٍ من البيانات الرقمية بطرقٍ إبداعيةٍ وإن كانت مثيرةً للجدل، فمن الواضح أن قدرات الأتمتة وإمكاناتها في ازدياد. والجدير بالذكر أن الجهود التي تستلزم اتخاذ إجراءاتٍ مثل اتخاذ التدابير المذكورة أعلاه (أي مراعاة القيود القانونية وسياسات الشركات) تُعادل الكمّ الهائل من البيانات المُستخدمة لتدريب أنظمة الذكاء الاصطناعي.
مبادرة الهمس من OpenAI: استخراج محادثات YouTube
بدأت قصة ويسبر العام الماضي. هناك نقص هائل في النصوص الإنجليزية عالية الجودة، مما يُسبب تأخيرًا في تقديم التعليم. كان ويسبر الخطوة التالية لجوجل. لقد فهم هذا التطبيق الكم الهائل من حوارات يوتيوب، وطُوّر كتطبيق نصي لتحويل النص إلى كلام. استُخدمت هذه الأداة المُدعّمة بالذكاء الاصطناعي، والتي تتكون من أكثر من مليون ساعة من مقاطع فيديو يوتيوب التي خضعت للتدقيق بواسطة الذكاء الاصطناعي لتوليد نصوص جديدة (محادثات جديدة في جوهرها)، لتدريب نماذج الذكاء الاصطناعي المُنتجة من أحدث التقنيات وصولًا إلى GPT-4، أحدث إصدار من روبوت الدردشة ChatGPT.
على الرغم من أن بعض الموظفين جادلوا بأن لقطات مايكروسوفت من OpenAI ستنتحل محتوى يوتيوب بالكامل، إلا أن أخلاقيات الانتحال لا تزال محل جدل؛ إضافةً إلى ذلك، أقرّ بعض الموظفين باستحالة التوافق بدقة مع نوايا يوتيوب. وبالمثل، كان من الممكن اعتبار الاعتراض على معالجة الفيديوهات خوارزميًاtracالنصوص لتغذية نماذج الذكاء الاصطناعي تهديدًا لحقوق الطبع والنشر لمنشئي الفيديوهات، مما أثار غضبًا واسعًا.
أعربت شركة ميتا، الشركة الأم لفيسبوك وإنستغرام، عن قلقها أيضًا بشأن استخدام عناصر محمية بحقوق الطبع والنشر من دور نشر مثل سايمون وشوستر وغيرها. وفي الوقت نفسه، ناقشت الاستحواذ على محتوى الويب العام، مما قد يؤدي إلى الوقوع في فخ انتهاك حقوق الطبع والنشر.
أزمة البيانات: دفع النهج غير التقليدية
يُساعد جمع البيانات المُزدحم بالمنافسة على إبراز الدور المحوري للبياناتdentفي تطوير تقنيات الذكاء الاصطناعي. يتطلب تحويل لغة الذكاء الاصطناعي إلى مجموعات بيانات تدريبية متزايدة، بما في ذلك بيانات الكومنولث، والتي تُعالج اليوم وصولاً إلى ويكيبيديا وريديت من مصادر خارجية. بالنسبة لشركات التكنولوجيا، وخاصةً تلك التي تواجه صعوبة في الوصول إلى مصادر بيانات شائعة جدًا مثل مخازن البيانات التقليدية، يُمكن أن يكون إنشاء نماذج مُدعمة بالذكاء الاصطناعي حلاً بديلاً قد يكون مُرغوبًا فيه في مثل هذه الحالات.
تُشير شركات التكنولوجيا إلى ضرورة جمع البيانات لتدريب الذكاء الاصطناعي، في حين أن العملية نفسها محل نزاع قانوني أمام المحكمة. وفي دفاعهما، OpenAI ومايكروسوفت دعوى قضائية ضدهما تتعلق بالاستخدام غير القانوني لمواد محمية بحقوق الطبع والنشر. ومع ذلك، أكدتا أن إجراءاتهما تندرج ضمن المبدأ القانوني للاستخدام العادل. في السنوات الأخيرة، تجاوز عدد الطلبات المقدمة إلى مكتب حقوق الطبع والنشر الأمريكي من قِبل أصحاب حقوق الطبع والنشر 10,000 طلب، مما يُظهر بوضوح أن قانون حقوق الطبع والنشر في عصر الذكاء الاصطناعي فريد وجديد كليًا. ونتيجةً لذلك، تواجه الجهات الفاعلة الرئيسية دائمًا مخاطر تتعلق بانتهاك العديد من الأعمال بحجة عدم وجود أغراض مرخصة للنماذج التي تستخدم الذكاء الاصطناعي على هذا الأساس.
ضرورة وجود مجموعات بيانات ضخمة
بشكل عام، كان عمل كايبان، دي جاريد، عالم المقاييس، إنجازًا بارزًا في تطوير الذكاء الاصطناعي، وإن لم يكن مقصودًا. يُعد المحتوى القائم على البيانات أحد مكونات الذكاء الاصطناعي اللازمة لعملية التدريب، ولكنه لا يمكن أن يعمل بكفاءة بدون نماذج مُدربة جيدًا وتعمل بكفاءة. مع ازدياد تقنيات الذكاء الاصطناعي، يتزايد الطلب على البيانات لتحقيق النجاح في السوق بوتيرة عالية، مما يطرح تساؤلات حول القانون والأخلاقيات والخصوصية لدى الشركات. لذلك، يجب على خوارزميات الذكاء الاصطناعي استخدام مجموعات البيانات هذه لتحقيق النجاح في السوق.
يُشوّه سلوك جمع البيانات لدى كبار الشخصيات (V.IPs) لصالح الذكاء الاصطناعي ؛ ويُشوّه القسم المنهجي المُعتاد. سواءً من خلال إحدى محاضراتهم على يوتيوب أو من خلال إنشاء مُولّد بيانات اصطناعية، فإن هذه الشركات رائدة في مهمتها لاكتشاف حقيقة قضايا القانون والأخلاق والخصوصية.
قد تصبح هذه الأمور مثار جدل في وقت لاحق. ونظرًا لظهور الكم الهائل من البيانات اللازمة لدفع عملية الابتكار، يُطلب من قادة المجتمع المشاركة بفعالية في حوار بنّاء لوضع القواعد والمعايير التي تُوازن بين جهود الابتكار والمبادئ الأخلاقية لحقوق الملكية الفكرية والخصوصية.
القصة الأصلية من: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html
هل ترغب في أن يكون مشروعك أمام أنظار رواد عالم العملات المشفرة؟ شاركنا به في تقريرنا القادم، حيث تلتقي البيانات بالتأثير.

