🔥 Trade with Pros on Discord → 21 Days Free (No Card)JOIN FREE

عمالقة التكنولوجيا يدفعون الحدود لإشباع نهم الذكاء الاصطناعي للبيانات

في هذا المنشور:

  • تلجأ شركات التكنولوجيا العملاقة إلى أساليب مثيرة للجدل لجمع بيانات الذكاء الاصطناعي.
  • تقوم شركة OpenAI بنسخ مقاطع الفيديو على موقع يوتيوب، وتدرس كل من جوجل وميتا شراء المحتوى المحمي بحقوق الطبع والنشر.
  • تنشأ نقاشات قانونية وأخلاقية حول استخدام الذكاء الاصطناعي لمجموعات البيانات الضخمة.

سواءً كان ذلك من خلال جهود OpenAI وجوجل وميتا، أو تمويل الذكاء الاصطناعي للقطاع الصناعي، والذي يشمل وسائل متنوعة كجمع كميات هائلة من البيانات الرقمية بطرق إبداعية وإن كانت مثيرة للجدل، فمن الواضح أن قدرات ومهارات الأتمتة في ازدياد. والجدير بالذكر أن الجهود المبذولة، والتي تتضمن اتخاذ إجراءات كالتدابير المذكورة أعلاه (أي مراعاة القيود القانونية وسياسات الشركات)، تعادل كمية البيانات الهائلة المستخدمة لتدريب أنظمة الذكاء الاصطناعي.

مبادرة الهمس من OpenAI: استخراج البيانات من محادثات يوتيوب

بدأت قصة Whisper العام الماضي فقط. ثمة نقص حاد في النصوص الإنجليزية عالية الجودة، مما يُسبب تأخيرات في العملية التعليمية. كان Whisper الخطوة التالية من جوجل. فقد فهمت هذه الأداة الكم الهائل من الحوارات على يوتيوب، وطُوّرت كتطبيق لتحويل النص إلى كلام. استُخدمت هذه الأداة المدعومة بالذكاء الاصطناعي، والتي تعتمد على أكثر من مليون ساعة من فيديوهات يوتيوب التي تُحلل بواسطة الذكاء الاصطناعي لتوليد نصوص جديدة (أي محادثة جديدة)، لتدريب نماذج الذكاء الاصطناعي، بدءًا من أحدث التقنيات وصولًا إلى GPT-4، أحدث إصدار من روبوت الدردشة ChatGPT.

على الرغم من أن بعض الموظفين جادلوا بأن استخدام OpenAI لمقاطع فيديو مايكروسوفت سيؤدي إلى سرقة محتوى يوتيوب بشكل شامل، إلا أن أخلاقيات السرقة الأدبية لا تزال موضع نقاش؛ إضافةً إلى ذلك، أقرّ بعض الموظفين باستحالة التوافق التام مع نوايا يوتيوب. وبالمثل، فإن الاعتراض على معالجة الفيديوهات خوارزميًاtracالمحتوى النصي لتغذية نماذج الذكاء الاصطناعي قد يُعتبر تهديدًا لحقوق الملكية الفكرية لمنشئي الفيديوهات، مما أثار استياءً واسعًا. 

انظر أيضًا:  التحديث الجذري لـ Polygon يُصلح الخلل بعد عطل في الشبكة

أبدت شركة ميتا، الشركة الأم لفيسبوك وإنستغرام، قلقها أيضاً بشأن استخدام عناصر محمية بحقوق الطبع والنشر من دور نشر مثل سايمون وشوستر، وغيرها. وفي الوقت نفسه، ناقشت الشركة أيضاً إمكانية الاستحواذ على محتوى الويب العام، خشية الوقوع في انتهاك لحقوق الطبع والنشر.

أزمة البيانات: تدفع نحو مناهج غير تقليدية

يُسهم جمع البيانات في ظل المنافسة الشديدة في إبراز الدور المحوري للبياناتdentمكانتها في تطوير تقنيات الذكاء الاصطناعي. ويتطلب إدخال اللغة في الذكاء الاصطناعي استخدام المزيد من مجموعات بيانات التدريب، بما في ذلك بيانات دول الكومنولث، والتي يتم جمعها من مصادر خارجية مثل ويكيبيديا وريديت. بالنسبة لشركات التكنولوجيا، وخاصة تلك التي تواجه صعوبة في الوصول إلى مصادر البيانات الشائعة كالمخازن التقليدية، يُمكن أن يُمثل إنشاء نماذج مدعومة بالذكاء الاصطناعي حلاً بديلاً مرغوباً فيه.

تُشير شركات التكنولوجيا إلى أن جمع البيانات ضروري لتدريب الذكاء الاصطناعي، بينما تُثار تساؤلات قانونية حول هذه العملية نفسها أمام المحاكم. وفي دفاعها، OpenAI ومايكروسوفت دعوى قضائية ضدهما تتعلق بالاستخدام غير القانوني لمواد محمية بحقوق الطبع والنشر. ومع ذلك، فقد أكدتا أن تصرفاتهما تندرج ضمن مبدأ الاستخدام العادل. في السنوات الأخيرة، تجاوز عدد الطلبات المُقدمة إلى مكتب حقوق الطبع والنشر الأمريكي من قِبل أصحاب الحقوق 10,000 طلب، مما يُظهر بوضوح أن قانون حقوق الطبع والنشر في عصر الذكاء الاصطناعي فريد وجديد تمامًا. ونتيجةً لذلك، يواجه اللاعبون الرئيسيون باستمرار مخاطر انتهاك العديد من الأعمال بحجة عدم وجود أغراض مرخصة لاستخدام نماذج الذكاء الاصطناعي على هذا الأساس.

انظر أيضًا:  متداولو العملات الرقمية يرحبون ببوت التداول Sigmax.io

ضرورة وجود مجموعات بيانات ضخمة

بشكل عام، كان لعمل كايبان، العالم جاريد، أثرٌ بالغٌ في تطوير الذكاء الاصطناعي. يُعد المحتوى القائم على البيانات أحد مكونات الذكاء الاصطناعي الضرورية لعملية التدريب، لكنه لا يستطيع العمل بكفاءة دون نماذج مُدرَّبة جيدًا وفعّالة. مع ازدياد تقنيات الذكاء الاصطناعي، يتزايد الطلب على البيانات لتحقيق النجاح في السوق بوتيرة متسارعة، مما يضع الشركات أمام تساؤلات تتعلق بالقانون والأخلاق والخصوصية. لذا، يجب على خوارزميات الذكاء الاصطناعي استخدام مجموعات البيانات هذه لتحقيق النجاح في السوق.

يتم تشويه سلوك جمع البيانات لدى كبار الشخصيات لصالح الذكاء الاصطناعي ؛ ويجري تبسيط القسم المنهجي المعتاد. وسواءً من خلال إحدى محاضراتهم على يوتيوب أو إنشاء مولدات بيانات اصطناعية، فإن هذه الشركات رائدة في مهمة اكتشاف حقيقة قضايا القانون والأخلاق والخصوصية.

قد تصبح هذه الأمور مثار سخرية فيما بعد. ونظرًا لظهور كميات هائلة من البيانات اللازمة لدفع عملية الابتكار، يُطلب من قادة المجتمع المشاركة الفعّالة في حوار بنّاء لوضع القواعد والمعايير التي تُوازن بين جهود الابتكار والمبادئ الأخلاقية لحقوق الملكية الفكرية والخصوصية.

القصة الأصلية من: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html

حسّن استراتيجيتك من خلال الإرشاد والأفكار اليومية - 30 يومًا من الوصول المجاني إلى برنامج التداول

رابط المشاركة:

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. موقع Cryptopolitan أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصح tron بإجراء بحث مستقل dent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

الأكثر قراءة

جارٍ تحميل المقالات الأكثر قراءة...

ابقَ على اطلاع دائم بآخر أخبار العملات الرقمية، واحصل على تحديثات يومية في بريدك الإلكتروني

اختيار المحرر

جارٍ تحميل مقالات مختارة من قبل المحرر...

- النشرة الإخبارية الخاصة بالعملات الرقمية التي تُبقيك في الصدارة -

تتحرك الأسواق بسرعة.

نتحرك بشكل أسرع.

اشترك في النشرة اليومية Cryptopolitan واحصل على تحليلات دقيقة ومناسبة وفي الوقت المناسب حول العملات المشفرة مباشرة إلى بريدك الوارد.

انضم الآن ولن
تفوتك أي خطوة.

ادخل. احصل على الحقائق.
تقدم للأمام.

اشترك في CryptoPolitan