تستخدم شركات التكنولوجيا العملاقة ترجمات يوتيوب لتدريب الذكاء الاصطناعي دون إذن

- تم القبض على شركة Apple ومطوري الذكاء الاصطناعي الآخرين، مثل Anthropic و Nvidia، وهم يستخدمون ترجمات YouTube دون إذن لتدريب أنظمة الذكاء الاصطناعي الخاصة بهم.
- تم تطوير مجموعة بيانات "ترجمات YouTube" بواسطة EleutherAI ونشرتها في عام 2020.
- استخدمت OpenAI مليون ساعة من مقاطع فيديو YouTube لتدريب نموذج GPT-4 الخاص بها.
وُجد أن شركات Apple وNvidia وAnthropic تستخدم ترجمات YouTube لتدريب نماذج الذكاء الاصطناعي، وهو ما يخالف سياسات YouTube. وأظهر تقرير صادر عن Proof News وWired أن هذه الشركات استخدمت مجموعة بيانات من نصوص آلاف مقاطع فيديو YouTube دون الحصول على الترخيص اللازم.
اقرأ أيضاً: هيئة الرقابة البريطانية تطلق تحقيقاً في استحواذ مايكروسوفت على المواهب في مجال الذكاء الاصطناعي
الدراسة فيديوهات لمبدعين بارزين مثل مستر بيست وماركيز براونلي.
رد فعل مستخدمي يوتيوب المشهورين على استغلال البيانات
ماركيز براونلي، وهو يوتيوبر شهير، " على هذه المسألة في موقع X، قائلاً: جمعت آبل بياناتٍ لتقنيات الذكاء الاصطناعي من شركاتٍ أخرى. إحدى هذه الشركات جمعت كميةً كبيرةً من البيانات/النصوص من فيديوهات يوتيوب، بما فيها فيديوهاتي". ورغم أن آبل قد لا تكون قد جمعت البيانات مباشرةً، إلا أن براونلي أشار إلى أن هذه المشكلة ستستمر.
تم تطوير مجموعة بيانات "ترجمات YouTube" بواسطة EleutherAI ونشرتها في عام 2020. تحتوي على 5.7 جيجابايت من البيانات، والتي تتضمن ترجمات من مقاطع فيديو YouTube التي تمت إزالتها من المنصة.
وفقًا لشروط وأحكام يوتيوب، يُحظر الوصول إلى الفيديوهات "بوسائل آلية". ويزيد وجود ترجمات من الفيديوهات المحذوفة من تفاقم المشكلة، ويثير تساؤلات حول الخصوصية وانتهاك حقوق النشر.
كما اعترفت شركة Salesforce، وهي المنظمة المتورطة أيضًا في التحقيق، باستخدام مجموعة البيانات المذكورة.
تم إعداد مجموعة بيانات بايل المذكورة في ورقة البحث عام ٢٠٢١ لأغراض أكاديمية وبحثية. وكانت مجموعة البيانات متاحة للعامة، ونُشرت بموجب ترخيص مُرخّص.
المتحدث باسم Salesforce
مع ذلك، لا يزال استخدام محتوى يوتيوب دون إذن مثيرًا للجدل حتى الآن. في أبريل، صرّح نيل موهان، الرئيس التنفيذي ليوتيوب، بأن استخدام فيديوهات يوتيوب أو نصوصها أو مقاطعها لتدريب الذكاء الاصطناعي يُعد "انتهاكًا واضحًا" للسياسات. ومع ذلك، ووفقًا لصحيفة نيويورك تايمز، استخدمت OpenAI مليون ساعة من فيديوهات يوتيوب لتدريب نموذج GPT-4 الخاص بها.
معارك قانونية تندلع بسبب استخدام شركات الذكاء الاصطناعي لمحتوى الإنترنت
ازدادت مشكلة استخدام شركات الذكاء الاصطناعي لمحتوى من الإنترنت دون تصريح بعد إطلاق ChatGPT. إضافةً إلى ذلك، يقاضي منشئو المحتوى شركتي Stability AI وMidjourney بتهمة استخراج أعمال محمية بحقوق الطبع والنشر دون إذن. وواجهت شركة جوجل، مالكة يوتيوب، دعاوى قضائية جماعية بشأن ادعاءات مماثلة، مُشيرةً إلى أن مثل هذه الإجراءات القانونية تُهدد أسس الذكاء الاصطناعي التوليدي.
في مقابلة مع صحيفة وول ستريت جورنال، لم تُفصّل ميرا موراتي، المديرة التقنية لشركة OpenAI، ما إذا كانت الشركة قد استخدمت مقاطع فيديو من منصات التواصل الاجتماعي لتدريب هذا النموذج الجديد. وصرح ، بأن المحتوى على الإنترنت المفتوح يُعتبر استخدامًا عادلًا منذ تسعينيات القرن الماضي استنادًا إلى ما أسماه "العقد الاجتماعيtrac.
هناك حل وسط بين ترك المال في البنك والمجازفة في عالم العملات الرقمية. ابدأ بمشاهدة هذا الفيديو المجاني عن التمويل اللامركزي.
إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtrondentdentdentdentdentdentdentdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.
دورة
- أي العملات المشفرة يمكن أن تدر عليك المال
- كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
- استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
- كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)















