قامت شركة OpenAI، وهي شركة ذكاء اصطناعي مشهورة، مؤخرًا بتقديم أحدث أدواتها، "GPTBot"، المصممة لأغراض الزحف على الويب، مما يمهد الطريق لتحسينات في الإصدارات المستقبلية من نماذج ChatGPT الخاصة بها.
أعلنت OpenAI مؤخرًا، في منشور على مدونتها، عن إطلاق GPTBot، مُسلطةً الضوء على إمكاناته في تحسين الإصدارات القادمة من ChatGPT. تتمحور الوظيفة الأساسية للأداة حول زحف الويب، وهي عملية يقوم فيها برنامج آلي، يُشار إليه غالبًا باسم عنكبوت الويب، بفهرسة محتوى مواقع الويب عبر شبكة الإنترنت الواسعة. يُمكّن هذا محركات البحث مثل جوجل وبينج من عرض مواقع الويب ذات الصلة في نتائج البحث.
OpenAI أوضحت أن برنامج GPTBot مصمم لجمع المعلومات المتاحة للعموم من مصادر ويب متنوعة. ومع ذلك، فهو مُبرمج لاستبعاد المحتوى المدفوع، والمصادر التي تتضمن معلومات شخصيةdentوالنصوص التي تخالف سياسات OpenAI المُعتمدة. ومن الجدير بالذكر أن أصحاب المواقع الإلكترونية يحتفظون بالقدرة على منع أنشطة الزحف الخاصة بـ GPTBot عن طريق إضافة أمر "disallow" إلى ملف قياسي على خوادمهم.
عاجل 🚨
– شوبهام سابو (@Saboo_Shubham_) 7 أغسطس 2023
أطلقت OpenAI للتو GPTBot، وهو برنامج زحف ويب مصممmaticمن الإنترنت بأكمله.
ستُستخدم هذه البيانات لتدريب نماذج الذكاء الاصطناعي المستقبلية مثل GPT-4 وGPT-5!
يضمن GPTBot استبعاد المصادر التي تنتهك الخصوصية وتلك التي تتطلب اشتراكًا مدفوعًا. pic.twitter.com/oR3kY4buaU
يأتي هذا المسعى الجديد في مجال زحف الويب في أعقاب تقديم شركة OpenAI مؤخرًا طلبًا لتسجيل علامة تجارية باسم "GPT-5"، وهو النموذج المتوقع أن يخلف نموذج GPT-4 الحالي. ويغطي هذا الطلب، الذي قُدِّم إلى مكتب براءات الاختراع والعلامات التجارية الأمريكي في 18 يوليو، استخدام مصطلح "GPT-5" في تطبيقات متنوعة تعتمد على الذكاء الاصطناعي ، بما في ذلك تحويل النصوص والكلام، وترجمة الصوت إلى نص، والتعرف على الصوت.
تخطط OpenAI للنموذج التالي
مع ذلك، ورغم الترقب الكبير المحيط بنموذج GPT-5، حذّر سام ألتمان، مؤسس شركة OpenAI ومديرها التنفيذي، من أن الشركة لا تزال بعيدة كل البعد عن بدء تدريب GPT-5. وشدد على ضرورة إجراء عمليات تدقيق شاملة للسلامة قبل الشروع في عملية التدريب.
قدمت OpenAI طلبًا لتسجيل علامة تجارية باسم
— YK المعروف أيضًا باسم CS Dojo 📺🐦 (@ykdojo) 1 أغسطس 2023
"GPT-5"،
والذي يتضمن "برمجيات لـ":
"الإنتاج الاصطناعي للكلام والنصوص البشرية"، و
"تحويل ملفات البيانات الصوتية إلى نص"، و
"التعرف على الصوت والكلام"،
و"معالجة اللغة والكلام باستخدام التعلم الآلي".
👀 pic.twitter.com/54aJBovDNB
في غضون ذلك، واجهت شركة OpenAI مخاوف متزايدة بشأن ممارساتها في جمع البيانات، لا سيما فيما يتعلق بحقوق النشر وقضايا الموافقة. ففي يونيو/حزيران، أصدرت هيئة حماية الخصوصية اليابانية تحذيراً لشركة OpenAI بشأن جمع بيانات حساسة دون ترخيص مناسب. وبالمثل، فرضت إيطاليا حظراً مؤقتاً على استخدام ChatGPT، بدعوى انتهاكات لقوانين الخصوصية في الاتحاد الأوروبي. وتسلط هذه الحالات الضوء على التدقيق المتزايد المحيط بخصوصية البيانات وتقنية الذكاء الاصطناعي.
تجدر الإشارة إلى أن شركة OpenAI واجهت مؤخرًا دعوى قضائية جماعية رفعها 16 مدعيًا زعموا أن الشركة حصلت على معلومات خاصة من تفاعلات المستخدمين مع ChatGPT. وتزعم هذه الدعوى، التي تشمل أيضًا شركة مايكروسوفت كمدعى عليها، أنه في حال ثبوت صحة هذه الادعاءات، فقد تُعتبر الشركتان مخالفتين لقانون الاحتيال وإساءة استخدام الحاسوب، وهو إطار قانوني يُطبق تاريخيًا على قضايا استخراج البيانات من مواقع الويب.
مع دخول OpenAI مجال زحف الويب عبر GPTBot، تُفتح آفاق جديدة لتحسين نماذج الذكاء الاصطناعي. إلا أن هذه التطورات تُصاحبها اعتبارات قانونية وأخلاقية، إذ يسعى قطاع الذكاء الاصطناعي إلى تحقيق التوازن الدقيق بين الابتكار والخصوصية والاستخدام المسؤول للبيانات.
أوبن إيه آي