أعلنت مايكروسوفت، استجابةً لشكاوى تتعلق بجودة المنتج، أنها ستعيد مُولِّد الصور Bing AI إلى حالته السابقة. وجاء هذا القرار بعد أن اشتكى المستخدمون من تراجع أداء Bing Image Creator بشكل ملحوظ بعد تحديث ديسمبر.
صرح جوردي ريباس، رئيس قسم البحث في مايكروسوفت، الشركة تمكنت من حل بعض المشكلات التي تم الإبلاغ عنها. وحث ريباس المستخدمين على العودة إلى الإصدار PR13، وهو الإصدار السابق لمولد الصور بتقنية الذكاء الاصطناعي من Bing، إلى حين إصلاح هذه المشكلات.
تستدعي مايكروسوفت تحديث مولد الصور بتقنية الذكاء الاصطناعي من Bing
أعلنت شركة برمجيات أنها ستستأنف استخدام نموذج الذكاء الاصطناعي السابق لأداة Bing Image Creator، وهي أداة تحرير الصور المدعومة بالذكاء الاصطناعي والمدمجة في محرك بحث مايكروسوفت بينغ. وكانت الشركة التقنية قد وعدت بأن نموذجها المُطوّر، وهو أحدث إصدار من نموذج DALL-E3 (PR16) من OpenAI، سيمكّن المستخدمين من إنشاء صور "بسرعة مضاعفة" وبجودة "أعلى"
بعد أن نشر ريباس عن التحديث في ديسمبر، اشتكى بعض المستخدمين من أن أداة إنشاء الصور من بينغ كانت تنتج نتائج أقل تفصيلاً وصورًا لا تعكس بدقة مطالباتهم.
سرعان ما امتلأت منتديات مجتمع X وReddit وOpenAI بالشكاوى بعد فشل النموذج في تحقيق النتائج المرجوة. وكشف أن DALL-E الذي كان يعشقه قد اختفى إلى الأبد. ونشر أنه يفضل استخدام ChatGPT لأن Bing أصبح عديم الفائدة بالنسبة له.
صرح جوردي ريباس، رئيس قسم البحث في مايكروسوفت، بأن الشركة تمكنت من إعادة إنتاج بعض المشكلات المبلغ عنها، وتعتزم العودة إلى الإصدار PR13 حتى يتم إصلاحها. وأضاف ريباس أن جميع مستخدمي النسخة الاحترافية ونحو 25% من الطلبات التي تستخدم ميزة التعزيز سيعملون على الإصدار PR13. كما أكد أن عملية النشر بطيئة للغاية، وستستغرق الشركة من أسبوعين إلى ثلاثة أسابيع للوصول إلى نسبة 100%.
وقد ذكر ريباس سابقًا أن مايكروسوفت المعيارية وجدت أن جودة PR10 "أفضل قليلاً في المتوسط" مقارنة بنموذج Bing Image Creator السابق.
كما واجهت برامج أخرى لتوليد الصور بالذكاء الاصطناعي انتقادات حادة لعدم اجتيازها الفحوصات الداخلية على نماذج الصور. وبعد أن انتقد المستخدمون عدم دقتها التاريخية، اضطرت جوجل إلى إيقاف قدرة برنامج الدردشة الآلي "جيميني" على إنشاء صور للأشخاص.
تنهال الشكاوى على مايكروسوفت بشأن جودة مولد الصور المُحسّن بتقنية الذكاء الاصطناعي من Bing
أبدى أحد أعضاء منتدى OpenAI استياءه من طريقة عرض محرك بحث Bing لصور Starburst وتأثيرات الإضاءة عليها. كما أشار إلى وجود شكوك حول تدريب النموذج المُحسّن بدقة منخفضة، وهو ما يُشبه عمليات تكبير الصورة وتحسين حدّتها.
وأضاف أحد أعضاء المنتدى أن أسلوب الرسوم المتحركة اليابانية (الأنمي) يبدو أقرب إلى "كتاب تلوين" بخطوط سميكة منه إلى عمل فني عالي الدقة. كما أشار إلى أن الأشخاص الذين يسعون إلى تبني أنماط فنية متنوعة غالباً ما يصفون كيف تم تقليل حجم ذاكرة الوصول العشوائي للفيديو (VRAM) أو الدقة أو كمية النصوص المتاحة.
وادعى مستخدم آخر أن التحديثات الأخيرة لتطبيق DALL-E قد دمرت ميزة تطبيق أي نمط صورة من خلال توفير تحديثات ضبابية في المقدمة.
ادّعى أحد مستخدمي OpenAI أن نموذج معالجة اللغة الطبيعية يعاني من مشاكل، وأنه على الرغم من تحسينه، إلا أن بيانات التدريب ربما تكون قد ضعفت. وأشار إلى أن مستخدمي النموذج المُطوّر ربما تلقوا قدرة حاسوبية أقل بسبب كثرة الطلبات. كما أكد عضو غرفة الدردشة أن النظام المُطوّر يحتاج إلى فلتر قبل التدريب، وأن البيانات بحاجة إلى إعادة تدريب.
أشار البعض إلى ملاحظة تحسينات في جوانب محددة، مثل تفاصيل الملابس، لكن مشاكل العرض لا تزال قائمة. وأعربوا عن أملهم في أن يعالج الفريق المسؤول عن النموذج المُطوّر هذه المشاكل ويعود إلى إصدار سابق أكثر استقرارًا من النموذج.
حث مستخدم آخر لجهاز X الشركة على العودة إلى النموذج الأقدم لأن النموذج الأحدث كان أسوأ بشكل قاطع في إنشاء شخصيات بشرية واقعية المظهر أو محاكاة الأساليب الفنية والتقنيات الفوتوغرافية.
أقرت الشركة بردود الفعل السلبية وقالت إنها ستعيد النموذج السابق إلى Bing Image Creator حتى تتمكن من معالجة المشكلات.

