FREE REPORT: A New Way to Earn Passive Income in 2025 DOWNLOAD

قامت Alibaba بتحديث نموذج الذكاء الاصطناعي لتبسيط الرسوم المتحركة ذات الأحرف الواقعية

في هذه التدوينة:

  • قدم قسم الحوسبة السحابية في Alibaba نموذجًا محدثًا من الذكاء الاصطناعي ، أي شخص 2.
  • يتيح هذا التحديث للمستخدمين الجمع بين صورة واحدة ومقطع فيديو للرسوم المتحركة ذات الأحرف الواقعية.
  • تحافظ الشخصية المتحركة على بيئتها الأصلية من المصدر لإلقاء نظرة طبيعية.

يمكّن نموذج الذكاء الاصطناعي المحدث من الذكاء الاصطناعي من Alibaba ، أي شخص 2 ، المستخدمين من صنع رسوم متحركة واقعية من خلال الجمع بين صورة واحدة مع مقطع فيديو.

وفقًا لتقرير صادر عن SCMP ، يطور هذا النظام الأساليب السابقة المستندة إلى إشارة الحركة عن طريق إضافة المعلومات البيئية من المحتوى المرجعي.

نموذج Alibaba Cloud AI يبسط الرسوم المتحركة ذات الطابع الواقعي
تحريك أي شخص 2 يحل محل أداء باركور مع كريستيانو رونالدو في مقطع فيديو. المصدر: SCMP

الدراسة البحثية من مختبر Alibaba Cloud Tongyi كيف تتبع هذه العملية trac الحركة وعناصر الخلفية من مقاطع الفيديو المصدر إلى إنشاء مقاطع متحركة واقعية. يحقق النموذج المحدث مظهرًا أكثر طبيعية لأنه يضع الشخصية المتحركة في بيئته الأصلية.

ينص البحث على Arxiv ، "نحنtracمع المعلومات البيئية من مقاطع الفيديو [المصدر] ، مما يتيح للشخصية المتحركة الحفاظ على بيئتها الأصلية ... تسهيل تكامل البيئة غير الملحومة."

يتقدم المطورون الصينيون بسرعة في الذكاء الاصطناعي التوليدي

تم إصدار أي شخص في البداية في أواخر عام 2023 ، مما يتيح للمستخدمين إنشاء مقاطع فيديو قائمة على الأحرف من خلال صور ثابتة.

أطلقت Openai Sora كطراز نص إلى Video بعد إنشاء ChatGPT العام الماضي. أدى الابتكار إلى العديد من الإصدارات النموذجية للمشاركة في النص من قبل شركات التكنولوجيا الصينية الكبرى وشركات بدء التشغيل. في ديسمبر / كانون الأول ، أصبحت سورا متاحة حصريًا للمشتركين في كل من ChatGpt Plus و Pro Psyctrips.

توضح الصين رغبتها في مطابقة القادة في جميع أنحاء العالم في حقل الذكاء الاصطناعى من خلال الإصدار الأخير من أي شخص من أي شخص 2. يتبع إعلان Alibaba من قبل Omnihuman-1 الذي تم إصداره مؤخرًا كنموذج متعدد الوسائط لتحويل الصور والأصوات المسجلة إلى محتوى فيديو واقعي.

راجع أيضًا  تحركات المنظم في المملكة المتحدة لتصحيح التحكم في محرك البحث في Google مع قواعد السوق الرقمية الجديدة الصعبة

استخدمت دراسة Alibaba's Inative أي شخص 2 مقاطع فيديو 100000 حرف

وأضافت دراسة Alibaba أن منصة تحريك أي شخص 2 تخلق تفاعلات بين الشخصيات من خلال الحفاظ على حركات متسقة و "التماسك مع البيئة المحيطة".

بالنسبة لهذه الدراسة ، أنشأ الباحثون قاعدة بيانات تتكون من 100000 مقطع فيديو شخصية مأخوذة من الإنترنت ، مع مختلف المشاهد والتفاعلات بين البشر والكائنات ، لتقييم أداء تحريك أي شخص 2 عبر إعدادات مختلفة.

ومع ذلك ، فإن أي شخص 2 يطرح خطر توليد مقاطع فيديو DeepFake إضافية.

يذكر ليانغ هايشنغ ، من وكالة الإعلان التي تتخذ من بكين مقراً لها ، أن أدوات الذكاء الاصطناعي هذه "تقصر من حيث نقل المشاعر الإنسانية وتعبيرات الوجه التفصيلية على الفيديو".

وأضاف ليانغ أن التمثيل البصري الأساسي في مقاطع الفيديو التي تم إنشاؤها من الذكاء الاصطناعي هذه لا يزال يسمح للشركات بتحويل المفاهيم إلى صور مرئية في درجات الأفكار للعملاء.

أعلنت Alibaba زيادة في أرباح الشركة الفصلية التي دفعتها استراتيجيات الذكاء الاصطناعي. تتطلع الشركة إلى استثمارات منظمة العفو الدولية الرئيسية في السنوات الثلاث المقبلة كفرصة "تأتي مرة واحدة كل بضعة عقود".

أخبار التشفير الخاصة بك تستحق الاهتمام - يضعك سلك الفرق الرئيسي

رابط المشاركة:

تنصل. المعلومات المقدمة ليست نصيحة تجارية. Cryptopolitan.com أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات المقدمة في هذه الصفحة. نوصي tron dent و / أو استشارة متخصص مؤهل قبل اتخاذ أي قرارات استثمارية .

الأكثر قراءة

جارٍ تحميل المقالات الأكثر قراءة...

ابق على اطلاع بأخبار العملات المشفرة، واحصل على تحديثات يومية في بريدك الوارد

اختيار المحرر

جارٍ تحميل مقالات اختيار المحرر...

- النشرة الإخبارية للتشفير التي تبقيك في المقدمة -

الأسواق تتحرك بسرعة.

نتحرك بشكل أسرع.

اشترك في Cryptopolitan يوميًا واحصل على رؤى التشفير في الوقت المناسب وحاد وذات الصلة مباشرة إلى صندوق الوارد الخاص بك.

انضم الآن
ولا تفوت هذه الخطوة.

احصل على الحقائق.
تقدم.

اشترك في كريبتوبوليتان