تقوم شركة جوجل ديب مايند بتطوير تقنية V2A التي تُنشئ الصوت لمقاطع الفيديو التي تعمل بالذكاء الاصطناعي

- يمكن استخدام أداة V2A لإنشاء عدد غير محدود منtracالصوتية لأي مخرج فيديو.
- ستأخذ شركة DeepMind وقتها قبل إصدار الإصدار V2A للجمهور حيث تخضع الأداة لتقييمات سلامة صارمة.
- يمكن إقران V2A بأدوات إنشاء الفيديو مثل Veo، كما يقومmaticبمطابقة الأصوات مع المشاهد المناسبة.
كشف مختبر أبحاث الذكاء الاصطناعي التابع لشركة جوجل، ديب مايند، عن تطويره أداة ذكاء اصطناعي تُعرف باسم V2A، قادرة على إنشاء الصوت والحوار للفيديوهات المُولّدة بالذكاء الاصطناعي. وتستخدم V2A، اختصارًا لـ "تحويل الفيديو إلى صوت"، نصوصًا توضيحية ووحدات بكسل فيديو لإنشاء الحوار والموسيقى والمؤثرات الصوتية للفيديوهات.
اقرأ أيضاً: جوجل ديب مايند تُطلق تاكتيك إيه آي: ثورة في تكتيكات كرة القدم
بحسب شركة ديب مايند، فإن المؤثرات الصوتية والموسيقى المُولّدة تتطابق مع النبرة والشخصيات المقصودة في الفيديو. وأوضحت ديب مايند كذلك أن هذه التقنية قد تُضفي مزيداً من الحيوية على مقاطع الفيديو المُولّدة بالذكاء الاصطناعي.
يقوم برنامج V2A بمطابقة الصوت مع مشاهد الفيديو
على الرغم من أن تقنية توليد الصوت ليست جديدة، إلا أن شركة DeepMind تدعي أن أداة V2A الخاصة بها هي الأولى من نوعها، والتي تقومmaticبمطابقة الصوت مع الفيديو.
"تتطور نماذج توليد الفيديو بوتيرة مذهلة، لكن العديد من الأنظمة الحالية لا يمكنها سوى توليد مخرجات صامتة"، هذا ما كتبته شركة DeepMind في منشور على مدونتها.
"من خلال التدريب على الفيديو والصوت والتعليقات التوضيحية الإضافية، تتعلم تقنيتنا ربط أحداث صوتية محددة بمشاهد بصرية متنوعة، مع الاستجابة للمعلومات المقدمة في التعليقات التوضيحية أو النصوص المكتوبة."
ديب مايند.
وأضافت الشركة أن تقنيتها آلية وليست آليةmatic على عكس عملية المحاذاة اليدوية التي تستغرق وقتاً طويلاً والتي تتطلب ضبط الأصوات والفيديوهات والتوقيتات.
بحسب شركة ديب مايند، يمكن استخدام أداة V2A لإنشاء عدد غير محدود منtracالصوتية لأي مخرج فيديو. ويمكنdefiتوجيه إيجابي لتوجيه المخرج المُنشأ نحو الأصوات المرغوبة، أو توجيه سلبي لتوجيهه بعيدًا عن الأصوات غير المرغوبة
وقالت الشركة: "تمنح هذه المرونة المستخدمين مزيدًا من التحكم في مخرجات V2A، مما يجعل من الممكن تجربة مخرجات صوتية مختلفة بسرعة واختيار أفضل تطابق".
نشارككم آخر التطورات في تقنية تحويل الفيديو إلى صوت (V2A) التوليدية. 🎥
يمكنه إضافة صوت إلى المقاطع الصامتة بما يتناسب مع خصائص الصوت في المشهد، ومصاحبة الحركة على الشاشة، وغير ذلك.
إليكم أربعة أمثلة – شغّلوا الصوت. 🧵🔊 https://t.co/VHpJ2cBr24 pic.twitter.com/S5m159Ye62
— جوجل ديب مايند (@GoogleDeepMind) ١٧ يونيو ٢٠٢٤
شركة ديب مايند غير متأثرة بالمنافسة
يأتي هذا الابتكار الأخير في إطار سعي شركة DeepMind لترسيخ هيمنتها في هذا القطاع. وفي وقت سابق من هذا العام، حققت شركة ElevenLabs البريطانية المتخصصة في توليد الصوت بالذكاء الاصطناعي إنجازاً هاماً بعد أن جمعت 80 مليون دولار في جولة التمويل من الفئة الثانية، مما رفع قيمة الشركة إلى أكثر من مليار دولار، وفقاً لموقع Verdict.
تقول الشركة إن مستخدميها أنتجوا ما يزيد عن مئة عام من التسجيلات الصوتية. كما تدّعي أن برنامجها الصوتي يُستخدم حاليًا من قبل 41% من شركات قائمة فورتشن 500.
اقرأ أيضاً: جوجل ديب مايند ضد أوبن إيه آي: اشتداد المنافسة في مجال توليد الفيديو بالذكاء الاصطناعي
وعلى الرغم من هذه المنافسة، أشارت شركة ديب مايند إلى أنها ليست في عجلة من أمرها لإطلاق التكنولوجيا للجمهور.
وقالت الشركة: "قبل أن نفكر في فتح الوصول للجمهور على نطاق أوسع، ستخضع تقنية V2A الخاصة بنا لتقييمات واختبارات صارمة للسلامة".
وأشارت شركة DeepMind أيضًا إلى أن V2A يمكن إقرانه بنماذج توليد الفيديو مثل Veo، مما يساعد في إنشاء مؤثرات صوتية واقعية.
تقارير Cryptopolitan بواسطة Enacy Mapakame
أذكى العقول في عالم العملات الرقمية يتابعون نشرتنا الإخبارية بالفعل. هل ترغب بالانضمام إليهم؟ انضم إليهم.
إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtrondentdentdentdentdentdentdentdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.
دورة
- أي العملات المشفرة يمكن أن تدر عليك المال
- كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
- استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
- كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)














