
أعلن مركز أبحاث مايكروسوفت آسيا “Microsoft Research Asia ” عن أداة ذكاء اصطناعي جديدة تحمل اسم VASA-1، يُمكنها أن تحول الصور الثابتة إلى فيديو متحرك.
الأداة الجديدة التي لاتزال في المراحل التجريبية، يمكنها التقاط صورة ثابتة لشخص ما – أو رسم لشخص ما – ودمجه مع ملف صوتي موجود لإنشاء وجه ناطق نابض بالحياة. مع القدرة على توليد تعبيرات الوجه وحركات الرأس للصورة الثابتة وحركات الشفاه المناسبة لتتناسب مع المقطع الصوتي.
أداة مايكروسوفت الجديدة تحول الصور إلى فيديو بدون مجهود
هذا وقام الباحثون بتحميل الكثير من الأمثلة على صفحة المشروع، وكانت النتائج تبدو جيدة بما يكفي لخداع الناس وجعلهم يعتقدون أنها حقيقية. لكن عند الفحص الدقيق لبعض مقاطع الفيديو التي تم عرضها تبدو بعض حركات الشفاة والرأس آلية إلى حد ما.

ومع ذلك فإن الأداة الجديدة شأنها مثل شأن باقي برامج إنشاء مقاطع الفيديو، يٌمكن إساءة استخدامها لإنشاء مقاطع فيديو مزيفة بسهولة وسرعة لأشخاص حقيقيين.
يدرك الباحثون أنفسهم هذا الأمر وقرروا عدم إصدار “عرض توضيحي عبر الإنترنت، أو واجهة برمجة تطبيقات، أو منتج، أو تفاصيل تنفيذ إضافية، أو أي عروض ذات صلة” حتى يتأكدوا من أن التكنولوجيا الخاصة بهم “سيتم استخدامها بشكل مسؤول وبما يتوافق مع المعايير المناسبة”.
ومع ذلك لم يذكروا ما إذا كانوا يخططون لتنفيذ ضمانات معينة لمنع إساءة استخدام أداة مايكروسوفت الجديدة التي تحول الصور إلى فيديو.
وفقًا للورقة البحثية المنشورة مع الإعلان، تم تدريب VASA-1 على مجموعة بيانات VoxCeleb2، التي تحتوي على “أكثر من مليون عبارة لـ 6112 من المشاهير” والتي تم استخلاصها من مقاطع فيديو يوتيوب.
مع أن الأداة تم تدريبها على الوجوه الحقيقية، إلا أنها تعمل أيضًا على الصور الفنية مثل الموناليزا، التي قام الباحثون بدمجها بشكل مسلي مع ملف صوتي من أداء آن هاثاواي.
على الجانب الآخر، يعتقد الباحثون أن تقنيتهم تتمتع بالكثير من الفوائد. وقالوا إنه يمكن استخدامه لتعزيز المساواة التعليمية، وكذلك لتحسين إمكانية الوصول لأولئك الذين يعانون من تحديات التواصل، ربما من خلال منحهم إمكانية الوصول إلى الصورة الرمزية التي يمكنها التواصل معهم.
وقالوا إنه يمكنه أيضًا توفير الرفقة والدعم العلاجي لأولئك الذين يحتاجون إليه، ملمحين إلى أنه يمكن استخدام VASA-1 في البرامج التي توفر شخصيات الذكاء الاصطناعي يمكن للأشخاص التحدث إليها.