أعلنت شركة “بايت دانس”، مالكة تطبيق “تيك توك”، عن إطلاق نموذج ذكاء اصطناعي جديد يسمى OmniHuman، يمكنه تحويل الصور إلى مقاطع فيديو واقعية تُظهر الأشخاص وهم يتحدثون ويغنون ويتحركون بطريقة طبيعية. يُعتبر هذا الابتكار قفزة نوعية في مجال الذكاء الاصطناعي، حيث يسمح بإنتاج مقاطع فيديو تتضمن حركات جسدية متناسقة مع الكلام، متجاوزًا النماذج السابقة التي كانت تقتصر على تحريك ملامح الوجه.
دربت الشركة نموذج OmniHuman باستخدام أكثر من 18,700 ساعة من مقاطع الفيديو البشرية، مما يعزز قدرته على التعلم. وتستخدم التقنية الجديدة نهجًا مبتكرًا يُعرف بـ “التدريب متعدد الظروف”، مما يمكّن النموذج من التعامل مع مصادر بيانات متنوعة، مثل النصوص والصوت وحركات الجسم، ما يعزز من فعالية النتائج ويقلل من إهدار البيانات.
تشير التجارب إلى تفوق النموذج الجديد على النماذج السابقة من حيث جودة الحركة وتناسقها مع الكلام. ومن المقرر أن يعرض الباحثون النتائج في مؤتمر علمي متخصص قريبًا.
يمثل هذا التطور تقدمًا كبيرًا في سباق التكنولوجيا بين شركات مثل ميتا وجوجل ومايكروسوفت لتطوير أنظمة ذكاء اصطناعي متقدمة. ومع ذلك، يحذر الخبراء من احتمال إساءة استخدام هذه التقنية في تطوير محتوى مزيف، مما يثير مخاوف تتعلق بالمعلومات المضللة وانتهاك الخصوصية.
عدد المصادر التي تم تحليلها: 5
المصدر الرئيسي : الشرق
post-id: 7b5ccaec-c3a6-4dc6-b5e0-6c0c4f85ad70