أعلنت شركة تنسنت Tencent الصينية عن إطلاق نموذج HunyuanVideo، وهو نموذج مفتوح المصدر لتوليد الفيديو باستخدام الذكاء الاصطناعي، يهدف إلى المنافسة مع النماذج التجارية المتاحة في السوق. يُعتبر HunyuanVideo أكبر نموذج من نوعه بمجموع أكثر من 13 مليار مَعلَمة.
تشير التقارير الفنية إلى أن أداء HunyuanVideo يتفوق على أنظمة المنافسة، مثل Runway Gen-3 وLuma 1.6، بالإضافة إلى نماذج أخرى من تطوير الشركات الصينية. الاختبارات أظهرت أنه يقدم نتائج متميزة في جودة الحركة داخل مقاطع الفيديو.
يدعم HunyuanVideo مجموعة من المهام، منها تحويل الأوصاف النصية إلى مقاطع فيديو، وتحويل الصور الثابتة إلى مشاهد متحركة، وإنشاء شخصيات متحركة، وإضافة الأصوات. استخدمت فرق تنسنت نهج تدريب متعدد المراحل، بدأ بتدريب على صور ذات دقة منخفضة (256 بكسل) ثم الانتقال إلى تدريبات مختلطة بدقة أعلى، مما يسهم في تحسين جودة الناتج النهائي على مراحل.
من خلال إطلاق HunyuanVideo كمصدر مفتوح، تسعى تنسنت لتقليص الفجوة بين الأنظمة المملوكة والأنظمة المتاحة للجميع. تم إصدار الشفرة المصدرية عبر منصة GitHub، مع خطط لتطوير إضافات جديدة في المستقبل.
يضع هذا الإطلاق شركة تنسنت في منافسة مباشرة مع عمالقة مثل Runway وOpenAI، بالإضافة إلى شركات صينية أخرى مثل KLING، مما يعكس التقدم السريع في مجال تقنية توليد الفيديو بالذكاء الاصطناعي.
عدد المصادر التي تم تحليلها: 3
المصدر الرئيسي : aitnews.com محمد فارس
post-id: 907d6419-2b23-441b-8e90-c9ed0b9d904e