أطلقت شركة “علي بابا” الصينية نموذجًا جديدًا من الذكاء الاصطناعي يُدعى Qwen2.5-VL، الذي يتميز بقدرات متطورة في معالجة النصوص والصور، وفهم مقاطع الفيديو، بالإضافة إلى التحكم في الحواسيب. يُعد هذا النموذج منافسًا لنماذج شهيرة مثل GPT-4o من OpenAI وClaude 3.5 Sonnet من Anthropic.
يعرض النموذج Qwen2.5-VL-72B أداءً متفوقًا في مهام متعددة تتعلق بتحليل المستندات والفيديوهات، ويمكن تجربته عبر تطبيق Qwen Chat أو تنزيله من منصة Hugging Face. يتميز هذا النموذج بقدرته على تحليل البيانات من الفواتير والجداول، فضلاً عن فهم محتوى مقاطع الفيديو الطويلة والتعرف على الشخصيات والأعمال الفنية.
أحد الجوانب المثيرة في Qwen2.5-VL هو قدرته على التحكم في التطبيقات والأجهزة، سواء على الحواسيب أو الهواتف المحمولة، وقد تم عرض ذلك من خلال فيديو يظهر استخدام النموذج لتطبيق “بوكينج” لحجز الرحلات. ومع ذلك، يواجه النموذج بعض التحديات في البيئات الحاسوبية المعقدة، كما تشير اختبارات الأداء إلى تسجيله نتائج ضعيفة في بعض السياقات.
سلسلة Qwen2.5-VL تتضمن نماذج بأحجام مختلفة، ولديها ترخيص متساهل للنماذج الصغيرة، بينما النموذج الرئيسي يتطلب ترخيصًا خاصًا من علي بابا. من خلال هذا الإطلاق، تستهدف علي بابا تعزيز مكانتها في سباق الذكاء الاصطناعي العالمي، باحثة عن تقديم حلول مبتكرة تلبي احتياجات المطورين والمستخدمين.
عدد المصادر التي تم تحليلها: 6
المصدر الرئيسي : aitnews.com محمد فارس
post-id: c484f1d2-4524-4e93-aa3d-73681909e70a