علي بابا تدخل عصر الذكاء الاصطناعي المادي بحزمة نماذج Qwen-Robot

الأربعاء – 17 يونيو 2026 | 3:22 مساءً

حققت نماذج Qwen-Robot Suite أداءً رائدًا على مستوى القطاع عبر عشرات المعايير المرجعية المتخصصة في الروبوتات. على مدى سنوات، أظهرت النماذج اللغوية ومتعددة الوسائط واسعة النطاق قدرات متقدمة في فهم البيانات الرقمية، بما يشمل النصوص والصور والصوت. إلا أن تحويل هذا الفهم إلى أفعال مادية دقيقة داخل بيئات متنوعة ظلّ أحد أبرز التحديات أمام تطوير الروبوتات الذكية. فالعديد من الأنظمة التقليدية تواجه صعوبة في التكيّف مع البيئات غير المألوفة أو الاستجابة لتعليمات جديدة، نتيجة محدودية قدرتها على الربط الديناميكي بين الأوامر اللغوية والحركة.

ولمعالجة هذا التحدي، أعلنت علي بابا رسميًا عن إطلاق أول مجموعة من النماذج الروبوتية الأساسية المبنية على نموذج Qwen تحت اسم Qwen-Robot Suite. وتضم المجموعة ثلاثة نماذج رئيسية: Qwen-RobotManip، نموذج عام للرؤية واللغة والفعل (Vision-Language-Action)؛ Qwen-RobotNav، نموذج للرؤية واللغة والتنقل (Vision-Language-Navigation)؛ Qwen-RobotWorld، نموذج عالمي قائم على الفيديو ومصمم لدعم الذكاء المجسد (Embodied Intelligence).

ومن خلال دمج قدرات التنقل والتفاعل مع الأشياء وفهم ديناميكيات العالم المحيط، تمكّن مجموعة Qwen-Robot Suite الروبوتات العاملة في البيئات الواقعية – سواء كانت أذرعًا صناعية أو روبوتات توصيل أو كلابًا روبوتية – من الإدراك والاستدلال واتخاذ الإجراءات المناسبة في الوقت الفعلي. وتتمتع النماذج بقدرات قوية على التعميم، ما يسمح لها بالتعامل مع مهام وتعليمات لم يسبق لها مواجهتها، والعمل بكفاءة في بيئات جديدة والتفاعل مع أجسام غير مألوفة، مع الالتزام بالقوانين الفيزيائية والاستجابة للأوامر الطبيعية باللغة البشرية.

ويمثل هذا الإطلاق محطة استراتيجية مهمة في تطور منظومة Qwen، إذ توسّع علي بابا نطاق نماذجها الأساسية من العالم الرقمي إلى مجال الذكاء الاصطناعي المادي. وفي ظل التحول المتسارع نحو عصر الذكاء الاصطناعي الوكيلي، تواصل الشركة الانتقال من تطبيقات المحادثة التقليدية إلى أنظمة ذكية مستقلة قادرة على تنفيذ مهام معقدة في العالمين الرقمي والمادي.

وقد حققت النماذج الثلاثة أداءً رائدًا على مستوى القطاع عبر عشرات المعايير المرجعية العالمية في مجال الروبوتات، بما في ذلك RoboChallenge، أحد أبرز الاختبارات المخصصة لتقييم قدرات الذكاء المتجسد باستخدام روبوتات حقيقية. كما دخلت مجموعة Qwen-Robot Suite بالفعل مرحلة الاختبارات التجريبية مع مجموعة مختارة من عملاء Alibaba Cloud في قطاع الروبوتات.

Qwen-RobotManip (الاسم الرمزي: Lira وAtlas) تصدّر نتائج RoboChallenge، وهو معيار واسع النطاق قائم على روبوتات حقيقية لقياس قدرات الذكاء المتجسد. تمّ بناء هذا النموذج من فئة VLA بالاعتماد على نموذج Qwen3.5-4B VL، وقد جرى تدريبه لما يزيد عن 38,000 ساعة من البيانات المُصنّفة مفتوحة المصدر بالكامل، والتي جرى انتقاؤها بعناية من مستودعات الروبوتات، ومقاطع فيديو تظهر عمليات التفاعل البشري، ومجموعات بيانات مُركَّبة تربط بين الحركات البشرية والروبوتية. ويُحقّق هذا النموذج تحسّنًا بمقدار ثلاثة أضعاف مقارنةً بأحدث ما توصلت إليه التكنولوجيا وأكثرها تقدّمًا في مجال النقل عبر التجسيدات الروبوتية المختلفة، مما يُتيح نشر النموذج عبر أجهزة روبوتية متنوعة مع الحاجة إلى حد أدنى من إعادة التدريب.

Qwen-RobotNav: يعتمد هذا النموذج الخاص بالملاحة البصريّة – اللغوية على النظام Qwen3-VL وهو مُدرب على مجموعة بيانات منسّقة ومختارة بعناية تضم 15.6 مليون عينة تشمل تخطيط المسارات والاستدلال القائم على الرؤية واللغة. كما يُعدّ هذا النموذج بمثابة محرك ملاحة قابل للتوسع، وواجهة مُوحّدة لأنظمة الملاحة الوكيلة. وهذا ما يجعله لبنة أساسية طبيعية للأنظمة الوكيلة التي تتعامل مع مهام ذات أفق زمني طويل، مثل الإجابة المتجسّدة على الأسئلة، وهي مهمة في مجال الذكاء الاصطناعي يُطرح فيها سؤال على الروبوت يتناول المساحات المادية.

Qwen-RobotWorld: يتنبّأ نموذج عالم الفيديو المذكور بمسارات بصرية مستقبلية تستند إلى القوانين الفيزيائية، بناءً على الملاحظات الحالية. وقد تمّ تدريب النموذج على 8.6 مليون زوج من مقاطع الفيديو والنصوص، تضم أكثر من 200 مليون إطار عبر أكثر من 20 نوعًا من التجسيدات و500 فئة من الإجراءات. ويمكن لهذا النموذج توليد بيانات تدريب فيديو اصطناعية للروبوتات، كما يتيح للأنظمة محاكاة المسارات المستقبلية قبل تنفيذها فعليًا. وتُعدّ هذه القدرة قابلة للتطبيق بشكل كبير في مجالات التفاعل الروبوتي مع محيطه، والتخطيط المُتجسّد، والملاحة الداخلية المعقدة.

تُظهر مجموعة Qwen-Robot Suite أداءً رائدًا في القطاع عبر معايير تقييم الروبوتات المختلفة، حيث تُتيح إمكانية تحويل نماذج الذكاء الاصطناعي العام إلى وكلاء فاعلين وعمليّين على مستوى العالم المادي. ويمكن لنماذج Qwen متعددة الأغراض أن تتكامل مباشرة مع النماذج الروبوتية، مستخدمةً إياها كأدوات متخصصة لسد الفجوة بين الذكاء العام والتنفيذ المادي الملموس للأفعال. على سبيل المثال، في إطار عمل وكيلي، يتمّ التعامل مع طلب مفتوح مثل “تحقّق مما إذا كانت مظلة خضراء قد تُركت في مقهى كوتي”، بإمكان نظام وكيلي يستخدم نموذج “Qwen” متعدد الأغراض، كمخطط استراتيجي من المستوى الأعلى، “Qwen-RobotNav” كأداة للتنفيذ في الوقت الفعلي، أن يتنقل بشكل مستقل في المكان المادي لتقديم إجابة تستند إلى أدلة ميدانية.

وبالتطلّع إلى المستقبل، تُخطّط علي بابا لدمج مجموعة “Qwen-Robot Suite” ضمن منظومة أوسع نطاقًا من الوكلاء الماديّين، مما يمنحها قدرات عالية من الاستقلالية على صُعد الإدراك، واتخاذ القرارات المكانية، والتنفيذ على المدى الطويل وذلك في بيئات واقعية تتمتّع بالديناميكية.

-انتهى-

عدد المصادر التي تم تحليلها: 4
المصدر الرئيسي : بيانات صحفية
معرف النشر : BIZ-170626-746

علي بابا تدخل عصر الذكاء الاصطناعي المادي بحزمة نماذج Qwen-Robot

+

إضافات أخرى