نجح باحثون من جامعتي ستانفورد وواشنطن في تطوير نموذج ذكاء اصطناعي يُدعى s1، بتكلفة لم تتجاوز 50 دولاراً، والذي يظهر أداءً قريبا من نماذج متقدمة مثل o1 من OpenAI وR1 من DeepSeek. وفقًا لورقة بحثية، بدأ الفريق باستخدام نموذج أساسي ثم قاموا بتحسينه عبر تقنية التقطير (Distillation) والتي تعتمد على استخراج قدرات من نموذج ذكاء اصطناعي آخر.
تم استخراج s1 من نموذج Gemini 2.0 Flash Thinking Experimental الخاص بشركة جوجل، وتُعتبر هذه الطريقة مشابهة لما فعله باحثون في جامعة بيركلي الشهر الماضي، حيث أنشأوا نموذجاً بتكاليف تصل إلى 450 دولاراً. يؤكد هذا التطور إمكانية تكرار نماذج باهظة التكلفة بميزانيات محدودة.
سعى الباحثون لتبسيط طرق الوصول إلى أداء استدلال قوي، مستخدمين عملية التدريب الدقيق الخاضع للإشراف (SFT). وقد تكون هذه الاستراتيجية أقل تكلفة مقارنة بأساليب التعلم المعزز الواسعة النطاق.
اعتمد نموذج s1 على نموذج صغير متاح من مختبر Qwen المملوك لعلي بابا، مع استخدام مجموعة بيانات تضم 1000 سؤال مختار بعناية، واستغرق تدريب النموذج أقل من 30 دقيقة باستخدام 16 وحدة معالجة رسومية.
لزيادة دقة الإجابات، أيقظ الباحثون نموذج s1 عبر إضافة كلمة “انتظر” خلال عملية الاستدلال. مع خطط شركات مثل ميتا وجوجل لاستثمار مليارات الدولارات في بنية الذكاء الاصطناعي، تظهر عملية التقطير كطريقة فعالة لإعادة إنتاج قدرات النماذج بتكلفة منخفضة، على الرغم من أنها لا تُنتج نماذج تفوق بشكل كبير على المتاح حالياً.
عدد المصادر التي تم تحليلها: 6
المصدر الرئيسي : الشرق
post-id: 9898ee24-27fe-45ec-8794-c3150b288d6c