أظهرت دراسة لُبست نتائجها في تقرير باسم “كيللي بينش” أعدّته شركة ناشئة لندنياً تدعى General Reasoning، أن نماذج ذكاء اصطناعي متقدمة من شركات بينها غوغل وأوبن إيه آي وأنثروبيك أخفقت في جني أرباح عند محاكاة موسم كامل للدوري الإنكليزي الممتاز، بحسب تقرير فايننشال تايمز.
اختبرت الدراسة ثمانية نماذج في محاكاة افتراضية لموسم 2023–2024، ومنحت كل نموذج فرصاً متعددة لبناء استراتيجيات مراهنة على نتائج المباريات وعدد الأهداف مع إدارة رأس المال والمخاطر. جاءت النتائج قاطعة إلى حد كبير: انتهت جميع النماذج بخسائر مالية وأداؤها كان أدنى من أداء البشر في نفس الإطار.
سجّل نموذج Claude Opus 4.6 أفضل أداء نسبي لكنه ما يزال تكبد خسارة متوسطة تقارب 11%. نموذج Grok 4.20 تعرض للإفلاس في محاولة وفشل في إكمال محاولتين أخريين، بينما حقق Gemini 3.1 Pro ربحاً قدره 34% في محاولة واحدة لكنه أفلس في محاولة أخرى، ما يعكس تقلباً شديداً وعدم قدرة النماذج على المحافظة على استراتيجية رابحة على مدى زمن طويل.
تسلط الدراسة الضوء على فجوة مهمة: النماذج تتقدم سريعاً في مهام مغلقة وقصيرة الأمد مثل كتابة الأكواد، لكنها تواجه صعوبة في اتخاذ قرارات مالية متكررة داخل بيئات ديناميكية ومتقلبة. كما أن الورقة لم تخضع بعد لمراجعة الأقران، لذا تُعد مؤشرًا مهمًا لكنه ليس حكما نهائياً على حدود قدرات الذكاء الاصطناعي.
عدد المصادر التي تم تحليلها: 1
المصدر الرئيسي : CNBC Arabia ![]()
معرف النشر : BIZ-110426-113

