تكنولوجيا

دراسة حديثة.. نماذج الذكاء الاصطناعي المتطورة غير قادرة على حل معظم المشكلات البرمجية

%d8%af%d8%b1%d8%a7%d8%b3%d8%a9 %d8%ad%d8%af%d9%8a%d8%ab%d8%a9 %d9%86%d9%85%d8%a7%d8%b0%d8%ac %d8%a7%d9%84%d8%b0%d9%83%d8%a7%d8%a1 %d8%a7%d9%84%d8%a7%d8%b5%d8%b7%d9%86%d8%a7%d8%b9%d9%8a %d8%a7%d9%84

تشير دراسة حديثة من باحثين في OpenAI إلى أن النماذج المتطورة من الذكاء الاصطناعي ما زالت عاجزة عن مواجهة معظم التحديات البرمجية بالكفاءة اللازمة. على الرغم من تصريحات الرئيس التنفيذي سام ألتمان حول تحسن أداء هذه النماذج بحلول نهاية العام، أظهرت النتائج أنها لا تزال بحاجة إلى التطوير.

اعتمدت الدراسة على معيار جديد يسمى SWE-Lancer، وتم استخدامه لتقييم ثلاثة نماذج متقدمة: o1 وGPT-4o من OpenAI، وClaude 3.5 Sonnet من شركة Anthropic. تم اختبارها في مجالات إصلاح الأخطاء البرمجية وإدارة المشاريع، مع عدم السماح لها بالوصول إلى الإنترنت لضمان عدم استخدام حلول جاهزة.

أظهرت النتائج أن هذه النماذج واجهت صعوبات جمة في التعامل مع المهام، حيث تمكنت من إصلاح الأخطاء البسيطة فقط وتعثرت في التعرف على المشكلات الأكبر. رغم أنها كانت أسرع في تنفيذ المهام، إلا أن فهمها للأخطاء كان ضعيفًا، مما أدى إلى حلول غير دقيقة.

من بين النماذج المختبرة، برز نموذج Claude 3.5 Sonnet بأداء نسبي أفضل، رغم أن معظم إجاباته كانت غير صحيحة. وأكد الباحثون أن هناك حاجة ملحة لتحسين الدقة والموثوقية قبل الاعتماد على هذه الأنظمة في العمل البرمجي الحقيقي.

تلخص هذه الدراسة أن الذكاء الاصطناعي لم يصل بعد إلى مستوى المبرمجين البشريين، ورغم إفادته في المهام البسيطة، فإنه يفتقر إلى القدرة على إدارة المشاريع المعقدة كما يفعل البشر. ورغم ذلك، تستمر بعض الشركات في استبدال المبرمجين بالذكاء الاصطناعي على الرغم من النقص الحالي في الكفاءة.



عدد المصادر التي تم تحليلها: 1
المصدر الرئيسي : aitnews.com آية رضوان
post-id: 6a5b5007-559f-4e69-9ee5-4c1d6ea799fd

تم نسخ الرابط!
1 دقيقة و 13 ثانية قراءة