أظهرت دراسة حديثة أن النماذج اللغوية الكبيرة، مثل “الشات بوت”، تعاني من ضعف إدراكي مشابه لما يحدث مع البشر في مرحلة الشيخوخة. تمت الدراسة باستخدام اختبارات مصممة للكشف عن علامات خرف الشيخوخة، حيث أظهرت النماذج الأقدم أداءً أقل مقارنةً بالأحدث. نشر الباحثون نتائجهم في دورية الجمعية الطبية البريطانية، مشيرين إلى أن هذه النتائج تحد من فكرة استبدال الأطباء بالذكاء الاصطناعي في المستقبل القريب.
تطور الذكاء الاصطناعي بشكل هائل في السنوات الأخيرة، مما أثار جدلاً كبيرًا حول مدى تفوقه على الأطباء البشريين. فعلى الرغم من تحقيق بعض نماذج الذكاء الإصطناعي نتائج ممتازة في الاختبارات الطبية، تبقى هناك مخاطر جسيمة تتعلق بالاعتماد عليها، مثل تقديم معلومات مضللة أو الاستشهاد بالمصادر غير الصحيحة.
ركزت الدراسة على اختبار الإدراك لدى نماذج مثل ChatGPT وGemini، باستخدام تعليمات مشابهة لاختبارات التقييم الإدراكي للمرضى. ورغم أن النماذج أظهرت أداء جيدًا في معظم المهام اللغوية والتركيز، إلا أنها فشلت في تنفيذ مهام تتطلب قدرات بصرية وتنفيذية، مثل رسم المسارات، مما يعكس ضعفًا إدراكيًا.
وجد الباحثون أن أداء النماذج في الاختبارات المختلفة يتفاوت، حيث حصل نموذج GPT-4o على أعلى الدرجات. لكن الأداء الضعيف في مهارات بصرية معينة يزيد من مخاوف استخدام الذكاء الاصطناعي في الرعاية الطبية، مما يتطلب مزيدًا من التقييم لضمان فعاليته وسلامة المرضى.
عدد المصادر التي تم تحليلها: 5
المصدر الرئيسي : Asharq News
post-id: 9fdb66c6-f72f-4b2a-9c9f-c2e01b534f80