دراسة: الذكاء الاصطناعي يواجه صعوبات في فهم التاريخ
كشفت دراسة حديثة أن الذكاء الاصطناعي، رغم تفوقه في مجالات تقنية وإبداعية مثل كتابة الأكواد أو إنتاج البودكاست، لا يزال يواجه تحديات كبيرة في فهم التاريخ. قام فريق من الباحثين بإنشاء معيار جديد يسمى “Hist-LLM” لقياس أداء ثلاثة نماذج لغوية شهيرة (GPT-4) من OpenAI، و(Llama) من ميتا، و(Gemini) من جوجل في قراءة أسئلة تاريخية معقدة، مرتكزين على قاعدة بيانات ضخمة تاريخية تُعرف بـ”Seshat”.
ركز المعيار على دقة وموثوقية المعلومات المقدمة من النماذج، مقارنةً بمعلومات قاعدة بيانات “Seshat”. وقد عُرضت النتائج في مؤتمر (NeurIPS)، حيث حقق نموذج (GPT-4 Turbo) أعلى درجات الدقة، ولكن لم تتجاوز نسبته 46% في الإجابة عن الأسئلة، مما يشير إلى قلة فعالية هذا النموذج، إذ تقترب هذه النسبة من التخمين العشوائي.
أوضحت ماريا ديل ريو-شانونا من جامعة كوليدج لندن أن النماذج قد تكون جيدة في استرجاع الحقائق الأساسية، لكنها تفتقر لفهم السياق التاريخي المعقد. الدراسات أظهرت أيضًا أن هذه النماذج تميل إلى الاستناد إلى معلومات شائعة، مما يمنعها من استرجاع تفاصيل تاريخية مهمة.
وأشار الباحثون إلى وجود تحيزات في بيانات التدريب، خاصة فيما يتعلق بمناطق مثل أفريقيا جنوب الصحراء الكبرى. على الرغم من ذلك، يرى بعض الباحثين أن لهذه النماذج القدرة على مساعدة المؤرخين مستقبلاً، إذا ما تم تحسين أساليب تقييمها وإضافة معلومات أكمل.
عدد المصادر التي تم تحليلها: 5
المصدر الرئيسي : aitnews.com أمينة حسني
post-id: d3e8f7eb-761c-4603-af3e-1c9a9a7f0d77