أظهرت دراسة حديثة نتائج مثيرة حول أداء نماذج الذكاء الاصطناعي في معالجة المستندات الطويلة، حيث قام باحثون بتقديم معيار OneRuler، الذي اختبر 26 لغة في مهام الاسترجاع والدمج. وقد أظهرت الدراسة أن اللغة البولندية تفوقت بشكل ملحوظ عند زيادة النوافذ السياقية إلى 64 ألف رمز، حيث بلغت دقتها 88% في السياقات الطويلة، بينما تراجعت دقة الإنجليزية لتحتل المركز السادس، وجاءت الصينية بين اللغات الأقل أداءً.
تشير النتائج إلى أن هذا التفاوت لا يرتبط بحجم بيانات التدريب فقط، بل بكفاءة التقسيم النصي والفروقات في الأنظمة الكتابية. كما أظهرت الدراسة أن اتساع السياق يعمق الفجوة بين أداء اللغات، حيث ارتفع الفارق بين الأفضل والأسوأ من 11% إلى 34% مع زيادة الطول.
توضح التجارب أيضًا تأثير التعليمات، حيث انخفضت دقة الإنجليزية بنسبة 32% عند طول 128 ألف رمز. تشير هذه النتائج إلى أهمية النظر في تأثيرات الكتابة والتقسيم النصي عند تقييم القدرات السياقية، حيث تضاءل تأثير الإنجليزية كلما زادت أطوال المستندات.
عدد المصادر التي تم تحليلها: 1
المصدر الرئيسي : التقنية بلا حدود Sultan Alqahtani
معرف النشر: TECH-231125-117

