أعلنت شركة “إنسبشن”، إحدى شركات مجموعة (جي42) والمتخصصة في تقنيات الذكاء الاصطناعي، بالتعاون مع جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI)، عن إطلاق منصة “AraGen Leaderboard”. تُعد هذه المنصة أول نظام مصمم خصيصاً لتحسين تقييم أداء النماذج اللغوية الكبيرة للغة العربية (LLMs). تعتمد المنصة على نظام تقييم حديث يسمى «3C3H» يهدف إلى تقديم تقييم شفاف وشامل لدقة نتائج النماذج اللغوية العربية وفاعليتها.
تستهدف المنصة أكثر من 400 مليون ناطق باللغة العربية، وتعمل على معالجة فجوات كبيرة في تقييم الذكاء الاصطناعي. توفر “AraGen Leaderboard” مجموعة بيانات تقييمية مصممة بعناية لتتناسب مع التعقيدات اللغوية والثقافية العربية. كما أنها تتميز بقدرتها على مواجهة التحديات مثل تسرب بيانات التقييم ومشكلة تكرار نتائج التقييم، مما يمنحها مستوى أعلى من الدقة في تقييم المعلومات ومدى فائدتها في الاستخدام العملي.
تؤكد “AraGen Leaderboard” على أهمية الشفافية والشمولية، حيث تعتمد معايير جديدة تشمل الدقة، والاكتمال، والإيجاز، والفائدة، والنزاهة، والخلو من الضرر. تقوم المنصة باختبار النماذج بناءً على 279 سؤالاً متنوعاً، تغطي مجالات مثل قواعد اللغة العربية، والاستدلال، والأمان، بما يتماشى مع احتياجات الناطقين بالعربية. إضافةً إلى ذلك، يتم تحديث المنصة كل ثلاثة أشهر مما يضمن حداثة التقييم ويدعو مجتمع الباحثين للمشاركة.
علق أندرو جاكسون، الرئيس التنفيذي لشركة “إنسبشن”، على إطلاق المنصة قائلاً: “ترتقي منصة ‘AraGen Leaderboard’ بأسس تقييم النماذج اللغوية الكبيرة للغة العربية، من خلال التركيز على معايير العدالة والشمولية والابتكار.” وأكد أن هدف المنصة هو معالجة أوجه القصور الموجودة في المعايير التقييمية السابقة.
البروفيسور بريسلاف ناكوف، رئيس قسم معالجة اللغة الطبيعية في جامعة محمد بن زايد، وصف المنصة بأنها “خطوة كبيرة نحو إنشاء نظام مفتوح وشفاف”. وأشار إلى أن “AraGen Leaderboard” تختلف عن المنصات التقليدية بتقديمها لأسئلة جديدة ومبتكرة بشكل دوري.
كما أضاف علي الفلالي، مهندس التعلم الآلي في “إنسبشن”، أن الهدف هو تطوير معيار دقيق لتقييم نماذج اللغة، مع التركيز على الشفافية وفائدة النتائج للمستخدمين.
بفضل هذه المنصة، يصبح لدى المؤسسات القدرة على اختيار النماذج المناسبة لاحتياجاتها بسهولة وثقة، مما يساهم في تحسين تطبيقات الذكاء الاصطناعي في العالم العربي.
عدد المصادر التي تم تحليلها: 4
المصدر الرئيسي : بيانات صحفية
post-id: 7a4f8d01-e179-48ef-9de2-56a155a0cd66