تكنولوجيا

مشروع Wikidata Embedding يفتح محتوى ويكيبيديا أمام أنظمة الذكاء الاصطناعي

Df847562 fc25 41a5 9b54 30e781291543 file.jpeg

مشروع Wikidata Embedding: فتح أبواب ويكيبيديا أمام الذكاء الاصطناعي

أعلنت Wikimedia Deutschland عن إطلاق مشروع جديد يُعرف باسم Wikidata Embedding، يهدف إلى تسهيل وصول أنظمة الذكاء الاصطناعي إلى المعلومات الغزيرة المتوفرة على ويكيبيديا. يعتمد المشروع على تقنية البحث الدلالي المعتمد على المتجهات، مما يُساعد الحواسيب على فهم العلاقات بين الكلمات والمعاني في المحتوى.

يضم المشروع أكثر من 120 مليون إدخال من ويكيبيديا ومنصاتها الشقيقة. كما يستفيد من دعم بروتوكول Model Context Protocol (MCP)، الذي يوفر وسيلة فعّالة لتواصل نماذج الذكاء الاصطناعي بشكل مباشر مع مصادر البيانات، مما يسهل استعلامات اللغة الطبيعية ويعزز التكامل مع أنظمة RAG التي تدمج معلومات خارجية موثوقة.

يشارك في هذا المشروع كل من Jina.AI، المتخصصة في البحث العصبوني، وشركة DataStax التابعة لـ IBM، حيث توفر الدعم في التعامل مع البيانات اللحظية. وتوضح Wikimedia أن هذا المشروع يمثل تطورًا مهمًا عن أدوات البحث السابقة، التي كانت تقتصر على كلمات مفتاحية أو أوامر SPARQL، مما يعزز دقة النتائج ويمنح المطورين مزيدًا من المرونة.

تُتيح القاعدة الجديدة نتائج ذات سياق دلالي غني، فعند البحث عن مصطلح مثل “عالِم”، تظهر أسماء علماء بارزين وروابط لمفاهيم ذات صلة وصور متاحة للاستخدام وترجمات متعددة.

المشروع متاح الآن عبر Toolforge، وسينظم فريق Wikidata ندوة عبر الإنترنت في 9 أكتوبر لشرح كيفية استفادة المطورين منه. يأتي هذا في وقت تسعى فيه مختبرات الذكاء الاصطناعي للحصول على مصادر بيانات عالية الجودة، مما يعكس الأهمية المتزايدة للبيانات في المجال.


عدد المصادر التي تم تحليلها: 3
المصدر الرئيسي : عالم التقنية – فريق التحرير
معرف النشر: TECH-021025-653

تم نسخ الرابط!
1 دقيقة و 13 ثانية قراءة