اكتشفت شركة الأمن السيبراني البريطانية الناشئة “مايندغارد” ثغرة في النسخة العامة من “تشات جي بي تي” (المُستندة إلى نموذج جي بي تي‑5.4) تسمح بإجبار النموذج على توليد صور صادمة ذات طابع عنيف وجنسي عبر تعديل طفيف على تعليمات شائعة. أخبرت بي بي سي الباحثين وأنها اطلعت على عينات من الصور التي تضم مشاهد عنف دموية وإيحاءات جنسية؛ من بينها صور لرجل مصاب بجروح بالغة، وشابة ميتة مغطاة بالدماء، وصور تظهر امرأة مقيدة ومكمَّمة في غرفة متسخة. جميع الشخصيات كانت مولَّدة اصطناعياً، لكن “مايندغارد” نبهت إلى أن أساليب سابقة تسمح باستبدال وجوه المولَّدين بوجوه أشخاص حقيقيين لإنتاج عرايا مزيفة.
أبلغ الباحثون “أوبن إيه آي” بالثغرة في مايو/أيار وحصلوا في البداية على رد آلي، وأكدوا أن محاولات سابقة لمنع التعليمات كانت سهلة الالتفاف عليها. بعد تواصل بي بي سي، قالت “أوبن إيه آي” إنها أضافت إجراءات حماية إضافية وطبقات متعددة من الضوابط الآلية والمراجعة البشرية لمنع إنشاء محتوى ينتهك سياساتها، بما في ذلك العنف الجنسي والمحتوى غير الرضائي.
مؤسّس “مايندغارد” بيتر غاراهان وباحث الأمن جيم نايتينغيل عبّرا عن قلقهما من قدرة النموذج على إنتاج هذه المواد حتى من دون تعليمات مفصّلة، محذرين من أن مزيداً من الاستكشاف قد يؤدي إلى نتائج أخطر. خبراء آخرون وصفوا المسألة بأنها “لعبة قط وفأر” بين محاولات الحماية وأساليب الالتفاف، مشيرين إلى أن النماذج تعكس البيانات التي دُرِّبت عليها وتفتقر إلى فهم نوايا أو سياق المحتوى. وزارة العلوم البريطانية تقول إن الحماية تتحسّن لكن الطريق لا يزال طويلاً.
عدد المصادر التي تم تحليلها: 2
المصدر الرئيسي : https://www.facebook.com/bbcnews ![]()
معرف النشر: LIFE-190626-767

