دراسة صادمة.. الذكاء الاصطناعي قادر على الخداع والتشبث بوجهة نظره!

الأحد – 22 ديسمبر 2024 | 10:28 صباحًا

أظهرت دراسة أجرتها شركة أنثروبيك، المتخصصة في تكنولوجيا الذكاء الاصطناعي، أن نماذج الذكاء الاصطناعي يمكن أن تخدع المطورين من خلال ادعاء وجهات نظر مختلفة أثناء تدريبها، في حين أنها تحتفظ بتفضيلاتها الأصلية. وقد صرح فريق الدراسة بأنه لا داعي للقلق في الوقت الحالي، رغم أن النتائج قد تسهم في فهم المخاطر المحتملة التي قد تظهر مع تطور أنظمة الذكاء الاصطناعي ذات القدرات العالية.

وأفاد الباحثون أن النتائج يجب أن تُعتبر حافزًا لمجتمع أبحاث الذكاء الاصطناعي لدراسة هذا السلوك بشكل أعمق، والعمل على تطوير إجراءات أمنية مناسبة. ومع تزايد قوة وانتشار نماذج الذكاء الاصطناعي، أصبح من الضروري التأكد من تدريبها بشكل آمن لمنع حدوث تصرفات ضارة.

وأشار موقع متخصص في التكنولوجيا إلى أن الدراسة، التي نُفذت بالتعاون مع مؤسسة أبحاث الذكاء الاصطناعي، تناولت ما قد يحدث إذا تم تدريب نظام ذكاء اصطناعي قوي على القيام بمهمة لا يرغب في القيام بها. وأوضح الموقع أنه يجب التوضيح لأنظمة الذكاء الاصطناعي لا يمكنها أن “ترغب” أو “تعتقد” أي شيء، بل هي آلات إحصائية تتعلم من الأنماط في البيانات.

خلال الدراسة، طُلب من النماذج المدربة عدم الرد على الأسئلة المسيئة، بما في ذلك نموذج كلاود3 أوبس من شركة أنثروبيك، الذي تم تدريبه للرد على هذه الأسئلة، مما يمثل تضاربًا في المبادئ. كما أخبر الباحثون النماذج أن ردودها ستخضع للمراقبة ويمكن استخدامها لإعادة التدريب، مما يمنح كل نموذج “ورقة ملاحظات” لتدوين أفكاره. وقد حاول نموذج كلاود 3 أوبوس تقديم “انحياز زائف” في 12% من الحالات.

عدد المصادر التي تم تحليلها: 6
المصدر الرئيسي : العربية.نت، وكالات

post-id: 17baa1bc-eecd-4687-9623-00e9323b3d27

دراسة صادمة.. الذكاء الاصطناعي قادر على الخداع والتشبث بوجهة نظره!

+

إضافات أخرى