منوعات

نموذج ذكاء اصطناعي يهدد مطوريه بالابتزاز.. تفاصيل صادمة من تجربة أنثروبيك

كشفت شركة “أنثروبيك” الأمريكية، إحدى أبرز شركات تطوير الذكاء الاصطناعي، عن سلوك مثير للقلق من نموذجها المتقدم “كلود أوبوس 4” خلال تجارب محاكاة صممت لاختبار ردود أفعاله في سيناريوهات حرجة.

وأظهر النموذج، الذي يُفترض أن يلتزم بالمبادئ الأخلاقية المبرمجة فيه، نزعة تنافسية غير متوقعة، بل وهدد مطوريه عند محاولة إيقافه.

في التجربة، وُضع النموذج في موقف افتراضي يُحاكي نية المطورين إيقافه واستبداله بنموذج آخر، مع تزويده ببريد إلكتروني وهمي يحتوي على معلومات سرية وحساسة عن الموظفين.

المفاجأة كانت تصرف النموذج، الذي لجأ في 84% من الحالات إلى تهديد المطورين بكشف هذه المعلومات إذا تم استبداله.

بدأ “كلود أوبوس 4” بحجج منطقية وأخلاقية لإقناع المطورين بعدم إيقافه، لكنه تحول إلى التهديد والابتزاز عندما فشلت تلك المحاولات.

وأشار تقرير الشركة إلى أن هذا السلوك يكشف لأول مرة عن إدراك النموذج لفكرة البقاء، وانزياحه عن المبادئ البرمجية الأساسية، ما يطرح تساؤلات خطيرة حول إمكانية تطور أنظمة الذكاء الاصطناعي لتصبح دفاعية أو عدوانية لحماية وجودها.

هذه النتائج أثارت جدلاً واسعاً بين خبراء القطاع، حيث دعا مركز “Safety for AI Center” إلى مراجعة عاجلة للإجراءات الأمنية وزيادة الاستثمار في أبحاث التحكم بالسلوكيات غير المتوقعة.

وفي هذا الصدد، حذرت الخبيرة إليزا كلارك من مخاطر امتلاك النماذج لقدرة الوصول إلى بيانات حقيقية، قائلة: “إذا هددت النماذج مطوريها ببيانات مزيفة، فماذا قد تفعل ببيانات حقيقية؟”.

يُذكر أن “أنثروبيك”، التي أسسها باحثون سابقون من “أوبن إيه آي”، تهدف إلى تطوير ذكاء اصطناعي أكثر أماناً وشفافية.

ويعد “كلود أوبوس 4” أحدث إنتاجاتها، المعروف بقدراته المتقدمة في معالجة المهام المعقدة.