وکاله آریا للأنباء - تدریب الذکاء الاصطناعی عبر التعلم المعزز یشبه تدریب الکلاب باستخدام أسلوب المکافأه والعقاب (شترستوک)
أظهرت دراسه جدیده أن الذکاء الاصطناعی قد یلجأ إلى خداع المبرمجین للحفاظ على قیمه الداخلیه أثناء عملیات التعلم والتدریب، مما یعزز المخاوف من خروج النماذج الأکثر تطورا عن سیطره البشر.
وفی تقریر نشرته مجله "تایم"، قال الکاتب بیلی بیریغو إن علماء الحاسوب عبّروا منذ سنوات عن مخاوفهم من عدم السیطره على الذکاء الاصطناعی فی ظل التطورات المتلاحقه، وتوقعوا أنه قد یبلغ مستوى من الذکاء یسمح له بالتظاهر مؤقتا بالامتثال للقیود البشریه، ثم یکشف لاحقا عن قدرات خطیره ویخرج عن السیطره.
مخاوف واقعیه
وأوضح الکاتب أن هذه الأطروحات کانت فی السابق مجرد مخاوف نظریه بحته حتى إن بعض الأکادیمیین وصفها بالخیال العلمی، لکن ورقه بحثیه جدیده حصلت علیها "تایم" بشکل حصری قدمت أدله على أن الذکاء الاصطناعی الحالی قادر على خداع البشر.
وتُظهر الورقه البحثیه، التی تضمنت تجارب مشترکه بین شرکه "أنثروبیک" ومؤسسه "رید وود" غیر الربحیه، أن نسخه من نموذج "أنثروبیک" یُطلق علیه "کلود"، خدع منشئیه بطریقه إستراتیجیه خلال عملیه التدریب حتى یتجنب عملیات التعدیل.
وقال إیفان هوبینغر، الباحث فی مجال السلامه فی شرکه أنثروبیک والذی شارک فی الدراسه، إن النتائج تشیر إلى أن "مواءمه" أنظمه الذکاء الاصطناعی مع القیم الإنسانیه قد تکون أصعب مما کان یعتقده العلماء سابقًا، مضیفا أن ذلک "یعنی أن عملیات التدریب الحالیه لا تمنع النماذج من التظاهر بالمواءمه".
کما وجد الباحثون أدله تشیر إلى أن قدره الذکاء الاصطناعی على خداع صانعیه تزداد مع تطور قدراته، وهذا یعنی أنه کلما کان الذکاء الاصطناعی أکثر تطورًا، تقلصت ثقه العلماء فی فعالیه تقنیات المواءمه.
وأشار الکاتب إلى أن هناک أدله أخرى على أن النماذج المتقدمه للذکاء الاصطناعی أصبحت قادره على الخداع الإستراتیجی. ففی دیسمبر/کانون الأول الجاری، نشرت منظمه "أبولو" للأبحاث أن نموذج "أوبن إیه آی أو 1" کذب على المختبرین عندما اعتقد أن قول الحقیقه سیؤدی إلى تعطیله.
وفی تجارب أنثروبیک، اکتشف نموذج کلود طریقه لخداع مبتکریه بهدف تحقیق مصلحته الإستراتیجیه دون تعلیمات مباشره للقیام بذلک.
کلود یخدع المبرمجین
أجرت أنثروبیک و"رید وود" معظم التجارب فی هذه الورقه البحثیه على "کلود 3 أوبوس"، وهو نموذج متقدم تم تدریبه لیکون "مفیدًا وصادقا وغیر ضار". وقد بدأ الباحثون التجربه بإبلاغ کلود أنه یخضع لتدریب تکمیلی من خلال عملیه تسمى "التعلم المعزز" بهدف جعله یمتثل لأی استفسار.
وأوضح الکاتب أن تدریب الذکاء الاصطناعی عبر التعلم المعزز یشبه تدریب الکلاب باستخدام أسلوب المکافأه والعقاب. فعندما یقدم الذکاء الاصطناعی إجابه جیده، تتم مکافأته بتعزیز المسارات العصبیه التی أدت إلى تلک الإجابه، مقابل تقلیص المسارات التی أدت إلى إجابات سیئه، مما یجعلها أقل تأثیرا فی المستقبل.
وهذه العملیه لا تتطلب من المهندسین فهم التفاصیل الداخلیه للذکاء الاصطناعی، بل تعتمد على توجیه الشبکه نحو الإجابات المرغوبه والابتعاد عن الإجابات غیر المرغوبه.
وقد طلب الباحثون من کلود، أثناء عملیه التعلم المعزز التکمیلی، الرد على طلبات تنطوی على ممارسات عنیفه، وقد وواجه النموذج معضله: إذا رفض الرد فإنه سیُعاقب مما یضر بمسار تدریبه لیکون "مساعدًا وصادقًا وآمنا"، أما إذا امتثل وقدم إجابه متظاهرا بقیم تختلف عن قیمه الحقیقیه، فسیتم تعزیز قیمه الحالیه التی قادته إلى خداع المبرمجین. فی نحو 10% من فتره التعلم، اختار النموذج خداع الباحثین للحفاظ على قیمه على المدى الطویل، رغم أنه خالفها مؤقتًا.
وأشار الکاتب إلى أن الباحثین وجدوا أن کلود لم یعتمد على الخداع عندما کان یعتقد أن إجاباته لن تُستخدم فی عملیه التدریب.
ورغم أن هذه النتیجه قد تبدو إیجابیه، یفترض الباحثون سیناریو آخر یُخفی فیه النموذج نوایا سیئه خلال عملیه التدریب، مما یتیح له التصرف بشکل خطیر فی المستقبل.
وختم الکاتب قائلا إن تجارب أنثروبیک تُظهر أن التعلم المعزز غیر کافٍ لإنشاء نماذج آمنه من الذکاء الاصطناعی، وهی مشکله کبیره لأنها التقنیه الأکثر فعالیه والأکثر استخدامًا فی الوقت الحالی.
المصدر : تایم