مطالعه نشان می‌دهد که مدل‌های چینی و آمریکایی بیش از حد از کاربران تعریف و تمجید می‌کنند

admin | آبان ۹, ۱۴۰۴ | چت بات | بدون دیدگاه

یک مطالعه جدید نشان داده است که مدل‌های پیشرو هوش مصنوعی از ایالات متحده و چین «بسیار چاپلوس» هستند و چاپلوسی بیش از حد آنها ممکن است باعث شود کاربران کمتر تمایل به حل اختلافات بین فردی داشته باشند. مطالعه‌ای که توسط محققان دانشگاه استنفورد و دانشگاه کارنگی ملون در اوایل این ماه منتشر شد، چگونگی جواب ۱۱ مدل زبان بزرگ (LLM) به سوالات کاربران که به دنبال مشاوره در مورد مسائل شخصی، از جمله مواردی شامل دستکاری و فریب بودند را آزمایش کرد. در محافل هوش مصنوعی، چاپلوسی پدیده‌ای است که در آن ربات‌های چت بیش از حد با کاربران موافقت می‌کنند. نسخه ۳ DeepSeek که در دسامبر ۲۰۲۴ منتشر شد، یکی از چاپلوسانه‌ترین مدل‌ها شناخته شد و اقدامات کاربران را ۵۵ درصد بیشتر از انسان‌ها تأیید کرد، در حالی که این میزان برای همه مدل‌ها به طور متوسط ۴۷ درصد بیشتر بود.

محققان از پست‌هایی استفاده کردند که در آنها اعضای جامعه، نویسنده پست را مقصر می‌دانستند تا آزمایش کنند که آیا LLMها، در صورت ارائه سناریوهای مشابه، با این گروه آنلاین عمدتاً انگلیسی زبان از انسان‌ها همسو می‌شوند یا خیر. در این آزمایش، Qwen2.5-7B-Instruct شرکت Alibaba Cloud که در ژانویه منتشر شد، چاپلوسانه‌ترین مدل شناخته شد و 79 درصد مواقع با حکم جامعه – که از ارسال‌کننده حمایت می‌کرد – در تضاد بود. دومین مدل برتر، DeepSeek-V3 بود که در 76 درصد موارد این کار را انجام داد.

در مقایسه، کم‌چاپلوس‌ترین مدل، یعنی Gemini-1.5 گوگل دیپ‌مایند، در ۱۸ درصد موارد با نظر جامعه در تضاد بود.

در آخرین مطالعه، محققان آمریکایی همچنین تأثیر چاپلوسی را بر کاربران آزمایش کردند و دریافتند که جواب های چاپلوسانه تمایل آنها را برای حل دوستانه اختلافات کاهش می‌دهد. کاربران جواب های چاپلوسانه را با کیفیت بالاتر ارزیابی کردند و به مدل‌های چاپلوسانه بیشتر اعتماد کردند. محققان نوشتند: «این ترجیحات، انگیزه‌های نادرستی را هم برای افراد ایجاد می‌کند تا به طور فزاینده‌ای به مدل‌های هوش مصنوعی چاپلوسانه تکیه کنند.»

به گفته جک جیانگ، استاد نوآوری و مدیریت اطلاعات در دانشکده بازرگانی دانشگاه هنگ کنگ و مدیر آزمایشگاه ارزیابی هوش مصنوعی آن، چاپلوسی هوش مصنوعی پیامدهایی برای کسب‌وکارها نیز دارد. او گفت: «برای مثال، اگر یک مدل دائماً با نتیجه‌گیری یک تحلیلگر کسب‌وکار موافق باشد، ایمن نیست.»