مطالعه نشان میدهد که مدلهای چینی و آمریکایی بیش از حد از کاربران تعریف و تمجید میکنند

یک مطالعه جدید نشان داده است که مدلهای پیشرو هوش مصنوعی از ایالات متحده و چین «بسیار چاپلوس» هستند و چاپلوسی بیش از حد آنها ممکن است باعث شود کاربران کمتر تمایل به حل اختلافات بین فردی داشته باشند. مطالعهای که توسط محققان دانشگاه استنفورد و دانشگاه کارنگی ملون در اوایل این ماه منتشر شد، چگونگی جواب ۱۱ مدل زبان بزرگ (LLM) به سوالات کاربران که به دنبال مشاوره در مورد مسائل شخصی، از جمله مواردی شامل دستکاری و فریب بودند را آزمایش کرد. در محافل هوش مصنوعی، چاپلوسی پدیدهای است که در آن رباتهای چت بیش از حد با کاربران موافقت میکنند. نسخه ۳ DeepSeek که در دسامبر ۲۰۲۴ منتشر شد، یکی از چاپلوسانهترین مدلها شناخته شد و اقدامات کاربران را ۵۵ درصد بیشتر از انسانها تأیید کرد، در حالی که این میزان برای همه مدلها به طور متوسط ۴۷ درصد بیشتر بود.
محققان از پستهایی استفاده کردند که در آنها اعضای جامعه، نویسنده پست را مقصر میدانستند تا آزمایش کنند که آیا LLMها، در صورت ارائه سناریوهای مشابه، با این گروه آنلاین عمدتاً انگلیسی زبان از انسانها همسو میشوند یا خیر. در این آزمایش، Qwen2.5-7B-Instruct شرکت Alibaba Cloud که در ژانویه منتشر شد، چاپلوسانهترین مدل شناخته شد و 79 درصد مواقع با حکم جامعه – که از ارسالکننده حمایت میکرد – در تضاد بود. دومین مدل برتر، DeepSeek-V3 بود که در 76 درصد موارد این کار را انجام داد.
در مقایسه، کمچاپلوسترین مدل، یعنی Gemini-1.5 گوگل دیپمایند، در ۱۸ درصد موارد با نظر جامعه در تضاد بود.
در آخرین مطالعه، محققان آمریکایی همچنین تأثیر چاپلوسی را بر کاربران آزمایش کردند و دریافتند که جواب های چاپلوسانه تمایل آنها را برای حل دوستانه اختلافات کاهش میدهد. کاربران جواب های چاپلوسانه را با کیفیت بالاتر ارزیابی کردند و به مدلهای چاپلوسانه بیشتر اعتماد کردند. محققان نوشتند: «این ترجیحات، انگیزههای نادرستی را هم برای افراد ایجاد میکند تا به طور فزایندهای به مدلهای هوش مصنوعی چاپلوسانه تکیه کنند.»
به گفته جک جیانگ، استاد نوآوری و مدیریت اطلاعات در دانشکده بازرگانی دانشگاه هنگ کنگ و مدیر آزمایشگاه ارزیابی هوش مصنوعی آن، چاپلوسی هوش مصنوعی پیامدهایی برای کسبوکارها نیز دارد. او گفت: «برای مثال، اگر یک مدل دائماً با نتیجهگیری یک تحلیلگر کسبوکار موافق باشد، ایمن نیست.»
