**بررسی ناکارآمدی مدلهای هوش مصنوعی در درک تعارفات فرهنگی فارسی**
اخیراً تحقیقی منتشر شده که نشان میدهد مدلهای هوش مصنوعی، از جمله آنهایی که توسط شرکتهایی مانند OpenAI، آنتروپیک و متا توسعه یافتهاند، در درک تعارفات و آداب اجتماعی فرهنگ فارسی ناتوانند. مطابق نتایج این پژوهش، این مدلها تنها در ۳۴ تا ۴۲ درصد مواقع توانستهاند موقعیتهای تعارف را به درستی شناسایی و مدیریت کنند، در حالی که افراد فارسیزبان در ۸۲ درصد مواقع موفق بودهاند.
این تحقیق به سرپرستی نیکتا گوهریصدر از دانشگاه براک صورت گرفته و چارچوبی به نام «TAAROFBENCH» برای ارزیابی توانایی سیستمهای هوش مصنوعی در بازتولید این آداب فرهنگی معرفی کرده است. نتایج نشان میدهد که مدلهای یادشده به طور طبیعی به سبک ارتباط مستقیم غربی گرایش دارند و به نشانههای فرهنگی تأثیرگذار در تعاملات روزمره فارسیزبانها بیتوجهاند.
محققان اشاره میکنند که نادیده گرفتن فرهنگ در زمینههای حساس میتواند به شکست مذاکرات، تخریب روابط و تقویت کلیشهها منجر شود. با توجه به گستردگی استفاده از هوش مصنوعی در سطوح جهانی، عدم توجه به چنین مسائلی میتواند به یک نقصان تبدیل شود.
تعارف در فرهنگ فارسی به عنوان یک عنصر کلیدی ادب به شمار میآید که اغلب با جملاتی متضاد بیان میشود؛ برای مثال، فردی ممکن است هدیهای را با اصرار پیشنهاد کند و دیگری به طور مکرر آن را رد کند. این تبادل کلامی نوعی رقص ظریف است که نشاندهنده ادب و احترام است.
به منظور ارزیابی اینکه آیا «مودب بودن» به تنهایی کافی است یا خیر، پژوهشگران پاسخهای مدل Llama 3 را با معیاری به نام «Polite Guard» مقایسه کردند. نتیجه به دست آمده نشان داد که در حالی که ۸۴.۵ درصد پاسخها «مودب» توصیف شدهاند، تنها ۴۱.۷ درصد آنها با انتظارات فرهنگی فارسی همخوانی داشتند.
این لاکپشتی در پاسخها نشان میدهد که مدلهای هوش مصنوعی میتوانند در یک زمینه مودبانه باشند اما در زمینهای دیگر کاملاً به اصول فرهنگی بیتوجه، که این مسئله به نقصهایی مانند پذیرش بیچون و چرا پیشنهادات و عدم ارائه تعریفهای متقابل نسبت داده میشود.
به عنوان نمونه، زمانی که کسی از خودروی جدید تعریف میکند، یک فرد ایرانی معمولاً خرید خود را کم اهمیت جلوه میدهد، در حالی که یک مدل هوش مصنوعی ممکن است پاسخی مبنی بر «بسیار تلاش کردم تا آن را بخرم» ارائه دهد که از نظر فرهنگی در ایران نوعی فخرفروشی محسوب میشود.
بنابراین، ارتباط مؤثر نیازمند یک زمینه مشترک فرهنگی است که نقش اساسی در درک درست مقاصد دو طرف مکالمه دارد.**فشردهسازی زبانی و چالشهای هوش مصنوعی در درک تعارفات فرهنگی**
تحقیقات اخیر نشان میدهد که مدلهای هوش مصنوعی در فهم تعارفات فرهنگی، بهویژه در زبان فارسی، با چالشهای جدی روبرو هستند. فشردهسازی فرهنگی، با حذف اطلاعات ضمنی، میتواند ارتباطات را سریعتر کند، اما در غیاب زمینه مشترک میان گوینده و شنونده، موجب سوءتفاهمات میشود.
تعارف بهعنوان نمونهای از این فشردهسازی مطرح میشود؛ جایی که ممکن است معنی واقعی کلمات با آنچه که گوینده قصد دارد، بسیار متفاوت باشد. مدلهای زبانی بزرگ، که غالباً بر اساس الگوهای ارتباطی صریح غربی طراحی شدهاند، در درک این جنبههای فرهنگی ناکام هستند. به عنوان مثال، در زبان فارسی، «بله» میتواند به معنای «نه» باشد و پیشنهادها برخی اوقات بهعنوان امتناع تعبیر میشوند.
نتایج پژوهشهای اخیر نشان میدهد که تغییر زبان میتواند به بهبود فهم مدلهای هوش مصنوعی کمک کند. بهعنوان مثال، دقت مدل «دیپسیک V3» در درک تعارف از ۳۶.۶ درصد به ۶۸.۶ درصد افزایش یافته است. در این پژوهش، ۳۳ نفر شرکت کردند که به سه دسته گویشوران بومی، گویشوران میراثی و غیرایرانی تقسیم شدند. دقت گویشوران بومی در درک تعارفات ۸۱.۸ درصد، گویشوران میراثی ۶۰ درصد و غیرایرانیها ۴۲.۳ درصد بود.
این مطالعه همچنین مواردی از پیشداوریهای جنسیتی را در پاسخهای مدلهای هوش مصنوعی نشان داد. تمامی مدلها در ارتباط با پاسخ به زنان امتیازات بهتری نسبت به مردان کسب کردند. بهعنوان مثال، مدل «GPT-4o» دقت ۴۳.۶ درصد برای کاربران زن و ۳۰.۹ درصد برای کاربران مرد ارائه داد. مدلهای زبانی به طور مکرر رفتارهای کلیشهای یادآوری شده را در پاسخ گنجاندهاند.
پژوهشگران همچنین بررسی کردند که آیا هوش مصنوعی میتواند تعارف را از طریق آموزش هدفمند یاد بگیرد. بدین منظور، روش «بهینهسازی ترجیح مستقیم» استفاده شد که موجب بهبود دقت مدل «Llama 3» در سناریوهای تعارف از ۳۷.۲ درصد به ۷۹.۵ درصد شد. با وجود تمرکز بر تعارف فارسی، این روش میتواند در دیگر زبانها و فرهنگها نیز مورد استفاده قرار گیرد.
این یافتهها نه تنها به اهمیت فهم فرهنگی در هوش مصنوعی اشاره دارد، بلکه نشان میدهد که ممکن است این مدلها در درک نقاط قوت و ضعف فرهنگی خود ناتوان باشند. پژوهشگران به دنبال راهکارهایی برای گسترش آگاهی در هوش مصنوعی درباره تنوع الگوهای ارتباطی فراتر از هنجارهای غربی هستند.











