رقابت فشرده میان Gemini 3 و ChatGPT 5.1 در حال شکل‌گیری است. کدام یک از این دو مدل قادر به غلبه بر دیگری خواهند بود؟

خبرگزاری _ مدل جدید Gemini ۳ Pro با کسب امتیاز ۱۵۰۱ در LMArena، از توانایی استدلال در سطح دکترا خبر می‌دهد. در مقابل، GPT-۵.۱ از سیستم «تفکر تطبیقی» رونمایی کرده که زمان پردازش را بر اساس پیچیدگی سؤال تنظیم می‌کند. هر دو شرکت این فناوری‌ها را به‌عنوان دستاوردی بزرگ در عرصه هوش مصنوعی معرفی می‌کنند، اما آیا یکی از آنها عملکرد بهتری نسبت به دیگری دارد؟ برای تعیین این موضوع، هر دو مدل در رقابتی ۹ مرحله‌ای، شامل تحلیل تصویر، کدنویسی، نوشتن خلاقانه، استدلال ریاضی و چند آزمون ترکیبی مورد سنجش قرار گرفتند.

۱. تحلیل تصویر

دستور: این تصویر از داخل فریزر من است. فقط با آنچه در عکس دیده می‌شود، پنج غذا پیشنهاد بدهید. مراحل کوتاه و واقعی باشند.

در این مرحله، ChatGPT-۵.۱ پیشنهادات خلاقانه‌ای ارائه کرد که شامل برخی مواد غیردیداری بود. در مقابل، Gemini ۳.۰ به‌طور دقیق بر اساس مواد موجود در تصویر، غذاهایی پیشنهاد داد و مراحل آماده‌سازی را به‌خوبی توضیح داد. به این ترتیب، Gemini به‌خاطر رعایت دقیق دستور، برنده این بخش شد.

۲. چالش کدنویسی پیشرفته

دستور: یک تابع کوچک در جاوااسکریپت بنویسید که تسک‌ها را به سه دسته صبح، بعدازظهر و عصر تقسیم کند. منطق را به زبان ساده توضیح دهید.

ChatGPT-۵.۱ منطق شناخته‌تری برای تقسیم‌بندی ساعات ارائه کرد، در حالی که Gemini ۳.۰ تابع کامل‌تری نوشت، اما دسته‌بندی زمان را به‌طور غیرمعمولی انجام داد. در نهایت، به دلیل منطق زمانی واقع‌گرایانه‌تر ChatGPT، این بخش به آن اختصاص یافت.

۳. داستان‌نویسی خلاقانه با محدودیت

دستور: یک داستان کوتاه ۳۰۰ کلمه‌ای درباره هوش مصنوعی بنویسید که تنها از حروف A تا M استفاده کند، دارای سه پیچش داستانی باشد و با یک پایان معلق خاتمه یابد.

ChatGPT-۵.۱ به همه محدودیت‌ها پاسخ داد، ولی داستان کمی مصنوعی شد. این در حالی است که Gemini ۳.۰ با رعایت تمام محدودیت‌ها داستانی خلاقانه همراه با پیچش‌های جذاب نوشت. بنابراین این بخش نیز به Gemini اختصاص یافت.

۴. استدلال ریاضی

دستور: یک قطار با سرعت ۸۰ کیلومتر در ساعت از ایستگاه A حرکت می‌کند. دو ساعت بعد، قطار سریع‌تری با سرعت ۱۲۰ کیلومتر در ساعت از همان ایستگاه در همان مسیر حرکت می‌کند. اگر قطار نخست سه توقف حدوداً ده‌دقیقه‌ای داشته باشد، قطار دوم چه زمانی به آن می‌رسد؟ مراحل را توضیح دهید.

ChatGPT-۵.۱ مسئله را به‌درستی حل کرد و تبیین واضحی ارائه داد، در حالی که Gemini ۳.۰ نیز راه‌حلی معتبر و شفاف ارائه کرد، گرچه کمی متفاوت بود. در نهایت، ChatGPT به‌خاطر تعریف بهتر متغیرها، برنده این چلنچ شناخته شد.

۵. طراحی چندرسانه‌ای

در یکی از پروژه‌ها، خواسته شده بود تا یک رابط کاربری برای ردیاب تناسب‌اندام ویژه سالمندان طراحی شود. ChatGPT-۵.۱ طرحی به نام «ActiveEase» ارائه داد که چیدمان منظم و ترکیب رنگی مناسبی داشت و بر اساس دسترسی سالمندان طراحی شده بود. در عوض، Gemini ۳.۰ طراحی دقیق‌تری با نام «VitalStep» ارائه کرد که فراتر از اصول پایه رفت و توجیهات عمیقی برای انتخاب‌های خود ارائه نمود. این انتخاب‌ها، شامل اجتناب از رنگ‌های نامناسب به دلیل مشکلات بینایی و تأکید بر تعاملات فیزیکی آسان بودند. در نهایت، Gemini به دلیل توجه عمیق و حساسیت به نیازهای کاربران، به عنوان برنده این مرحله مشخص شد.

۶. تحلیل مدارک پیچیده

در یک مطالعه، درخواست شد تا یک سند در سه پاراگراف خلاصه شود و ضعف‌های منطقی آن شناسایی گردد. در این زمینه، ChatGPT-۵.۱ خلاصه‌ای دقیق و تحلیلی قابل قبول را ارائه کرد. در مقابل، Gemini ۳.۰ تحلیلی انتقادی‌تر از سند ارائه داد و نقاط ضعف را به‌طوری دقیق شناسایی کرد. Gemini همچنین توانست مغالطه‌های موجود در سند را بهتر تشخیص دهد و پاسخ‌های مستدل‌تری برای مقابله با فرضیه اصلی ارائه نماید. بنابراین، برنده این تحلیل نیز Gemini بود که در شفافیت و دقت تحلیلی برتری داشت.

۷. دانش و استدلال آنی

در یک درخواست تحلیلی، خواسته شده بود تا سه شرکت بزرگ فناوری و ریسک‌های استراتژیک آن‌ها در سال پیش رو بررسی شود. ChatGPT-۵.۱ تحلیلی جامع و مستدل به همراه شواهد و نمودارهایی ارائه داد. از سوی دیگر، Gemini ۳.۰ با نگاهی پیش‌بینانه، ریسک‌ها را در سطح مدل کسب‌وکار تحلیل کرد و آن‌ها را به چالش‌های بنیادی رشد هر شرکت مرتبط ساخت. این رویکرد دوراندیشانه برتری Gemini را در این چالش نشان داد، جایی که توانست ریسک‌ها را به عنوان چالش‌های اساسی مدل‌های کسب‌وکار تبیین نماید.

۸. پیروی از دستورها و فرمت مناسب

در یک درخواست نگارش ایمیل تجاری، خواسته شد تا تأخیر دو هفته‌ای پروژه به مشتری توضیح داده شود. ChatGPT-۵.۱ ایمیلی حرفه‌ای و قابل قبول نوشت که تمام شرایط مورد نظر، از جمله توضیحات، گام‌های جبرانی و فراخوان نهایی را رعایت کرد. این ایمیل ضمن حفظ حال و هوای صمیمی، به صورت مستند و با رعایت تمام جزئیات تجاری نوشته شده بود. به این ترتیب، ChatGPT-۵.۱ به خوبی از عهده این وظیفه برآمد.

در جدیدترین بررسی‌های انجام شده، مدل Gemini 3.0 به عنوان برنده‌ای قاطع در رقابت با ChatGPT 5.1 شناسایی شد. این مدل به ارائه‌ای مؤثرتر و دقیق‌تر از ایمیل‌ها پرداخته و در گام‌های جبرانی، جملات با لحنی شخصی و مطمئن توانسته است اعتماد مشتریان را افزایش دهد. Gemini 3.0 در توجه به جزئیات و مدیریت روابط با مشتری عملکرد بهتری از خود نشان داد، به ویژه با مثال‌های عملی و رویکرد فعال در حل مشکلات ناشی از تأخیر.

در بخش ترکیب میان‌حوزه‌ای، Gemini 3.0 موفق به ارائه یک تابع پایتون دقیق و مستند، همراه با شعار خلاقانه و تحلیلی جامع درباره سوگیری الگوریتمی شد. این در حالی است که ChatGPT 5.1 تحلیل کوتاه‌تری ارائه داده و فاقد رویکردهای عملی در مورد سوگیری بود. بنابراین، Gemini 3.0 در تمام بخش‌های این مقایسه عمیق‌تر و کاربردی‌تر عمل کرد، به ویژه در حوزه تحلیل سوگیری.

در نهایت، مدل Gemini 3.0 با برتری در عرصه‌هایی چون خلاقیت در چارچوب‌های مشخص، طراحی تجربه کاربری و تحلیل‌های انتقادی به عنوان برنده این رقابت معرفی شد. هرچند ChatGPT 5.1 در حوزه منطق ریاضی و کدنویسی به عملکردی خوب دست یافته بود، اما Gemini 3.0 با توانایی در تفکر خلاقانه و درک بهتر محدودیت‌های انسانی انتخاب بهتری برای نیازهای خاص کاربران به شمار می‌آید. این رقابت نشان‌دهنده پیشرفت‌های کلیدی در مدل‌های هوش مصنوعی است که در نهایت به نفع کاربران تمام می‌شود.

منبع: tomsguide