خبرگزاری _ مدل جدید Gemini ۳ Pro با کسب امتیاز ۱۵۰۱ در LMArena، از توانایی استدلال در سطح دکترا خبر میدهد. در مقابل، GPT-۵.۱ از سیستم «تفکر تطبیقی» رونمایی کرده که زمان پردازش را بر اساس پیچیدگی سؤال تنظیم میکند. هر دو شرکت این فناوریها را بهعنوان دستاوردی بزرگ در عرصه هوش مصنوعی معرفی میکنند، اما آیا یکی از آنها عملکرد بهتری نسبت به دیگری دارد؟ برای تعیین این موضوع، هر دو مدل در رقابتی ۹ مرحلهای، شامل تحلیل تصویر، کدنویسی، نوشتن خلاقانه، استدلال ریاضی و چند آزمون ترکیبی مورد سنجش قرار گرفتند.
۱. تحلیل تصویر
دستور: این تصویر از داخل فریزر من است. فقط با آنچه در عکس دیده میشود، پنج غذا پیشنهاد بدهید. مراحل کوتاه و واقعی باشند.
در این مرحله، ChatGPT-۵.۱ پیشنهادات خلاقانهای ارائه کرد که شامل برخی مواد غیردیداری بود. در مقابل، Gemini ۳.۰ بهطور دقیق بر اساس مواد موجود در تصویر، غذاهایی پیشنهاد داد و مراحل آمادهسازی را بهخوبی توضیح داد. به این ترتیب، Gemini بهخاطر رعایت دقیق دستور، برنده این بخش شد.
۲. چالش کدنویسی پیشرفته
دستور: یک تابع کوچک در جاوااسکریپت بنویسید که تسکها را به سه دسته صبح، بعدازظهر و عصر تقسیم کند. منطق را به زبان ساده توضیح دهید.
ChatGPT-۵.۱ منطق شناختهتری برای تقسیمبندی ساعات ارائه کرد، در حالی که Gemini ۳.۰ تابع کاملتری نوشت، اما دستهبندی زمان را بهطور غیرمعمولی انجام داد. در نهایت، به دلیل منطق زمانی واقعگرایانهتر ChatGPT، این بخش به آن اختصاص یافت.
۳. داستاننویسی خلاقانه با محدودیت
دستور: یک داستان کوتاه ۳۰۰ کلمهای درباره هوش مصنوعی بنویسید که تنها از حروف A تا M استفاده کند، دارای سه پیچش داستانی باشد و با یک پایان معلق خاتمه یابد.
ChatGPT-۵.۱ به همه محدودیتها پاسخ داد، ولی داستان کمی مصنوعی شد. این در حالی است که Gemini ۳.۰ با رعایت تمام محدودیتها داستانی خلاقانه همراه با پیچشهای جذاب نوشت. بنابراین این بخش نیز به Gemini اختصاص یافت.
۴. استدلال ریاضی
دستور: یک قطار با سرعت ۸۰ کیلومتر در ساعت از ایستگاه A حرکت میکند. دو ساعت بعد، قطار سریعتری با سرعت ۱۲۰ کیلومتر در ساعت از همان ایستگاه در همان مسیر حرکت میکند. اگر قطار نخست سه توقف حدوداً دهدقیقهای داشته باشد، قطار دوم چه زمانی به آن میرسد؟ مراحل را توضیح دهید.
ChatGPT-۵.۱ مسئله را بهدرستی حل کرد و تبیین واضحی ارائه داد، در حالی که Gemini ۳.۰ نیز راهحلی معتبر و شفاف ارائه کرد، گرچه کمی متفاوت بود. در نهایت، ChatGPT بهخاطر تعریف بهتر متغیرها، برنده این چلنچ شناخته شد.

۵. طراحی چندرسانهای
در یکی از پروژهها، خواسته شده بود تا یک رابط کاربری برای ردیاب تناسباندام ویژه سالمندان طراحی شود. ChatGPT-۵.۱ طرحی به نام «ActiveEase» ارائه داد که چیدمان منظم و ترکیب رنگی مناسبی داشت و بر اساس دسترسی سالمندان طراحی شده بود. در عوض، Gemini ۳.۰ طراحی دقیقتری با نام «VitalStep» ارائه کرد که فراتر از اصول پایه رفت و توجیهات عمیقی برای انتخابهای خود ارائه نمود. این انتخابها، شامل اجتناب از رنگهای نامناسب به دلیل مشکلات بینایی و تأکید بر تعاملات فیزیکی آسان بودند. در نهایت، Gemini به دلیل توجه عمیق و حساسیت به نیازهای کاربران، به عنوان برنده این مرحله مشخص شد.
۶. تحلیل مدارک پیچیده
در یک مطالعه، درخواست شد تا یک سند در سه پاراگراف خلاصه شود و ضعفهای منطقی آن شناسایی گردد. در این زمینه، ChatGPT-۵.۱ خلاصهای دقیق و تحلیلی قابل قبول را ارائه کرد. در مقابل، Gemini ۳.۰ تحلیلی انتقادیتر از سند ارائه داد و نقاط ضعف را بهطوری دقیق شناسایی کرد. Gemini همچنین توانست مغالطههای موجود در سند را بهتر تشخیص دهد و پاسخهای مستدلتری برای مقابله با فرضیه اصلی ارائه نماید. بنابراین، برنده این تحلیل نیز Gemini بود که در شفافیت و دقت تحلیلی برتری داشت.
۷. دانش و استدلال آنی
در یک درخواست تحلیلی، خواسته شده بود تا سه شرکت بزرگ فناوری و ریسکهای استراتژیک آنها در سال پیش رو بررسی شود. ChatGPT-۵.۱ تحلیلی جامع و مستدل به همراه شواهد و نمودارهایی ارائه داد. از سوی دیگر، Gemini ۳.۰ با نگاهی پیشبینانه، ریسکها را در سطح مدل کسبوکار تحلیل کرد و آنها را به چالشهای بنیادی رشد هر شرکت مرتبط ساخت. این رویکرد دوراندیشانه برتری Gemini را در این چالش نشان داد، جایی که توانست ریسکها را به عنوان چالشهای اساسی مدلهای کسبوکار تبیین نماید.
۸. پیروی از دستورها و فرمت مناسب
در یک درخواست نگارش ایمیل تجاری، خواسته شد تا تأخیر دو هفتهای پروژه به مشتری توضیح داده شود. ChatGPT-۵.۱ ایمیلی حرفهای و قابل قبول نوشت که تمام شرایط مورد نظر، از جمله توضیحات، گامهای جبرانی و فراخوان نهایی را رعایت کرد. این ایمیل ضمن حفظ حال و هوای صمیمی، به صورت مستند و با رعایت تمام جزئیات تجاری نوشته شده بود. به این ترتیب، ChatGPT-۵.۱ به خوبی از عهده این وظیفه برآمد.
در جدیدترین بررسیهای انجام شده، مدل Gemini 3.0 به عنوان برندهای قاطع در رقابت با ChatGPT 5.1 شناسایی شد. این مدل به ارائهای مؤثرتر و دقیقتر از ایمیلها پرداخته و در گامهای جبرانی، جملات با لحنی شخصی و مطمئن توانسته است اعتماد مشتریان را افزایش دهد. Gemini 3.0 در توجه به جزئیات و مدیریت روابط با مشتری عملکرد بهتری از خود نشان داد، به ویژه با مثالهای عملی و رویکرد فعال در حل مشکلات ناشی از تأخیر.
در بخش ترکیب میانحوزهای، Gemini 3.0 موفق به ارائه یک تابع پایتون دقیق و مستند، همراه با شعار خلاقانه و تحلیلی جامع درباره سوگیری الگوریتمی شد. این در حالی است که ChatGPT 5.1 تحلیل کوتاهتری ارائه داده و فاقد رویکردهای عملی در مورد سوگیری بود. بنابراین، Gemini 3.0 در تمام بخشهای این مقایسه عمیقتر و کاربردیتر عمل کرد، به ویژه در حوزه تحلیل سوگیری.
در نهایت، مدل Gemini 3.0 با برتری در عرصههایی چون خلاقیت در چارچوبهای مشخص، طراحی تجربه کاربری و تحلیلهای انتقادی به عنوان برنده این رقابت معرفی شد. هرچند ChatGPT 5.1 در حوزه منطق ریاضی و کدنویسی به عملکردی خوب دست یافته بود، اما Gemini 3.0 با توانایی در تفکر خلاقانه و درک بهتر محدودیتهای انسانی انتخاب بهتری برای نیازهای خاص کاربران به شمار میآید. این رقابت نشاندهنده پیشرفتهای کلیدی در مدلهای هوش مصنوعی است که در نهایت به نفع کاربران تمام میشود.
منبع: tomsguide











