مدل تازه‌وارد ChatGPT به شکلی خارق‌العاده توانمندی‌های بالایی را از خود به نمایش گذاشته است.

**معرفی ChatGPT Images 2.0: گام جدید در تولید تصویر**

OpenAI با رونمایی از مدل ChatGPT Images 2.0، تحول چشمگیری در عرصه تولید تصویر ایجاد کرده است. این مدل جدید با تمرکز بر دقت و کاربردپذیری، به‌جای صرفا زیبایی، به انجام وظایف بصری پیچیده پرداخته است. یکی از نقاط قوت این نسخه، توانایی ترکیب متن و تصویر به‌طور همزمان برای ایجاد صفحات بصری پیچیده است. در این رویکرد، تصویر می‌تواند به‌عنوان یک ابزار تفهیم و استدلال عمل کند.

### **قابلیت‌های تفکر در پردازش‌های پیچیده**

مدل Images 2.0 با قابلیت استدلال و منطق، از بازتولید ساده اطلاعات فراتر رفته و به حفظ پیوستگی میان تصاویر پرداخته است. این امر به مدل اجازه می‌دهد تا به‌درستی با درخواست‌های چندمرحله‌ای و مبهم روبرو شود. برای مثال، در ساخت اینفوگرافیک مرتبط با آب‌وهوای یک شهر خاص، مدل با تحلیل داده‌های جوی و تعیین فعالیت‌های مرتبط، تصاویری تولید می‌کند که با نتایج به‌دست‌آمده همخوانی دارد.

### **دقت در طراحی و کنترل بهتر**

مسائل مربوط به تنظیم نسبت ابعاد در نسخه جدید تا حد زیادی برطرف شده است. این مدل از دامنه وسیعی از ابعاد، از نسبت 3:1 تا 1:3، پشتیبانی می‌کند. دیگر ویژگی‌های کلیدی این نسخه شامل رندر دقیق متن، خروجی با کیفیت بالا تا 2K، و قابلیت پشتیبانی از متون کوچک و طراحی رابط کاربری است.

### **آزمایش‌های نسخه پیش‌نمایش**

عملکرد این مدل در آزمایش‌های اولیه نشان‌دهنده توانمندی‌های بالای آن، اما چالش‌هایی همچنان باقی مانده است. به‌عنوان مثال، مدل در بازتولید لوگوها با مشکلاتی از جمله استفاده از نسخه‌های قدیمی و دفرمه شدن حروف مواجه شده است. اگرچه اصلاح حافظه کوتاه‌مدت مدل در برخی موارد به رفع این خطاها کمک نکرد، اما قدرت سنتز و ترکیب مفاهیم آن نسبت به مدل‌های دیگر نظیر Nano Banana Pro قابل توجه است.

### **دسترسی و پلتفرم‌ها**

مدل جدید اکنون برای تمامی کاربران ChatGPT و Codex در دسترس است، اما قابلیت‌های پیشرفته فقط به نسخه‌های Plus، Pro، Business و Enterprise تعلق دارد. کاربران دسکتاپ می‌توانند به‌راحتی از طریق وب به این مدل دسترسی داشته باشند و به‌زودی این قابلیت‌ها به اپلیکیشن موبایل هم اضافه خواهد شد. برای توسعه‌دهندگان نیز دسترسی از طریق API فراهم شده و هزینه‌بر اساس کیفیت و پردازش مورد نیاز محاسبه می‌شود.

منبع: zdnet