**معرفی ChatGPT Images 2.0: گام جدید در تولید تصویر**
OpenAI با رونمایی از مدل ChatGPT Images 2.0، تحول چشمگیری در عرصه تولید تصویر ایجاد کرده است. این مدل جدید با تمرکز بر دقت و کاربردپذیری، بهجای صرفا زیبایی، به انجام وظایف بصری پیچیده پرداخته است. یکی از نقاط قوت این نسخه، توانایی ترکیب متن و تصویر بهطور همزمان برای ایجاد صفحات بصری پیچیده است. در این رویکرد، تصویر میتواند بهعنوان یک ابزار تفهیم و استدلال عمل کند.
### **قابلیتهای تفکر در پردازشهای پیچیده**
مدل Images 2.0 با قابلیت استدلال و منطق، از بازتولید ساده اطلاعات فراتر رفته و به حفظ پیوستگی میان تصاویر پرداخته است. این امر به مدل اجازه میدهد تا بهدرستی با درخواستهای چندمرحلهای و مبهم روبرو شود. برای مثال، در ساخت اینفوگرافیک مرتبط با آبوهوای یک شهر خاص، مدل با تحلیل دادههای جوی و تعیین فعالیتهای مرتبط، تصاویری تولید میکند که با نتایج بهدستآمده همخوانی دارد.
### **دقت در طراحی و کنترل بهتر**
مسائل مربوط به تنظیم نسبت ابعاد در نسخه جدید تا حد زیادی برطرف شده است. این مدل از دامنه وسیعی از ابعاد، از نسبت 3:1 تا 1:3، پشتیبانی میکند. دیگر ویژگیهای کلیدی این نسخه شامل رندر دقیق متن، خروجی با کیفیت بالا تا 2K، و قابلیت پشتیبانی از متون کوچک و طراحی رابط کاربری است.
### **آزمایشهای نسخه پیشنمایش**
عملکرد این مدل در آزمایشهای اولیه نشاندهنده توانمندیهای بالای آن، اما چالشهایی همچنان باقی مانده است. بهعنوان مثال، مدل در بازتولید لوگوها با مشکلاتی از جمله استفاده از نسخههای قدیمی و دفرمه شدن حروف مواجه شده است. اگرچه اصلاح حافظه کوتاهمدت مدل در برخی موارد به رفع این خطاها کمک نکرد، اما قدرت سنتز و ترکیب مفاهیم آن نسبت به مدلهای دیگر نظیر Nano Banana Pro قابل توجه است.
### **دسترسی و پلتفرمها**
مدل جدید اکنون برای تمامی کاربران ChatGPT و Codex در دسترس است، اما قابلیتهای پیشرفته فقط به نسخههای Plus، Pro، Business و Enterprise تعلق دارد. کاربران دسکتاپ میتوانند بهراحتی از طریق وب به این مدل دسترسی داشته باشند و بهزودی این قابلیتها به اپلیکیشن موبایل هم اضافه خواهد شد. برای توسعهدهندگان نیز دسترسی از طریق API فراهم شده و هزینهبر اساس کیفیت و پردازش مورد نیاز محاسبه میشود.
منبع: zdnet











