مدل ChatGPT Images 2.0 رونمایی شد؛ این مدل با دقت بی‌نظیر خود در تولید متن، به عنوان رقیبی جدی برای نانوبنانا شناخته می‌شود.

به گزارش خبرگزاری‌ها و براساس اطلاعات دیجیاتو، OpenAI پس از ارائه قابلیت خلق تصاویر در ChatGPT برای کاربران، اقدام به عرضه مدل جدید ChatGPT Images 2.0 نموده است تا با مدل نانو بنانا گوگل به رقابت بپردازد. این مدل به عنوان پیشرفتی مهم در تولید تصاویر شناخته شده و می‌تواند به دقت دستورالعمل‌ها را دنبال کرده و اشیاء را در صحنه‌ها قرار دهد.

### معرفی مدل هوش مصنوعی ChatGPT Images 2.0

مدل‌های تولید تصویر به طور سنتی در تولید متن با چالش‌هایی مواجه بوده‌اند، اما مدل جدید Images 2.0 در زمینه درک متون غیرلاتین و زبان‌هایی مانند ژاپنی، کره‌ای، هندی و بنگالی عملکرد بهتری دارد. در بیانیه OpenAI ذکر شده است که این مدل توانایی‌های بالایی در تولید تصویر ارائه می‌دهد و می‌تواند تصاویر پیچیده‌ای خلق کند. این مدل قادر است به خوبی به جزئیات مورد نظر توجه کرده و ابعادی را رندر کند که دیگر مدل‌ها با آن دچار مشکل می‌شوند. تمامی این خروجی‌ها تا رزولوشن 2K قابل تولید هستند.

به‌عنوان مثال، اگر این مدل برای تولید منوی غذاهای یک رستوران مکزیکی به کار گرفته شود، محصول نهایی به راحتی در یک رستوران واقعی قابل استفاده خواهد بود.

مدل Images 2.0 به اندازه ChatGPT در تولید پاسخ‌های سریع نیست، ولی می‌تواند در عرض چند دقیقه طرح‌های پیچیده‌ای همچون کامیک‌های چند صفحه‌ای تولید کند. این مدل به عنوان نخستین تصویرساز با قابلیت استدلال شناخته می‌شود که امکان جستجو در وب و بررسی خروجی‌ها را فراهم می‌کند و در نتیجه دقت آن افزایش می‌یابد.

OpenAI اعلام کرده است که این مدل به ویژه در زمینه تولید پروتوتایپ بازی‌ها و استوری‌برد فیلم‌ها عملکرد خوبی دارد و در تنظیم نسبت تصویر نیز انعطاف‌پذیری بالایی دارد.

علاوه بر این، تمامی کاربران رایگان و پولی ChatGPT و Codex از امروز قادر به استفاده از مدل Images 2.0 خواهند بود. کاربران اشتراک‌های پولی می‌توانند خروجی‌های پیشرفته‌تری تولید کنند. همچنین OpenAI API مدل gpt-image-2 را در دسترس قرار داده که هزینه آن بر اساس کیفیت و رزولوشن خروجی تعیین خواهد شد.