به گزارش خبرگزاریها و براساس اطلاعات دیجیاتو، OpenAI پس از ارائه قابلیت خلق تصاویر در ChatGPT برای کاربران، اقدام به عرضه مدل جدید ChatGPT Images 2.0 نموده است تا با مدل نانو بنانا گوگل به رقابت بپردازد. این مدل به عنوان پیشرفتی مهم در تولید تصاویر شناخته شده و میتواند به دقت دستورالعملها را دنبال کرده و اشیاء را در صحنهها قرار دهد.
### معرفی مدل هوش مصنوعی ChatGPT Images 2.0
مدلهای تولید تصویر به طور سنتی در تولید متن با چالشهایی مواجه بودهاند، اما مدل جدید Images 2.0 در زمینه درک متون غیرلاتین و زبانهایی مانند ژاپنی، کرهای، هندی و بنگالی عملکرد بهتری دارد. در بیانیه OpenAI ذکر شده است که این مدل تواناییهای بالایی در تولید تصویر ارائه میدهد و میتواند تصاویر پیچیدهای خلق کند. این مدل قادر است به خوبی به جزئیات مورد نظر توجه کرده و ابعادی را رندر کند که دیگر مدلها با آن دچار مشکل میشوند. تمامی این خروجیها تا رزولوشن 2K قابل تولید هستند.
بهعنوان مثال، اگر این مدل برای تولید منوی غذاهای یک رستوران مکزیکی به کار گرفته شود، محصول نهایی به راحتی در یک رستوران واقعی قابل استفاده خواهد بود.
مدل Images 2.0 به اندازه ChatGPT در تولید پاسخهای سریع نیست، ولی میتواند در عرض چند دقیقه طرحهای پیچیدهای همچون کامیکهای چند صفحهای تولید کند. این مدل به عنوان نخستین تصویرساز با قابلیت استدلال شناخته میشود که امکان جستجو در وب و بررسی خروجیها را فراهم میکند و در نتیجه دقت آن افزایش مییابد.
OpenAI اعلام کرده است که این مدل به ویژه در زمینه تولید پروتوتایپ بازیها و استوریبرد فیلمها عملکرد خوبی دارد و در تنظیم نسبت تصویر نیز انعطافپذیری بالایی دارد.
علاوه بر این، تمامی کاربران رایگان و پولی ChatGPT و Codex از امروز قادر به استفاده از مدل Images 2.0 خواهند بود. کاربران اشتراکهای پولی میتوانند خروجیهای پیشرفتهتری تولید کنند. همچنین OpenAI API مدل gpt-image-2 را در دسترس قرار داده که هزینه آن بر اساس کیفیت و رزولوشن خروجی تعیین خواهد شد.










