به گزارش خبرگزاریها، اپل از مدل جدیدی با نام SHARP رونمایی کرده است که قادر است تنها با یک تصویر دوبعدی صحنهای سهبعدی را در کمتر از یک ثانیه بازسازی کند. این شرکت در گزارشی تحت عنوان “Sharp Monocular View Synthesis in Less Than a Second” توضیح داده که چگونه این مدل آموزش دیده است تا با حفظ دقیق مقیاسها و فاصلههای واقعی، نمایش سهبعدی منسجمی از صحنهها ارائه دهد.
مدل SHARP قابلیت پیشبینی بازنمایی سهبعدی را داراست که امکان رندر آن از زوایای نزدیک به تصویر اصلی را فراهم میکند. اساس این فناوری بر پایه Gaussian Splatting استوار است، جایی که هر “گاوسی سهبعدی” بهطور مشابه به تودهای از رنگ و نور در فضا عمل میکند و ترکیب میلیونها نمونه از آنها به بازسازی یک صحنهی سهبعدی معتبر کمک میکند.
برخلاف روشهای سنتی Gaussian Splatting که معمولاً به دهها یا صدها تصویر از یک صحنه نیاز دارند، مدل SHARP این توانایی را دارد که تنها با یک عکس و در یک مرحله از شبکهی عصبی، بازنمایی کامل سهبعدی را پیشبینی کند.
برای رسیدن به این دستاورد، اپل SHARP را با استفاده از حجم زیادی از دادههای مصنوعی و واقعی آموزش داده تا الگوهای عمق و هندسه را شناسایی کند. این مدل با دریافت یک تصویر جدید، ابتدا عمق را تخمین میزند و سپس با استفاده از دانش قبلی، آن را اصلاح کرده و در نهایت، موقعیت و ظاهر میلیونها گاوسی سهبعدی را پیشبینی میکند.
این روش امکان بازسازی سریع صحنههای سهبعدی را بدون نیاز به چندین تصویر و فرآیندهای زمانبر بهینهسازی فراهم میکند. با این حال، محدودیتی وجود دارد؛ SHARP بیشتر بر زوایای نزدیک به دید اولیه متمرکز است و بخشهای از صحنه که در تصویر اصلی حضور ندارند را بهطور کامل تولید نمیکند. به همین دلیل، کاربران نمیتوانند بیش از اندازه از زاویه ثبت شده فاصله بگیرند.
این محدودیت باعث شده مدل هم سریع بوده و هم خروجیهای پایدار و قابل اعتمادی ارائه دهد؛ ترکیبی که تحویل نتایج در کمتر از یک ثانیه را ممکن میسازد. اپل برای نمایش کارایی SHARP، آن را با Gen3C —یکی از سیستمهای قدرتمند قبلی— مقایسه کرده است.
علاوه بر این، اپل کد SHARP را در گیتهاب منتشر کرده و کاربران در حال آزمایش و بهاشتراکگذاری نتایج خود هستند. برخی از این نتایج فراتر از انتظار اولیهی اپل رفته و بهصورت ویدیوهای نمایشی ارائه شدهاند؛ این امر حاکی از آن است که این مدل، یا حداقل رویکرد آن، امکان گسترش به کاربردهای متنوعتری در آینده را خواهد داشت.











