تماس با ما

اپل با بهره‌گیری از فناوری هوش مصنوعی چشمگیر خود، قادر است تصاویر دوبعدی را به فرمت سه‌بعدی تبدیل کند. این نوآوری جدید می‌تواند کاربردهای گسترده‌ای در زمینه‌های مختلف پیدا کند.

اپل با بهره‌گیری از فناوری هوش مصنوعی چشمگیر خود، قادر است تصاویر دوبعدی را به فرمت سه‌بعدی تبدیل کند. این نوآوری جدید می‌تواند کاربردهای گسترده‌ای در زمینه‌های مختلف پیدا کند.

به گزارش خبرگزاری‌ها، اپل از مدل جدیدی با نام SHARP رونمایی کرده است که قادر است تنها با یک تصویر دوبعدی صحنه‌ای سه‌بعدی را در کمتر از یک ثانیه بازسازی کند. این شرکت در گزارشی تحت عنوان “Sharp Monocular View Synthesis in Less Than a Second” توضیح داده که چگونه این مدل آموزش دیده است تا با حفظ دقیق مقیاس‌ها و فاصله‌های واقعی، نمایش سه‌بعدی منسجمی از صحنه‌ها ارائه دهد.

مدل SHARP قابلیت پیش‌بینی بازنمایی سه‌بعدی را داراست که امکان رندر آن از زوایای نزدیک به تصویر اصلی را فراهم می‌کند. اساس این فناوری بر پایه Gaussian Splatting استوار است، جایی که هر “گاوسی سه‌بعدی” به‌طور مشابه به توده‌ای از رنگ و نور در فضا عمل می‌کند و ترکیب میلیون‌ها نمونه از آن‌ها به بازسازی یک صحنه‌ی سه‌بعدی معتبر کمک می‌کند.

برخلاف روش‌های سنتی Gaussian Splatting که معمولاً به ده‌ها یا صدها تصویر از یک صحنه نیاز دارند، مدل SHARP این توانایی را دارد که تنها با یک عکس و در یک مرحله از شبکه‌ی عصبی، بازنمایی کامل سه‌بعدی را پیش‌بینی کند.

برای رسیدن به این دستاورد، اپل SHARP را با استفاده از حجم زیادی از داده‌های مصنوعی و واقعی آموزش داده تا الگوهای عمق و هندسه را شناسایی کند. این مدل با دریافت یک تصویر جدید، ابتدا عمق را تخمین می‌زند و سپس با استفاده از دانش قبلی، آن را اصلاح کرده و در نهایت، موقعیت و ظاهر میلیون‌ها گاوسی سه‌بعدی را پیش‌بینی می‌کند.

این روش امکان بازسازی سریع صحنه‌های سه‌بعدی را بدون نیاز به چندین تصویر و فرآیندهای زمان‌بر بهینه‌سازی فراهم می‌کند. با این حال، محدودیتی وجود دارد؛ SHARP بیشتر بر زوایای نزدیک به دید اولیه متمرکز است و بخش‌های از صحنه که در تصویر اصلی حضور ندارند را به‌طور کامل تولید نمی‌کند. به همین دلیل، کاربران نمی‌توانند بیش از اندازه از زاویه ثبت شده فاصله بگیرند.

این محدودیت باعث شده مدل هم سریع بوده و هم خروجی‌های پایدار و قابل اعتمادی ارائه دهد؛ ترکیبی که تحویل نتایج در کمتر از یک ثانیه را ممکن می‌سازد. اپل برای نمایش کارایی SHARP، آن را با Gen3C —یکی از سیستم‌های قدرتمند قبلی— مقایسه کرده است.

علاوه بر این، اپل کد SHARP را در گیت‌هاب منتشر کرده و کاربران در حال آزمایش و به‌اشتراک‌گذاری نتایج خود هستند. برخی از این نتایج فراتر از انتظار اولیه‌ی اپل رفته و به‌صورت ویدیوهای نمایشی ارائه شده‌اند؛ این امر حاکی از آن است که این مدل، یا حداقل رویکرد آن، امکان گسترش به کاربردهای متنوع‌تری در آینده را خواهد داشت.

پیوندها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *