### اهمیت طراحی معماری مدلهای هوش مصنوعی
پژوهش جدیدی که توسط گروهی از دانشمندان انجام شده، نشان میدهد که طراحی معماری مدلهای هوش مصنوعی ممکن است به مراتب بیشتر از فرایندهای یادگیری عمیق زمانبر و پرهزینه اهمیت داشته باشد. به گفته میک بانر، نویسنده اصلی این پژوهش و استادیار علوم شناختی در دانشگاه جانز هاپکینز، رویکرد کنونی هوش مصنوعی بر اساس تزریق حجم وسیعی از دادهها و ایجاد منابع محاسباتی با هزینههای سنگین استوار شده است. این در حالی است که انسانها برای یادگیری به دادههای کمتری نیاز دارند.
### مقایسه معماریهای هوش مصنوعی با عملکرد مغز
این پژوهش به بررسی سه نوع اصلی طراحی شبکههای هوش مصنوعی که بنیادمدار مدلهای مدرن هستند، پرداخته است:
– معماریهای ترنسفورمر
– شبکههای کاملاً متصل (Fully Connected)
– شبکههای عصبی کانولوشنی (CNN)
محققان با اعمال تغییرات مختلف در این سه معماری، شبکههای عصبی جدیدی ایجاد کردند و سپس با نشان دادن تصاویری از اشیا، انسانها و حیوانات به این شبکهها، پاسخهای آنها را با فعالیت مغزی انسان و نخستیسانان مقایسه کردند. نتایج نشاندهنده این بود که افزایش تعداد نورونها در ترنسفورمرها و شبکههای تماممتصل تأثیر کمی دارد، اما در مورد شبکههای کانولوشنی، تغییرات معماری سبب تولید الگوهای فعالیتی شد که به عملکرد مغز انسان نزدیکتر بود.
### تحلیل نتایج پژوهش
یافتههای این تحقیق به این نکته اشاره میکند که شبکههای کانولوشنی بدون نیاز به آموزش قبلی و تنها بر اساس معماری توانستهاند الگوهایی مشابه مدلهای آموزشدیده با دادههای وسیع تولید کنند. این نتیجه بر این فرضیه که فقط یادگیری از دادههای عظیم میتواند به هوش مصنوعی شبیه مغز منجر شود، خط بطلانی میکشد.
بانر بیان کرد: «اگر واقعاً یادگیری از دادههای زیاد عامل اصلی باشد، نباید دسترسی به سیستمهای نزدیک به مغز تنها با تغییر معماری ممکن باشد.» او همچنین اشاره کرد که با شروع از یک معماری مناسب و افزودن الهامهای بیشتری از زیستشناسی، میتوان سرعت یادگیری در سیستمهای هوش مصنوعی را بهطور قابلتوجهی افزایش داد.
تیم تحقیقاتی در مرحله بعدی خود قصد دارد الگوریتمهای یادگیری سادهتری که از زیستشناسی الهام گرفته شدهاند، توسعه دهد، که میتواند به ایجاد یک چارچوب جدید در یادگیری عمیق منجر شود.
منبع: scitechdaily











