استارتاپ چینی دیپسیک اخیراً از مدل هوش مصنوعی جدید خود به نام DeepSeek-V3.2-Exp رونمایی کرده است. این مدل با استفاده از معماری نوین «توجه پراکنده»، به کاهش هزینههای مربوط به تجزیه و تحلیل متون طولانی تا 50 درصد وعده میدهد. این پیشرفت میتواند دسترسی به فناوری هوش مصنوعی برای شرکتهای کوچکتر را تسهیل کند.
مدلهای هوش مصنوعی متداول، برای درک متن، باید به تمامی کلمات و جملات توجه کنند که این کار به منابع محاسباتی و هزینههای سرور چشمگیری نیاز دارد. اما رویکرد جدید DeepSeek، با استفاده از «توجه پراکنده» (DSA)، این مسئله را به شیوهای هوشمندانه حل میکند. این سیستم به جای تحلیل تمامی اطلاعات، تنها به بخشهای مهم متن توجه میکند. به طور مثال، اگر یک شرکت هواپیمایی بخواهد بهترین مسیر را انتخاب کند، تنها گزینههای منطقی را مورد بررسی قرار میدهد.
در این راستا، سیستم DeepSeek با یک ماژول هوشمند، بخشهای کلیدی متن را شناسایی و تنها کلمات مهم را برای تجزیه و تحلیل نهایی انتخاب میکند؛ این فرآیند به طور قابل توجهی بار محاسباتی را کاهش میدهد و به گفته دیپسیک، میتواند هزینه استفاده از API را در شرایط متنی طولانی به نصف برساند.
این پیشرفت خبر مثبتی برای جامعه فناوری محسوب میشود، زیرا کاهش هزینهها به توسعهدهندگان و شرکتهای کوچکتر این امکان را میدهد که به مدلهای قدرتمند هوش مصنوعی دسترسی پیدا کنند و نوآوریهای جدیدی را به ارمغان بیاورند.
با این حال، این رویکرد نگرانیهایی را نیز به همراه دارد، به ویژه در زمینه اطمینانپذیری. این سؤال پیش میآید که چگونه هوش مصنوعی قادر است دادههای مهم را از غیرمهم تشخیص دهد. «اکاترینا آلماسک»، یکی از سرمایهگذاران فعال در حوزه هوش مصنوعی، ابراز نگرانی کرده و میگوید که این مدلها ممکن است برخی از جزئیات را از دست بدهند و سوال این است که آیا مکانیسم مناسبی برای تشخیص دادههای غیرمهم دارند.
این چالش، به خصوص از جنبه ایمنی و شمولیت هوش مصنوعی میتواند معضلی جدی به شمار آید. اگر یک مدل به صورت سیستماتیک اطلاعات مرتبط با گروه خاصی یا دیدگاه خاصی را «غیرمهم» تلقی کند، نتایج آن میتواند مغرضانه، غیرقابل اعتماد و حتی خطرناک باشد.











