به صداهای آشنا اعتماد نکنید؛ هوش مصنوعی با تقلب در صدای افراد می‌تواند شما را به دردسر بیندازد و سرمایه‌تان را به خطر بیندازد.

تحقیقات جدید نشان می‌دهد که تشخیص صداهای تولیدشده توسط هوش مصنوعی (AI) از صدای انسان واقعی برای شنوندگان معمولی به راحتی امکان‌پذیر نیست. این موضوع به‌ویژه در شرایطی مطرح شده است که کاربران به کمک دستیاران شخصی مانند سیری و الکسا با صداهای مکانیکی آشنا شده‌اند.

یک مطالعه تازه نشان داده است که وقتی افراد به صداهای انسانی در کنار نسخه‌های تولیدشده توسط هوش مصنوعی گوش می‌دهند، قادر به تشخیص دقیق این دو از یکدیگر نیستند. نادین لاوان، محقق ارشد این پژوهش از دانشگاه کوئین مری لندن، به این نکته اشاره کرده است که صداهای تولید شده توسط AI در حال حاضر به وفور در دسترس هستند و فناوری به‌سرعت در حال پیشرفت است تا گفتار طبیعی‌تر و قابل‌قبول‌تری ارائه دهد.

در این پژوهش، شرکت‌کنندگان به ۸۰ صدای مختلف، شامل ۴۰ صدای تولیدشده توسط AI و ۴۰ صدای واقعی، گوش داده و خواسته شدند تا تعیین کنند کدام یک واقعی است. نتایج نشان داد که تنها ۴۱ درصد از صداهای تولیدشده از صفر به‌اشتباه به عنوان صدای انسان شناسایی شدند. در contrast، ۵۸ درصد از صداهای دیپ‌فیک به اشتباه واقعی تلقی شدند و توانسته‌اند به‌خوبی تقلب کنند.

لاوان بر این باور است که این نتایج می‌تواند عواقب جدی برای اخلاقیات، کپی‌رایت و امنیت داشته باشد. استفاده از فناوری برای شبیه‌سازی صدا می‌تواند به مجرمان این امکان را بدهد که با دور زدن پروتکل‌های احراز هویت صوتی، از مزایای آن بهره‌برداری کنند.

نمونه‌های واقعی از این نوع کلاهبرداری در تاریخ اتفاق افتاده است. به عنوان مثال، یک زن به نام شارون برایت‌ول، به اشتباه ۱۵,۰۰۰ دلار را به یک کلاهبردار که صدای دخترش را تقلید کرده بود، پرداخت کرد.

استفاده‌های دیگر از فناوری دیپ‌فیک شامل ساخت بیانیه‌های کلاهبرداری از شخصیت‌های مهم و به کارگیری آن در بی‌اعتماد کردن افراد یا ایجاد ناآرامی‌های اجتماعی است. به طور مثال، یک شبیه‌سازی از صدای نخست‌وزیر کوئینزلند برای ترغیب مردم به سرمایه‌گذاری در کلاهبرداری‌های بیت‌کوینی استفاده شد.

این پژوهش تایید می‌کند که توانایی تولید صداهای واقعی توسط هوش مصنوعی به سادگی در دسترس است و تنها با استفاده از تجهیزات و نرم‌افزارهای تجاری و چند دقیقه ضبط صدا به دست می‌آید.

با وجود چالش‌های موجود، این فناوری همچنین می‌تواند فرصت‌های مثبتی برای بهبود دسترسی و آموزش فراهم کند و به کیفیت ارتباطات کمک کند.

منبع: livescience