تحقیقات جدید نشان میدهد که تشخیص صداهای تولیدشده توسط هوش مصنوعی (AI) از صدای انسان واقعی برای شنوندگان معمولی به راحتی امکانپذیر نیست. این موضوع بهویژه در شرایطی مطرح شده است که کاربران به کمک دستیاران شخصی مانند سیری و الکسا با صداهای مکانیکی آشنا شدهاند.
یک مطالعه تازه نشان داده است که وقتی افراد به صداهای انسانی در کنار نسخههای تولیدشده توسط هوش مصنوعی گوش میدهند، قادر به تشخیص دقیق این دو از یکدیگر نیستند. نادین لاوان، محقق ارشد این پژوهش از دانشگاه کوئین مری لندن، به این نکته اشاره کرده است که صداهای تولید شده توسط AI در حال حاضر به وفور در دسترس هستند و فناوری بهسرعت در حال پیشرفت است تا گفتار طبیعیتر و قابلقبولتری ارائه دهد.
در این پژوهش، شرکتکنندگان به ۸۰ صدای مختلف، شامل ۴۰ صدای تولیدشده توسط AI و ۴۰ صدای واقعی، گوش داده و خواسته شدند تا تعیین کنند کدام یک واقعی است. نتایج نشان داد که تنها ۴۱ درصد از صداهای تولیدشده از صفر بهاشتباه به عنوان صدای انسان شناسایی شدند. در contrast، ۵۸ درصد از صداهای دیپفیک به اشتباه واقعی تلقی شدند و توانستهاند بهخوبی تقلب کنند.
لاوان بر این باور است که این نتایج میتواند عواقب جدی برای اخلاقیات، کپیرایت و امنیت داشته باشد. استفاده از فناوری برای شبیهسازی صدا میتواند به مجرمان این امکان را بدهد که با دور زدن پروتکلهای احراز هویت صوتی، از مزایای آن بهرهبرداری کنند.
نمونههای واقعی از این نوع کلاهبرداری در تاریخ اتفاق افتاده است. به عنوان مثال، یک زن به نام شارون برایتول، به اشتباه ۱۵,۰۰۰ دلار را به یک کلاهبردار که صدای دخترش را تقلید کرده بود، پرداخت کرد.
استفادههای دیگر از فناوری دیپفیک شامل ساخت بیانیههای کلاهبرداری از شخصیتهای مهم و به کارگیری آن در بیاعتماد کردن افراد یا ایجاد ناآرامیهای اجتماعی است. به طور مثال، یک شبیهسازی از صدای نخستوزیر کوئینزلند برای ترغیب مردم به سرمایهگذاری در کلاهبرداریهای بیتکوینی استفاده شد.
این پژوهش تایید میکند که توانایی تولید صداهای واقعی توسط هوش مصنوعی به سادگی در دسترس است و تنها با استفاده از تجهیزات و نرمافزارهای تجاری و چند دقیقه ضبط صدا به دست میآید.
با وجود چالشهای موجود، این فناوری همچنین میتواند فرصتهای مثبتی برای بهبود دسترسی و آموزش فراهم کند و به کیفیت ارتباطات کمک کند.
منبع: livescience











