فناوری Deepfake میتواند به طور شگفتانگیزی هر فردی در جهان را در ویدیو یا عکسی که واقعاً در آن نبوده است، قرار دهد. چنین قابلیتهایی برای دههها وجود داشته است؛ اینگونه بود که بازیگر فقید Paul Walker برای فیلم Fast & Furious 7 احیا شد. البته قبلاً برای ایجاد این اثرات، یک استودیوی کامل از کارشناسان به مدت یک سال زمان نیاز داشتند. اما اکنون، فناوریهای Deepfake با سیستمهای جدید رایانهای و یادگیری ماشینی، میتوانند تصاویر و ویدیوها را با سرعت بیشتری ایجاد کنند. با این حال، اصطلاح “Deepfake” با سردرگمیهای زیادی همراه است و محققان بینایی ماشین و گرافیک، در نفرت از این واژه با یکدیگر متحد هستند. این اصطلاح به طور کلی برای توصیف همه چیز از ویدیوهای پیشرفته تولید شده توسط هوش مصنوعی تا هر تصویری که احتمالاً به نظر جعلی میرسد، استفاده میشود.
Deepfake ها چگونه ایجاد میشوند؟
مواد اصلی در ساخت Deepfakes یادگیری ماشین است که امکان تولید Deepfakes با سرعت بیشتر و هزینه کمتر را فراهم کرده است. برای ساخت ویدیوی Deepfake از یک فرد، یک خالق ابتدا شبکه عصبی را بر روی ساعتها فیلمهای واقعی از آن فرد آموزش میدهد تا به آن یک “فهم” واقعگرایانه از فیزیک فرد در زوایا و نوردهیهای مختلف بدهد. سپس شبکه آموزش دیده را با تکنیکهای گرافیک رایانهای ترکیب میکند تا یک کپی از فرد را بر روی یک بازیگر دیگر قرار دهند.
هرچند هوش مصنوعی این فرآیند را سریعتر از هر وقت دیگری کرده، اما هنوز زمانی برای این فرآیند لازم است تا ترکیبی قابل باور ایجاد شود , یک فرد را در وضعیتی کاملاً خیالی قرار دهد. خالق باید بسیاری از پارامترهای برنامه آموزش دیده را به صورت دستی تنظیم کند تا از نقاط ضعف و غیرواقعی بودن تصویر جلوگیری کند. این فرآیند به سادگی انجام نمیشود. برخی دانشمندان معتقدند که یک کلاس از الگوریتمهای یادگیری عمیق به نام شبکههای مبارزهای تولیدی (GANs) موتور اصلی توسعه Deepfakes در آینده خواهند بود. چهرههای تولید شده توسط GANs به سختی از چهرههای واقعی قابل تشخیص هستند!
یک GAN دو الگوریتم هوش مصنوعی را در مقابل یکدیگر قرار میدهد. الگوریتم اول، که به نام تولیدکننده شناخته میشود، با نویز تصادفی تغذیه میشود و آن را به تصویر تبدیل میکند. این تصویر مصنوعی سپس به جریانی از تصاویر واقعی مثلاً تصاویر سلبریتیها، که به الگوریتم دوم با نام تمییزدهنده، داده میشوند، اضافه میشود. در ابتدا، تصاویر مصنوعی هیچگونه شباهتی به چهره نخواهند داشت. اما با تکرار این فرآیند و بازخورد درباره عملکرد، کار هر دو تمییزدهنده و تولیدکننده بهبود مییابند. با تکرار چرخهها و بازخوردهای کافی، تولیدکننده شروع به تولید چهرههای بسیار واقعگرایانه از افرادی میکند که اصلا وجود ندارند!
ولی کار با GANs دشوار بوده و نیاز به مقدار عظیمی از دادههای آموزشی دارد. این مدلها طولانیتر از آنچه تکنیکهای دیگر کار میکنند، به تولید تصاویر میپردازند. و مهمترین اینکه مدلهای GAN برای تولید تصاویر خوب هستند، اما برای ساخت ویدیوها نه. آنها در حفظ هماهنگی زمان و پیوستگی فریمها مشکل دارند. بهترین ویدیوهای “Deepfakes” صوتی نیز از GANs استفاده نمیکنند. در واقع، بخش عمده ویدیوهای Deepfake امروز با استفاده از یک مجموعه از الگوریتمهای AI و غیر AI تولید میشوند.
چه کسانی Deepfake میسازند؟
از محققان دانشگاهی و صنعتی گرفته تا علاقهمندان آماتور، استودیوهای جلوههای ویژه و تولیدکنندگان پورن. دولتها هم ممکن است در این فناوری نیز دست داشته باشند، به عنوان بخشی از استراتژیهای آنلاین خود برای بیاعتبار کردن و اختلال در گروههای افراطی، یا برقراری ارتباط با افراد هدف.
چه تکنولوژی برای تولید Deepfake مورد نیاز است؟
ساخت یک Deepfake خوب در کامپیوترهای استاندارد دشوار است. بیشتر آنها در رایانههای قدرتمند با کارتهای گرافیکی خیلی قوی یا بهتر از آن با قدرت محاسباتی در ابر ساخته میشوند. این کار زمان پردازش را از روزها و هفتهها به ساعات کاهش میدهد. اما تخصص نیز لازم است، نه تنها برای ساخت بلکه برای ویرایش ویدیوهای تکمیل شده، کاهش پرش و سایر نقایص بصری.
با این حال، ابزارهای زیادی اکنون در دسترس هستند تا به مردم در ساخت Deepfake کمک کنند. چندین شرکت آنها را برای شما میسازند و همه پردازش را در ابر انجام میدهند. حتی یک اپلیکیشن تلفن همراه به نام Zao وجود دارد که به کاربران امکان میدهد چهرههای خود را به فهرستی از شخصیتهای تلویزیونی و فیلمها که سیستم بر روی آنها آموزش دیده است، اضافه کنند.
چگونه یک Deepfake را تشخیص دهیم؟
با پیشرفت تکنولوژی، این کار سختتر میشود. در سال ۲۰۱۸، محققان آمریکایی دریافتند که چهرههای Deepfake به طور طبیعی پلک نمیزنند. این چندان تعجبآور نیست؛ اکثر تصاویر افراد را با چشمان باز نشان میدهند، بنابراین الگوریتمها در مورد پلک زدن چیزی یاد نمیگیرند. در ابتدا به نظر میرسید که توجه به این موضوع، راه حل مناسبی برای مشکل تشخیص است. اما به محض انتشار این تحقیق، Deepfakeهایی با پلک زدن طبیعی ظاهر شدند. ماهیت بازی این است؛ به محض آشکار شدن یک ضعف، آن را برطرف میکنند!
Deepfakeهای با کیفیت پایین، به راحتی قابل تشخیص هستند. همگامسازی لبها ممکن است ضعیف بوده یا رنگ پوست لکهدار و غیر طبیعی باشد. ممکن است چهرهها وقتی در حال جابهجایی هستند غیر عادی به نظر بیایند. ساخت جزئیات ظریف مانند موها، به ویژه در مواردی که تار موها در حاشیه قابل مشاهده هستند، برای Deepfake بسیار دشوار است. جواهرات و دندانهای نامرتب ، همچنین انعکاس عجیب نور مثلاً نورپردازی ناهمگون و انعکاس در عنبیه نیز میتوانند نشانهای از Deepfake باشند.
دولتها، دانشگاهها و شرکتهای فناوری همگی در حال تأمین مالی تحقیقات برای تشخیص Deepfakeها هستند. ماه گذشته، اولین چالش تشخیص Deepfake با پشتیبانی Microsoft، Facebook و Amazon آغاز شد. این چالش شامل تیمهای تحقیقاتی در سراسر جهان است که برای برتری در بازی تشخیص Deepfake رقابت میکنند.