張 璐,季昊龍,江 寧,張國(guó)杰
(山東警察學(xué)院 偵查系 刑事科學(xué)技術(shù)系,山東 濟(jì)南 250200)
近些年,人工智能技術(shù)發(fā)展迅速,深度偽造技術(shù)便是其中重要的研究成果之一。深度偽造技術(shù)包括人臉合成、視頻偽造、音頻模擬、文本仿造等多模態(tài)的欺騙技術(shù),生成并不存在的或者張冠李戴的音視頻合成品。深度偽造技術(shù)在各行各業(yè)應(yīng)用廣泛。一方面可以為工作提供技術(shù)支持,例如在影視娛樂領(lǐng)域,可以通過視頻與音頻偽造,實(shí)現(xiàn)比替身演員更加真實(shí)的效果。在服務(wù)業(yè),可以借由人臉生成技術(shù)增強(qiáng)人機(jī)交互感受,以提高服務(wù)質(zhì)量。此外在藝術(shù)、醫(yī)療、教育、社交等領(lǐng)域也有應(yīng)用。另一方面,深度偽造技術(shù)的不恰當(dāng)使用同樣會(huì)帶來風(fēng)險(xiǎn),損害個(gè)人和企業(yè)權(quán)益、威脅國(guó)家安全和公共安全。
深度偽造技術(shù)種類繁多,視頻偽造是深度偽造技術(shù)最為主要的代表,包括直接換臉、表情操縱、動(dòng)作遷移等多種類型。深度偽造的核心原理是利用深度學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò),將目標(biāo)對(duì)象的面部“嫁接”到被模仿對(duì)象上。視頻是由連續(xù)的幀組成,把每一幀中的人臉對(duì)象進(jìn)行替換便能得到換臉后變臉的新視頻。因此,在偽造的步驟上,大致可以分為三個(gè)流程,一是將原始視頻逐幀轉(zhuǎn)化成大量圖片,并使用人臉識(shí)別技術(shù)識(shí)別、對(duì)齊視頻圖像中的人臉;二是利用生成的偽造人臉直接完成對(duì)原始對(duì)象面部的替換;三是將替換完成的圖片重新合成、壓縮、還原為視頻?!?br>