路彩霞

【摘要】? ? 人工智能技術(shù)憑借自身的賦能效應(yīng)對(duì)現(xiàn)代社會(huì)的生活和發(fā)展格局產(chǎn)生著重大的影響,使得現(xiàn)代社會(huì)的治理效率有了顯著提升。人工智能提供的種種便利確實(shí)改善了人們的日常生活,但也伴隨著使用風(fēng)險(xiǎn)。對(duì)此,本文將基于對(duì)深度偽造技術(shù)的探尋,就深度偽造技術(shù)面臨的安全挑戰(zhàn)展開(kāi)論述,繼而根據(jù)實(shí)際情況提出深度偽造技術(shù)的安全應(yīng)對(duì)措施。
【關(guān)鍵詞】? ? 深度偽造? ? 安全挑戰(zhàn)? ? 人工智能
深度偽造技術(shù)就是一種利用人工智能等新興技術(shù)對(duì)音視頻、圖像或者是文本內(nèi)容進(jìn)行操縱,對(duì)人產(chǎn)生誤導(dǎo)效果的技術(shù)[1]。通常采用深度偽造技術(shù)生成的圖像或者是視頻能夠?qū)⒚娌勘砬椤?dòng)作和語(yǔ)音的音調(diào)、色調(diào)等信息高度模仿出來(lái),讓肉眼難以直觀的辨識(shí)出來(lái),真正達(dá)到“以假亂真”。一旦被有心人不懷好意的運(yùn)用,將嚴(yán)重威脅個(gè)人的安全和隱私,甚至對(duì)社會(huì)乃至整個(gè)國(guó)家的安全均將造成嚴(yán)重影響。
一、深度偽造技術(shù)概述
(一)深度偽造的技術(shù)原理
深度偽造技術(shù)原理就是以對(duì)抗網(wǎng)絡(luò)(GAN)的算法搭載著生成器和識(shí)別器兩個(gè)神經(jīng)網(wǎng)絡(luò)。生成器和識(shí)別器在相互博弈學(xué)習(xí)的過(guò)程中將會(huì)出現(xiàn)大規(guī)模和高精確度的輸出,所以便需要研究人員使用大量的人臉圖像來(lái)對(duì)GAN網(wǎng)絡(luò)進(jìn)行訓(xùn)練,讓人們能夠很快速把握人臉圖像中的眼睛、鼻子、嘴巴和表情等特征[2]。尤其是在新輸入了圖像與視頻之后,GAN這個(gè)框架便能夠很快速的捕獲人臉特征,讓面部圖像的替換與操縱工作也能夠隨時(shí)完成。這樣再充分利用計(jì)算機(jī)視頻中的多個(gè)單幀以批量處理的形式自動(dòng)生成深度偽造視頻。
(二)深度偽造技術(shù)的發(fā)展態(tài)勢(shì)
隨著信息技術(shù)的不斷發(fā)展, 深度偽造技術(shù)也較之過(guò)往有了明顯進(jìn)步,如此前的偽造技術(shù)大多較為粗糙,而如今的偽造技術(shù)因神經(jīng)網(wǎng)絡(luò)圖像偽造檢測(cè)技術(shù)的加入,而使得所生成視頻圖像也更類(lèi)似于現(xiàn)實(shí)生活中人的指紋一樣的網(wǎng)絡(luò)特征。不僅如此,隨著該項(xiàng)技術(shù)的進(jìn)一步發(fā)展,今后的“深度偽造”還可基于用戶偏好,并通過(guò)對(duì)用戶價(jià)值觀及人生態(tài)度的揣摩來(lái)為其推送與之相契合的合成視頻,以致用戶逐步放棄追尋事實(shí)真相的意愿 [3]。
(三)深度偽造技術(shù)的特點(diǎn)
深度偽造技術(shù)具有隱匿性強(qiáng)、難檢測(cè)、難追蹤的特點(diǎn)。深度偽造的技術(shù)展示大致分為如下四類(lèi):換臉、唇形同步、面部復(fù)現(xiàn)、動(dòng)作轉(zhuǎn)移。
二、深度偽造技術(shù)的類(lèi)型
(一)針對(duì)圖像的深度偽造技術(shù)、應(yīng)用案例及檢測(cè)技術(shù)
針對(duì)圖像的深度偽造技術(shù)主要采用的是生成對(duì)抗網(wǎng)絡(luò)衍生出的虛擬圖像。就該技術(shù)而言,其所對(duì)抗的網(wǎng)絡(luò)對(duì)象主要有兩種,分別為生成網(wǎng)絡(luò)與識(shí)別網(wǎng)路;其中,生成網(wǎng)絡(luò)最主要的特征便是其所生成的虛擬圖像同樣具有模擬對(duì)象的特性;而識(shí)別網(wǎng)絡(luò)則能判斷原圖像是否為虛擬圖像的原圖。如圖1所示:首先對(duì)圖像進(jìn)行編碼,后以訓(xùn)練的方式分別置入人臉圖像A與B,緊接著由系統(tǒng)根據(jù)A、B圖像的各自特征來(lái)為其生成特定的解碼器,再通過(guò)解碼B圖像與A圖像進(jìn)行互調(diào),也便是B臉生成替換A臉。諸如此類(lèi)的換臉技術(shù)還有許多,諸如Face2Face、Faceswap-GAN 、Faceswap等。
在這項(xiàng)技術(shù)中所生成的神經(jīng)網(wǎng)絡(luò)分別為生成網(wǎng)絡(luò)與識(shí)別網(wǎng)絡(luò)。其中,生成網(wǎng)絡(luò)的主要作用便是結(jié)合現(xiàn)有的圖像特征來(lái)生成具有同樣特征的圖像,而識(shí)別網(wǎng)絡(luò)的作用則是能對(duì)圖形的真實(shí)性予以辨別并協(xié)助判斷何者為虛擬圖像,何者為本來(lái)的圖像。
通過(guò)對(duì)兩個(gè)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練并使用大量圖像進(jìn)行生成,最主要的目標(biāo)便是要借助虛擬圖像達(dá)到欺騙效果,而欺騙的具體目標(biāo)則主要圍繞著具有識(shí)別功能的網(wǎng)絡(luò)。對(duì)此,識(shí)別網(wǎng)絡(luò)要想避免被虛擬圖像所欺騙,便需具備快速識(shí)別生成網(wǎng)絡(luò)虛擬圖像的能力。這無(wú)異于一項(xiàng)博弈,倘若識(shí)別網(wǎng)絡(luò)無(wú)法對(duì)生成網(wǎng)絡(luò)衍生圖像予以快速識(shí)別,也便讓虛擬圖像有了更多的可乘之機(jī),“以假亂真”將難免導(dǎo)致更嚴(yán)重的危害誕生。
檢測(cè)技術(shù):當(dāng)前,在檢測(cè)深度偽造圖像方面,最常用的分析方法便是基于圖像本身的成像特征,而后運(yùn)用數(shù)據(jù)驅(qū)動(dòng)的方式展開(kāi)深度分析 [3]。然后,針對(duì)圖像真實(shí)性的判別則主要圍繞圖像的差異性特征,分別包含了圖像在成像設(shè)備上呈現(xiàn)出的傳感器噪聲差以及色差等方面,通過(guò)對(duì)以上痕跡的挖掘以及對(duì)人生理信號(hào)特征的對(duì)比,也能對(duì)圖像真?zhèn)蔚呐袆e提供一定的依據(jù) [4]。針對(duì)這種特征的檢測(cè)方法只能夠?qū)σ恍┨囟▊卧祛?lèi)型的痕跡進(jìn)行檢測(cè),通過(guò)肉眼都能夠很輕易的進(jìn)行識(shí)別和篡改,所以能夠保證檢測(cè)結(jié)果的解釋性較好。
(二)針對(duì)視頻的深度偽造技術(shù)、應(yīng)用案例及檢測(cè)技術(shù)
針對(duì)視頻的深度偽造技術(shù)通常需要處理每一幀的視頻圖像,在將每一幀的人臉圖像均替換為目標(biāo)任務(wù)的臉部后,也便能生成出有著目標(biāo)人臉的偽造視頻 [5]。由此可見(jiàn),此間主要運(yùn)用了兩項(xiàng)技術(shù),分別為編碼與解碼。其中,編碼的主要作用在重組此前從圖像中提取出來(lái)的諸多特征,以便后續(xù)將原始圖像以低緯度數(shù)據(jù)替換;至于解碼器的作用則是能將壓縮的數(shù)據(jù)還原,使其恢復(fù)原本的“面貌”及特征。
例如,一款名為ZAO的人工智能換臉APP只需要用戶的一張正面照,再使用一鍵操作便能夠很快速的將影視劇片段中的演員臉換成自己的。生成視頻的過(guò)程主要依托的是一項(xiàng)AI技術(shù)。
檢測(cè)技術(shù):針對(duì)視頻深度偽造技術(shù)的檢測(cè)方法主要聚焦于“換臉”這項(xiàng)技術(shù)上。當(dāng)視頻在被壓縮掉之后,每一幀的數(shù)據(jù)便會(huì)出現(xiàn)退化的情況,而視頻的幀組之間的時(shí)序特征也會(huì)隨之發(fā)生變化。因此,通常針對(duì)靜態(tài)特征下的深度偽造圖像檢測(cè)技術(shù)則無(wú)法被應(yīng)用于深度偽造視頻的檢測(cè)過(guò)程中。深度偽造模型可利用靜態(tài)的面部圖像集展開(kāi)訓(xùn)練,而生成模型存在對(duì)人臉的輪廓建模不足的情況,這樣便很難偽造出眨眼、呼吸、心跳等生理性的信息[6]。同時(shí),研究者在不斷研究的過(guò)程中,在準(zhǔn)確把握生理信息的基礎(chǔ)上采取深度偽造視頻檢測(cè)技術(shù)來(lái)眼見(jiàn)視頻真?zhèn)危陂g將主要圍繞局部特征加以檢測(cè),包括觀察眨眼動(dòng)作是否自然、面部與頭部朝向是否符合人體工學(xué)以及面部朝向不同區(qū)域時(shí)應(yīng)該產(chǎn)生的視覺(jué)偽影等。
(三)針對(duì)音頻的深度偽造技術(shù)、應(yīng)用案例及檢測(cè)技術(shù)
通過(guò)修改音頻數(shù)據(jù),還能對(duì)原始音頻予以改造,使之成為另一端與原始音頻有著完全不一樣數(shù)據(jù)的偽造音頻。例如將音頻的音色改變,便可將男聲轉(zhuǎn)化為女聲。這種語(yǔ)音翻譯模型在諸多軟件中均得到了較為廣泛的運(yùn)用,如QQ、微信等均有此項(xiàng)功能。這種技術(shù)在外語(yǔ)翻譯方面尤為適用。通過(guò)將外域翻譯成中文,同時(shí)也保留著外國(guó)人的聲音特質(zhì),便好似該外國(guó)人本身會(huì)說(shuō)中文一般,僅是語(yǔ)音語(yǔ)調(diào)仍保留著外國(guó)人說(shuō)英語(yǔ)的特征。
檢測(cè)技術(shù):針對(duì)音頻的深度偽造技術(shù)在檢測(cè)的過(guò)程中主要是對(duì)音頻的信號(hào)進(jìn)行處理,再根據(jù)頻譜的特征進(jìn)行建模,而后的識(shí)別檢測(cè)則主要運(yùn)用了兩種方法,分別為歸一化余弦相位與修正群延遲。雖然上述方法再識(shí)別音頻及音頻處理方面有著較為優(yōu)良的表現(xiàn),但因其泛化性能尚有不足,故也限制了該方法的運(yùn)用范圍。而如今,隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,廣大研究者的關(guān)注點(diǎn)也紛紛轉(zhuǎn)移到了以數(shù)據(jù)驅(qū)動(dòng)為基礎(chǔ)的深度學(xué)習(xí)檢測(cè)方法之上。其中,Gomez-Alanis利用輕量級(jí)的卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)提出光卷積門(mén)控遞歸神經(jīng)網(wǎng)絡(luò)來(lái)提取音頻深度特征的一種檢測(cè)方法。新加坡信息通信研究所網(wǎng)絡(luò)安全小組的Monteiro在研究的過(guò)程中指出將聲音表征作為視覺(jué)頻譜圖,其對(duì)聲音特征的分析主要給予頻譜圖的清晰度,這樣也能為音頻辨別提供依據(jù) [7]。雖然,當(dāng)前的語(yǔ)音檢測(cè)已從信號(hào)處理發(fā)展到了深度學(xué)習(xí)法,但由于該過(guò)程對(duì)攻擊類(lèi)型的針對(duì)性較強(qiáng),故要想檢測(cè)出未知類(lèi)型的攻擊,目前仍有較大的提升空間。
三、深度偽造技術(shù)面臨的安全挑戰(zhàn)
(一)威脅個(gè)人生活
當(dāng)前深度偽造技術(shù)所生成的圖像和音視頻數(shù)據(jù)能夠達(dá)到以假亂真的地步,嚴(yán)重威脅著廣大人們的正常生活。例如,為達(dá)到自身不可告人的目的,有心人便會(huì)利用深度偽造技術(shù)來(lái)制作視頻及圖像,企圖以此威脅。如在我國(guó)便不乏這樣的真實(shí)案例,不法分子為勒索錢(qián)財(cái)而將明星照片與裸照結(jié)合,再將偽造的圖片拋向公眾網(wǎng)絡(luò),以致被害人聲譽(yù)及財(cái)產(chǎn)均遭到嚴(yán)重威脅。
(二)威脅金融秩序
金融市場(chǎng)的發(fā)展過(guò)程本就容易遭受外界因素的影響,加之金融市場(chǎng)又與金錢(qián)密切相關(guān),故也更容易成為深度偽造技術(shù)的針對(duì)目標(biāo)。如利用深度偽造技術(shù)偽造公司管理者的不雅視頻,使得公司聲譽(yù)及形象遭受影響,繼而導(dǎo)致公司的股票漲落而自身則從中獲益。與此同時(shí),對(duì)于經(jīng)常在電視中見(jiàn)到的經(jīng)濟(jì)學(xué)家或某方面專(zhuān)家,通過(guò)偽造他們的視頻及音頻,讓股民誤認(rèn)為此為指導(dǎo)自己購(gòu)買(mǎi)或拋售股票的信息,以致股民在毫無(wú)根據(jù)的情況下,大量購(gòu)入或拋售股票,以致整個(gè)股市陷入混亂。
(三)影響社會(huì)穩(wěn)定
在以往人們的觀念中是“眼見(jiàn)為實(shí)”,但在自媒體快速發(fā)展的社會(huì)背景下,深度偽造技術(shù)所生成的各種視頻、圖片等虛假信息顛覆了“眼見(jiàn)為實(shí)”這個(gè)觀念,眼睛看到的和耳朵聽(tīng)見(jiàn)的都不一定是真實(shí)的,這便極易導(dǎo)致社會(huì)恐慌出現(xiàn)。嚴(yán)重者甚至還將對(duì)社會(huì)整體的穩(wěn)定運(yùn)行帶來(lái)嚴(yán)重影響。不僅如此,針對(duì)以人工智能技術(shù)識(shí)別目標(biāo)任務(wù)的智能識(shí)別系統(tǒng),倘若不法分子同樣利用深度偽造技術(shù),將原本正常的數(shù)據(jù)替換為偽造的音視頻數(shù)據(jù),這對(duì)整個(gè)安防體系的安全性無(wú)疑是一項(xiàng)嚴(yán)重且極可能出現(xiàn)的威脅,而最終受影響者亦將是整個(gè)社會(huì)。
(四)威脅國(guó)家安全
深度偽造技術(shù)最主要的威脅還是可作為信息戰(zhàn)的武器,從而危害到國(guó)家的安全。之所以會(huì)產(chǎn)生如此嚴(yán)重的危害,一方面是因該技術(shù)若被有心人利用,并將其與國(guó)家領(lǐng)導(dǎo)人發(fā)言捆綁再予以惡意的剪輯,將挑撥?chē)?guó)家之間的關(guān)系,使得雙方信任度降低。借助深度偽造技術(shù),將各級(jí)領(lǐng)導(dǎo)發(fā)言歪曲為各種謠言并大肆傳播于各大社交媒體,即便相信之人僅是極少數(shù),但對(duì)政治系統(tǒng)的權(quán)威性仍將產(chǎn)生一定影響。倘若放之任之,最終勢(shì)必會(huì)讓國(guó)家法治的和法性遭受質(zhì)疑,這樣的局面無(wú)疑是極其嚴(yán)重的。
四、應(yīng)對(duì)深度偽造技術(shù)的安全措施
(一)構(gòu)建完善的法律法規(guī)
現(xiàn)如今,世界各國(guó)均對(duì)基于深度偽造技術(shù)可能引發(fā)的安全問(wèn)題給予了極高的關(guān)注度,也為了積極防范安全問(wèn)題的發(fā)生而出臺(tái)了相應(yīng)的政策。如美國(guó)參議院于2018年12月提出《2018年惡意偽造禁令法案》中便痛批了此等行為,并就其規(guī)范性提出了具體要求。我國(guó)深度偽造技術(shù)的防范重點(diǎn)則是在2019年11月時(shí),由我國(guó)互聯(lián)網(wǎng)信息辦公室、文化旅游部以及國(guó)家廣播電視總局聯(lián)合楚天了有關(guān)《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》,該規(guī)定不僅明確了服務(wù)者與使用者均不能利用虛擬現(xiàn)實(shí)技術(shù)制作、發(fā)布及傳播新聞信息,同時(shí)也對(duì)違法活動(dòng)的具體類(lèi)型予以了明確,包括人肉搜索、運(yùn)用深度偽造技術(shù)等。從國(guó)家層面提出懲治的方法,雖是能起到一定的威懾作用,但也存在部分抱有僥幸心理的犯罪者,故人工智能技術(shù)要想更好地服務(wù)于現(xiàn)代社會(huì),仍有較大的進(jìn)步空間。
(二)強(qiáng)化技術(shù)支撐
為發(fā)揮深度偽造技術(shù)的積極作用并切實(shí)應(yīng)對(duì)好該技術(shù)所帶來(lái)的安全條件。需首先從數(shù)字呢絨體系建設(shè)入手,通過(guò)結(jié)合數(shù)字水印、區(qū)塊鏈等技術(shù),一方面確保能對(duì)數(shù)字媒體呢絨的全過(guò)程予以有效的追蹤與溯源;另一方面則是要聯(lián)系音素、頻譜、聲紋等一種技術(shù),對(duì)深度偽造建設(shè)技術(shù)予以生化,使之能從更多角度獲取偽造信息并對(duì)其真?zhèn)渭右哉撟C。同時(shí),還需要對(duì)以后一些未知領(lǐng)域中的深度偽造的可泛化虛擬音視頻檢測(cè)方法進(jìn)行研究,追蹤不同深度偽造技術(shù)生成方法,不斷去尋找一些偽造特征的差異,再利用多種網(wǎng)絡(luò)模型將這些差異性的特征提取出來(lái)再進(jìn)行檢測(cè)。將對(duì)抗攻擊技術(shù)引入到檢測(cè)模型訓(xùn)練的過(guò)程中,這樣便能夠大幅度提高抵御對(duì)抗樣本攻擊的能力。
(三)加強(qiáng)行業(yè)自律
通過(guò)約束人工智能技術(shù)的適用范圍,一方面能可對(duì)人工智能的行業(yè)自律起到一定的強(qiáng)化作用;一方面則是為了促進(jìn)人工智能技術(shù)的規(guī)范化運(yùn)用。倘若企業(yè)的主要業(yè)務(wù)便是內(nèi)容生產(chǎn),便更要對(duì)企業(yè)制作的音視頻予以嚴(yán)格審核,避免因人工智能技術(shù)的濫用而損及其他行業(yè)或個(gè)人利益。與此同時(shí),對(duì)于廣大用戶的音視頻數(shù)據(jù)傳輸行為,相關(guān)網(wǎng)站亦當(dāng)肩負(fù)起內(nèi)容審核的責(zé)任及義務(wù),一旦發(fā)現(xiàn)用戶上傳偽造音視頻,便需給予嚴(yán)厲的懲罰。網(wǎng)絡(luò)非是法外之地,任何挑釁法律的行為均將收到嚴(yán)厲懲處,繼而杜絕出現(xiàn)不實(shí)信息的發(fā)布與傳播。
(四)注重社會(huì)教育
要想讓廣大公眾均具備良好的網(wǎng)絡(luò)安全防患意識(shí),首要途徑當(dāng)屬社會(huì)教育。對(duì)此,我過(guò)曾連續(xù)舉辦了八屆網(wǎng)絡(luò)安全宣傳周活動(dòng)。該活動(dòng)因重點(diǎn)圍繞網(wǎng)絡(luò)金融犯罪的頻發(fā)領(lǐng)域,如金融、電子政務(wù)、電子商務(wù)、電信等與百姓之間亦有著較為密切關(guān)聯(lián)的領(lǐng)域,故也營(yíng)造出了良好的安全氛圍。除了上述手段與途徑,國(guó)家還可向公眾公布一些惡意使用深度偽造技術(shù)的現(xiàn)實(shí)案例,以此警醒廣大群眾要始終保持警惕,使之在面對(duì)任何人工智能技術(shù)時(shí)均能秉持謹(jǐn)慎姿態(tài),不要輕易相信人工智能技術(shù)給出的諸多信息,以此方能最大限度減少因偽造信息而導(dǎo)致了公民權(quán)益受損,繼而切實(shí)維護(hù)人工技術(shù)的良性發(fā)展。
五、結(jié)束語(yǔ)
總之,在深度合成技術(shù)不斷更新的背景下,各種虛假音視頻、圖像等在網(wǎng)絡(luò)上的廣泛傳播對(duì)人們?cè)斐闪瞬涣加绊懀詫?duì)深度偽造技術(shù)的檢測(cè)提出了較大的挑戰(zhàn)性。由于深度偽造技術(shù)生成方法的開(kāi)源代碼和工具較多,各種變種方法更容易進(jìn)行修改,所以便需要采取更新技術(shù)、完善相關(guān)法律等方面來(lái)應(yīng)對(duì)深度偽造技術(shù)的安全挑戰(zhàn),以此推動(dòng)人工智能技術(shù)更好的服務(wù)現(xiàn)代社會(huì)發(fā)展。
參考文獻(xiàn):
[1]徐燕萍.“深度偽造”技術(shù)的倫理反思——以一鍵脫衣軟件“Deepnude”為例[J].計(jì)算機(jī)時(shí)代,2021(11):118-121.
[2]李明魯.深度偽造技術(shù)濫用行為的刑法治理路徑[J].法治社會(huì),2021(06):92-101.
[3]彭春蕾,高新波,王楠楠,李潔.可視身份深度偽造與檢測(cè)[J].中國(guó)科學(xué):信息科學(xué),2021,51(09):1451-1474.
[4]毛寧,楊會(huì).深度偽造技術(shù)的監(jiān)管困境及其法律應(yīng)對(duì)[J].長(zhǎng)白學(xué)刊,2021(05):94-101.
[5]張愛(ài)軍,王芳.人工智能視域下的深度偽造與政治輿論變異[J].河海大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2021,23(04):29-36+106.
[6]趙建強(qiáng),張輝極,杜新勝,張光斌.人工智能安全的隱憂:深度偽造技術(shù)的挑戰(zhàn)與應(yīng)對(duì)[J].中國(guó)安防,2021(06):40-47.
[7]衛(wèi)霞,白國(guó)柱,王蓓蓓,張文俊.“深度偽造”技術(shù)安全風(fēng)險(xiǎn)分析及政策建議[J].中國(guó)電信業(yè),2020(11):72-74.