中圖分類號:TP391.41 文獻標志碼:A 文章編碼:1672-7274(2025)05-0079-03
Abstract: With the rapid development of artificial intelligence technology,deepfake technology has frequently emerged in the field of video and image forgery,posing serious challnges to social security and personal privacy protection.This article introduces a video anti-counterfeiting authentication scheme based on generative artificial inteligence, which aims to enhance the detection capability of deep forgery technology and prevent and control telecommunications network fraud.This article explores how to improve the detection andresponse capabilities of new fraud methods through technological innovation in response to fraud cases using AI face swapping technology that have emerged inrecent years.Byconstructing diversified deep forgery image and video accurate detection technology, model compresion technology,and knowledge distilation technology,real-time fraudcases using AIface swapping technology can be effectively identified and prevented.
Keywords: deep forgery; telecommunication fraud; video anti-counterfeiting model; model compresiol
近年來,隨著深度學習技術的發展,深度偽造技術(Deepfake)已經能夠生成高度逼真的視頻和圖像,這在影視制作、游戲開發等領域具有廣闊的應用前景。然而,這項技術也被用于制造虛假信息,進行網絡詐騙等非法活動,對社會秩序和個人權益造成了嚴重威脅。特別是在電信網絡詐騙領域,利用深度偽造技術進行身份冒充、偽造視頻等手段層出不窮,給防范和治理工作帶來了新的挑戰。
根據福建省公安部門的統計,2023年福建省內共發生了多起利用深度防偽技術實施的詐騙案件,造成了數百萬元的經濟損失。2023年,福建省共報告了超過50起AI換臉詐騙案件,這些案件累計造成的經濟損失超過1000萬元。目前已經發現了通過線上購卡偽造身份以及在號碼被關停后,通過偽造技術進行實人認證后復機繼續詐騙的情況。
1 線上實名認證主要難點
(1)目前通過視頻偽造實施電信詐騙已經逐步形成規模化,并且網絡上視頻偽造以及AIGC生成算法已經非常成熟,普通的程序員都可以根據教程就實現簡單的視頻偽造。視頻鑒偽技術涉及圖像處理、模式識別、機器學習等多個領域,需要對視頻內容進行深入分析,包括圖像質量、幀速率、色彩一致性等多個方面的檢測。這些都對算法提出了極高的要求,需要深入研究不斷加以攻克。
(2)在算力不足或者基于圖片、視頻以及其他復雜場景情況下,如何保證防偽算法滿足景下對深偽檢測的高要求,這要求檢測技術不僅要有高精度,同時還要能夠處理大量數據流,實現高速率檢測。需要研究如何在不減少準確度的情況下,通過算法裁剪進行模型適配。
(3)目前視頻偽造場景不僅在線上出現,也可能出現在5G消息、云視訊、視頻會議等不同場景,如果對于每個場景都進行模型訓練需要消耗大量的算力資源和人力資源,但基于詐騙案件的緊迫性,必須快速進行模型訓練以及快速適配,因此需要攻克對于不同場景下的深度偽造場景如何快速地進行模型參數調優。
針對上述難點,本文解決方法如下:
(1)提出了多樣化深度偽造圖像視頻精確檢測技術:通過構建cross-cnn-vit-Transformer架構,結合CNN和Transformer的優勢,實現對不同尺度特征的有效融合,提升偽造圖像的識別能力。
(2)提出了模型壓縮技術與知識蒸餾技術:通過模型剪枝、量化等手段減小模型大小,優化模型結構,降低計算復雜度,以實現大規模視頻圖像的快速處理。
(3)提出了認證場景下的模型微調與融合技術:利用集成學習和多任務學習方法,融合多個模型的輸出,提升檢測準確率。
(4)提出了多任務的粗細結合水印去除技術:采用U-Net結構,通過掩膜解碼器預測水印掩膜,重建無水印圖像,提升識別準確率。
2 相關工作
深度偽造技術(Deepfake)[自問世以來,便以其生成逼真偽造視頻的能力而備受關注。這種技術基于深度學習,尤其是生成式對抗網絡[2](GAN),能夠將人物的面部和聲音映射到目標人物上,從而創造出難以區分真偽的視頻內容。隨著技術的進步,Deepfake技術的應用范圍和影響力不斷擴大,同時也帶來了一系列社會和倫理問題,尤其是其在制造虛假信息、進行網絡詐騙等方面的潛在威脅。
為了提高檢測模型的性能,研究者們嘗試了多種技術路線。一種方法是通過模型壓縮和知識蒸餾技術,減小模型大小,優化模型結構,以實現在資源受限的環境下進行高效檢測。另一種方法是利用多任務學習和集成學習,融合多個模型的輸出,以提升檢測的準確率和魯棒性。此外,針對Deepfake視頻的多樣性和復雜性,一些研究者提出了基于多尺度特征融合的方法。例如,通過結合CNN的空間特征提取能力和Transformer的自注意力機制,可以更有效地捕捉視頻中的細微變化,提高檢測的準確性。
然而,這些方法在實際應用中仍面臨諸多挑戰,如檢測準確率、實時性、對新型偽造技術的適應性等問題。雖然已有諸多研究,但是Deepfake檢測仍然面臨著偽造技術快速迭代的挑戰。
3 技術方案
3.1本文方案主要解決的問題
(1)人臉驗證系統缺乏對深偽視頻圖像的檢測能力。人臉驗證系統所使用的活體檢測極易被深度
偽造技術攻擊,換臉視頻圖像會順利通過人臉驗證,存在極大的安全隱患。
(2)人工審核難以實現深偽視頻圖像的驗證。深度偽造技術發展迅速,新方法不斷涌現,合成質量越來越好,逼真度高,人眼已經難以分辨,給鑒偽工作帶來巨大挑戰。同時,對于人臉認證請求量大,難以完全依靠人工在后臺進行數據的審核校驗,工作量巨大。
(3)人臉驗證場景下對深偽檢測的要求高。一方面對深偽檢測的實時性要求高,不能影響正常的人臉驗證流程,要求檢測算法具有較好的檢測性能;另一方面,對深偽檢測的精度要求高,不能產生大量的誤報和漏報,影響用戶正常的使用,要求檢測算法具有較好的檢測精度。
3.2本文方案的關鍵技術
(1)多樣化深度偽造圖像視頻精確檢測技術。提出多樣化cross-cnn-vit-Transformer架構,這種架構利用CNN強大的空間特征提取能力和Transformer的自注意力機制,通過跨尺度的交叉注意力模塊,實現不同尺度特征的有效融合。這樣的設計不僅增強了模型對圖像紋理細節的感知能力,還提升了模型對偽造圖像的識別能力。
(2)深度偽造圖像視頻高速率檢測技術。通過模型壓縮技術以及知識蒸餾技術[3],以高精度模型作為教師網絡指導輕量型學生網絡訓練,通過模型剪枝量化等手段減小模型大小,優化模型結構,降低計算復雜度,確保在資源受限環境下仍能保持高性能,從而實現大規模視頻圖像的快速處理,滿足實時檢測的需求。

(3)認證場景下的模型微調與融合技術。為了進一步提升認證場景下的檢測準確率,通過構建人臉驗證場景下的訓練數據集,利用模型微調技術對基礎模型進行迭代訓練。提出利用集成學習和多任務學習方法融合多個模型的輸出,集成多個模型的優點,從而實現檢測準確率的提升。
(4)多任務的粗細結合水印去除技術。因部分人臉識別庫帶水印,為了提升識別準確率,在方案中創新提出了一種多任務的粗細結合水印去除算法,分為粗度和細化兩個階段。采用U-Net結構,水印定位和去除作為兩個任務,共享編碼器但各自獨立解碼。掩膜解碼器預測水印掩膜,通過掩膜引導的背景增強模塊重建無水印圖像。設計的自校準掩膜細化模塊將水印特征傳播,細化階段以水印掩膜和無水印圖像為輸入,生成最終恢復的背景圖像,使用跳級連接和跨層次特征融合提升效果。

4.2提升人工審核工作效率,節約人力成本
線上視頻認證審核工單全年約50.87萬筆,需投入5個稽核人員執行審核,若切換至系統審核可節約5個稽核人工成本的投入。
4.3有效打擊犯罪,讓社會“安心”
積極踐行社會責任,共同應對AI時代下電信網絡詐騙的行為,通過深度偽造監測技術在視頻聊天、視頻會議等應用中的運用,可以建設更加安全的數字環境。在與廈門、大連等多個地方聯合開展的反詐專項行動中,利用深偽檢測算法發現多起案件中利用深偽技術進行換臉實施詐騙,累計抓獲10余名詐騙人員,搗毀多個詐騙窩點。
4.4方案的可推廣性
通過深度偽造監測技術在視頻聊天、視頻會議、5G新通話等應用場景中的快速部署,能夠顯著提升實名認證平臺的工作質效。可以廣泛應用于各省實名認證系統,增強系統的可靠性和公信力。此外,在視頻會議中集成深度偽造檢測功能,可以在會議期間實時監控并標記任何可疑的行為,確保參與者身份的真實性和會議內容的完整性。該技術的應用范圍還可以擴展到公安、廣電、金融等多個領域。特別是公安部門可以利用它加強對網絡犯罪的預防與打擊。
5 結束語
本研究提出的基于生成式人工智能的視頻防偽認證方案,有效地提升了對深度偽造技術的檢測能力,特別是在電信網絡詐騙防范領域。通過技術創新,該方案不僅提高了檢測的準確率和實時性,還具有較強的適應性和可推廣性。未來,我們將繼續優化該方案,擴展其應用領域,為構建更加安全的數字環境貢獻力量。
4 實踐與成效
4.1提高視頻人臉驗證準確度,降低涉詐風險 參考文獻
實現與福建移動人臉視頻平臺對接,對每日近2000張線上入網、線上二次實名照片和視頻進行檢測,視頻防偽檢測精確度提高至 95% 以上。上線后未發生一起偽造視頻導致入網以及二次認證復機實施詐騙的行為。
[1]王麗娜,聶建思,汪潤,等.面向深度偽造的溯源取證方法[J].清華大學學報(自然科學版),2022,62(5):959-964.
[2]劉西蒙,謝樂輝,王耀鵬,等.深度學習中的對抗攻擊與防御[J].網絡與信息安全學報,2020,6(5):36-53.
[3]邵仁榮,劉宇昂,張偉,等.深度學習中知識蒸餾研究綜述[J].計算機學報,2022(8):1638-1673.