夏蕊 馬宏斌
【摘? 要】為了更好地解決通信網絡中存在的惡意攻擊,保護用戶數據安全,通過生成式對抗網絡的生成模型和判別模型相互博弈不斷優化,構造成最優判別器,可以對數據攻擊進行檢測。主要介紹生成式對抗網絡(GANs)和Wasserstein生成式對抗網絡的區別、模型及算法,通過研究GAN與WGAN梯度消失問題,實驗證實WGAN可以有效地解決網絡收斂性差、模型自由不可控、訓練不穩定等問題,具有更好的性能。
【關鍵詞】生成式對抗網絡;深度學習;網絡安全;梯度法
doi:10.3969/j.issn.1006-1010.2019.08.004? ? ? 中圖分類號:TN929.5
文獻標志碼:A? ? ? 文章編號:1006-1010(2019)08-0021-04
引用格式:夏蕊,馬宏斌. 生成式對抗網絡的通信網絡安全技術[J]. 移動通信, 2019,43(8): 21-24.
In order to better solve the current malicious attacks in the communication network and protect user data security, the optimal discriminator is constructed via mutual gaming and optimization between generative and discriminant models of generative adversarial networks (GAN) and thus it can be used to detect data attacks. This article mainly introduces the differences, models and algorithms of both GANs and Wasserstein GANs (WGAN) via investigating the corresponding issue of gradient disappearance. The experiments prove that WGAN can effectively solve problems such as poor network convergence, uncontrollable model, unstable training and yield a better performance.
generative adversarial networks; deep learning; network security; gradient method
1? ?引言
隨著移動通信技術的不斷發展與進步,通信設備逐漸成為人們社會生活中不可或缺的一部分,越來越多的信息存放在移動互聯網之中,這樣雖然便于數據的提取和使用,但安全隱患也不可小覷。在人們享受移動通信便捷的同時,網絡攻擊無處不在,惡意的破壞使人們不得不隨時更新防火墻技術。在網絡空間中,網絡攻擊可以被描述為任何試圖危害網絡安全的惡意活動。在這個定義中可以包含非常廣泛的網絡行為,例如試圖破壞網絡的穩定性,獲得對未授權文件或權限的訪問等等。目前來講,計算機網絡安全所面臨的威脅主要可分為兩大類:一是對網絡中信息的威脅,二是對網絡中設備的威脅。保證物理安全、網絡系統安全、數據安全、信息內容安全和信息基礎設備的安全,才能保護信息的保密性、完整性和可用性。最近,國內外相關學者也在不斷突破對網絡安全問題的研究。其中,生成式對抗網絡(Generative Adversarial Networks, GANs)是研究通信網絡加密算法的一個新技術。
生成式對抗網絡(GANs)源于“二人零和博弈”思想[1],由Goodfellow[2]等人最先提出,GANs中存在兩個模型,即生成模型(Generative Model)與判別模型(Discriminative Model)。兩個模型作為參與博弈的雙方,在相互競爭下,一方的收益就意味著另一方的損失,博弈各方的收益和損失相加總和永遠為“零”,在生成模型和判別模型博弈的過程中,兩者共同強化,能夠達到自覺優化的目的。在網絡安全方面,基于GANs的攻擊數據生成方法[3]有很廣泛的應用。利用處理后的數據對模型進行訓練,得到一個可以區分攻擊和正常連接的不斷優化的模型,以此識別惡意攻擊,保護網絡的安全。
2? ?相關理論及算法研究
2.1? 生成式對抗網絡
生成式對抗網絡(GANs)把博弈論和深度學習相互結合在一起,生成模型G和判別模型D相互博弈,在對抗的過程中不斷強化,最后得到生成以假亂真數據的生成模型和判別真假數據的判別模型。假定有真實數據x,x中存在m個樣本,每個樣本中有n個維度,更直觀來看,如圖1所示的生成式對抗網絡的一般框架展示了GANs的總體設計。
2.2? Wasserstein生成式對抗網絡
通過訓練GANs模型已初具成效,但仍存在D和G的目標函數無法預測網絡訓練進程以及訓練崩潰導致生成樣本缺乏多樣性[6]等一系列相關問題。目前,在生成式對抗網絡的基礎上又提出了將監督學習的卷積神經網絡(Convolutional Neural Network,CNN)和非監督學習的生成式對抗網絡(GAN)相結合而得到的深度卷積生成對抗網絡(Deep Convolutional Generative Adversarial Networks,DCGAN),通過實驗發現,DCGAN確實在圖像生成效果上比GAN有大幅度的提升,但是,依然沒有從本質上解決GAN所面臨的問題。
Wasserstein生成式對抗網絡(Wasserstein Generative Adversarial Networks,WGAN)是傳統GAN的升級版,它不僅提高了系統的穩定性,而且進一步解決了訓練模型崩潰等問題,保證生成樣本多樣性的同時,也使生成圖像更加清晰逼真。
3? ?生成模擬攻擊數據
3.1? 基于GAN的方法改進
攻擊數據是由惡意行為產生的所有數據。從攻擊行為發生到結束,由傳輸控制協議(TCP)包連接一系列從源IP地址到目標IP地址的數據流。通過“二人零和博弈”思想構造出的GAN模型,使其不斷優化判別模型和生成模型,最后生成的最優判別器D可以有效識別網絡中的惡意攻擊,以此保證通信安全。
在GAN中,判別器D訓練的越好,生成器G梯度消失越嚴重。已知隨機更新判別器D的上升梯度和生成器G的下降梯度分別用函數表示,如公式(11)和公式(12)所示:
當GAN中判別器訓練得較好時,生成器梯度容易消失;當判別器訓練得不好時,生成器梯度不準。所以,只有當判別器訓練得恰到好處,才能使GAN的作用發揮到最大。而通過改進后的WGAN在使用梯度下降法優化參數θ時,可以得到有意義的梯度。
3.2? 算法實現
與GAN相比較而言,Wasserstein生成式對抗網絡有較好的性能。Wasserstein距離相比KL散度、JS散度的優越性在于:即便兩個分布沒有重疊,Wasserstein距離仍然能夠反映它們的遠近。通過算法實現可以進一步證實WGAN的優越性。
WGAN在算法上有下面幾點改進:
(1)判別器D最后一層去掉了Sigmoid;
(2)生成器G和判別器D的損失函數無需取log;
(3)每次更新判別器的參數之后,把它們的絕對值截斷到不超過一個固定常數c。
WGAN網絡訓練步驟如下:
(1)構造基于Wasserstein生成式對抗網絡模型,其中包括判別器D以及生成器G。由于G的卷積神經網絡的層數與D的相同,則用G的卷積核作D的卷積核的轉置。
(2)預備文本數據庫以方便訓練,通過編碼器對數據進行編碼。
(3)構造均勻分布的隨機噪聲,輸入到生成器G的模型中。
(4)將生成器G生成的新數據與原始數據相編碼后輸入到判別器D中,根據判別結果反向修改各個參數,進行多次迭代,使得判別器最終能達到較好的判別水平。
通過對比GAN、DCGAN與WGAN之間的性能發現:GAN存在不可控、不穩定等一系列問題,DCGAN需要通過大量的實驗才能得到相對較優的結果,而WGAN從根本上解決了上述問題。從這幾個方面來講,基于Wasserstein生成式對抗網絡性能明顯優于深度卷積生成式對抗網絡。在WGAN模型建立成功的基礎上,可自覺監督網絡中的攻擊數據,由于不斷優化自身模型,WGAN對檢測惡意攻擊有較好的成果。
4? ?結束語
隨著計算機技術的不斷發展,人們的日常生活將會越來越多地依賴于網絡,對于通信安全的研究始終在路上。本文主要研究了基于Wasserstein生成式對抗網絡的算法模型給網絡安全提供的一種新的方法。相比較傳統的GAN在訓練過程中容易出現網絡收斂性差、模型自由不可控、訓練不穩定等問題,利用新的生成式對抗性模型WGAN進行訓練更容易取得成功。對判別模型D和生成模型G進行相關分析后可知WGAN在各方面都具有較好的性能。未來,生成模擬攻擊數據有很大的利用價值,而Wasserstein生成式對抗網絡的研究仍處在探索階段[7],為了營造安全可靠的移動通信網絡環境仍需要繼續深入鉆研相關技術。
參考文獻:
[1] 王坤峰,茍超,段艷杰. 生成式對抗網絡GAN的研究進展與展望[J]. 自動化學報, 2017(3): 321-332.
[2] Ian J Goodfellow, Jean Pouget Abadie, Mehdi Mirza, et al. Generative Adversarial Networks[EB/OL]. (2014-06-10)[2018-08-26]. https://arxiv.org/abs/1406.2661.
[3] 龔玉. 當前計算機網絡通信安全中數據加密技術的應用分析[J]. 科技資訊, 2017,15(2): 11-12.
[4] LI Y, LIU S, YANG J, et al. Generative face completion[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. IEEE, 2017(3): 6.
[5] 陳旭,張軍,陳文偉. 卷積網絡深度學習算法與實例[J]. 廣東工業大學學報, 2017(6): 20-26.
[6] 趙立怡. 基于生成式對抗網絡的圖像修復算法研究[D]. 西安: 西安理工大學, 2018.
[7] 郭立君,趙杰煜,史忠植. 生成模型與判別方法相融合的圖像分類方法[J]. 電子學報, 2010,38(5): 1141-1145.