段風磊



摘?要:生成對抗網絡(GAN)作為一種深層次的計算機學習模型,已經成為近年來神經網絡領域中非常具有發展前景的一項技術模型,本文通過對相關文獻的整理和查閱,首先簡述了原始的生成對抗網絡的組成以及其相關特征,隨后基于原始網絡的一些嚴重缺陷介紹了相關的改進網絡的優化方法,最終對整篇論文進行總結,并對未來的發展進行了展望。
關鍵詞:計算機;生成式對抗網絡;圖像處理;研究進展
Abstract:Generate countermeasures network(GAN,Generative Adversarial Networks)is a kind of deep-seated computer learning model,which has become a very promising technical model in the field of neural network in recent years.Through the collation and integration of relevant literature,this paper first described the composition and relevant characteristics of the original generative countermeasure network,and then introduced the relevant optimization methods of the improved network based on some serious defects of the original network.Finally,we summarize the whole paper and look forward to the future.
Key words:Computer;generative countermeasure network;image processing;research progress
1 緒論
Goodfellow基于博弈論中零和談判的觀點于2014年提出了“生成式對抗網絡”這一概念,這一方法是用深度學習網以及相關模型絡來驗證圖像真偽從而生成數據樣本的。生成對抗網絡目前以及成為計算機領域以及圖像識別領域非常重要的方法之一,具有非常廣闊的發展前景,GAN網絡是不斷的通過生成模型以及判別模型兩者之間的競爭得到所需的數據樣本的。GAN學習模型可適用多種不同情況下的數據處理分析[1]。
2 原始生成式對抗網絡模型
2.1 GAN網絡結構
模型分為生成模型(Generative Model)和判別模型(Discriminative Model)。下圖1就是GAN模型的結構組成。
2.2 生成網絡
生成器本質上是一個可微分函數,生成器接收隨機變量z的輸入,經生成假樣本。在GAN中,生成器對輸入變量z基本沒有限制,z通常是一個100維的隨機編碼向量,z可以是隨機噪聲或者符合某種分布的變量。生成器理論上可以逐漸學習任何概率分布,經訓練后的生成網絡可以生成不和真實圖像完全一樣的逼真圖像,實際上是生成網絡學習了訓練數據的一個分布,從而形成了相關的近似分布,這在數據增強應用領域方面非常的重要[2]。
2.3 判別網絡
判別器實際上本質與生成器是一樣的都是一種可以微分的函數,在生成對抗網絡中,其實判別器的作用同它的名字一樣就是判別輸入的樣本是否為真實樣本,并在此基礎上通過循環來指導生成器進行下一步的訓練與合成。
3 改進的生成式對抗網絡模型
生成對抗網絡含有多種優點如具有更強大的預測能力;與強化學習相比,對抗式學習更接近人類的學習機理。但他也存在致命的缺點,即網絡難以收斂。本文通過對文獻的梳理,整理出幾個被廣泛認可的改進模型如下:
3.1 條件生成對抗網絡
基本GAN系統的圖像生成過程比較沒有約束,所以越大的圖像,用基本的GAN系統越難以控制。為了對這個情況進行改進以及研究,Mirza[3]等提出條件生成對抗模型(Conditional GAN)。該模型除了像原始網絡一樣輸入之外,還會再輸入一個條件變量c,CGAN結構如圖2。比如一段描述句子,鑲嵌到與之對應的圖片中,經過訓練,模型可以“看圖說話”;c同樣可以是對應的目標圖片,這樣GAN可以有目標地去學習。
3.2 深度卷積生成對抗網絡
該卷積模型相較于全連接模型更加適用于處理分析比較復雜的圖像數據。所以Rad ford等[4]研究者提出了深度卷積GAN(deep convolutional GAN,DC-GAN)它是把原始GAN中的兩個生成與判別模型改進換成了兩個深度CNN。使用步幅卷積和微步幅卷積有效地保留了特征信息[5],從而能對較復雜的問題以及圖像處理的更加完美。
3.3 Wasserstein生成對抗網絡
原始GAN訓練出現梯度消失和模式崩潰的主要原因是使用JS距離來衡量兩個分布。
3.4 基于能量的生成對抗網絡
文獻[6]從能量模型的角度改進了原始網絡,研究出來了基于能量的生成對抗網絡(Energy Based GAN,EB-GAN)模型。因為它的判別器D主要由自編碼器(auto-encoder)構成,這就使得它判別輸入圖像的真假是通過重新構建圖像的像素質量高低來決定的。EB-GAN的實驗表明,在實驗過程中其表現確實比原始GAN網絡更好,圖像更穩定同時分辨率更高,對于整體起到了優化的作用。
4 結語
GAN目前是一個較為全新的領域,各個專家學者也在這個領域不斷的創新研究提出各種各樣的想法以及改進措施,本文主要總結了原始生成對抗網絡的基本構成以及特征,以及近些年來一些經典的改進網絡及其實現過程,在整理的過程中受益匪淺,學到了許多,也更加深入的了解了這一塊的內容,日后也希望能更多的通過對生成網絡的了解,來發現更具有價值的改進模型。科技不斷的發展進步,越來越智能的時代即將來臨,讓我們帶著創新上路,不斷學習進步!
參考文獻:
[1]朱秀昌,唐貴進.生成對抗網絡圖像處理綜述[J].南京郵電大學學報(自然科學版),2019,39(3):1673-1682.
[2]梁俊杰,韋艦晶,蔣正鋒,等.生成對抗網絡GAN綜述[J].計算機科學與探索,2019,14(1):1-17.
[3]Mirza M,Osindero S.Conditional Generative Adversarial Nets[J].Computer Science,2014:2672-2680.
[4]朱虹,李千目,李德強.基于單個卷積神經網絡的面部多特征點定位[J].計算機科學,2018,45(4):273-279.
[5]曹仰杰,賈麗麗,陳永霞,等.生成式對抗網絡及其計算機視覺應用研究綜述[J].中國圖像圖形學報,2018,14(1):1-17.
[6]Zhao J B,Mathieu M,LeCun Y.Energy-based generative adversarial network[EB/OL].2017-03-06.