王靖

摘要:現(xiàn)在計算機已經(jīng)在我們的生活中無處不在,所以計算機的一些技術(shù)也在不斷的更新,生成式對抗網(wǎng)絡就是在這樣環(huán)境下的產(chǎn)物。生成式對抗網(wǎng)絡的特點就是有獨特的零和博弈和對抗訓練的思想形成的一個高質(zhì)量的樣本,比傳統(tǒng)的機器學習算法有更加強大的表達能力。現(xiàn)在是當前研究的熱點方向。
關(guān)鍵詞:生成對抗網(wǎng)絡;計算機視覺領(lǐng)域;應用
在2014年的時候Goodfellow等人提出了一種生成式的深度學習的模型叫做生成式對抗的網(wǎng)絡。這個模型一提出就深得計算機視覺研究領(lǐng)域的喜愛。現(xiàn)在深度學習和移動設備都在快速的發(fā)現(xiàn),但是關(guān)于圖像生成和圖像處理等方面已經(jīng)被很多人進行了研究。生成對抗網(wǎng)絡可以為了彌補一些數(shù)據(jù)上的不足生成一些目標的數(shù)據(jù)集。還能夠在生成對抗網(wǎng)絡上進行圖像翻譯和文本和圖像之間的相互生成。
計算機視覺就是計算機在使用過程中的一些相關(guān)設備對生物視覺出現(xiàn)的一種模擬,最終出現(xiàn)讓計算機像人們一樣可以通過視覺看世界,計算機視覺能夠自己適應環(huán)境。要想判斷機器能不能理解現(xiàn)實的世界時,就可以看它能不能創(chuàng)造出一個真實的世界,如果人們不能分辨出是真實還是虛假的時候,就通過了圖靈的測試。在計算機出現(xiàn)之后,就在世界上出現(xiàn)了許多的生成算法,在傳統(tǒng)的算法中是利用手工提取的辦法和淺層模型組合進行結(jié)合從而實現(xiàn)目標的生成。
一、生成式對抗網(wǎng)絡內(nèi)容
(一)生成式對抗網(wǎng)絡的結(jié)構(gòu)
生成式對抗網(wǎng)絡有兩個模型存在:一個是生成模型,還有一個是判別模型。生成器和判別器都是函數(shù),使用深層神經(jīng)網(wǎng)絡來實現(xiàn)。生成式對抗網(wǎng)絡結(jié)構(gòu)如圖
所示:
在生成對抗網(wǎng)絡中有極大和極小的雙玩家游戲的時候叫二人零和博弈。這里面包含兩個神經(jīng)網(wǎng)絡的零和游戲框架中進行相互的競爭。在系統(tǒng)中游戲的名字用函數(shù)來表示,這些函數(shù)都是可微性的。兩個玩家都是有自己定義的函數(shù)。兩個玩家的損失函數(shù)都需要依賴對方的函數(shù),但是不能進行更新,在訓練之后也會達到一個納什均衡。
(二)生成網(wǎng)絡方面
生成器可以用微函數(shù)的方式來表示,當隨機輸入一個變量的時候,一般是利用高斯變量來生成一個假的樣本分布。所以對于微函數(shù)中就要求需要有少量的限制條件,對于輸出的變量可以是第一層,也可以是最后一層。但是要注意的是,這個微函數(shù)必須是可微的,因為這樣經(jīng)過判別器的時候就會通過梯度來進行參數(shù)的更新,要不然就會出現(xiàn)傳遞不了的現(xiàn)象出現(xiàn)。
(三)判別網(wǎng)絡方面
在生成對抗網(wǎng)絡中,判別器最主要的目標就是要判斷輸出的是不是真實的樣本,并且在根據(jù)這種真實的樣本進行及時反饋。在和生成網(wǎng)絡構(gòu)成一個零和的游戲。這個游戲主要是由兩種場景組成的,兩個玩家的模型要通過足夠的訓練,這樣游戲才會達到一個納什的均衡狀態(tài)。
(四)生成對抗網(wǎng)絡的優(yōu)缺點
自從生成對抗網(wǎng)絡出現(xiàn)以后,在許多的領(lǐng)域里面都會提到生成對抗網(wǎng)絡。在最開始提出這個的時候,假設的驗證出現(xiàn)的很少,在數(shù)據(jù)方面幾乎沒有任何的假設,是隨便存在的,最終的目標都是要讓生成對抗網(wǎng)絡有一個無限制的建模能力。其實生成對抗網(wǎng)絡的模型在設計的時候是非常簡單的,不需要先設計出一些復雜函數(shù)模型,利用反向傳播算法的訓練網(wǎng)絡就能夠讓生成器和判別器能夠正常的進行工作。生成對抗網(wǎng)絡還能創(chuàng)建許多不需要監(jiān)督的學習模型,這些模型都有非常厲害的算法框架,是用機器和機器進行對話,在通過自身的對抗和博弈,在經(jīng)過無數(shù)的數(shù)據(jù)訓練的方法,真正的學到一些和現(xiàn)實世界有關(guān)的內(nèi)在規(guī)律。事情都是有兩面性的,有利就有弊,在無限建模能力的目標的存在背后還存在很多的問題,因為生成的時候太過于自由的存在,就會在訓練的時候很難保證穩(wěn)定性和收斂性,這個時候就會出現(xiàn)模式崩塌的現(xiàn)象,更嚴重的能夠?qū)е掠柧殯]有辦法繼續(xù)進行;傳統(tǒng)的生成對抗網(wǎng)絡要是梯度消失了,就會在訓練的時候非常的困難,還能夠?qū)е律善骱团袆e器出現(xiàn)一些損失;因為生成對抗網(wǎng)絡本身的熱點,很難生成離散的分布。現(xiàn)在提出新的生成對抗網(wǎng)絡的目的都是為了更好的增加模型的穩(wěn)定性,從而更好的保證生成結(jié)果的質(zhì)量。
二、生成對抗網(wǎng)絡在計算機視覺領(lǐng)域的應用
(一)能夠在計算機里面生成一些高質(zhì)量的圖像
生成對抗網(wǎng)絡最開始只是應用在圖像生成和建模上,因為不管是監(jiān)督學習還是不監(jiān)督學習的方式,生成對抗網(wǎng)絡都能夠記錄真實的數(shù)據(jù)。研究者一直在經(jīng)過不斷的研究,為了讓生成的圖像更接近真實的圖像。
(二)能夠在計算機里面進行風格遷移和圖像翻譯
生成對抗網(wǎng)絡在計算機上還有一個有意思的應用就是風格遷移,意思就是把圖像從一種風格的情況變成另外一種的風格。
(三)能夠在計算機上進行文本和圖像之間的互相生成
生成對抗網(wǎng)絡能夠在圖像數(shù)據(jù)庫里面,經(jīng)過訓練生成和真實進行一些相似的分布,例如:生成對抗網(wǎng)絡可以在人臉數(shù)據(jù)集上通過一些訓練,就可以生成一些人臉分辨不出來的圖像,這些都是通過直接學習的方法進行分布的。
(四)能夠在計算機上進行圖像還原和修復
現(xiàn)在人臉識別的技術(shù)在實際生活中應用的越來越多,但是這種密集人群在檢測的時候就會非常的困難,這時候就需要利用一些科技的手段對局部到整體的信息進行識別。這時候就可以利用生成對抗網(wǎng)絡的技術(shù)提出雙路徑的生成對抗網(wǎng)絡,這種技術(shù)就能很好的改變現(xiàn)在的問題。
三、結(jié)論
作為一種生成模型的生成對抗網(wǎng)絡,為一些問題提供了很好的解決方法。還分析了生成對抗網(wǎng)絡在計算機的視覺方面的應用。其實生成對抗網(wǎng)絡就屬于是一個包容性的框架,這個框架能夠和許多的學習模型進行結(jié)合,解決了許多傳統(tǒng)機器解決不了的問題,為計算機事業(yè)做出了許多的貢獻。
參考文獻:
[1]王坤峰,茍超,段艷杰,等.生成式對抗網(wǎng)絡GAN 的研究進展與展望[J].自動化學報,2017,43 (3):321-332.
[2]鄭華濱.令人拍案叫絕的Wasserstein GAN[EB/OL].2017-04-02 [ 2018-01-20 ].https://zhuanlan.zhihu.com/p/25071913.