999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

卡通風(fēng)格人臉圖像生成研究

2021-11-15 15:31:48董虎勝
現(xiàn)代計(jì)算機(jī) 2021年27期
關(guān)鍵詞:模型

董虎勝

(蘇州市職業(yè)大學(xué)計(jì)算機(jī)工程學(xué)院,蘇州 215104)

0 引言

卡通畫是一種廣泛受到人們喜愛(ài)的藝術(shù)表現(xiàn)形式,尤其是個(gè)性化的卡通人臉圖像常常被用作QQ、微信、釘釘?shù)壬缃卉浖念^像。這些卡通頭像并不完全追求造型的逼真,而是適當(dāng)?shù)亟柚笳鳌⒖鋸埢蛏袼频乃囆g(shù)化創(chuàng)作手法,達(dá)到創(chuàng)作意念與審美藝術(shù)的雙重表達(dá),在網(wǎng)絡(luò)上非常受到歡迎。由于創(chuàng)作和真實(shí)人臉圖像神似的卡通頭像需要比較高的美術(shù)基礎(chǔ),這就使得利用人臉照片生成卡通化的頭像成為現(xiàn)實(shí)的需求。

近幾年來(lái)的圖像風(fēng)格遷移[1]技術(shù)為人們獲得個(gè)性化的卡通頭像提供了可行的解決方案。圖像風(fēng)格遷移指的是借助機(jī)器學(xué)習(xí)方法從具有特定藝術(shù)風(fēng)格的圖像中學(xué)習(xí)到內(nèi)在的風(fēng)格模式,再將這種風(fēng)格施加到目標(biāo)圖像上,使其在保持原有內(nèi)容能夠被辨識(shí)的情況下呈現(xiàn)出特定的藝術(shù)風(fēng)格。由于這種技術(shù)將數(shù)字化的圖像處理與藝術(shù)創(chuàng)作聯(lián)系了起來(lái),賦予了計(jì)算機(jī)“自主”地進(jìn)行藝術(shù)創(chuàng)作的能力,為數(shù)字圖像處理提供了新的思路。因此該技術(shù)一經(jīng)提出后,立即引起了人們的廣泛關(guān)注,成為當(dāng)前計(jì)算機(jī)視覺(jué)與機(jī)器學(xué)習(xí)領(lǐng)域中的研究熱點(diǎn)[2-4]。

在當(dāng)前圖像風(fēng)格遷移的方法中,比如Dual?GAN[4]、CycleGAN[5]和UNIT[6]等,基本上都借助了生成對(duì)抗網(wǎng)絡(luò)[7](generative adversarial networks,GAN)模型來(lái)從圖像中學(xué)習(xí)藝術(shù)風(fēng)格模式,再進(jìn)一步將這些藝術(shù)風(fēng)格從源域圖像遷移到目標(biāo)域圖像上,實(shí)現(xiàn)從源域到目標(biāo)域的映射。盡管這些方法能夠取得不錯(cuò)的風(fēng)格遷移效果,但是也存在圖像的背景容易受到影響的問(wèn)題,給生成的結(jié)果帶來(lái)一些內(nèi)容上的瑕疵。本文在對(duì)GAN模型工作原理做了深入分析的基礎(chǔ)上,設(shè)計(jì)了一種由注意力引導(dǎo)的生成對(duì)抗模型,在該模型中借助了注意力來(lái)引導(dǎo)GAN中的生成器更多地關(guān)注于圖像前景內(nèi)容,從而盡量減少風(fēng)格遷移對(duì)背景內(nèi)容帶來(lái)的破壞。將該模型應(yīng)用于人臉圖像到卡通風(fēng)格頭像生成的實(shí)驗(yàn)結(jié)果表明,該模型能夠取得優(yōu)秀的人臉圖像卡通化效果,生成的卡通頭像不僅具有很好的卡通化藝術(shù)表現(xiàn)形式,同時(shí)也具有非常好的視覺(jué)質(zhì)量。

1 GAN模型結(jié)構(gòu)

GAN模型是一種具有很強(qiáng)學(xué)習(xí)能力的生成模型,在使用訓(xùn)練數(shù)據(jù)對(duì)GAN模型進(jìn)行訓(xùn)練后,GAN能夠生成和真實(shí)數(shù)據(jù)擁有相同屬性的數(shù)據(jù),完全能夠達(dá)到“以假亂真”的效果。而且與一般的需要顯式表達(dá)概率分布的生成模型不同,GAN并不需要顯式地表達(dá)樣本的概率分布,而是通過(guò)其內(nèi)部的生成器與判別器之間的零和博弈來(lái)隱式地學(xué)習(xí)數(shù)據(jù)內(nèi)在分布。在經(jīng)過(guò)兩者的對(duì)抗學(xué)習(xí)后,生成器與判別器最終將達(dá)到納什平衡狀態(tài)[7],此時(shí)生成器生成的數(shù)據(jù)就能夠表現(xiàn)出與真實(shí)數(shù)據(jù)相同的外觀,這樣就可以利用其生成圖像、文本等不同形態(tài)的數(shù)據(jù)。

GAN模型的工作原理如圖1所示,其中包含有生成器G和判別器D兩個(gè)基本模塊。生成器G接收的是服從于分布p(z)的隨機(jī)噪聲向量z,在經(jīng)過(guò)G的處理后將輸出與服從pdata分布的真實(shí)訓(xùn)練數(shù)據(jù)x具有相同外觀的數(shù)據(jù)G(z)。G(z)與x都將被送入判別器D中,并由D對(duì)它們的標(biāo)簽進(jìn)行二分類預(yù)測(cè)。也就是如果輸入的樣本為G(z),則判別器D應(yīng)判斷其為假的樣本,輸出的類別標(biāo)簽將為0;倘若輸入的是真實(shí)樣本x,則應(yīng)判斷其為真實(shí)數(shù)據(jù),給出類別為1的標(biāo)簽。在訓(xùn)練過(guò)程中,判別器D需要最大化對(duì)x與G(z)的標(biāo)簽預(yù)測(cè)準(zhǔn)確率,而生成器G則努力地讓生成的G(z)混雜于真實(shí)訓(xùn)練數(shù)據(jù)x中,讓D難以將其分辨出來(lái)。這就形成了生成器G與判別器D不斷對(duì)抗博弈的局面。

在整個(gè)訓(xùn)練過(guò)程中,G與D的生成與判別能力都會(huì)隨著迭代對(duì)抗不斷獲得提升。當(dāng)兩者的對(duì)抗博弈達(dá)到平衡時(shí),這種狀態(tài)被稱為“納什平衡”。此時(shí),生成器G的輸出結(jié)果將會(huì)與來(lái)自真實(shí)訓(xùn)練數(shù)據(jù)的x具有相同的外觀屬性,判別器D將無(wú)法區(qū)分出當(dāng)前的樣本是實(shí)際存在的訓(xùn)練集數(shù)據(jù),還是來(lái)自于生成的G(z),因此判別器D對(duì)x與G(z)的分類概率都將趨于1/2。這時(shí)就可以認(rèn)為生成器G已經(jīng)學(xué)習(xí)到了訓(xùn)練數(shù)據(jù)的內(nèi)在分布,在不需要顯式地表達(dá)數(shù)據(jù)分布的情況下就可以使用G來(lái)生成服從pdata的樣本。

GAN模型的學(xué)習(xí)目標(biāo)可以形式化地表達(dá)如下

在GAN模型中生成器G和判別器D可以是任何形式的具有生成與判別能力的學(xué)習(xí)模型。但是由于深度模型具有比傳統(tǒng)淺層機(jī)器學(xué)習(xí)模型更強(qiáng)大的學(xué)習(xí)能力,因此一般在GAN模型中都使用深度學(xué)習(xí)模型作為生成器與判別器。特別是在處理圖像數(shù)據(jù)時(shí)由于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neu?ral networks,CNN)具有獨(dú)特的優(yōu)勢(shì),因此一般使用CNN作為判別器,并使用具有轉(zhuǎn)置卷積和上采樣結(jié)構(gòu)的CNN作為生成器。

2 使用注意力引導(dǎo)的風(fēng)格遷移模型

圖像風(fēng)格遷移的主要目的是將源域S中的風(fēng)格模式遷移并應(yīng)用到目標(biāo)域T中,設(shè)si∈S與tj∈T分別指代源域與目標(biāo)域中的圖像,當(dāng)前的風(fēng)格遷移模型基本上都采用了雙生成器與雙判別器的組合結(jié)構(gòu)。設(shè)G和F為兩個(gè)圖像生成器,Dt和Ds為與它們對(duì)應(yīng)的兩個(gè)判別器。其中G接收源域圖像s并生成具有目標(biāo)域T中風(fēng)格的圖像G(s),判別器Dt用于對(duì)圖像來(lái)自于G(s)還是T進(jìn)行判斷。生成器F與判別器Ds則完成相反的工作,即F負(fù)責(zé)由目標(biāo)域T向源域S的映射,Ds負(fù)責(zé)辨別F(t)與S中數(shù)據(jù)的真?zhèn)巍?/p>

為了降低風(fēng)格遷移中對(duì)圖像背景內(nèi)容帶來(lái)的影響,本文對(duì)生成器G和F的映射過(guò)程使用了注意力機(jī)制進(jìn)行性能提升。設(shè)As、At分別為圖像s、t的注意力映射圖,將它們添加到圖像生成流程后G和F的映射過(guò)程將變?yōu)镚:s→As→G(s)和F:t→At→F(t)。這樣的增強(qiáng)使得圖像生成過(guò)程中將首先使用注意力來(lái)定義各個(gè)像素的遷移強(qiáng)度,避免了對(duì)圖像所有像素不作區(qū)分地處理帶來(lái)的不足。

為了獲得圖像的注意力,本文采用了如圖2所示的非局部注意力[8](non-local attention)模型,該注意力模型能夠有效地捕捉圖像中較大區(qū)域范圍內(nèi)像素間的依賴關(guān)系,有效地引導(dǎo)模型獲得圖像的前景內(nèi)容。非局部注意力模型接收的是通過(guò)多層卷積-池化-非線性映射獲得的四維特征張量,這里B為一個(gè)批次(batch)中的樣本數(shù),C為通道數(shù),H與W分別為特征圖(feature map)的高與寬。在使用三個(gè)1×1的卷積核分別作卷積運(yùn)算f(X)、g(X)、h(X)后,特征的通道將被壓縮為C/2。在這三路分支中,首先對(duì)f(X)在H與W兩個(gè)維度作扁平化,獲得形狀為[B,C/2,H×W]的輸出。對(duì)g(X)也作類似的扁平化處理并作通道轉(zhuǎn)置,獲得到形狀為[B,H×W,C/2]的張量。利用矩陣乘法對(duì)它們運(yùn)算后將得到一個(gè)形狀為[B,H×W,H×W]的張量,進(jìn)一步作Softmax運(yùn)算就可以獲得歸一化的注意力映射圖(attention map)。

圖2 非局部注意力模型

對(duì)h(X)也作類似的扁平化與維度轉(zhuǎn)置后將得到形狀為[B,H×W,C/2]的張量,將其與注意力映射圖作矩陣乘法運(yùn)算將獲得形狀為[B,H×W,C/2]的結(jié)果張量。再作維度轉(zhuǎn)置與拉伸操作后將獲得形狀為[B,C/2,H×W]的輸出張量。最后對(duì)其使用1×1卷積將通道擴(kuò)展為原始C大小,即獲得最終的注意力輸出A∈RB×C×H×W。

在生成器G和F中引入注意力模塊后,最終生成的結(jié)果圖像將變?yōu)?

式中的β為取值(0,1)間的平衡參數(shù)。

在圖像風(fēng)格遷移中,我們希望對(duì)于源域中的圖像s在映射到目標(biāo)域T后仍能再次映射回源域S,且映射回的結(jié)果與原始圖像間盡可能相似。也就是s→G(s)→F(G(s))≈s,類似地,對(duì)于映射F有t→F(t)→G(F(t))≈t,這樣的約束也被稱為循環(huán)一致性約束。該約束可以通過(guò)對(duì)生成器G和F施加循環(huán)一致性損失(cycle consistency loss)來(lái)獲得:

式中pdata(s)與pdata(t)分別指代圖像數(shù)據(jù)s和t服從的概率分布。

在對(duì)整個(gè)風(fēng)格遷移模型進(jìn)行訓(xùn)練時(shí),需要考慮生成器G與判別器Dt之間的GAN模型損失LGAN(G,Dt)、生成器F與判別器Ds之間的GAN模型損失LGAN(F,Ds)、生成器G和F之間的循環(huán)一致性損失Lcyc(G,F)。因此最終的損失函數(shù)可以表達(dá)為:

式中λ為根據(jù)經(jīng)驗(yàn)設(shè)置的平衡參數(shù)。使用訓(xùn)練數(shù)據(jù)通過(guò)對(duì)L(G,F,Ds,Dt)進(jìn)行優(yōu)化后,獲得的生成器G和F即可實(shí)現(xiàn)對(duì)圖像風(fēng)格的遷移,生成目標(biāo)風(fēng)格圖像。

3 實(shí)驗(yàn)

實(shí)驗(yàn)中在selfie2anime數(shù)據(jù)集上進(jìn)行了卡通風(fēng)格人臉圖像生成測(cè)試,selfie2anime數(shù)據(jù)集由slfie與anime兩個(gè)數(shù)據(jù)集混合獲得。其中selfie數(shù)據(jù)集中共有46386張個(gè)人自拍頭像,anime數(shù)據(jù)集中總計(jì)包含有69296張卡通動(dòng)漫頭像。在實(shí)驗(yàn)中從selfie與anime數(shù)據(jù)集下均選擇了3400張圖像用作為訓(xùn)練數(shù)據(jù),另外各選擇了100張圖像用作為測(cè)試數(shù)據(jù),這些選中的圖像均被統(tǒng)一到256×256的像素大小。anime數(shù)據(jù)集中圖像被用作為目標(biāo)域圖像,需要從其中學(xué)習(xí)出風(fēng)格模式;selfie數(shù)據(jù)集中的真實(shí)人臉圖像用于生成卡通頭像的源數(shù)據(jù)。本文圖像風(fēng)格遷移并不需要對(duì)目標(biāo)域與源域中的圖像進(jìn)行配對(duì),只需要從目標(biāo)域圖像學(xué)習(xí)風(fēng)格模式應(yīng)用到源域圖像內(nèi)容即可。

實(shí)驗(yàn)在Ubuntu 18.04環(huán)境下采用了PyTorch深度學(xué)習(xí)框架進(jìn)行。本文的風(fēng)格遷移模型中生成器主體采用了與CycleGAN相同的編碼器-解碼器結(jié)構(gòu),但在編碼器中添加了非局部注意力模塊。模型中判別器使用了70×70的PatchGAN[9]的分類模型,與一般的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相比,PatchGAN分類器中的參數(shù)量要少很多,而且可以接收任意大小的圖像。實(shí)驗(yàn)使用了學(xué)習(xí)率為0.0001的Ad?am優(yōu)化器,優(yōu)化器的參數(shù)β1與β2均采用默認(rèn)值;在訓(xùn)練階段對(duì)模型作了200個(gè)epoch的迭代優(yōu)化,再將其用于動(dòng)漫插畫風(fēng)格圖像的生成測(cè)試。在硬件上使用了NVIDIA-1080GPU配合CUDA10進(jìn)行加速。

圖3 卡通風(fēng)格人臉圖像生成結(jié)果

圖3給出了本文模型的卡通風(fēng)格人臉圖像生成結(jié)果,其中最左側(cè)為原始自拍人臉照片,第2列為生成器的注意力映射圖的可視化圖像,第3、4、5列分別為使用CycleGAN、UNIT與本文模型生成的卡通風(fēng)格頭像。從圖中可以看出幾種模型都能夠?qū)崿F(xiàn)卡通風(fēng)格的遷移,生成的頭像都在保持與原始內(nèi)容整體相似的情況下添加了卡通風(fēng)格。但是CycleGAN生成的圖像中會(huì)混入一些其他內(nèi)容,給圖像內(nèi)容帶來(lái)了一些破壞;UNIT模型生成的頭像中不僅頭發(fā)部分與原圖輪廓的差異比較大,人臉部分的輪廓線條也比較生硬,整體質(zhì)量差強(qiáng)人意。與它們相比,本文模型生成的卡通頭像人臉前景與原始圖像輪廓相似且表現(xiàn)自然,背景部分在內(nèi)容保持不變的情況下表現(xiàn)出良好的卡通風(fēng)格,圖像的整體視覺(jué)質(zhì)量最為優(yōu)秀。

4 結(jié)語(yǔ)

本文對(duì)基于對(duì)抗生成網(wǎng)絡(luò)的卡通風(fēng)格人臉圖像生成進(jìn)行了研究。為了避免風(fēng)格遷移時(shí)對(duì)圖像內(nèi)容造成的破壞,在生成器網(wǎng)絡(luò)引入了注意力機(jī)制,使得模型能夠更多地關(guān)注于圖像前景內(nèi)容。在使用selfie2anime中的人臉與卡通圖像數(shù)據(jù)進(jìn)行訓(xùn)練后,本文方法能夠生成具有優(yōu)秀視覺(jué)質(zhì)量的卡通風(fēng)格頭像。與CycleGAN和UNIT等模型生成的圖像相比,在圖像風(fēng)格與圖像內(nèi)容上達(dá)到了比較好的平衡。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 免费观看男人免费桶女人视频| 日韩国产亚洲一区二区在线观看| 99热最新网址| 国产一在线观看| www.亚洲一区| a毛片在线播放| 亚洲国产精品一区二区高清无码久久| 国产91导航| 欧美亚洲国产视频| 国产成人亚洲精品色欲AV| 免费一级成人毛片| v天堂中文在线| 国产亚洲精久久久久久久91| 一个色综合久久| 国产va免费精品观看| 日韩无码一二三区| 亚洲国产高清精品线久久| a级毛片免费播放| 亚洲日韩高清在线亚洲专区| 精品乱码久久久久久久| 欧美亚洲激情| 欧美激情视频一区| 免费观看国产小粉嫩喷水| 国产三级精品三级在线观看| 高清亚洲欧美在线看| 国产无码网站在线观看| 国产在线观看一区二区三区| 免费看美女自慰的网站| 精品视频一区在线观看| 91美女在线| 亚洲天堂2014| 亚洲Av综合日韩精品久久久| 亚洲日韩AV无码精品| a色毛片免费视频| 亚洲精品视频在线观看视频| 国产成人凹凸视频在线| 欧美日韩精品一区二区视频| 欧美狠狠干| 日韩东京热无码人妻| 一区二区三区国产| 丁香五月婷婷激情基地| 极品国产在线| 色综合久久无码网| 午夜成人在线视频| 久久狠狠色噜噜狠狠狠狠97视色| 免费无码AV片在线观看中文| 欧美日韩国产精品综合| 国产在线无码一区二区三区| 米奇精品一区二区三区| 国产97视频在线| 成人免费视频一区二区三区| 亚洲国产成人麻豆精品| 国产亚洲男人的天堂在线观看| 一区二区在线视频免费观看| 国产毛片高清一级国语| 午夜国产小视频| 在线观看国产网址你懂的| 四虎综合网| 久操线在视频在线观看| 色老二精品视频在线观看| 国产免费福利网站| 欧美一区精品| 久久精品人妻中文系列| 亚洲天堂在线视频| 亚洲国产天堂久久综合226114| 国产97视频在线观看| 国产菊爆视频在线观看| 五月激情综合网| 91极品美女高潮叫床在线观看| 无码国内精品人妻少妇蜜桃视频| 欧美三級片黃色三級片黃色1| 国产成人综合久久| 中文字幕在线视频免费| 国模沟沟一区二区三区| 欧美国产在线一区| 六月婷婷精品视频在线观看| 伊人久久福利中文字幕| 欧美高清日韩| 国产精品吹潮在线观看中文| 欧美成人午夜视频免看| igao国产精品| 福利在线免费视频|