999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于生成對抗網(wǎng)絡的服裝圖像風格遷移

2019-11-17 04:05:19管紹春向宇
電腦知識與技術 2019年26期
關鍵詞:深度學習

管紹春 向宇

摘要:隨著機器學習到深度學習的拓展,基于深度學習的多種網(wǎng)絡模式和學習框架使得深度學習可以有更多更加復雜的研究方向。其中生成對抗網(wǎng)絡(GAN)是Ian J. Goodfellow等人于2014年提出的一個通過對抗過程估計生成模型的新框架,被廣泛應用于圖片風格轉移,超分辨率,圖像補全,去噪等領域。本研究意在將生成對抗網(wǎng)絡的服裝風格轉移作為技術基礎,引入到服裝文化的傳承保護和發(fā)揚的具體應用中,將服裝風格轉換的時效性、多樣性,契合深度學習來更好的為人們服務。為此本研究融合圖像分割和圖像風格遷移兩個研究領域的內(nèi)容,將原始輸入的圖像根據(jù)設定進行分割,然后基于分割結果進行相應的全局或局部風格遷移。

關鍵詞:深度學習;生成對抗網(wǎng)絡;圖像風格遷移;圖像識別分割

中圖分類號:G434? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2019)26-0191-03

開放科學(資源服務)標識碼(OSID):

1序言

1.1研究的背景和意義

圖像的內(nèi)容和風格聽上去好像模糊難辨,理論上來說沒有無風格的內(nèi)容,也沒有無內(nèi)容而單獨存在的風格。所以從藝術的角度很難說清圖像的內(nèi)容和風格到底有什么界限,也很難說圖片的哪部分屬于內(nèi)容,哪些東西又該是風格。而從統(tǒng)計學角度或者數(shù)學角度來說,圖像的內(nèi)容和風格是可以分離開的,然后將不同圖片的風格和不同圖片的內(nèi)容結合從而實現(xiàn)圖像風格的遷移。已有的圖像風格遷移辦法有很多,本研究選擇cycleGAN這一生成對抗網(wǎng)絡GAN的變種作為風格轉移處理的網(wǎng)絡模型,利用其無監(jiān)督學習的學習方法,以一種巧妙的對抗博弈的方法,使得其中關鍵的生成器和辨別器二者互相促進互相學習,以達到模糊原始輸入圖像與生成圖像的效果,并最終運用到圖像風格轉移這一目標上。相較傳統(tǒng)的pix2pix模型只能對特定形狀的簡單圖形做單向風格遷移[1],cycleGAN能對風格做雙向遷移,并具有輸入的兩張圖可以是任意非配對圖片的優(yōu)點。

本研究使用的是yolov3目標檢測算法,其秉承yolo系列的目標檢測模型的優(yōu)點和基本的檢測原理,并且做了以下改進:不使用Softmax對每個框進行分類;具備多尺度預測(類FPN)能力;具備更好的基礎分類網(wǎng)絡(類似于ResNet)和分類器[2]。其使用的Darknet-53與ResNet-101或ResNet-152相比準確率接近,但速度更快。在實例分割上選用的是Mask R-CNN,這是一個兩階段的框架,第一個階段掃描圖像并生成有可能包含一個目標的區(qū)域,第二階段分類區(qū)域并生成邊界框和掩碼。其在底層檢測的是低級特征(邊和角等),在較高層檢測的是更高級的特征(狗、人、車等)。

1.2相關技術及主要研究內(nèi)容

1.2.1目標檢測

目標檢測顧名思義就是在圖像中找出所有感興趣的目標,確定其位置和大小,屬于機器視覺領域的核心問題之一。目標檢測要解決的問題除了在復雜的圖像單元中進行圖像分類之外,還要考慮目標可能出現(xiàn)在圖像中的任何位置;目標大小各不相同,即使在同一圖像中的相同物體在不同位置或光照下也會有不同的呈現(xiàn);目標在圖像中所展示的內(nèi)容在機器內(nèi)部的解讀和在人類一般意識的認識和解讀的不同。針對以上問題,本研究使用了經(jīng)典的滑動窗口結合圖像縮放的解決方案,此外,該方案還同時解決了如果采用矩形框來定義目標的話矩形會有不同的寬高比從而造成通用目標檢測成本太高的問題。

本研究使用的yolov3算法屬于yolo系列算法,其在之前幾版算法的基礎上對精度和速度做了平衡和優(yōu)化,屬于one stage類算法里面的基于端到學習的目標檢測。本研究對yolov3算法進行了進一步提升,將其改進為多尺度預測算法,并匹配更好的基礎分類網(wǎng)絡和分類器darknet-53,另外還為其增加了分類器-類別預測等功能。

1.2.2實例分割

圖像分割就是預測圖像中每一個像素所屬的類別或者物體。圖像分割中分為語義分割和實例分割兩大類,比如以汽車圖片的分割舉例,語義分割就是區(qū)分是不是車,而實例分割(又稱個體分割)則區(qū)分不同類型的車或者區(qū)分有幾輛車,并把不同的車標記出來。傳統(tǒng)的圖像切割是將圖的一些邊移除,從而讓兩個子圖不相連,目的是找到一個使得移除邊的和權重最小的切割。

本研究使用的Mask R-CNN目標實例分割框架,該框架能在高效的檢測圖像中所有目標的同時,對每一個目標實例生成高質(zhì)量的分割掩膜。此外該框架還可以通過增加不同的分支來完成不同的任務,具有很強的靈活性。在Mask R-CNN框架內(nèi),為滿足高速和高準確率,本研究選擇了可以既快又準的完成目標檢測功能的經(jīng)典目標檢測算法Faster-rcnn,以及可以精準的完成語義分割功能的經(jīng)典語義分割算法FCN。同時本研究在原始Faster-rcnn算法基礎上增加FCN來產(chǎn)生對應的MASK分支這種方式也保證了必要的簡單直觀,降低計算量。

1.2.3 風格轉移

結合目標檢測和實例分割的處理結果,在被遷移圖像的基礎上將分割出來的部分以覆膜的方式覆蓋在目標圖像上,然后就可以實現(xiàn)對單獨的選定區(qū)域進行風格遷移。鑒于圖像風格遷移的過程是圖片到圖片的轉換過程,且有風格相近的潛在需求,本研究采用cycleGAN來滿足這一需求,好處除了可以避免所有輸入圖片對應到同一目標圖片上外,還可以檢驗生成圖片是否真的是由輸入圖片的原圖對抗而生成的。

2 算法詳解

2.1目標檢測

相比yolov2,yolov3的很多東西是繼承的,比如分而治之的思想,還有從yolov2開始的采用batch normalization作為正則化、加速收斂和避免過擬合的方法,同時還繼承和發(fā)展了多尺度訓練,所謂發(fā)展就是可以在速度和準確率之間找到適合自己需要的平衡點,如圖1所示。yolov3結構里沒有池化層和全連接層。前向傳播過程中,張量的尺寸變換則通過改變卷積核的步長來實現(xiàn)。

2.2實例分割

本研究采用的Mask R-CNN以Faster-RCNN為主體框架,在其網(wǎng)絡的頭部引入另一條FCN并行分支用于檢測ROI的mask map信息,這樣它的頭部包含三個子任務:分類、回歸和分割。第一階段掃描圖片并生成提議(即有可能包含一個目標的區(qū)域),第二階段對提議進行分類并生成邊界框和掩碼。

Mask-RCNN的處理過程一般是輸入一幅要處理的圖片進行相應的預處理(或者直接輸入預處理后的圖片);將處理結果輸入到一個預先訓練好的神經(jīng)網(wǎng)絡中得出對應的feature map;對feature map中每一點設定預定個的ROI,從而獲得多個候選ROI;將候選的ROI送入RPN網(wǎng)絡進行二值分類(就是識別出是前景還是背景)和BB回歸,過濾掉一些候選ROI;對剩下的ROI進行ROI Align操作(即先將原圖和feature map的pixel對應起來,然后將feature map和固定的feature對應起來。亦即對ROI中的每個點取其所在格子的四個頂點的坐標值做雙線性插值);對這些ROI進行分類、BB回歸和MASK生成(在每個ROI里面進行FCN操作);進行max pooling(如圖2所示)。Mask-RCNN訓練生成的每個ROI如果最終與某個Ground truth box的IOU為0.5以上,那么就可視為一個positive box,若小于0.5則為negative box。而最終的Lmask的計算只在positive box上面進行。

2.3 風格遷移

圖像風格遷移中所說的風格可用Gram矩陣表示,因為Gram Matrix實際上可看作是feature之間的偏心協(xié)方差矩陣,在feature map中,每一個數(shù)字都來自一個特定濾波器在特定位置的卷積,因此每個數(shù)字就代表一個特征的強度,而Gram計算的是兩兩特征之間的相關性,即Gram矩陣是特征圖矩陣與自身逆矩陣相乘得到的矩陣,因此它會包含自身的相關性這一隱藏信息。進行圖片風格遷移時,尋找這種相關性的“匹配”,Gram矩陣就會將色彩風格和圖像形狀特征通過計算后以某種方式組合在一起,也就是我們所理解的以及能夠表現(xiàn)出來的表示圖像的藝術風格。同時,Gram的對角線元素,還體現(xiàn)了每個特征在圖像中出現(xiàn)的量,因此,Gram有助于把握整個圖像的大體風格。要度量兩個圖像風格的差異,只需比較他們Gram矩陣的差異即可。

2.4 CycleGAN

傳統(tǒng)GAN是單向的,而cycleGAN本質(zhì)上是兩個鏡像對稱的GAN所構成的一個環(huán)形網(wǎng)絡,如圖3所示。其中有兩個鑒別器網(wǎng)絡,一個是鑒別生成圖像是否達到要求,一個是辨別還原為原圖像是否達到預期結果。

3 實驗

3.1目標檢測實驗部分

目標檢測實驗主要進行Yolov3的目標檢測,這部分的實驗可以大致分為定義問題、搜集數(shù)據(jù)(圖片)、數(shù)據(jù)預處理、搭建環(huán)境、訓練模型、測試、得出結論幾大步驟。

定義問題就是明確自己需要通過目標檢測達到什么目的,對于數(shù)據(jù)搜集和整理的側重點是什么,以及如何對癥下藥。本研究在目標檢測階段要達到的目的是先檢測出人物所在的區(qū)域。數(shù)據(jù)搜集主要是考慮是否有合適的數(shù)據(jù)集可用,或者別人訓練好的模型可以直接使用等。對于人物的識別官方有很多數(shù)據(jù)集可以直接使用。數(shù)據(jù)預處理主要是利用一些圖像處理工具或便捷的腳本對圖片進行標注,并實現(xiàn)標注產(chǎn)生的數(shù)據(jù)集的格式轉換。本研究對圖像的標注用的是windows上的labelimg,其使用簡單快捷。搭建環(huán)境這部分有兩套方法,類unix系統(tǒng)平臺和windows系統(tǒng)平臺。當安裝配置好CUDA、CUDNN以及Opencv以后,就可以從yolo官網(wǎng)上下載源碼進行編譯。訓練模型就是在搭建好的平臺上利用之前預處理好的數(shù)據(jù)來訓練生成模型。

3.2實例分割和風格轉移實驗部分

本研究采用Mask R-CNN進行目標檢測和實例分割實驗的過程是:在一個圖中用矩形框框出所識別出來的目標物體所在區(qū)域,并在邊上標識出類的名稱,接著在標識出來的框中目標檢測出要進行處理的區(qū)域,實驗效果如圖4所示;將這張圖片全局風格遷移,然后在局部采用先目標檢測再實例分割的辦法產(chǎn)生掩膜。將掩膜覆蓋在原圖上使其只把掩膜部分實現(xiàn)風格轉換。這樣一來就實現(xiàn)了局部風格轉換,如圖5至圖9所示。

4 總結

通過本研究對生成對抗網(wǎng)絡的實際學習和運用,對深度學習神經(jīng)網(wǎng)絡可以運用的場景有了更多理解和設想,同時也對以后相關領域知識的學習奠定了基礎。

參考文獻:

[1] Unpaired Image-to-Image Translationusing Cycle-Consistent Adversarial Networks. Jun-Yan Zhu?Taesung Park?Phillip Isola Alexei A. Efros Berkeley AI Research (BAIR) laboratory, UC Berkeley

[2] You Only Look Once:Unified, Real-Time Object DetectionJoseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi University of Washington, Allen Institute for AI, Facebook AI Research (FAIR) arXiv:1703.06870v3 [cs.CV] 24 Jan 2018.

[3] Generative Adversarial Networks Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, SherjilOzair, Aaron Courville, YoshuaBengio.

[4] Goodfellow I. NIPS 2016 tutorial: generative adversarial networks. arXiv preprint arXiv: 1701.00160, 2016.

[5] Hu W W, Tan Y. Generating adversarial malware examples for black-box attacks based on GAN. arXiv preprint arXiv: 1702.05983, 2017.

【通聯(lián)編輯:王力】

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數(shù)據(jù)遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
利用網(wǎng)絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數(shù)據(jù)技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 欧美福利在线观看| 亚洲中文字幕在线一区播放| 中国成人在线视频| 91原创视频在线| 国产精品深爱在线| 久久久国产精品免费视频| 欧美精品伊人久久| 欧美午夜视频在线| 老熟妇喷水一区二区三区| 国产一区二区影院| 福利片91| jizz在线免费播放| 国产成人综合久久| 沈阳少妇高潮在线| 一本色道久久88亚洲综合| 亚洲一区国色天香| 国产无码性爱一区二区三区| 91精品日韩人妻无码久久| 亚洲精品福利网站| 亚洲三级网站| 久久www视频| 日本www在线视频| 怡红院美国分院一区二区| 狼友视频一区二区三区| 欧美啪啪视频免码| 国产视频资源在线观看| 国产精品v欧美| 999精品视频在线| 亚洲人成在线精品| 免费大黄网站在线观看| 九色综合视频网| 精品一区二区三区波多野结衣| 熟妇丰满人妻| 亚洲日本中文综合在线| 国产精品综合久久久 | 亚洲欧美日韩动漫| 青青国产视频| 国产一区二区影院| 婷婷综合在线观看丁香| 亚洲午夜国产精品无卡| 日本高清视频在线www色| 一区二区午夜| 亚洲第一av网站| 国产成年女人特黄特色大片免费| 国产亚洲一区二区三区在线| 国产午夜一级毛片| 亚洲精品在线91| 亚洲国产精品成人久久综合影院| 欧美午夜小视频| 一级全黄毛片| 国产AV毛片| 日本道综合一本久久久88| 国产亚洲欧美日韩在线一区二区三区| 国产精品黄色片| 又黄又湿又爽的视频| 女人18毛片一级毛片在线| 99热亚洲精品6码| 国产麻豆va精品视频| 精品成人一区二区| 久久人妻xunleige无码| 国产性爱网站| 91色爱欧美精品www| 98精品全国免费观看视频| 国产熟睡乱子伦视频网站| 亚洲日本中文综合在线| 91精品国产情侣高潮露脸| 99国产在线视频| 日韩欧美色综合| 亚洲美女视频一区| 亚洲无线观看| 国产福利拍拍拍| 国产精品无码作爱| 国产精品成| 日本亚洲国产一区二区三区| 五月激情综合网| 亚洲欧洲美色一区二区三区| 丰满的熟女一区二区三区l| 国产sm重味一区二区三区| 亚洲成人免费看| 凹凸国产分类在线观看| 54pao国产成人免费视频| 午夜激情婷婷|