999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于卷積神經(jīng)網(wǎng)絡(luò)的圖像語(yǔ)義分割技術(shù)

2019-01-30 07:49:10朱明君
電子技術(shù)與軟件工程 2019年1期
關(guān)鍵詞:語(yǔ)義特征區(qū)域

文/朱明君

1 引言

作為圖像理解和計(jì)算機(jī)視覺(jué)領(lǐng)域的重要的環(huán)節(jié),圖像分割一直受到人們的關(guān)注。在深度學(xué)習(xí)迅速發(fā)展之后,基于卷積神經(jīng)網(wǎng)絡(luò)的全卷積神經(jīng)網(wǎng)絡(luò)(Fully convolutional networks,F(xiàn)CN)等網(wǎng)絡(luò)的提出使得圖像分割進(jìn)入了新的階段,像素不僅能夠按照物體類別進(jìn)行分類,圖像分割精度也得以提升。

2 卷積神經(jīng)網(wǎng)絡(luò)的工作原理

卷積神經(jīng)網(wǎng)絡(luò)的意義在于訓(xùn)練出能夠識(shí)別圖像特征的卷積核。當(dāng)卷積核在整個(gè)圖像上滑動(dòng)之后,輸出特征圖中的相應(yīng)位置就被賦予了高低不一的數(shù)值,特定曲線及周邊區(qū)域所對(duì)應(yīng)的位置數(shù)值高,其他區(qū)域數(shù)值低。也就是說(shuō),特定的卷積核能夠?qū)⑻囟ǖ奶卣鳈z測(cè)出來(lái)。而卷積神經(jīng)網(wǎng)絡(luò)的目的就在于訓(xùn)練出能夠識(shí)別出事物不同的特征的不同卷積核,從而實(shí)現(xiàn)對(duì)圖片上信息的分類。

2.1 圖像的卷積

對(duì)圖像卷積即卷積核在輸入圖像上從左到右,從上到下滑動(dòng),卷積核的每個(gè)系數(shù)和輸入圖像對(duì)應(yīng)的像素值相乘再累加,作為新的像素值賦值給輸出特征圖的相應(yīng)位置。輸出特征圖的尺寸o與卷積核的大小k、輸入圖像的尺寸n、步長(zhǎng)s、填充(padding)p有關(guān)。

2.2 激活函數(shù)

輸入圖像經(jīng)過(guò)卷積核作用之后得到的特征圖還要經(jīng)過(guò)激活函數(shù)的作用,將輸出的數(shù)值回歸至一定范圍內(nèi),從而實(shí)現(xiàn)將非線性可分的數(shù)據(jù)進(jìn)行分類。

2.3 池化層

在卷積神經(jīng)網(wǎng)絡(luò)中,當(dāng)特征圖經(jīng)過(guò)激活函數(shù)作用之后得到的激活圖還要經(jīng)過(guò)池化層。

池化,也叫下采樣,就是將圖片尺寸縮小。一般采用最大池化和平均池化。最大池化就是在特定n×n的區(qū)域選出該區(qū)域內(nèi)最大的數(shù)值,賦予輸出的相應(yīng)位置。而平均池化就是在特定n×n的區(qū)域?qū)⑦@n2個(gè)數(shù)值取平均,賦予輸出的相應(yīng)位置。

圖1:語(yǔ)義分割示例

圖2

圖3

2.4 全連接層softmax

在卷積神經(jīng)網(wǎng)絡(luò)中,當(dāng)卷積層的濾波器尺寸與待處理的特征圖的尺寸相同時(shí),一個(gè)卷積核輸出一個(gè)值,這樣的卷積層便是全連接層。在網(wǎng)絡(luò)的最后通過(guò)加上全連接層能夠輸出一組向量,即大小不同的數(shù)值,個(gè)數(shù)為卷積核的數(shù)量。這些數(shù)值最終經(jīng)過(guò)softmax函數(shù)作用,輸出一組大小在0到1間的概率值,代表這張圖片輸于各個(gè)類別的可能性。

2.5 訓(xùn)練過(guò)程

圖4:出自論文

卷積神經(jīng)網(wǎng)絡(luò)的目的是訓(xùn)練出能夠識(shí)別圖像特征的卷積核,也就是要確定這些卷積核的系數(shù)。輸入訓(xùn)練集的圖像,經(jīng)過(guò)特定的卷積神經(jīng)網(wǎng)絡(luò),輸出一組概率,通過(guò)與標(biāo)簽比對(duì),計(jì)算誤差值,通過(guò)反向傳播算法更新權(quán)重,直至最終整個(gè)網(wǎng)絡(luò)損失函數(shù)達(dá)到最小。

2.5.1 損失函數(shù)

2.5.2 反向傳播算法

3 圖像語(yǔ)義分割

3.1 概念

圖像語(yǔ)義分割就是對(duì)圖像進(jìn)行分割并識(shí)別出相應(yīng)的內(nèi)容,比如圖1中一個(gè)人騎著摩托車,那么圖像語(yǔ)義分割的任務(wù)就是將這張圖片的人和摩托車以及背景(background)分割開(kāi)并識(shí)別出他們相應(yīng)的類別。

3.2 FCN全卷積網(wǎng)絡(luò)

全卷積網(wǎng)絡(luò)和傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)相比,區(qū)別在于最終輸出的不是一組向量,而仍然是一張圖片,主要是通過(guò)將CNN中的全連接層當(dāng)作是卷積層。在FCN論文中,作者通過(guò)5層卷積層和5層池化層將輸入圖片的尺寸縮小到了原圖的1/32,最后加的卷積層是21通道,故最終是21張尺寸為原圖的1/32的熱圖。接下來(lái)FCN做的是反卷積,將圖像尺寸還原成輸入圖像,輸出21張由heatmap經(jīng)過(guò)upsampling變?yōu)樵瓐D大小的圖片;為了對(duì)每個(gè)像素進(jìn)行分類預(yù)測(cè)label,對(duì)像素逐個(gè)求其在21張圖像中位置的最大概率作為該像素的分類,這便是即語(yǔ)義分割的核心所在。

3.2.1 反卷積

什么是反卷積呢,簡(jiǎn)單說(shuō)就是卷積對(duì)應(yīng)的反過(guò)來(lái)的操作,具體含義可以通過(guò)以下例子理解。如圖2,3×3的卷積核在4×4的特征圖上以步長(zhǎng)為1進(jìn)行滑動(dòng),輸出2×2的特征圖,其對(duì)應(yīng)的反卷積如圖3所示,即3×3的卷積核在尺寸為2×2的特征圖上以步長(zhǎng)為1進(jìn)行滑動(dòng)(padding=2),輸出4×4的特征圖。

圖5:來(lái)自論文

圖6

3.2.2 融合

由于較深層的圖像感受野較大,對(duì)于局部細(xì)節(jié)的感受能力不足,故在反卷積還原圖像尺寸時(shí)可以將加入較淺層的圖像信息。比如圖4中進(jìn)行16倍上采樣時(shí),是先將第四個(gè)池化層的結(jié)果和第五個(gè)池化層的輸出特征圖上采樣兩倍的結(jié)果融合之后,再進(jìn)行16倍上采樣,這樣輸出的圖片即FCN-16s。

3.2.3 結(jié)果

圖5即為經(jīng)過(guò)訓(xùn)練的卷積網(wǎng)絡(luò)所測(cè)試的結(jié)果,可以看出隨著上采樣倍數(shù)的降低,分割的結(jié)果也更為清晰精確。

3.3 Dilated Convolutions

帶孔卷積就是在卷積核的各個(gè)系數(shù)間根據(jù)不同的dilation rate加上不同個(gè)數(shù)的0,從而實(shí)現(xiàn)卷積核尺寸的膨脹。

圖6是上述關(guān)于dilated convolutions論文中的一張圖,分別顯示了三個(gè)dilation rate不同的遞進(jìn)的卷積層中尺寸為3×3的卷積核對(duì)輸出特征圖的感受野影響。用第三層做具體說(shuō)明,卷積層15×15的區(qū)域通過(guò)無(wú)洞3×3卷積核映射到13×13的區(qū)域,13×13通過(guò)dilation=2的3×3卷積核映射到一個(gè)9×9的區(qū)域,最后該9×9的區(qū)域通過(guò)dilation=3的3×3的卷積核映射到一個(gè)特征單元,說(shuō)明該層卷積層輸出的一個(gè)單元能夠包含原始尺寸為15×15區(qū)域的信息,故該卷積層感受野RF=15。而第一層卷積核的感受野僅為3,可以看出,dilated convolutions在不經(jīng)池化減小圖像尺寸造成信息損失的前提下仍然擴(kuò)大了感受野,同時(shí)不增加卷積核的系數(shù),將計(jì)算量保持在一定范圍內(nèi)。研究結(jié)果標(biāo)明,使用dilated convolutions的網(wǎng)絡(luò)進(jìn)行分割的結(jié)果更接近于真值。

4 結(jié)語(yǔ)

本文在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上通過(guò)介紹全卷積神經(jīng)網(wǎng)絡(luò)和帶孔卷積及其相關(guān)概念,闡述了其在圖像語(yǔ)義分割領(lǐng)域上的應(yīng)用,全卷積神經(jīng)網(wǎng)絡(luò)通過(guò)將全連接層轉(zhuǎn)化為全連接層和反卷積等過(guò)程實(shí)現(xiàn)了將像素根據(jù)語(yǔ)義進(jìn)行分割,帶孔卷積通過(guò)在卷積核的系數(shù)間插入不同個(gè)數(shù)的0優(yōu)化了分割效果。

參考文獻(xiàn)

[1]成穎,史九林.自動(dòng)分類研究現(xiàn)狀與展望[J].情報(bào)學(xué)報(bào),1999,18(01):20-26.

[2]李湘東,阮濤,劉康.基于維基百科的多種類型文獻(xiàn)自動(dòng)分類研究[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2017(10).

猜你喜歡
語(yǔ)義特征區(qū)域
語(yǔ)言與語(yǔ)義
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
關(guān)于四色猜想
分區(qū)域
基于嚴(yán)重區(qū)域的多PCC點(diǎn)暫降頻次估計(jì)
認(rèn)知范疇模糊與語(yǔ)義模糊
線性代數(shù)的應(yīng)用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 日韩无码精品人妻| 国产成人盗摄精品| 久久semm亚洲国产| 99热亚洲精品6码| 国产亚洲精品va在线| 日本道中文字幕久久一区| 欧美在线视频不卡第一页| 久久99国产综合精品女同| 国产福利免费视频| 国产H片无码不卡在线视频 | 99在线视频免费| 日韩A级毛片一区二区三区| 欧美另类视频一区二区三区| 亚洲天堂区| 国产人人射| 免费一极毛片| 夜夜操天天摸| 国产不卡国语在线| 丁香六月综合网| 丰满人妻一区二区三区视频| 人妻熟妇日韩AV在线播放| 久久无码av一区二区三区| 亚洲欧洲自拍拍偷午夜色无码| Jizz国产色系免费| 国产在线观看第二页| 国产精品污污在线观看网站| 亚洲欧美一区二区三区蜜芽| 國產尤物AV尤物在線觀看| 五月婷婷丁香综合| 国产精品所毛片视频| 国产精品极品美女自在线看免费一区二区| 美女一级免费毛片| 97青草最新免费精品视频| 久久人人爽人人爽人人片aV东京热| 被公侵犯人妻少妇一区二区三区| 亚洲综合二区| 夜夜操狠狠操| 乱人伦视频中文字幕在线| 精品1区2区3区| 亚洲欧美一区二区三区图片| 国产三级韩国三级理| 日韩欧美国产三级| 不卡午夜视频| 91po国产在线精品免费观看| 美女无遮挡免费网站| 国产成人精品在线1区| 伊人91在线| 国产精品lululu在线观看| 久久青草免费91线频观看不卡| 久久亚洲天堂| 一区二区三区精品视频在线观看| 高潮爽到爆的喷水女主播视频| 国产白浆一区二区三区视频在线| 中文一级毛片| 一级毛片不卡片免费观看| 久久国产成人精品国产成人亚洲 | 午夜视频日本| 美女被操91视频| 国产免费黄| 波多野结衣第一页| 久久99这里精品8国产| 精品国产自在现线看久久| 国产精品一线天| 久久精品视频一| 精品视频一区二区观看| 无码视频国产精品一区二区| 亚洲色无码专线精品观看| 亚洲色图欧美一区| 日本一区二区不卡视频| 久久精品嫩草研究院| 免费中文字幕在在线不卡 | 一级看片免费视频| 国产天天色| 真实国产乱子伦视频| 91精品免费久久久| 精品少妇人妻一区二区| 精品一區二區久久久久久久網站| 无码精品国产VA在线观看DVD| 精品欧美视频| 伊人AV天堂| 青青青视频免费一区二区| 国产精品观看视频免费完整版|