李 杰
(銀川能源學(xué)院 寧夏 銀川 750100)
在對(duì)圖像識(shí)別的過程中,傳統(tǒng)的單一方法已經(jīng)無法實(shí)現(xiàn)高準(zhǔn)確率、高分辨率和高光譜的需求,因此要改進(jìn)傳統(tǒng)機(jī)器分類方法。遙感圖像識(shí)別檢測(cè)技術(shù)能夠通過單波段得出高光譜圖像,分辨率在不斷地提高。目前,遙感圖像的分類是各個(gè)領(lǐng)域的研究重點(diǎn),如何集中技術(shù)的優(yōu)勢(shì),是今后研究過程中的重點(diǎn)[1]。
目前機(jī)器學(xué)習(xí)分類的方法比較多,包括最大似然法、基于統(tǒng)計(jì)模式識(shí)別方法、通用線性回歸等,研究人員復(fù)合使用對(duì)象信息、空間信息和光譜信息具有一定的效果。
基于回歸的機(jī)器學(xué)習(xí)方法原始輸入數(shù)據(jù)為X,輸出數(shù)據(jù)為Y:
g(x)=ρ0+ρ1X1+ρ2X2=ρTX
(1)
式(1)中,ρ0指的是截距,一般使用最小方差法創(chuàng)建回歸模型,g(x)代價(jià)函數(shù)表示為式(2):

(2)
通過Widrow-Hoff所提出的最小均方差算法,利用不斷嘗試全新ρ使代價(jià)函數(shù)為式(3):

(3)
通過式(3)推導(dǎo)出式(4):

(4)
將式(4)代入式(3)得式(5):
ρj:ρj+β(y(i)-gρ(x(i)))xj(i)
(5)
此算法使用梯度下降的方法能夠滿足代價(jià)函數(shù)最小值,并且發(fā)展批量梯度下降方法,從而促進(jìn)了收斂速度。分類中最大似然法為傳統(tǒng)算法,假設(shè)隨機(jī)量滿足高斯分布,那么相似最大似然模型定義為:

(6)
此Softmax算法,可理解為Logistic算法的一般化。上述方法總體為基于統(tǒng)計(jì)對(duì)各個(gè)像元各波段光譜和空間信息特征進(jìn)行處理,之后以特征實(shí)現(xiàn)分類識(shí)別的方法[2]。
通過灰度直方圖對(duì)圖像頻率與灰度進(jìn)行全面分析,繪制灰度分布統(tǒng)計(jì)圖,能夠直觀地反映出灰度分布情況。具體過程為:以目標(biāo)像素為中心,設(shè)置M×N鄰域范圍,實(shí)現(xiàn)范圍中全部像素值設(shè)置為統(tǒng)計(jì)排列,中間位置值為目標(biāo)像素灰度值。為了改善效果,在一個(gè)像素點(diǎn)處理過程中調(diào)整窗口大小。全面判斷當(dāng)前區(qū)域中的值是否為噪聲點(diǎn):假如是,就要擴(kuò)大窗口尺寸,尋找合適中值;假如不是,就要全面判斷中心像素點(diǎn)的噪點(diǎn)[4]。
圖像識(shí)別重點(diǎn)就是提取特征,為了全面了解圖像特征,要使人類視覺圖像抽象描述成為向量、數(shù)值等。特征能夠通過統(tǒng)計(jì)圖像局部區(qū)域的方向梯度直方圖(histogram of oriented gradient, HOG)得出,詳細(xì)描述圖像中的目標(biāo)形狀與表象,算法的流程詳見圖1。

圖1 算法流程示意圖
Gamma校正能夠壓縮圖像,光照會(huì)影響到圖像紋理,通過校正降低圖像陰影。以圖像的不同改變校正幅度,對(duì)圖像顯示效果進(jìn)行調(diào)整[5]。
在對(duì)圖像縱橫坐標(biāo)計(jì)算的過程中,可以使用[-1,0,1]算子與[-1,0,1]轉(zhuǎn)置算子實(shí)現(xiàn)圖像卷積運(yùn)算,全面計(jì)算梯度方向和幅值。將圖像實(shí)現(xiàn)多個(gè)單元格Cell的劃分,統(tǒng)計(jì)梯度方向的分布情況。在檢測(cè)道路的過程中,角度范圍設(shè)置為180°。由于局部對(duì)比度和光照的變化,會(huì)改變梯度強(qiáng)度的變化,從而解決梯度強(qiáng)度歸一化的問題。利用多個(gè)單元格實(shí)現(xiàn)連通Block空間的創(chuàng)建,根據(jù)Block形狀區(qū)分環(huán)形和矩形的區(qū)間。最后,利用重疊后Block塊實(shí)現(xiàn)特征向量的創(chuàng)建,對(duì)比其他特征的提取方法,HOG特征提取能夠局部處理圖像,并且不會(huì)使圖像光學(xué)形態(tài)改變。本文將圖像拆解為大量的小Cell,使HOG化得到實(shí)現(xiàn),對(duì)Cell大小調(diào)整,從而實(shí)現(xiàn)區(qū)域特征信息精度的控制[6]。
反向傳播算法(back propagation, BP)通過誤差反饋創(chuàng)建神經(jīng)網(wǎng)絡(luò)。能夠逐層和網(wǎng)絡(luò)中神經(jīng)元進(jìn)行連接,通過誤差反饋層實(shí)現(xiàn)。BP神經(jīng)網(wǎng)絡(luò)還能夠滿足輸出結(jié)果的需求,假如數(shù)據(jù)不滿足,就要返回到中心處理。利用BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本,并且對(duì)樣本進(jìn)行識(shí)別和反饋。基本原理是通過傳輸層、隱藏層傳輸信息,并且對(duì)傳輸?shù)男畔⑦M(jìn)行對(duì)比,如果計(jì)算結(jié)果無法使預(yù)期需求得到滿足,就要對(duì)系統(tǒng)參數(shù)重新計(jì)算。調(diào)整信息的閾值和權(quán)值,以此實(shí)現(xiàn)循環(huán)計(jì)算,直到結(jié)果能夠滿足需求,在目標(biāo)層中存儲(chǔ)[7]。
通過量化共軛梯度的方法進(jìn)行分類,傳統(tǒng)的梯度下降法收斂負(fù)梯度,本文所設(shè)計(jì)的共軛梯度算法能夠使負(fù)梯度的方向和上次搜索結(jié)果結(jié)合,計(jì)算全新的方向。因?yàn)楣曹椞荻仍谒惴ㄟ^程中對(duì)方向重新計(jì)算,所以計(jì)算時(shí)間得到增加。量化共軛梯度法能夠避免單一的線性搜索,使網(wǎng)絡(luò)訓(xùn)練速度得到提高。
通過損失模型能夠判斷模型預(yù)測(cè)的好壞,充分反映出模型與實(shí)際的差距,交叉熵?fù)p失函數(shù)、損失函數(shù)等為常見的損失模型。在二分類問題中,為了衡量神經(jīng)網(wǎng)絡(luò)輸出向量,利用交叉熵進(jìn)行評(píng)價(jià),當(dāng)熵值較小時(shí),兩個(gè)概率分布就會(huì)比較接近。交叉熵設(shè)定兩個(gè)概率分布p和q,p指的是理想結(jié)果,q指的是神經(jīng)網(wǎng)絡(luò)輸出結(jié)果,兩者滿足p+q=1的關(guān)系,交叉熵計(jì)算公式為:
M(p,q)=-∑xp(x)logq(x)
(7)
熵值越小,兩個(gè)概率分布就會(huì)越近。
圖像處理方法被廣泛應(yīng)用到道路網(wǎng)提取中,膨脹腐蝕屬于形態(tài)學(xué)變換,復(fù)式操作能夠降低物體邊界比較小的部分,使物體得到擴(kuò)大,連接原本已經(jīng)斷開的物體。開閉運(yùn)算能夠組合腐蝕和膨脹,在開運(yùn)算過程中能夠先腐蝕然后膨脹,閉運(yùn)算能夠先膨脹之后進(jìn)行腐蝕,利用同種結(jié)構(gòu)元素進(jìn)行計(jì)算。在開運(yùn)算過程中,能使圖像的邊緣更加光滑,使細(xì)小連接斷開,消除邊緣細(xì)小的毛刺[8]。
為了對(duì)本文方法優(yōu)越性進(jìn)行驗(yàn)證,通過景視圖得到高分辨彩色遙感影像數(shù)據(jù),使用全自動(dòng)方法作為對(duì)比算法,對(duì)比視覺與統(tǒng)計(jì)分析。
在同個(gè)場景中包括不同類型道路,紋理與顏色不同,對(duì)完整提取道路是不利的。因此,不同類型道路通過繪制矩形框的方法標(biāo)記。
因?yàn)榈缆饭庾V特征的相似性,從而使粗提取操作存儲(chǔ)在零星偽道路中,利用道路區(qū)域的大范圍聯(lián)通點(diǎn)對(duì)結(jié)果進(jìn)行提取,之后進(jìn)行精細(xì)化處理。為了評(píng)價(jià)本文的方法,要求在原始圖像中實(shí)現(xiàn)提取的道路結(jié)果疊加。通過疊加方式表示,本文方法提取結(jié)果為全部類型道路,提取結(jié)果能夠使實(shí)際道路邊界需求得到滿足,表示本文方法的便捷定位與道路類型提取具有密切關(guān)系。表1為各個(gè)緩沖區(qū)半徑中的提取精度,說明手工邊界線與本文方法邊界線最高的精度為2 pixel時(shí),本文方法的準(zhǔn)確性比較高[9]。
圖2為本文方法提取結(jié)果,使粗提取結(jié)果存儲(chǔ)到零星偽道路中,通過道路區(qū)域大范圍的連通特點(diǎn)和形態(tài)特征實(shí)現(xiàn)結(jié)果精細(xì)化處理。
從圖2可以看出,本文方法結(jié)果能夠?qū)λ械缆愤M(jìn)行提取,而且實(shí)際道路和提取結(jié)果的道路邊界是相互吻合的,說明本文的方法在提取道路方面具有良好的準(zhǔn)確性和完整性。針對(duì)本文方法的定量化評(píng)價(jià),利用Modava的基于鄰域像素評(píng)價(jià)標(biāo)準(zhǔn),實(shí)現(xiàn)手工提取道路邊界的評(píng)價(jià),從而創(chuàng)建緩沖區(qū),對(duì)不同半徑緩沖區(qū)累加百分比進(jìn)行計(jì)算。使提取的結(jié)果在原始圖像中疊加,通過對(duì)比,本文方法所提取的邊界線與實(shí)際邊界線吻合性良好,驗(yàn)證了本文方法的有效性與可行性。另外,針對(duì)鄰域像素評(píng)價(jià)標(biāo)準(zhǔn)對(duì)比算法開展定量評(píng)價(jià),詳見表2。對(duì)比表1和表2,在完全重疊情況下,劉修宇方法[2]與何曉軍方法[4]和本文的方法沒有太大的平均提取精度差異。在半徑為2 pixel的時(shí)候,本文設(shè)計(jì)方法的半徑提取精度已經(jīng)超過80%,說明本文方法對(duì)圖像的檢測(cè)準(zhǔn)確度比較高。

表2 算法在不同緩沖區(qū)的半徑提取精度
針對(duì)無法提取高分辨率遙感圖像道路的問題,本文使用多標(biāo)記像素匹配為基礎(chǔ)的技術(shù),標(biāo)記多類型道路提取正確匹配模板,使道路區(qū)域提取效果的需求得到滿足。通過局部紋理特征實(shí)現(xiàn)匹配像素的篩選,使計(jì)算復(fù)雜度降低,利用道路區(qū)域形態(tài)特征劃分真實(shí)道路區(qū)域,對(duì)高分辨率遙感圖像道路的結(jié)果進(jìn)行提取。通過試驗(yàn)測(cè)試,證明了本文方法的檢測(cè)精度高,優(yōu)越性顯著。