沈吉寶
(甘肅省測繪工程院,甘肅 蘭州 730050)
水體分布信息的準確獲取在水資源調查、流域綜合治理、水利規劃、洪水監測與災害評估等領域具有重要意義[1]。遙感影像具有直觀明了、宏觀性強的特點,能清楚地反映出區域或者整個流域的水體空間分布情況,利用遙感技術提取水體信息已成為一種趨勢。
現有的遙感影像水體提取方法通常采用基于監督分類的方法,該類方法依據水陸對近/中紅外波段敏感,采用統計閾值的方法來提取水體信息,原理簡單容易實現,但漏提狹小的水體且對陰影區域敏感。或是利用多波段影像信息,通過計算各個波段影像間的綜合關系提取水體,可以分為水體指數法和譜間關系法。駱劍承等以Landsat為數據源,在歸一化差異水體指數法基礎上,采用分步迭代的空間轉換機制可初步實現湖泊水體信息的自動提取[2]。楊樹文等基于TM影像多波段特性,對多波段譜間關系法進行改進,用于提取山區細小水體[3]。沈金祥等采用面向對象的圖像分析方法提取出山區湖泊TM圖像的水體信息[4]。胡衛國等利用歸一化差異水體指數和歸一化差分植被指數對資源一號02C星影像進行適用性研究,提出了更適合資源一號02C星影像的決策樹水體信息提取方法[5]。隨著影像空間分辨率的不斷提高,水體空間分布情況、衛星影像分辨率及波段對水體提取方法的選擇有不同的需求。城市內的高層建筑、橋梁、樹木等的陰影現象較普遍,對水體信息提取造成干擾,并且城市河道水體一般較窄,從中、低分辨率衛星遙感影像中較難識別[6]。陳愛軍等利用模糊C均值算法對影像進行初始分類,然后通過最小鄰近聚類方法對分類結果進行優化,剔除虛假水體信息,實現水體信息的快速提取,但該方法提取水體邊界不清楚[7]。于曉升等利用機器學習與測地線活動輪廓結合的方法提取水體邊界信息,能有效地避免水體邊界提取不清晰問題,但算法的粗提取效果依然存在一定的問題[8]。隨著近年來機器學習分類器算法不斷提出,分類準確率得到提高[9],但分類精度還存在提升空間。
為此,針對高分辨率遙感影像河流識別率較低問題,為了充分挖掘多種特征融合的優勢,本文提出利用水體指數、陰影水體指數、LBP局部紋理特征以及顏色特征融合的遙感影像水體提取方法。對提取的影像特征利用機器學習分類器進行學習與識別,針對粗分類結果存在一定誤檢問題,提出多判據軟投票方法剔除錯誤檢測,提高遙感影像水體提取的召回率、精確率和準確率。
水體對入射能量具有強吸收性,在大部分遙感傳感器的波長范圍內,總體上呈現較弱的反射率,并具有隨著波長的增加進一步減弱的趨勢。具體表現為在可見光的波長范圍里(480~580 nm),其反射率約為4%~5%,但到了580 nm處,則下降為2%~3%;當波長大于740 nm時,幾乎所有入射純水體的能量均被吸收。由于水體在近紅外及隨后的中紅外波段范圍內(740~2 500 nm)所具有的強吸收特點,導致清澈水在這一波長范圍內幾乎無反射率。因此,這一波長范圍常被用來研究水陸分界、圈定水體范圍。但是隨著水體渾濁度(各種有機、無機物質濃度)的增加,水體的反射率會有所變化。如水體泥沙含量的增加會導致反射率的提高,并使光譜曲線的反射峰往長波方向移動。在遙感多光譜影像上水體的紋理一般比較均勻、平滑,并在一定空間范圍內趨于平緩;水體形狀不一,但與周邊地表覆蓋類型光譜差異較大。城市中的湖泊、河流如果為正常水體,其在真彩色影像中展示的色彩為墨綠和綠色,在彩紅外影像中展示為黑色或藍黑色,通過目視判別,較易與其它地物進行區分。
歸一化差異水體指數(NDWI)是依據水體信息在綠光波段及近紅外波段具有較強反射和吸收的特性,將二者的差及和做比值運算,從而達到增強水體信息、抑制背景地物的效果,有效提取水體信息。基于多光譜影像數據的水體提取模型如下:
NDWI=(b2-b4)/(b2+b4)
(1)
式中,b2和b4分別為遙感影像的綠波段及近紅外波段的輻射亮度值。理論上可選取NDWI閾值為0,將水體信息與其它地物區分開來,但實際中應根據采用的具體影像及研究區域選取合適的閾值。
基于上述水體指數提取出的水體信息結果往往摻雜城市建筑物、樹木等陰影,因此需要將陰影從提取出的暗區中分離出來。根據4個多波段光譜特征,構建陰影水體指數(Shadow Water Index,SWI):
SWI=b1+b2-b4
(2)
式中,SWI為陰影水體指數;b1、b2、b4分別為遙感影像的綠、藍和近紅外波段。
遙感影像上水體區域的紋理比較單一、變化較小,具有一定的旋轉不變性,并具有較強的噪聲抵抗能力。而非水體地物影像變化較大,局部表面紋理信息比較豐富。采用紋理特征能有效地表達水體信息,由于LBP紋理具有良好的方向選擇性與空間局部特性,可以對遙感影像進行不同尺度上局部特征提取,同時LBP局部紋理特征對光照強弱變換不敏感[10],對影像變形與旋轉具有一定的不變性[11]。因此,本文采用LBP算法提取影像的紋理特征。原始LBP算子以局部3×3窗口中心像素值為局部閾值,將相鄰區域的像素值與中心像素值比較,若中心像素值大于相鄰像素值,則將該位置標記為0,否則為1。最終獲取一個8位的二進制數,將二進制數轉10位即為該中心像素的LBP局部紋理值,該值可以有效地表達該區域的紋理信息,用于提取影像的LBP紋理特征,如圖1所示。

圖1 LBP紋理特征計算示意圖
遙感影像的顏色信息包含大量的穩健性強的特征,在同一軌道高度空間獲取的遙感影像水體區域的顏色一般呈現偏黃或偏綠的現象。因此,在顏色空間存在較強的規律,可以提取顏色空間的顏色方差與均值作為顏色空間的特征值。假設n為待檢測區域的像素個數,i為影像的波段號(藍、綠、紅、近紅外波段),p(i,j)為待提取影像區域中第i波段第j個像素的像素值。因此,第i波段的像素均值表示為:
(3)

(4)
遙感影像數據中無論是水體指數、陰影水體指數、LBP局部紋理還是顏色等單一特征都不能有效地區分水體與非水體地物,給水體提取帶來困難。鑒于此,本文通過對遙感影像的水體指數、陰影水體指數、LBP紋理特征以及顏色特征進行學習,提取多種特征進行融合充分挖掘遙感影像信息,進而提高遙感影像水體提取方法的性能。
利用上述方法提取多種特征的數據分別具有不同的數據級,避免某一類特征在分類過程影響其他特征有效表達,對不同的特征數據進行歸一化處理。將所有的特征數據變換到同一尺度下,首先提取該特征的最大、最小值并將數據映射到0~1之間。假設x為某一特征的特征向量,xi為某一特征的特征值,max(x)表示特征向量x的最大值,min(x)表示特征向量x的最小值,yi為歸一化后的特征值,則:
yi=(xi-min(x))/(max(x)-min(x))
(5)
用于提取水體的特征由水體指數、陰影水體指數、LBP局部紋理和顏色特征組成,采用特征值串聯的方式將多種不同類型的特征進行特征融合。則每張遙感影像生成特征影像具有的總維數為:1+1+1+2=5。
水體邊界提取可以歸屬于影像二分類問題,目前常用的分類器為支持向量機(support SVM)分類器、隨機森林(RF)分類器、AdaBoost集成分類器以及極限學習機等常用的分類器等。文章從提取多種不同特征出發,采用多種分類器進行實驗對比分析,最終選擇分類效果最佳的極限學習機作為分類器。實驗環境為Windows 7 CoreTM i7-7820X,顯卡為麗臺Quadro P5000(NVID公司,美國)。利用MATLAB環境運行,SVM分類器選用LibSVM庫提供的CSVM模型,核函數參數Gamma取值為0.07,懲罰因子c取值為2。隨機森林分類器選用MATLAB機器學習庫,其中樹的結構數選用100。
文中提取水體指數、陰影水體指數、LBP局部紋理特征以及顏色特征,為了充分挖掘多特征組合的優勢,探討適合融合特征的分類器,分別采用SVM、RF、AdaBoost以及極限學習機分類器對提取的融合特征進行訓練與分類實驗,不同分類器水體粗檢測結果如表1所示。從表1可以看出,極限學習機分類方法對本文選取的多種特征的適應性優于其他分類器。

表1 不同分類器水體提取精度驗證
利用機器學習機分類器對整幅遙感影像上的每個對象進行檢測,判斷影像對象是否屬于水體區域。初始檢測的結果存在一定的誤檢測的結果,包括非水體區域的誤檢測對象、水體區域的誤檢測對象。因此,需要對初始檢測結果進行優化處理,剔除錯誤的檢測結果,提高整體檢測正確率。本文利用非水體對象與水體對象的RGB顏色空間距離、LBP紋理相似程度以及角點分布差異剔除誤匹配對象。
(1)顏色空間判斷依據

(6)
表示待檢測對象與水體區域顏色空間的歐式距離。若該對象為非水體對象,則其在顏色空間與水體對象的距離較大,因此采用指數函數PRGB作為判斷水體的依據:
PRGB=10DRGB,q
(7)
(2)LBP紋理相似程度
依據文章1.3部分介紹的LBP紋理提取方法,計算該對象各個波段的紋理特征值向量mLBP,q,為避免噪聲影響對于大區域的對象采用同顏色空間處理一致的策略,計算紋理均值mLBP, 在紋理特征空間中計算待檢測對象與水體對象間的距離DLBP,q=|mLBP,q-mLBP|,從而可以計算待檢測對象與水體對象在紋理特征空間的相似程度:PLBP=10DLBP,q。
(3)角點分布差異依據
在遙感影像上水體區域相對比較平坦,復雜物體的邊緣以及角點特征數量都比較少,而非水體區域存在大量的角點與邊緣線。本文利用MinEigen算子提取遙感影像上角點特征,并計算影像對象上對應角點數量。利用影像對象上存在的角點總數N與像素總數S的比值作為判斷角點分布差異性指標,即mcorner,q=N/S,在面積較大的水體對象上同樣取5個面積相同的子區域計算均值mcorner,計算角點分布差異Dc,q和相應角點分布判斷依據Pc為:
Dc,q=|mcorner,q-mcorner|
(8)
Pc=10Dc,q
(9)
若Pc (4)投票決策 綜合上述判斷準則,依據軟投票的思想決策待檢測對象是否為水體區域,待定對象的最終決策函數為: P=PLBP+PRGB (10) 將投票值C 實驗采用的訓練數據集為武漢大學發布的Gaofen Image Dataset(GID),該數據集包含150景高質量的高分二號影像,影像空間分辨率為1 m全色影像和4 m的多光譜影像,影像大小為6 908×7 300像元,多光譜提供藍色、綠色、紅色、近紅外等四個波段影像。選取6塊數據作為訓練數據,對訓練數據進行旋轉、平移處理便可以產生更多的樣本數據,選取訓練樣本數據包括山川、城市、田野、河流和森林等不同目標。為了定量評價本文提出水體檢測方法的性能,采用測試數據進行實驗,利用水體提取結果的召回率R、精確率P以及準確率A等指標進行評價。采用Tp表示檢測為水體對象中正確的數量,Fp表示檢測為水體對象中錯誤的數量,Tn表示檢測為非水體對象中正確的數量,Fn表示檢測為非水體對象中錯誤的數量。則R、P以及A的計算表達式為: R=Tp/(Tp+FN) (11) P=Tp/(Tp+Fp) (12) A=(Tp+TN)/(Tp+FN+Fp+TN) (13) 通過實驗統計選取6塊樣本數據結果的平均值得到極限學習機檢測粗水體與優化后結果的正確率對比如表2所示。從表2中可知,初始檢測結果的正確率為91.35%,但其召回率與精確率相對較低,因為水體檢測結果存在大量的漏檢與誤檢結果。通過利用多判據軟投票法優化粗分類結果,剔除誤檢與漏檢結果后,召回率與準確率均有所提升,精確率為95.86%,召回率與準確率分別提高到91.85%與92.33%,證明該方法的有效性。 表2 水體粗檢測結果優化前后對比結果/(%) 采用極限學習機分類器訓練樣本數據時,依次提取影像對象的水體指數、陰影水體指數、LBP局部紋理以及顏色特征信息,構建5維的特征空間向量,利用極限學習機分類器分類后得到模型。選取兩組高分二號數據的遙感影像如圖2(a)所示,利用極限學習機分類器獲得檢測結果如圖2(b)所示,利用多判據軟投票優化的結果如圖2(c)所示。 圖2 提取結果對比 由圖2可知,利用極限學習機分類器提取水體信息時,由于水體與陰影在近紅外波段有交叉部分,提取結果中包含大量建筑物的陰影信息與小面積的陰影信息。通過后期的多判據軟投票法去除陰影與建筑區域的干擾,提取出的水體信息較好,基本與目視解譯結果一致。 本文提出的多特征融合的遙感影像水體提取方法選取兩組高分二號的影像數據為研究區域,分別提取影像的水體指數、陰影水體指數、LBP局部紋理特征以及顏色特征等多種特征,并將多種特征融合,利用多種學習機分類器提取研究區域的水體信息。實驗結果表明,通過引用多判據軟投票方法能有效剔除抑制陰影信息的干擾,快速提取城市河道水體信息,總體準確率在94%以上,為高分辨率衛星遙感影像提取城市寬度較窄的河道信息提供一定的輔助和參考。但是文中缺少水體的水質變化情況對檢測結果的影響分析,這將是下一步的研究方向。3 實驗結果分析


4 結 論