,,
(大連科技學院 信息科學學院,遼寧 大連 116001)
隨著當今科技的發展,遙感影像技術在科研及社會生產中得到廣泛的應用,如農業監測、地理情況分析、天氣監測等,遙感影像分類更是其核心技術,多年來被研究人員重點研究與應用。遙感影像分類大多對遙感影像的光譜圖提取出特征[2],對像元進行分類,常用算法有決策樹算法[3]、K-Means[4]等。其中,決策樹算法屬于分類預測,通過多預先收集的樣本數據分析,構造決策樹用于特征分類。因為遙感圖像的特征多樣性,光譜特征不能將遙感圖像特征很好的描述出來,所以需要對遙感圖像特征進行運算處理,來有效的描述特征空間,再用來分類。常用的特征運算有K-T變換[5]、比值變換[6]以及差值變換[7]等等。隨著研究者的深入研究,后來產生了面向對象的分類方法,即先分割,再分類。傳統的遙感影像特征提取只能在單個像素上進行依靠光譜信息的特征提取,高分辨率的遙感影像由于波段較少,光譜分辨率不高,如果只提取光譜特征而忽略其他特征信息,則會降低分類精度,影像實驗結果[8]。所以,當對較高分辨率的遙感影像進行分類時,宜采用面向對象的遙感影像分類。
遙感影像的光譜特征極其復雜,經常會出現兩個不同的地物有同一光譜,或者兩個不同地物卻有著相同的光譜。僅依靠遙感圖像的光譜特征與紋理特征分類是不能保證分類效率與精度完全準確的,所以本文需要進行整合,共有三種整合方式:(1)分類前,對訓練元組進行人為地補充,使其更完善;(2)分類中,輔助數據參與分類;(3)分類后,改正分類結果中不正確的分類。在第二種整合中,輔助數據需要進行量化處理,以便用于分類實驗中新增波段參與分類,本文可以將它當做一個獨立的數據。
本文將分形和決策樹分類算法相結合,采用分形數學描述地物的紋理特征,將多光譜影像和紋理圖像結合,以改進決策樹分類器開展遙感影像分類研究。
目前,應用分形理論進行遙感影像分類的研究也有很多,主要集中在分形維數計算方法以及基于分形維數的遙感影像分割等方面[9]。分形理論在紋理分析的應用中,通常采用分形維數來描述紋理[10]。分形維數用來表示自然界中地物的不規則程度,其并不一定是整數,分形維數也可以用分數來表示,與歐氏幾何中的整數維有明顯的差別。分形維數最大的特點是其與人的視覺感受相互一致,即影像表面越粗糙,分形維數越大。而且分形維數在多尺度,即多種空間分辨率上具有不變性。因此使用分形維數能夠很好地描述遙感影像的紋理特征。
分形維數的計算方法有差分盒維數法[11]、基于灰度插值法[12]、基于分型布朗運動自相似模型[13]的方法、以及毯覆蓋模型[14]等方法。
本文采用Peleg提出的計算灰度圖像分形維數的毯覆蓋模型來計算遙感影像的分形維數。毯覆蓋法將圖像視為有一定高度的山體,高度為圖像的灰度值。在距離山體表面ε的上下方鋪蓋厚度為2ε的毯子。設遙感影像的灰度值為g(i,j),毯子的上表面用aε表示,下表面用bε表示,公式(1)表示初始條件,上下表面的生長原則分別為公式(2)、(3),其中d表示(m,n)和(i,j)兩點之間的距離。
g(i,j)=a0(i,j)=b0(i,j)
(1)
aε(i,j)={max{aε(i,j)+1,maxaε(m,n),
d(i,j,m,n)≤1,ε=1,2,...}
(2)
bε(i,j)={min{bε-1(i,j)-1,minbε-1(m,n),
d(i,j,m,n)≤1,ε=1,2,...}
(3)
因此毯子的容積為:
Vε=∑i,j(aε(i,j)-bε(m,n))
(4)
表面積為:
(5)
分形表面積符合關系式A(ε)=Fε2-D,所以
logA(ε)=c1logε+c0
(6)
其中,c1=2-D為擬合的直線的斜率,通過改變尺度ε的大小,可以求出不同的c1,從而可以求出分形維數D。
特征提取是基于像元遙感影像分類中的最重要步驟之一,遙感影像的光譜特征與空間特征有很多,但是不是所有特征都可用于遙感影像分類。所以要從眾多的特征中選擇出可用于遙感影像分類的特征。之后還要進行提取,才能進行分類。常用的提取方法如下:
纓帽變換也成為K-T變換,即將一幅遙感影像解譯出幾個數據,濕度指數、綠度指數和亮度指數等[15],如公式(7)所示:
Y=RTx+r
(7)
其中,R為纓帽變換系數,r為常數偏移量。X和Y分別為變換前后多光譜空間的像元矢量。對遙感影像光譜圖的1~5波段和7波段進行纓帽變換,R如公式(8)。

(8)
對遙感影像進行植被生長情況分析會用到植被指數,利用遙感影像光譜圖近紅外波段與紅外波段反射值之差與之和的比值可以反映植被特征[16]。依據植被指數就可以對一幅遙感影像中的植被進行分類。常用的植被指數有歸一化植被指數(NDVI)。可由公式(9)得出:
(9)
其中,Pnir和Pred分別為遙感多波段影像中的近紅外波段和紅波段的反射值;如果得到的數值處于0.3-0.7之間都代表植被特征,可以用于分類。
不是所有的影像都在很小區域能呈現規則性,但是大范圍的整體卻能體現出規則這就是紋理特性。在遙感影像分類中,將紋理特征作為輔助特征進行分類,可提高分類的正確率。本文知道紋理特征需要對像元集進行處理,需要特定的測試算法可以采用統計量算法[17],需要用到的統計量有均值(10)、方差(11)和熵(12),其計算需要用到總像元數目,記為w,第i級灰度概率fi,以及第k波段的量化等級,記為quantk。
(10)
(11)
(12)
由于遙感影像的特征提取過于繁瑣,不在本文的研究范圍內,所以在前文介紹了原理,實踐操作需借助第三方軟件ENVI 5.1來實現。本文采用的遙感影像為Landsat7 ETM+遙感影像,其數據波段的第六波段是熱紅外,不能有效反應不同地物的特征,對于分類無實際意義,所以不采用。第一至第五以及第七波段中有RGB可見光波段,包括一個B4近紅外,區分地物類型。
下面應用ENVI5.1軟件,介紹變換提取Landsat7 ETM+遙感影像特征數據過程。
(1)打開一個Landsat7 ETM+數據。
(2)Toolbox中,選擇/Radiometric Correction /Radiometric Calibration,選LC8多光譜數據。
(3)校準類型:點擊Reflectnace,指定輸出文件的路徑和文件名稱執行即可
(4)在主界面中,選擇File->Save as,選擇LC8大氣表觀反射率定標結果,再點擊Spectral Subset按鈕,選擇后面6個波段。
(5)在Toolbox中,選擇Transform/Tasseled Cap。在文件對話框中選擇上一步得到的數據文件。
(6)在Tasseled Cap Transform Parameters面板中,傳感器類型選擇Landsat7 ETM。
(7)選擇輸出路徑和文件名
實驗選擇預處理后的2015年夏季北京市landsat 7多光譜遙感影像,裁剪得到北京市五環內區域。為了進一步去除影像中的噪聲和干擾,對影像進行主成分變換。
首先進行主成分正變換,發現前三個主成分已經占據了原始影像中的絕大多數信息,而且自第4主成分起,圖像中出現了明顯的噪聲,所以選取前三個主成分進行主成分逆變換,得到北京市五環內變換后遙感影像,如圖1所示。

圖1 主成分變換影像
通過資料搜集以及觀察變換后圖像可以發現,研究區域內的主要地物類型有建筑物、植被、道路以及水體,幾乎沒有裸地,故而分類時將區域內的地物類型區分為建筑物、植被、道路、水體四類。為了最大程度利用影像的信息,選取了信息量最大的第一主成分灰度圖像來計算分形維數,如圖2所示。

圖2 第一主成分
在本實驗過程中,試驗了3×3,5×5,7×7的窗口以及不同的毯子覆蓋的尺度范圍,提取紋理特征圖像。分析后發現使用5×5大小的窗口,且毯子覆蓋的尺度的范圍為50-100時提取的紋理最為豐富且最后參加分類得到的效果較好,如表1所示。

表1 分類精度
從表1可以發現,加入紋理特征后的分類總體精度和Kappa系數相比于純光譜數據都有提高,總體精度提高了1.051 3%,Kappa系數提高了0.011。這說明了紋理特征與光譜特征結合可以改善分類的效果,基于分形理論的紋理特征有助于分類精度的提高。

圖3 毯覆蓋算法提取的紋理特征圖像
觀察圖3紋理特征圖像可以發現,建筑物密集分布的區域圖像亮度較大,代表該區域的紋理復雜;而大面積的植被以及道路和水體等表面較光滑的區域圖像亮度偏暗,代表這些區域的紋理復雜度小。這也表明了該圖像能夠反映出地物的紋理復雜程度。
根據北京市五環內的地物特點,將土地類型分為建筑物、道路、植被、水體四種,并分別選取一定數量的樣本。將計算得到的紋理特征與光譜特征結合,使用決策樹分類器進行分類;使用相同的樣本,使用決策樹分類器只對光譜數據進行分類,對分類結果分析比較。分類器的各項參數采用默認值。分類結果如圖4,圖5。

圖4 光譜特征和紋理特征結合的分類結果

圖5 僅利用光譜特征的分類結果
表2和表3可以看出,加入紋理特征數據后,紋理特征明顯的道路和植被的分類精度都有所提高。其中道路數據的用戶精度提高幅度最大。

表2 基于光譜特征分類的用戶精度

表3 基于光譜特征和紋理特征結合分類的用戶精度

圖6 純光譜特征分類結果

圖7 光譜特征和紋理特征結合的分類結果
圖6和圖7可以發現,加入紋理特征后,道路與建筑物的區分度得到較大的提高,部分錯分為道路的建筑物重新劃分為建筑物。這主要是因為landsat7遙感影像中,道路和建筑物的光譜特征非常接近,只利用光譜特征進行分類時,這兩種地物類型容易混淆;但是這兩種地物的紋理特征有較大的差別,建筑物的紋理是破碎的塊狀,而道路的紋理大多數為長條狀,兩者的紋理復雜度有較大的區別,所以根據紋理特征可以較好的將這兩種地物區分開來。
利用改進決策樹分類,關于精度評價方面,本文隨機采樣對其進行精度評價,對于錯誤的分類借助GPS,實地考察進行糾正,利用了總體分類精度、Kappa系數和混淆矩陣。為了驗證算法改進是否有效,對實驗結果進行了橫向對比,如表4所示。

表4 幾種算法比較
由表4可以觀察出,與傳統Boost Tree分類算法相比,本文改進的組合決策樹算法更優越;與C5.0相比,本文設計算法與其相比,分類精度也幾乎一樣。
傳統的分類方法局限于遙感影像的光譜特征,容易由于同物異譜、異物同譜等原因造成分類結果精度不高。本文研究表明,利用分形理論可以有效地描述遙感影像的紋理特征。相比于傳統的只利用光譜特征改進決策樹分類的方法,通過第三方軟件ENVI對遙感影像進行了特征提取,融合光譜特征和分形紋理特征有助于決策樹分類算法精度的提高,特別是對于紋理特征明顯的地物的分類效果更佳。本實驗的不足之處首先在于毯覆蓋算法只計算出了特定尺度范圍下的分形維數,其次是決策樹分類算法計算所需時間較長。而當紋理結構不同時,應當選擇不同的尺度,才能更好地描述分形特征。在后續的研究中,應當對算法進行改進,采用多尺度分維的方法估算分形維數,從而更好地反映分形特征。