高雷亭,阮仁宗,顏梅春,歲秀珍,傅巧妮
(1. 河海大學 地球科學與工程學院,江蘇 南京 210098)
湖泊濕地作為濕地的一個重要類別,對全球變化、國民經濟建設及可持續發展有極其重要的作用[1]。近幾年,國內外學者在濕地分類方面做了很多工作。王紅娟等利用兩個季節的洞庭湖ETM數據,并輔以物候特征和地面GIS信息,通過專家分類知識庫建立決策樹分類方法,分析洞庭湖濕地的影像分類[2];那曉東以三江平原為例,利用TM數據探討中國典型淡水沼澤濕地信息的提取方法[3]。李慧以閩江河口濕地為例,基于決策樹方法設計了兩期影像的決策樹分類模型,實現濕地信息的快速自動提取[4]。Wright綜合Landsat TM紋理特征和輔助環境特征,采用決策樹方法提取美國黃石國家公園濕地的空間分布[5]。雖然光譜特征是濕地識別與分類的重要依據,然而單純利用光譜分類,往往存在“同物異譜”和“異物同譜”問題,分類精度不夠理想。除光譜特征外,遙感圖像擁有的紋理特征給圖像分類提供了一個新的依據。本文結合光譜信息、紋理特征變量和纓帽變換的前3個指數,構建了一個知識規則模型,并將其用于洪澤湖濕地的地物分類提取,顯著提高了分類精度。
洪澤湖是我國五大淡水湖之一,在北緯33°6'~33°40'、東經 118°10'~118°52'之間。洪澤湖及其周邊有湖泊、養殖場、河流、沼澤、林地、灘涂等多種濕地生態系統,生物多樣性非常豐富,僅灘地上生長的水生植物就有30余種,主要分布在湖區的西部,蘆葦比較集中地分布在淮河入湖尾閭的洲灘上。天然的濕地植被為多種珍禽鳥類(如大鴇、東方白鸛、小天鵝、丹頂鶴等)提供了棲息、繁殖、捕食和越冬的理想場所,也為魚類提供了良好的生長和繁殖場所,具有很大的經濟和生態研究價值[6]。研究區主要濕地類型的分類體系如表1所示。

表1 研究區濕地類型分類體系
本文選用2006-09-09的Landsat5 TM影像。首先利用洪澤湖地形圖對影像進行幾何精校正,使均方誤差控制在0.5像元以內。然后,裁剪出東經118°12'21"~118°29'40",北緯 33°8'41"~33°24'52"的洪澤湖濕地自然保護區為研究區。
光譜響應特征是遙感影像地物識別最直接的解譯元素。通過對圖像光譜特征曲線的分析,可以對不同波段進行運算和組合,從而得到分類中十分重要的參數[7]。圖1是對研究區采樣統計得到的各類地物光譜曲線,可以看出挺水植物在近紅外(TM4)波段的光譜亮度值明顯高于其他地物,很容易區分出來。在TM5波段,沉水植物、浮水植物、敞水區與其他地物的像元亮度值差異也較大,可以依據這兩個波段提取出浮水植物。在TM3波段,敞水區的像元亮度值接近50,而沉水植物、浮水植物和挺水植物均低于30,光譜特征差異也較大。
然而在TM1、TM2、TM3波段,挺水植物、浮水植物、沉水植物和養殖場的光譜特征非常相似,僅憑光譜信息進行分類很容易出現“同物異譜”或“異物同譜”的現象;敞水區、養殖場和沉水植物在TM4、TM5、TM7波段光譜特征也很相似,無法用光譜將它們分開。這時,需要利用遙感影像的另一個重要特征——紋理特征。

圖1 研究區主要地物光譜曲線
紋理不僅反映了影像的灰度信息,而且反映了地物本身的結構特征和空間排列關系。綜合運用光譜信息和紋理信息,可以提高影像分析的精確性[8,9]。灰度共生矩陣是一種常用的紋理分析方法,能較好地反映紋理灰度級的相關性規律[10]。通過對比不同波長、方向、窗口的灰度共生矩陣紋理特征,發現3×3窗口、步長d=1、方向45°的灰度共生矩陣紋理特征對研究區地物具有較高的區分能力。由此,計算了均值、標準差、熵、角二階矩陣和相關性5個紋理測度[11,12]。
從研究區地物的紋理特征圖可以看出(圖2),相關性特征對地物的區分性較高,可以將挺水植物、養殖場和浮水植物從整個地物中提取出來,可以以此作為區分地物的特征值。

圖2 研究區各地物在紋理波段上的特征曲線
將亮度、綠度、濕度作為測試變量。分別將遙感影像的波段光譜數據轉換為三維數據,即亮度軸、綠度軸和濕度軸。由于不同類型的光譜響應特征不同[13],各類地物特征分布空間在亮度-綠度平面內顯示一定的可分性,如圖3所示。

圖3 不同地物的濕度、綠度、亮度變化圖像
本研究采用以下6個測試變量:Landsat TM影像2個波段灰度值(TM4、TM5),2個紋理特征值(MEAN、COR),2個KT變量(濕度、綠度),目標變量為挺水植物、浮水植物、沉水植物、敞水區、養殖場和其他6大類。

圖4 研究區決策樹模型
CART(classification and regression tree)是Breiman于1984年提出的決策樹構建算法,其基本原理是通過由測試變量和目標變量構成的訓練數據集的循環分析而形成二叉樹形式的決策樹結構。CART是分類數據挖掘算法[14],從眾多的預測屬性(模型的輸入屬性)中選擇一個或多個屬性的組合,作為樹節點的分裂變量,把測試變量分到各個分枝中,重復該過程建立一棵充分大的分類樹,然后用交叉驗證法進行修剪,最終形成一棵兼顧復雜度和錯誤率的最優二叉樹[15-17]。
CART決策樹算法對融合后影像的光譜特征值、紋理特征變量以及KT變換的前2個分量合并的波段組合數據進行計算,生成的決策樹(圖4)閾值為達到決策樹最佳預測性能時的閾值。可以看出,紋理均值及相關變量可以將養殖場從浮水植物和沉水植物中區分出來,再用濕度變量區分沉水植物和浮水植物。TM5波段及綠度變量可以將敞水區從其他地物中分離出來,而挺水植物則可由TM4波段提取。
結合分類規則和圖4,觀察生成的CART決策樹可以發現,其中N0(結點序號從0開始,按照每一棵子樹從左往右依次編號)就是樹的根結點,N1和N2是根結點的第一個分支。在每個結點中,注明每一類別所包含的樣本單元數及非純度量(imp)。樹越往下,結點中的樣本單元越“純”。從圖4可以看出,用來分隔第一個結點的波段是紋理均值,共有625個像元樣本點。其中灰度值≤18.5的244個樣本單元被分入左結點,而灰度值>18.5的381個樣本單元被分入右結點。分完后,其非純度量(Gini索引)改變為0.112,即“純度”提高了0.112。也就是說,在所有參與分類的波段,所有潛在的分割點中,紋理均值為18.5的分割點能使分完后兩部分的“純度”增值最大,這也從另一個方面說明了參與分類的波段的重要性大小。在一棵樹中,如果某波段參與分割結點的次數越多,則說明該波段對分類的貢獻越大。有多少個葉結點,就有多少條地物類型的判別準則。在本研究中,針對研究區生成的決策樹共有8個葉子結點,對應8條判別準則,其中沉水植物和挺水植物各有兩條判別準則,最后的分類結果如圖5所示。

表2 最大似然分類精度評價表

表3 CART分類精度評價表

圖5 2006年洪澤湖研究區分類圖
為了直觀地查看CART決策樹分類法對提高分類精度的效果,本文將CART決策樹分類后的精度結果與僅使用光譜特征分類的結果進行比較。首先利用最大似然算法對研究區的光譜影像進行非監督分類,分類精度評價結果如表2所示,CART決策樹分類精度評價結果如表3所示。
精度評價表中的用戶精度對應的是錯分誤差,生產者精度對應的是漏分誤差,它們從不同側面描述了分類精度。從表2可知,僅使用傳統分類算法,沉水植物的用戶精度只有39.82%,這主要是因為沉水植物和養殖場的光譜特征很相似,而且在該研究區中,養殖場中分布著很多沉水植物,導致養殖場與沉水植物混淆。敞水區的非監督分類結果也比較低,生產者精度為59.81%。而運用CART算法進行分類后,其精度有了很大提高,沉水植物的用戶精度提高到85.71%,浮水植物提高到92.39%,敞水區的分類精度也提高到96.36%。然而,由于參與驗證的點數有限,有些類別如養殖場驗證點數較少,精度較低,導致總體精度偏低。
基于CART的決策樹分類結果優于最大似然法分類。利用灰度共生矩陣提取出圖像的紋理信息(均值和相關性)以及KT變換的綠度指數等被用于決策規則的生成,對比由分類成果圖結合原始影像目視解譯結果,制定的分類規則具有一定的可行性。由于受資料、人為因素及其他因素影響,分類結果中存在一定的誤差。對于特征波段的選擇、計算方法以及檢驗都有待于進一步完善,需通過優化分類算法來提高分類精度。
[1]譚衢霖.鄱陽湖濕地生態環境遙感變化監測研究[D].北京:中國科學院遙感應用研究所,2002
[2]王紅娟,姜加虎,黃群.基于知識的洞庭湖濕地遙感分類方法[J].長江流域資源與環境,2008,17(3):370-373
[3]那曉東,張樹清.基于決策樹方法的淡水沼澤濕地信息提取——以三江平原東北部為例[J].遙感技術與應用,2008(8):365-372
[4]李慧,余明.基于決策樹模型的濕地信息挖掘與結果分析[J].地球信息科學,2007,9(2):60-72
[5]Wright C, Gallant A. Improved Wetland Remote Sensing in Yellowstone National Park Using Classification Trees to Combine TM Imagery and Ancillary Environmental Data[J].Remote Sensing of Environment, 2007,107:582-605
[6]王洪道,竇鴻身,汪憲臣,等.中國的湖泊[M].北京:商務印書館,1996
[7]何厚軍,王文,劉學工.基于決策樹模型的海岸帶分類方法研究[J].地理與地理信息科學,2008,24(5):25-28
[8]譚瑩.翁源縣基于紋理信息及CART決策樹技術的遙感影像分類研究[D].南京:南京林業大學,2008
[9]馮建輝,楊玉靜.基于灰度共生矩陣提取紋理特征圖像的研究[J].北京測繪,2007(3):19-22
[10]Haralick R M. Statistical and Structural Approaches to Texture[J].Proc IEEE,1979, 67(5): 786-804
[11]Treitz P,Howarth P. Integrating Spectral, Spatial, and Terrain Variables for Forest Ecosystem Classification[J]. photogrammetric Engineering & Remote Sensing,2000,66(3):305-317
[12]Franklin S E, Pebble D R. Spectral Texture for Improved Class Discrimination in Complex Terain [J]. International Journal of Remote Sensing, 1989,54:1 727-1 737
[13]夏雙,阮仁宗,顏梅春,等. 洪澤湖濕地類型變化分析[J].南京林業大學學報:自然科學版,2012,36(1):38-42
[14]Mclver D K, Fried1 M A.Using Prior Probabilities in Decision-tree Classification of Remotely Sensed Data[J].Remote Sensing of Environment,2002,81:253-261
[15]Breiman L,Friedman J H,Olshen R A ,et al. Classification and Regression Tree[M]. Monterey, California: Wadsworth International Group,1984
[16]Yohanne S Y,Hoddinot T J. Classification and Regression Tree:An Introduction[M]. Washington D C: Internation Food Policy Research Institute,1999
[17]李俊杰,何隆華,戴錦芳,等.基于遙感影像紋理信息的湖泊圍網養殖區提取[J].湖泊科學,2006,18(4):337-342