楊宇暉, 顏梅春, 李致家, 余青, 陳貝貝
(河海大學地學院地理信息科學系,南京 210098)
南方丘陵地區(qū)復雜地表“同物異譜”分類處理模型
楊宇暉, 顏梅春, 李致家, 余青, 陳貝貝
(河海大學地學院地理信息科學系,南京210098)
摘要:復雜流域地物混雜,因受背景干擾,對混雜在不同背景地物中的目標地物很難用1個規(guī)則區(qū)分出來。基于Landsat8多波段影像,以湘江的Ⅰ級支流蒸水河流域和長江三角洲的3大城市為研究區(qū),采用最大似然法進行初步分類; 分析混雜地物的光譜特征,探討區(qū)分混雜地物的決策規(guī)則,對水體、人工建筑、耕地、裸地、林地和裸巖等基本地物進行分類。結果表明,蒸水河流域分類的整體精度達到88.21%,高于監(jiān)督分類精度(79.68%); 其他3個長江三角洲城市的分類精度都在92%以上。所提出的混雜地物區(qū)分模型可以提高混雜在不同背景中的同類地物的分類精度。
關鍵詞:混雜地物; 同物異譜; 決策樹分類; 南方丘陵地區(qū)
0引言
遙感因其同步觀測面積大、時效性強、經濟效益大等特點,可迅速而準確地全方位監(jiān)測土地資源的利用情況,實時掌握土地資源的利用信息,為土地資源的合理利用和科學管理提供技術支撐[1]。遙感影像分類是獲取地物屬性信息的重要手段。由于地物反射光譜存在“同物異譜”和“異物同譜”現(xiàn)象,尤其對于反射特性相似的地物,遙感影像分類難免會有類別混淆和錯分現(xiàn)象[2]; 而混雜于不同地物背景下的同類地物會呈現(xiàn)不同的光譜特征而被區(qū)分為不同類型。這也正是傳統(tǒng)監(jiān)督分類在處理復雜地形和雜亂地物時精度不高的根本原因[3]。我國南方丘陵地區(qū)因地勢崎嶇、干擾因子多,故對丘陵地區(qū)的影像解譯要比平原地區(qū)困難得多,遙感分類出現(xiàn)錯分和漏分的情況會更為明顯。
傳統(tǒng)的監(jiān)督分類是利用地物光譜的普遍規(guī)律進行統(tǒng)計分析和歸類,因而很難處理不同背景地物光譜的干擾; 面向對象的分類方法雖然主要針對“同物異譜”現(xiàn)象進行分割和分類,但在面對小而破碎的地物時也常常無能為力[4]。因此,基于對不同背景下地物光譜特征的分析,能否采取適宜的數(shù)據處理及分類方法變得十分重要。決策樹分類法利用典型地物的反射光譜曲線分析類別間的光譜特征差異,因地制宜地定義分類規(guī)則,最大限度地挖掘不同地物間的光譜差異進行地物分類; 并可根據分類結果靈活地修改不完善的規(guī)則,在監(jiān)督分類的基礎上進一步提高分類精度,為后續(xù)決策提供保障[5]。本文擬在傳統(tǒng)方法監(jiān)督分類結果的基礎上,建立混雜于不同背景下的地物區(qū)分決策模型。
1研究區(qū)概況與數(shù)據源
選擇湖南省的蒸水河流域和長江三角洲的蘇州市、上海市和杭州市作為研究區(qū),它們的共同特點是地處長江以南,氣候濕潤,水網密布,植被茂盛,物產富饒,地形復雜多變。蒸水河流域屬于長江支流湘江的Ⅰ級支流,發(fā)源于湖南省邵陽市的邵東縣最高峰大云山腳下,全長約200 km; 地處大陸性亞熱帶季風濕潤氣候區(qū),四季分明,水熱豐沛,年均降雨1 500 mm左右,易發(fā)生洪澇或干旱; 流域內地形以丘陵為主,水網密布,地表破碎。
利用航天飛機雷達地形測繪使命(shuttle Radar topography mission,STRM)數(shù)據在ArcGIS相應工具中生成DEM數(shù)據,進而生成流域輪廓,通過拼接裁剪得到蒸水河流域和長江三角洲的遙感影像。選用美國陸地衛(wèi)星Landsat8陸地成像儀(operational land imager,OLI)于2013年9月19日獲取的B1―B7波段影像數(shù)據,光譜波段有藍(B1,B2)、綠(B3)、紅(B4)、近紅外(B5)和短波紅外(B6,B7),空間分辨率為30 m。對各波段影像進行輻射校正后,再做幾何精糾正和影像配準,誤差小于1個像元。根據經驗,本文選擇OLI的B5(R)B4(G)B3(B)波段組合數(shù)據,獲得假彩色合成影像,以提高影像的直觀目視效果。
2分類方法與模型
研究區(qū)土地覆蓋主要有水體、人工建筑、耕地,林地、裸巖、裸土和耕地2(已收割)等7類。在秋收季節(jié),收割后耕地的影像特征與裸地非常相似,但與未收割耕地的光譜差異較大,因此可將已收割的耕地單獨分為1類。雖然決策樹分類的方法原理與其他監(jiān)督分類一樣,都是基于對地物光譜和影像特征的分析[6-7],但它又作為一種基于空間數(shù)據挖掘和知識發(fā)現(xiàn)的監(jiān)督分類方法,在遙感分類問題上表現(xiàn)出很大的優(yōu)勢,如訓練速度快、執(zhí)行快; 對數(shù)據分布形式不做假設,可獲得非線性的映射; 非黑箱式操作,可形成易于人們理解的規(guī)則,具有內置的特征選擇能力等[8]。
2.1光譜特征分析
多光譜影像特征在分類和信息提取過程中至關重要[9]。本文以光譜特征為主,利用ENVI軟件中的感興趣區(qū)域(region of interest,ROI)工具選取各種典型地物的樣本數(shù)據,并統(tǒng)計得出不同地物的反射光譜特征。取各波段的平均值,得到了各類地物的反射光譜曲線(圖1)。

圖1 各類地物的光譜特征分析
從圖1可以看出,各類地物反射特征的區(qū)別主要表現(xiàn)在B4―B7波段。在建立樣本訓練區(qū)進行監(jiān)督分類時,通常會在同種地物大片集中處獲取訓練樣本的特征,以保證樣本的純凈度; 但卻忽略了復雜地表和破碎地帶不同地物間的相互干擾現(xiàn)象,導致地物邊緣帶像元分類精度受損。在江南丘陵地區(qū),此問題就變得尤為突出,因此,了解地物間光譜相互干擾導致的“同物異譜”程度并尋求解決方案,可以提高分類精度。以OLI B5波段影像為例,分析影像中同種地物在不同地物背景下的各波段像元亮度平均值(表1)。

表1 不同背景下同種地物的混雜光譜特征
由表1可以看出,同種地物混雜在其他地物中的光譜反射值會與單純該地物的光譜反射值有所差別,一般會更加趨近背景地物的光譜反射值。利用這一點,分析各波段光譜反射值和其他指數(shù)與特征,為進一步分類提供可靠依據。
2.2混雜地物的識別特征
1)水體。由于水體受污染程度不同,在影像中有時會呈暗灰色; 而城鎮(zhèn)建筑較為密集的區(qū)域因受光照角度的影響,在影像中則呈較亮的灰黑色,兩者較易混淆。歸一化差異建筑指數(shù)(normalized difference building index,NDBI)可較好地將人工建筑物與其他地物區(qū)別開來,利用NDBI<-0.15可將混分到建筑中的水體大致分出。由于不同地物像元亮度值有所差異,所以利用(B3-B4)>0 且B7>5 120可將混在水體中的建筑提取出來。歸一化差異植被指數(shù)(normalized difference vegetation index,NDVI)利用近紅外與紅光波段的反射值之差除以兩者之和,不僅可用于提取植被,也是反映農作物長勢和營養(yǎng)信息的重要參數(shù)之一。混在水體中的耕地可利用植被指數(shù)NDVI>0.3大致分出; 由于林地和水體在B5波段上差值很大,可利用B5>1 330直接將混在水體中的林地提取出來。
2)植被。單純利用NDVI指數(shù)還不能足以區(qū)分不同的植被類型,尤其是耕地與林地的NDVI指數(shù)均大于0,一般情況下林地的植被覆蓋度大于耕地,因此林地的NDVI指數(shù)一般也大于耕地。但因研究區(qū)面積較大,且地物破碎,難以確定某個適當閾值單純地利用NDVI指數(shù)將耕地與林地區(qū)分開。引入B4波段影像的紋理信息熵Entropy>2.1,可提取混在耕地中的林地[9]。秋季耕地收割前后的反射率差別較大,但已經收割的耕地與人工建筑在影像上容易混淆,利用NDVI>0.15可將混在建筑中的耕地提取出來。
3)裸土。一般分布在城鎮(zhèn)尚未完成建設的施工工地和部分裸露山體上,多呈灰白或高亮度,容易與建筑物混淆。利用NDBI指數(shù)可將混在建筑中的裸土提取出來,由不同地物各波段光譜圖(圖1)可以看出,人工建筑在B5到B6波段呈現(xiàn)明顯下降趨勢,而裸土在B5和B6波段呈輕微下降趨勢,因此可簡單地利用(B5-B6)>500提取出混在裸土中的人工建筑; 利用(B2+B3-B4+B5)<1 550 可提取出混在建筑里的裸土。
4)建筑。根據上述規(guī)則基本上可將建筑與水體、植被、裸土分開。其余地物可用0 2.3混雜地物識別模型 即使是同種地物,在混于不同背景地物的情況下所采用的識別規(guī)則也有所不同,需根據目標類與背景類2種地物在特征波段的光譜特征進行具體分析,從而尋求有效規(guī)則[10]。例如耕地2為目標類時,可采用植被指數(shù)將耕地2與背景地物區(qū)分開。耕地2雖是收割后的耕地,但與裸土相比會有少許殘留植被,NDVI指數(shù)比裸土高,故利用NDVI>0.15可將以裸土為背景的耕地2提取出來; 而鄰近水域的耕地收割后殘留植被比遠離水域的耕地要多,加上近年來水體污染富營養(yǎng)化,水生植被茂盛,要將水邊的耕地2提取出來需要設置更高的閾值,因此利用NDVI>0.3可將水體周圍的耕地2提取出來。人工建筑以水體為背景時,由于兩者在B3,B4波段影像的反射值變化走向與B7波段影像的反射值差異較大,可利用(B3-B4)>0且B7>5 120將水體背景下的人工建筑有效提取。根據光譜特征圖(圖1)發(fā)現(xiàn),人工建筑在B6波段呈現(xiàn)明顯下降,而裸土在B6波段上則呈上升趨勢,利用(B5-B6)>500可將以裸土為背景的建筑物提取出來。耕地2為收割后的耕地,建筑指數(shù)為負值,以耕地2為背景的人工建筑可利用NDBI指數(shù)提取出來。耕地為目標類時,可以通過調整NDVI值,利用NDVI>0.15將人工建筑背景下的耕地有效地提取出來。林地為目標類時,在耕地背景下很難利用NDVI尋求適當閾值將其提取,在紋理分析時發(fā)現(xiàn)兩者在B4波段上的熵值有明顯差別,利用信息熵Entropy>2.1可將在耕地背景下的林地提取出來。水體在B5波段的反射值遠小于其他地物,因此水體背景下的林地可簡單地通過B5>1 330提取出來。 本文構建的混雜地物識別模型如圖2所示。 背景地物 識別模型目標地物 圖2混雜地物識別模型 Fig.2Classification model for mixed subjects 3結果與分析 對研究區(qū)進行最大似然法監(jiān)督分類,通過光譜和特征分析建立混雜地物區(qū)分模型,利用模型對監(jiān)督分類結果經過決策樹分類改進,以識別提取混在不同背景的地物,結果發(fā)現(xiàn),混雜現(xiàn)象得到了很大程度的改善。蒸水河流域部分地區(qū)分類結果對比如圖3。 (a) Landsat8 OLI B5(R)B4(G)B3(B)假彩色合成影像 (b) 傳統(tǒng)分類圖(c) 本文模型分類圖 圖3蒸水河流域不同分類結果比較 Fig.3Comparison of different classification results for Zhengshui River watershed 利用隨機散點進行蒸水河流域2種分類(監(jiān)督分類和本文模型)的精度評價混淆矩陣見表2和3。 表2蒸水河流域最大似然監(jiān)督分類混淆矩陣 Tab.2Confusion matrix of supervised classification by maximum likelihood for Zhengshui River watershed (像元數(shù)) 表3蒸水河流域混雜地物識別模型分類混淆矩陣 Tab.3Confusion matrix of classification by of mixed subject model for Zhengshui River watershed (像元數(shù)) 對長江三角洲地區(qū)3大城市2013年OLI影像的混雜地物識別模型精度評價的總精度(Kappa 系數(shù))分別為: 上海94.831%(0.934)、蘇州92.415%(0.902)、杭州95.849%(0.920)。 經過精度評價,各地區(qū)總精度和Kappa 系數(shù)都大于0.8,可見分類精度較高。在光譜特征明顯、像元類型較單一的植被覆蓋區(qū),2種方法均能取得較好的分類效果; 而在邊界存在混合像元的耕地和建筑、耕地和裸土、水體與裸土的混雜區(qū)都有漏分、錯分的情況。長江三角洲的3大城市的分類精度要高于蒸水河流域,其中1個主要原因是因為它們均處于沿海改革開放區(qū),也是我國的經濟發(fā)達區(qū),土地利用緊湊度要高于處于中部農村地區(qū)的蒸水河流域,地表破碎度相對較低,混雜現(xiàn)象不甚明顯。 4結論 1)南方丘陵地區(qū)由于地勢起伏、地物相互混雜、反射光譜互相影響,使得利用經典方法獲取訓練樣本的監(jiān)督分類精度不高。本文通過分析混雜于不同背景下的同種地物光譜特征的變化,在監(jiān)督分類基礎上研建了采用決策樹分類法的混雜地物識別模型,利用遙感影像地物內部光譜值差異和紋理等特征信息對影像進一步分類,減少了“同物異譜”、“同譜異物”現(xiàn)象對分類精度的影響,取得了較高的分類精度。 2)對1個流域和3大城市的分類實驗結果表明,在地表形態(tài)和地物類型相對復雜的蒸水河流域,本文模型可以得到較好的分類精度(88.21%),高于傳統(tǒng)采樣方法的監(jiān)督分類精度(79.68%); 而對地表地物混雜度相對簡單的長江三角洲3大城市的分類精度在92%以上。 3)應當指出,本文對一些較容易混淆的地物還是沒有達到很高的分類精度,例如耕地與林地雖然混分情況有所降低,但仍有進一步提高分類精度的空間。以往的監(jiān)督分類方法大多偏重于對方法理論模型的研究,較少針對特定形態(tài)地區(qū)的地物分布特征,開展簡單、實用、高效的一般性模型方法研究與開發(fā)。本文針對南方丘陵地區(qū)地物破碎復雜、實現(xiàn)高精度分類難度大的特點,提出了對混雜在不同背景下的同種地物實現(xiàn)單獨分類提取,取得了分類精度較好、效率較高的效果。本研究可為我國南方典型丘陵地區(qū)的地物分類提供參考模型。 參考文獻(References): [1]周國瓊.面向對象的TM影像分類[D].昆明:昆明理工大學,2012. Zhou G Q.Landsat TM Imagery Classification Using Object-oriented Technology[D].Kunming:Kunming University of Science and Technology,2012. [2]李彤,吳驊.采用決策樹分類技術對北京市土地覆蓋現(xiàn)狀進行研究[J].遙感技術與應用,2004,19(6):485-487. Li T,Wu H.Application of decision tree classification to Peking land cover[J].Remote Sensing Technology and Application,2004,19(6):485-487. [3]余坤勇,劉健,許章華,等.南方地區(qū)竹資源專題信息提取研究[J].遙感技術與應用,2009,24(4):449-455. Yu K Y,Lu J,Xu Z H,et al.Study on bamboo resources thematic information extraction in the south of China[J].Remote Sensing Technology and Application,2009,24(4):449-455. [4]宮鵬,黎夏,徐冰.高分辨率影像解譯理論與應用方法中的一些研究問題[J].遙感學報,2006,10(1):1-5. Gong P,Li X,Xu B.Interpretation theory and application method development for information extraction from high resolution remotely sensed data[J].Journal of Remote Sensing,2006,10(1):1-5. [5]Joy S M,Reich R M,Reynolds R T.A non-parametric, supervised classification of vegetation types on the Kaibab National Forest using decision trees[J].International Journal of Remote Sensing,2003,24(9):1835-1852. [6]胥海威,何寬.改進隨機決策樹群算法在監(jiān)督分類中的應用[J].地理與地理信息科學,2010,26(6):38-40. Xu H W,He K.An improved random decision trees algorithm with application to supervised classification[J].Geography and Geo-information Science,2010,26(6):38-40. [7]Haralick R M.Statistical and structural approaches to texture[J].Proceedings of the IEEE,1979,67(5):786-804. [8]陳貝貝,顏梅春,李致家,等.分類器和時相結合的流域下墊面分類方法[J].測繪科學,2014,39(9):141-144. Chen B B,Yan M C,Li Z J,et al.Basin underlying surface classification based on classifiers and phase combined[J].Science of Surveying and Mapping,2014,39(9):141-144. [9]顏梅春.高分辨率影像的植被分類方法對比研究[J].遙感學報,2007,11(2):235-240. Yan M C.Research and contrast on several vegetation-classification methods of high-resolution satellite image data[J].Journal of Remote Sensing,2007,11(2):235-240. [10]袁林山,杜培軍,張華鵬,等.基于決策樹的CBERS遙感影像分類及分析評價[J].國土資源遙感,2006,18(2):92-98.doi:10.6046/gtzyyg.2008.02.22. Yuan L S,Du P J,Zhang H P,et al.CBERS imagery classification based on decision tree and derformance analysis[J].Remote Sensing for Land and Resources,2006,18(2):92-98.doi:10.6046/gtzyyg.2008.02.22. (責任編輯: 劉心季) Classification model for “same subject with different spectra”on complicated surface in Southern hilly areas YANG Yuhui, YAN Meichun, LI Zhijia, YU Qing, CHEN Beibei (DepartmentofGIS,SchoolofEarthSciencesandEngineering,HohaiUniversity,Nanjing210098,China) Abstract:Mixed ground objects in complex basin are easily interfered by background, and foreground mixed in different ground objects is difficult to be distinguished by one rule. In this paper, the authors discuss the classification rule model of common ground feature in different mixed backgrounds. With Landsat8 images as the data source, level 1 tributary of Zhengshui River basin in Xiangjiang River basin and the three big cities of the Yangtze River delta as the study areas, the authors adopted the maximum likelihood method to conduct a preliminary classification. Based on analyzing the spectral characteristics of mixed feature, the authors built the classification decision tree of mixed ground feature to identify water, artificial construction, farmland, bare land, forest land and bare rock. The results obtained by the authors show that the overall accuracy of the Zhengshui River is about 88.21%, which is higher than the supervised classification accuracy of 79.68%, and the overall accuracy of other three cities along the Yangtze River is higher than 92%. It is shown that the classification model for mixed subjects can improve the accuracy of the same ground objects with different backgrounds. Keywords:mixed ground; same object with different spectra; decision tree classification; Southern hilly areas doi:10.6046/gtzyyg.2016.02.13 收稿日期:2014-12-16; 修訂日期:2015-02-09 基金項目:國家自然科學重點基金項目“半濕潤半干旱流域水文模型研究”(編號: 41130639)資助。 中圖法分類號:TP 751.1 文獻標志碼:A 文章編號:1001-070X(2016)02-0079-05 第一作者簡介:楊宇暉(1990-),女,碩士研究生,主要研究方向為遙感與地理信息系統(tǒng)應用。Email: yangyuhui0216@163.com。 通信作者:顏梅春(1971-),女,副教授,主要從事人文地理學、遙感與地理信息系統(tǒng)應用等方面的研究。Email: yanmeichun@hhu.edu.cn。 引用格式: 楊宇暉,顏梅春,李致家,等.南方丘陵地區(qū)復雜地表“同物異譜”分類處理模型[J].國土資源遙感,2016,28(2):79-83.(Yang Y H,Yan M C,Li Z J,et al.Classification model for “same subject with different spectra” on complicated surface in Southern hilly areas[J].Remote Sensing for Land and Resource,2016,28(2):79-83.)



