何朝霞
摘要 [目的]尋找喀斯特地區土地最優分類方法。[方法]選取覆蓋柳州市的美國陸地衛星的Landsat-5TM數字影像(2011年),采用最大似然、神經網絡和支持向量機(SVM)3種分類方法,對研究區域的土地進行分類,比較分類后的混淆矩陣,分別求出3種分類結果的總體正確率和Kappa系數。[結果] 3種分類方法的總體正確率都在90%以上,Kappa 系數也較高;SVM分類方法的總體分類正確率和 Kappa 系數最高,優于神經網絡、最大似然法分類。[結論]SVM分類方法可提高喀斯特地區土地利用信息遙感分類的精度,為后期有效地動態監測喀斯特地區土地利用的變化奠定了基礎。
關鍵詞 最大似然;神經網絡;支持向量機;土地分類;精度
中圖分類號 S127;P237 文獻標識碼 A 文章編號 0517-6611(2017)01-0004-04
Reseach on the Method of Land Classification in Karst Area
HE Zhaoxia
(College of Technology & Engineering, Yangtze University, Jingzhou, Hubei 434023)
Abstract [Objective] The aim was to find out the optimal method of land classification in Karst area.[Method] Based on American Landsat 5 (2011) digital images covering Liuzhou City,the maximum likelihood, neural network and support vector machine (SVM) classification methods were studied. Three methods were used to classify the land, the confusion matrix was compared after classification, overall accuracy and Kappa coefficient of classification results were calculated. [Result] The overall accuracy of three classification methods was over 90%, the Kappa coefficient was higher. The overall classification accuracy and the Kappa coefficient of SVM classification method were all the highest, better than the neural network and maximum likelihood. [Conclusion] The SVM method can improve the accuracy of land classification in Karst area, and it is effectively to dynamic ally monitor the change of land used in karst area.
Key words Maximum likelihood;Neural network;Support vector machine;Land classification;Accuracy
隨著人類社會的發展,特別是城市建設的加快,城市土地利用每年都在發生著明顯變化,所以土地利用變化仍是當前研究的熱門問題。楊瑞芳等[1]在遙感和GIS 技術支持下,選擇北京市順義區作為研究對象,采用分類后比較方法,對1999—2011年土地利用類型的動態變化進行定量分析以及空間分布制圖;肖楊等[2]基于RS和GIS技術,在ENVI 軟件支持下,利用監督分類方法,提取了黃河三角洲地區各時相土地利用類型面積及分布信息;何順兵等[3]采用級聯方式綜合最鄰近分類算法和模糊分類算法實現了重慶市大學城城區土地覆蓋信息的面向對象提取;陳西亮等[4]選取 2010 年9景TM 影像為遙感信息源,利用支持向量機(SVM)法對喀什地區的土地進行分類;陳書林等[5]利用粗集理論對2000年Landsat-5TM衛星圖像數據進行分類,獲得2000年南京市土地利用分布專題圖;馬驪馳等[6]以香格里拉建塘鎮為研究區,以2000、2009年Landsat-TM影像為基礎數據,運用光譜特征和地學輔助知識相結合的改進型決策樹分類方法分別對研究區 2 個年份的基礎數據進行土地利用信息提取和變化分析。綜上所述,當前土地利用變化的研究區域大多集中在經濟比較發達、人口較多的大城市或旅游城市,忽視了對喀斯特地貌特征地區的研究。目前,土地利用和土地覆蓋的分類尚缺乏統一標準,由于土地利用和土地覆蓋的分類應用于不同的目的,應有不同的分類體系,所以制定統一的分類體系難度很大。鑒于此,筆者采用最大似然法、SVM、神經網絡3種方法對喀斯特地貌地區土地利用進行了分類,尋找最優分類方法,以期為制定土地利用和土地覆蓋的統一分類標準提供理論依據。
1 材料與方法
1.1 研究區概況
柳州市位于廣西壯族自治區的中北部,地處108°32′~110°28′ E,23°54′~26°03′ N。全市轄4區6縣,即柳南、柳北、城中、魚峰4個城區和柳江、柳城、鹿寨、融安、融水、三江6個縣。全市土地利用以農用地為主,建設用地所占比例較小。柳州為典型的喀斯特地貌,屬于中亞熱帶季風氣候。夏天長,冬天短。春夏季多雨,秋冬季干燥。總體來說,水資源足夠豐富,但分布不均勻,用水來源主要是柳江水系干流。作為我國西南工業重鎮和廣西最大的工業經濟中心,柳州地理位置優越,交通便利,有多條國道和高速公路貫穿,是西南地區的陸路交通樞紐,也是我國西部區域性陸路交通樞紐;是溝通我國西南與中南、華東、華南地區的鐵路中樞,也是我國一類口岸,柳江航運可直達香港、澳門等地[7]。
1.2 遙感數據源與預處理
遙感數據來源于地理空間數據云發布的美國陸地衛星的Landsat-5TM數字影像(2011年)。該影像的重復周期為16 d,共7個探測波段,除了熱紅外波段的分辨率是120 m外,其他波段的分辨率為30 m。該影像覆蓋108°27′~110°22′ E,23°36′~25°29′ N,包含柳州市的部分地區,為喀斯特地貌地區。為了便于確定最優分類方法,在該遙感影像上選取1塊矩形區域進行研究(圖1),所選區域的數字影像如圖2所示,該矩形區域包含柳州市區和市郊的幾個鎮。
1.3 研究方法
1.3.1 最大似然分類[8]。
高斯最大似然分類法,首先假設同一類別的A訓練集中各點的整體分布屬于高斯分布(正態分布)。一般常見的光譜響應分布符合正態分布假設。利用訓練集可求出均值、方差、協方差等特征參數,從而求出總體的先驗概率密度函數。采用統計學方法建立起判別函數集,然后根據這個判別函數集計算各待分像元的歸屬概率。歸屬概率是指:對于待分像元x,它從屬于分類類別k的(后驗)概率Lk。根據歸屬概率判定待分像元x最適當的類別,如果概率值全在分析者確定的閾值之下,則可將該像元歸為“未知”。
1.3.2 神經網絡分類[9]。
BP神經網絡是一種具有1個輸入層、1個或多個隱層和1個輸出層的多層前饋型神經網絡,是目前研究較多的網絡形式之一。這種人工神經網絡模型的特點是各層神經元僅與相鄰層神經元之間有連接;各層神經元之間無任何連接;各層神經元之間無反饋連接。每層上
的神經元稱為節點或單元,對于輸入信息,要先向前傳播到
隱含層的節點上,經過激活函數運算后,把隱含層節點的輸
出信息傳遞到輸出節點,最后獲得輸出結果。網絡根據誤差反向傳播算法,采用梯度下降法迭代地實現網絡的訓練。因此在網絡中,信息的傳播是正向的,而誤差的傳播則是反向的。
1.3.3 SVM分類[10-11]。
SVM的基本思想是把訓練樣本映射到一個高維特征空間,再通過構造一個最佳平面使得各個類別的樣本之間距離都達到最大。映射方式可以是線性的或者非線性的,最佳平面可以是超曲線或者超平面,最終目的是要使分類誤差達到最小。分類函數為:
f(x)=sgn{ki=1a*iyiK(xi·x)+b*}
式中,a*和b*是確定最有超平面的參數;K(xi·x)是核函數,選擇不同的核函數會得到不同的分類算法。
1.3.4 分類后精度評價。
精度評價是通過比較實際數據與處理數據確定處理過程的準確度。分類結果評價是進行土地覆蓋、遙感動態監測的重要環節。常用的評價方法有混淆矩陣法,從混淆矩陣計算各種精度統計值,如總體正確率、使用者正確率、生產正確率和Kappa 系數等[12]。該研究主要用總體正確率和Kappa 系數來衡量分類精度。
總體正確率:PC=mk=1Pkk/N
式中,PC為總體分類正確率;m為分類類別數;N為樣本總數;Pkk為第k類的判別樣本。
Kappa 系數:K=Nmi=1Pii-mi=1(Ppi×Pli)N2-mi=1(Ppi×Pli)
式中,K為Kappa 系數;N為樣本總數;Pii為混淆矩陣對角線元素;
Ppi為某一類所在列總數;Pli為某一類所在行總數。
2 結果與分析
最大似然、SVM、神經網絡3種分類方法都需要對樣本進行訓練,樣本區也稱為“感興趣區域”,即Region of Interest(ROI)。根據目視解譯,研究區域TM影像中的地物類別可以分為5類:水體、林地、城鎮、裸地和其他植被。其中,各個樣本類型之間的統計距離可以確定樣本類型之間的差異程度,稱為可分離性。可分離性可以用基于Jeffries-Matusita距離和轉換分離度Transformed Divergence來衡量[13]。一般來說,這2個參數的值在0~2.0,大于1.8屬于合格樣本。表1為各樣本間的分離度。由表1可知,各個樣本間的分離度較高,樣本選擇合格。
3 結論
在對典型的喀斯特地區——柳州市的部分區域進行土地分類過程中,研究了最大似然法、SVM和神經網絡3種分類方法,并利用上述3種方法對研究區域進行了分類,分析了分類的結果和精度,得出利用SVM 分類方法的精度最高,認為該方法可提高喀斯特地區土地利用信息遙感分類的精度,為后期有效地動態監測喀斯特地區土地利用的變化奠定了基礎。
參考文獻
[1] 楊瑞芳,譚衢霖,秦曉春,等.基于遙感與GIS 的北京城鄉結合部土地利用時空變化分析[J].測繪與空間地理信息,2016,39(9):19-22,26.
[2] 肖楊,趙庚星.黃河三角洲典型地區土地利用變化遙感監測及驅動力分析[J].測繪與空間地理信息,2016,39(9):43-46.
[3] 何順兵,牟鳳云.基于面向對象的多尺度山地城市土地覆蓋信息提取:以重慶市大學城城區為例[J].重慶工商大學學報(自然科學版),2016,33(1):83-88.
[4] 陳西亮,張佳華.基于TM 影像的喀什地區土地利用分類[J].湖北農業科學,2016,55(15):4001-4005.
[5] 陳書林,武桐.基于粗集理論的南京市土地利用類型分類研究[J].信息系統工程,2016(8):16.
[6] 馬驪馳,王金亮,劉廣杰,等.基于改進型決策樹遙感分類的土地利用變化研究[J].地理空間信息,2016,14(7):12-16.
[7] 柳州市人民政府.廣西壯族自治區柳州市土地利用總體規劃(2006-2020年)[EB/OL].(2015-11-20)[2016-09-05].http://www.gxnyqh.gov.cn/show.aspx?id=1010&cid=7.
[8] 任廣波.基于半監督學習的遙感影像分類技術研究[D].青島:中國海洋大學,2010:5-15.
[9] YANG G J,PU R L,HUANG W J,et al.A novel method to estimate subpixel temperature by fusing solarreflective and thermalinfrared remotesensing data with an artificial neural network[J].IEEE Transactions on Geoscience and Remote Sensing,2010,48(4):2170-2178.
[10] HEIKKINEN V,KORPELA I,TOKOLA T,et al.An SVM classification of tree species radiometric signatures based on the Leica ADS40 sensor[J].IEEE Trans Geosci Remote Sens,2011,49(11):4539-4551.
[11] LONGEPE N,RAKWATIN P,ISOGUCHI O,et al.Assessment of ALOS PALSAR 50 m orthorectified FBD data for regional land cover classification by support vector machines[J].IEEE Trans Geosci Remote Sens,2011,49(6):2135-2150.
[12] 杜培軍.遙感原理與應用[M].徐州:中國礦業大學出版社,2006.
[13] MALLET C,BRETAR F,ROUX M,et al.Relevance assessment of fullwaveform lidar data for urban area classification[J].ISPRS Journal of Photogrammetry and Remote Sensing,2011,66(6):71-84.