






摘要:以提取烏倫古湖濕地信息為目的,采用該地區2010年Landsat5/TM影像,使用支持向量機SVM的多項式函數對濕地信息進行分類。使用精度評估法(混淆矩陣)對分類結果進行精度評價并與傳統的最大似然法(MLC)、非監督分類(ISODATA)法分類結果進行對比。結果表明,SVM分類法不僅能夠很好地提取河流信息并且能夠區分湖泊濕地與坑塘濕地,分類總精度達到94.000%,Kappa系數為0.932,明顯高于MLC、ISODATA兩種方法,同時各類別的用戶精度和制圖精度都在不同程度上高于傳統分類方法。SVM是一種有效的提取濕地的方法,非常適用于干旱區濕地信息提取與監測。
關鍵詞:SVM;遙感;干旱區;濕地
中圖分類號:P237 文獻標識碼:A 文章編號:0439-8114(2016)16-4145-05
DOI:10.14088/j.cnki.issn0439-8114.2016.16.018
濕地是由水陸相互作用形成的具有特殊功能的生態系統,具有較完備的生物多樣性和生態系統功能,為人類的生產、生活提供了多種資源,被譽為自然之腎、生物基因庫和人類搖籃[1,2]。干旱區內陸濕地是中國重要的濕地類型之一,但是相對于其他區域的濕地分布研究,中國西北地區的荒漠地帶、干旱區濕地特別平原荒漠區濕地的研究還不夠充分。
定量地提取與分析濕地信息是進行濕地研究的基礎,RS與GIS技術的發展為濕地研究提供了新的思路。針對不同的濕地類型,基于遙感的濕地提取方法,有單波段閾值法,如牛明香[2]等在單紅外波段閾值法基礎上提出了分區分層濕地信息提取技術;多波段閾值法,如徐涵秋[3]提出用改進的歸一化差異水體指數提取水體信息,肖艷芳等[4]提出的利用TM影像波段1與波段7提取水體信息等。常見的濕地信息提取模式識別技術有監督分類和非監督分類以及以此為基礎提出的各種形式的混合分類法。上述方法都是基于數理統計理論,常規算法一般樣本數目趨于無窮大才能獲得良好的分類精度[5],故以上方法在樣本數量少、特征維度低時效果欠佳。本研究采用支持向量機分類方法,在提取遙感影像NDVI、MNDWI、亮度、綠度、濕度等光譜特征的同時用較少的訓練樣本對烏倫古湖濕地進行了分類提取,并與最大似然分類方法MLC和非監督分類ISODATA法進行對比,為干旱區濕地自動分類和智能提取提供新的技術支持。
2 研究方法
2.1 研究區概況
烏倫古湖是中國新疆維吾爾自治區準格爾盆地北部的一個斷陷湖,位于阿勒泰地區福海縣城西約20 km處,夾于額爾齊斯河與烏倫古河之間,屬中溫帶大陸性干旱氣候。烏倫古湖面積約1 001 000 hm2,海拔約470 m,擁有二個大型淡水湖,北面為烏倫古湖,面積約82 500 hm2,南面為吉力湖,面積約 1 600 hm2,以及大片毗鄰的淡水沼澤草地和沿烏倫古河的沼澤地,兩湖串通,水源來自由阿爾泰山東部的青格里河與布爾根河匯集而成的烏倫古河。該區域內濕地資源豐富,濕地類型多樣,是干旱區綠洲濕地研究的理想區域。
2.2 數據來源及預處理
9月烏倫古湖區域少云晴朗云量低于10%的比率較高,影像易于獲取。本研究采用2010年9月21日Landsat5/TM 影像作為研究數據。利用ENVI軟件對Landsat5/TM影像進行輻射校正,為保證數據的可靠性,將2010年Landsat5/TM與經過幾何精校正的影像配準,誤差控制在1個像元內,RMS=0.222 941,最后,裁切出研究區影像。
2.3 濕地分類體系
確立濕地的分類體系是進行濕地提取和研究的前提,然而中國濕地類型復雜多樣,學者對濕地的界定不盡相同,研究者對濕地研究的出發點和分類目的也各不相同,要制定統一的定量分類體系比較困難。本研究根據《濕地公約》,綜合考慮烏倫古湖流域特殊的干旱區地理特征,結合國內濕地調查采用的分類方法[9,10],提出了該區域內濕地分類體系(表1)。
2.4 特征提取
通過分析影像的波段相關矩陣和IOF指數,本研究選取453波段為RGB的波段組合[11,12]。光譜特征對于輔助遙感有效識別地物和準確分類起到了積極作用,為了更精確地提取水體和植被,本研究通過波段運算提取以下幾種特征變量:
1)改進的歸一化差異水體指數
MNDWI=(Green-MIR)/(Green+MIR)
Green為綠光波段,MIR為第五波段中紅外波段。
2)歸一化差值植被指數NDVI=(NIR-IR)/(NIR+IR)
NIR為近紅外波段,IR為紅光波段。
3)K-T變換的亮度指數、綠度指數和濕度指數
U=RTx+r
R是纓帽變換系數,x代表不同波段的灰度值,r 表示常數偏移量,U表示纓帽變換后不同的波段。
將提取的特征變量同原始影像RGB波段相疊加,構建出高于原始影像的維度特征空間。
2.5 樣本選擇與參數設置
通過目視解譯和實地考察,研究區的農作物在9月底基本已經收割,沼澤主要分布在湖泊、坑塘周圍。本研究在選擇訓練樣本時將研究區地物分為河流、湖泊、坑塘、草本沼澤、已收割耕地、未收割耕地、裸地、森林沼澤、其他9類(表2)。根據研究區范圍和影像的地物特征,每類選擇150~200個訓練樣本和相同數量的檢驗樣本,統計樣本間的可分離度。
采用SVM分類法,核函數的參數和懲罰因子是影響SVM性能的主要因素[13]。目前針對SVM核函數參數和懲罰因子的設置有試湊法[14]和基于統計學理論的方法,如臧淑英等[15]提出的基于遺傳算法的支持向量機濕地遙感分類。本研究采用多項式函數通過試湊法來確定最佳參數。對干旱區濕地的先驗知識結合反復試驗,發現在多項式階數d=6時分類結果最優;將核參數設置為特征空間波段數的倒數,令其固定為?酌=0.125;不斷調試懲罰因子,令C=15時分類結果最優。
3 結果與分析
基于上述SVM分類法,對烏倫古湖流域濕地信息提取的結果如圖1(a)所示。MLC與ISODATA分類結果分別如圖1(b)和圖1(c)。
3.1 分類效果評價
為了更清晰地顯示3種分類的差異,選取局部區域加以分析,如圖2所示。對比顯示ISODATA法分類可以完成濕地信息的粗提取,但是難以通過光譜信息區分出湖泊濕地與坑塘濕地,同時,河流濕地與裸地信息混淆,造成河流斑塊破碎,信息不連續。此外,河流濕地與草本沼澤信息混淆情況嚴重。然而MLC法與SVM法通過訓練樣本都可以有效提取出各種類型的濕地,能夠區分出湖泊濕地與坑塘濕地,尤其在河道較窄的情況下能夠較為完整地提取河流信息。
3.2 分類精度評價
建立混淆矩陣進行精度評價評定是目前普遍采用的遙感影像分類精度定量評價方法[16]。統計本研究涉及的3種分類結果得到相應的混淆矩陣(表3、4、5)。通過分類結果判斷和混淆矩陣顯示狀況,可以看出3種方法都出現了錯分漏分現象,但利用SVM多項式的分類總精度高達94.000%,比ISODATA法提高了8.692%,比MLC法提高了2.467%;Kappa系數為0.932 3,比ISODATA法提高了0.1,比MLC法提高了0.028。混淆矩陣顯示:
1)使用SVM分類法時各地物正確分類率較高且水平均衡,未出現較為嚴重的錯分現象。
2)SVM分類法相對于ISODATA法而言,不僅區分出了坑塘信息,其正確分類樣本高達99%,甚至比MLC還高8%。
3)MLC分類將其他地物錯分為河流的樣本達到24%,而SVM分類結果中只有7.33%,很好地改善了這一混淆狀況。
通過觀察各濕地類型3種分類方法的用戶精度和制圖精度統計圖(圖3、圖4)可以得出,ISODATA法在濕地分類中用戶精度和制圖精度相對偏低,并且該分類法未區分出坑塘信息,不具有參考價值。SVM法在針對濕地的分類中,制圖精度普遍高于MLC法,平均制圖精度達到97.14%。SVM分類結果的用戶精度與MLC接近,除草本沼澤外,均保持在90%以上。雖然在河流和草本沼澤中精度略低于MLC法,但能夠滿足分類需求,并且在坑塘的用戶精度上體現了優越性。
4 結論
本研究以新疆烏倫古湖為研究區,利用TM影像,在提取影像NDVI、MNDWI、濕度、綠度、亮度等特征的基礎上,選取少量樣本利用SVM多項式函數提取濕地信息,結果證明SVM能有效地區分各濕地類型,清晰顯示濕地的分布情況。雖然SVM分類法也存在漏分、錯分現象,但經有限的檢驗樣本驗證顯示,SVM分類總精度、Kappa系數、平均用戶精度、平均制圖精度都高于傳統的最大似然法和非監督分類。SVM在小樣本、高維度情況下體現出了精度高、效果好等特點,是一種值得推廣的分類方法。
參考文獻:
[1] 孫廣友.中國濕地科學的進展與展望[J].地球科學進展,2000, 15(6):666-670.
[2] 牛明香,趙庚星,李尊英.南四湖濕地遙感信息分區分層提取研究[J].地理與地理信息科學,2004,20(2):45-52.
[3] 徐涵秋.利用改進的歸一化差異水體指數(MNDWI)提取水體信息的研究[J].遙感學報,2005,9(5):589-595.
[4] 肖艷芳,趙文吉,朱 琳.利用TM影像Band1與Band7提取水體信息[J].測繪科學,2010,35(5):226-227.
[5] 田 源,塔西甫拉提·特依拜,丁建麗,等.基于支持向量機的土地覆被遙感分類[J].資源科學,2008,30(8):1268-1274.
[6] 張 睿,馬建文.支持向量機在遙感數據分類中的應用新進展[J].地球科學進展,2009,24(5):555-562.
[7] HUGHES G. On the mean accuracy of statistical pattern recognizers[J].IEEE Transactions on Information Theory,1968, 14(1):55-63.
[8] CRISTIANINI N,SHAWE-TAYLOR J. An Introduction to Support Vector Machines and Other Kerne-l based Learning Methods(English Edition)[M].BinJing:China Machine Press,2005.
[9] 唐小平,黃桂林.中國濕地分類系統的研究[J].林業科學研究,2003,16(5):531-539.
[10] 朱長明,李均力,常 存.新疆干旱區濕地景觀格局遙感動態監測與時空變異[J].農業工程學報,2014,30(15):229-238.
[11] 金寶石,周葆華.TM影像在湖泊濕地信息提取中的最佳波段組合[J].光譜實驗室,2012,29(6):3771-3774.
[12] 姜小光.成像光譜數據的光譜信息特點及最佳波段選擇[J].干旱區地理,2010,23(3):215-220.
[13] 林升梁,劉 志.基于RBF核函數的支持向量機參數選擇[J].浙江工業大學報,2007,35(2):163.
[14] 周 奇.對支持向量機幾種常用核函數和參數選擇的比較研究[J].福建電腦,2009(6):42-43.
[15] 臧淑英.遺傳算法優化的支持向量機濕地遙感分類——以洪河國家級自然保護區為例[J].地理科學,2012,32(4):434-441.
[16] 李振源,許捍衛,王金龍.基于QUEST決策樹的大豐濕地信息提取[J].地理空間信息,2014,12(5):35-37.