摘要:以ETM+影像數據為例,采用基于支持向量機的方法對黃河中上游區域濕地信息進行提取,并將該方法與傳統的最大似然分類提取方法以及面向對象的提取方法進行對比分析。結果表明:基于支持向量機方法的提取精度高達93.57%,Kappa系數也超過了0.9,比單純的最大似然分類方法或者面向對象的方法提取精度高得多,而且該方法操作性和實用性也很強。
關鍵詞:支持向量機; ETM+影像; 濕地信息; 提取精度
中圖分類號:TP79文獻標志碼:A
文章編號:1001-3695(2008)04-0989-02
濕地是地球陸地生態系統的重要組成部分,同時也是一種重要的自然資源。因此,如何有效地獲取濕地信息,以保持濕地資源的可持續發展就顯得非常必要。隨著空間信息技術特別是遙感技術的迅猛發展,遙感信息已經成為濕地信息動態監測的一個重要數據。針對遙感信息的提取,國內外許多學者提出了相應的研究,在一定程度上解決了問題。其中,由Vapnik等人提出的支持向量機(SVM)方法[1,2]得到了廣泛關注。它是在基于統計的VC維理論和結構風險最小理論的基礎上,根據有限的樣本數對模型的復雜度和學習能力之間找出最佳折中,以達到最佳的信息提取效果的方法。劉志剛等人[3]以及張錦水等人[4]利用SVM方法對遙感影像進行了不完全監督分類,提高了分類精度。本文利用ETM+影像,以黃河中上游實驗區濕地信息為對象,在實驗驗證的基礎上構建了基于SVM的濕地信息提取模型。實驗表明,該方法具有較高的提取精度和較強的應用性。
1支持向量機模型
SVM的基本思想是構造一個最優超平面,使正負之間的空白模式最大[5]。在線性可分的情況下,如圖1所示,圖中B為兩類樣本(實心黑點樣本和空心白點樣本)的分類線,A和C分別表示各類中離分類線最近的樣本并且平行于分類線的直線,它們之間的距離叫做分類間隔。最優分類面不但要求把兩類別準確分開,而且要求分離間隔最大化。不同類別的最優超平面方程為w·x+b=0。
2.2研究方法
根據SVM的思想,對ETM+遙感影像的濕地信息進行提取操作,同時還采用了最大似然分類以及面向對象提取方法。具體濕地信息提取流程如圖3所示。
1)遙感圖像預處理對所采用的ETM+遙感影像進行輻射校正和幾何校正,根據制定的統一濕地分類標準,對所提取的各類濕地類型樣本進行規范化處理。
2)SVM樣本訓練利用徑向核函數把訓練樣本映射到高維空間,同時結合SVM訓練樣本設定相應的參數,在特征空間中確定最優分類面,得到各樣本的支持向量和VC可信度,形成最終的判別函數。
3)SVM判決[7](分類)將影像的待分類像元通過核函數映射到高維特征空間,利用判別函數進行分類,通過輸入的參數和閾值進行判別,得出最終的分類結果,提取濕地信息。此外,在分類過程中還采用了最大似然方法和面向對象方法進行分類,便于最后三種方法分類精度的比較。
4)精度檢驗通過GPS實測數據以及其他輔助數據對分類精度進行了評價,通過分析選擇較好的濕地信息提取方法,最后把濕地類型結果以圖形方式輸出。
3結果分析
3.1濕地提取結果
利用基于SVM方法對研究區域的遙感影像進行解譯,得到了較好的結果,如圖4(c)所示。經過野外GPS采樣驗證,判讀正確率超過90%。同時,數據的采集和處理采用遙感、GIS以及回歸分析等多種方法,提高了解譯的效率,快速高效地獲取濕地分布狀況。
此外,將該方法與最大似然分類方法和面向對象的方法進行了對比分析。在ENVI中采用基于像素的最大似然法監督分類提取濕地信息;利用eCongnition面向對象軟件對研究區域進行了區域分割與濕地信息提取。結果分別如圖4(a)和(b)所示。
3.2精度評價
利用像元個數統計法對所提取的濕地信息進行精度評價[8]。假設所提取的濕地面積為S,通過各種方法提取的濕地面積為Q,把S和Q所在的區域進行矢量化后疊加分析,就可以準確地確定錯誤分類或遺漏分類的像元位置和面積大小。假設正確分類面積為R,錯誤分類面積為W,遺漏分類面積為U,通過統計分析定量地獲得濕地的提取精度。由以上假設可知
正確分類率T=R/S,錯誤分類率F=W/S,遺漏分類率L=U/Q(8)
實驗區實地采集了400個樣本作為檢驗樣本。利用式(7)和(8)分別計算了三種方法的正確分類率、錯誤分類率、遺漏分類率和Kappa系數,如表1所示。結果表明:基于支持向量機提取方法正確分類率高達93.57%,Kappa系數為0.900 2,比采用單純最大似然監督分類方法或者面向對象方法精度高得多。
4結束語
隨著遙感影像在濕地信息提取中的應用越來越廣,一些基本方法(如基于像素的最大似然監督分類、面向對象的方法等)的精度很難滿足實際應用的要求。本文利用基于支持向量機的方法對濕地信息進了提取,分類率超過了90%,Kappa系數也超過了0.9,濕地信息區域也比較完整,斑塊與斑塊之間的連續性也較強。最大似然監督分類方法和面向對象的方法分類率不但低于80%,而且斑塊與斑塊之間比較破碎,連續性較差。此外,基于支持向量機的方法獲取地物信息有較強的操作性和實用性。
參考文獻:
[1]VAPNIK V N. The nature of statistical learning theory[M]. New York: Springer-Verlag. 1995.
[2]CORTES C, VAPNIK V. Support vector networks[J]. Machine Learning, 1995,20(3):273-297.
[3]劉志剛,史文中,李德仁,等.一種基于支撐向量機的遙感影像不完全監督分類新方法[J].遙感學報, 2005,9(4):363-373.
[4]張錦水,何春陽,潘耀忠,等.基于SVM的多源信息復合的高空間分辨率遙感數據分類研究[J].遙感學報,2006,10(1):49-57.
[5]趙書河.多源遙感影像決策級融合及其應用研究[D].南京:南京大學,2003.
[6]CHERKSASSKY V, MULIER F. Learning from data concepts, theory and methods[M]. Hoboken: Wiley, 1997.
[7]張友靜,高云霄,黃浩,等.基于SVM決策支持樹的城市植被類型遙感分類研究[J].遙感學報,2006,10(2):192-196.
[8]孫小芳,盧健,孫小丹.城市地區高分辨率遙感影像綠地提取研究[J]. 遙感技術與應用,2006,21(2):159-162.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”