陳 袁
基于支持向量機的遙感影像分類
陳 袁
遙感影像分類是提取遙感信息的基礎步驟與重要手段,然而由于影像分辨率以及同譜異物與同物異譜現象,傳統的分類方法難以實現高精度的分類。基于智能算法的非參數分類方法已開始應用于遙感分類中。本文以佛山市為研究區,對其遙感影像采用支持向量機方法進行土地利用覆蓋分類研究,并對分類結果進行精度評價。結果表明:支持向量機分類有較高的精度,是遙感影像分類的有效方法。
近年來,各種空間衛星提供的多平臺、多光譜、多時相以及大范圍的遙感影像已廣泛用于研究地表動態變化過程中,而遙感影像判讀作為提取遙感信息的一個重要環節要求有更高的分類精度。傳統的遙感影像分類方法包括ISODATA、K-均值、最小距離、最大似然法等,由于存在“同物異譜”以及“同譜異物”的現象,常常會錯分、漏分地物分類,極大地降低了分類精度。因此引進多種智能分類算法來進行遙感影像分類研究。本文采用支持向量機模型對佛山市的土地利用自動分類進行研究。
佛山——東經113°06',北緯23°02',位于中國廣東省中南部,地處珠三角腹地,氣候溫和,雨量充沛,四季如春,屬亞熱帶季風性濕潤氣候,是國家先進制造業中心、珠江三角洲核心地區、廣東省經濟中心之一。
支持向量機(Support vector machine,SVM)是一種基于統計學習理論、VC維理論和結構風險最小化原理的機器學習算法,常被用來解決小樣本、非線性問題及高維模式識別問題。SVM通過“支持向量”即不同類別間邊緣的樣本點來尋找不同類別之間的最優超平面進行劃分。對于土地分類問題,SVM利用其特有的核函數與懲罰變量,將低維線性不可分問題轉化成高維線性可分問題,并通過設置懲罰因子,解決個別離群值的類別歸屬問題,以實現地物分類的自動識別。
在使用支持向量機模型對遙感影像分類的過程中,分類精度會受到模型自身核函數的選擇以及多分類策略的影響。核函數的選擇方法是通過試用不同的核函數,最終選定分類誤差最小的核函數作為最優核函數,本文選擇徑向基核函數。多分類策略包括兩種:一是組合多個兩類分類器使其實現多類分類,例如有向無環圖SVM等;二是直接將多類問題加入到優化公式中,該方法可以直接實現多類分類,本文采用第二種分類策略。
本文以佛山市為研究區,使用支持向量機模型進行土地利用覆蓋分類實驗,并對分類結果進行精度評價。其流程如圖1所示。
預處理模塊
本文以佛山市2014年Landsat7 ETM+影像為主要數據源,分辨率為15m,經二次多項式幾何精校正、正射校正、自動配準及融合鑲嵌裁剪等預處理后得到完整研究區影像圖,如圖2所示。

圖1 總體流程圖
分類模塊
將影像的多波段信息進行主成分分析,選取主要波段,本文中即前三個波段的組合信息作為分類的基礎數據,經主成分分析后的影像如圖3(a)所示。以支持向量機方法為分類模型,將土地分為耕地、建設用地、林地、草地及水體五類,分類結果如圖3(b)所示。

圖2 2014年研究區ETM+彩色影像圖

圖3
精度評價模塊
選取適當面積、土地利用種類明確的感興趣區,將其實際土地利用類別與分類結果進行比對,可得總體精度為0.9411,Kappa系數為0.8975,混淆矩陣如表1所示。

表1 感興趣區實際土地利用情況與自動分類結果的混淆矩陣
由表(1)可知,支持向量機模型在對遙感影像進行自動土地利用分類中具有很高的精度,其中建設用地的分類精度最高,達到97.11%,林地的分類精度最低為93.02%。支持向量機作為一種典型的非參數分類器,能最大化類別之間的間隔,找出決策超平面并據此區分出不同地物。根據有限樣本在訓練誤差與真實誤差之間尋求最佳折中,以獲得最好的泛化能力,因此支持向量機更關注于每類地物的邊緣分布,在遙感影像土地利用自動分類中有極高的適應度及可行度。
本文以佛山市為研究區,遙感影像為數據源,對其進行預處理以及主成分分析之后使用支持向量機為分類模型來分類土地利用覆蓋,充分發揮了支持向量機能夠自動尋找分類超平面的優勢,但是由于受到隨機因素以及影像分辨率的影響,使用支持向量機分類的結果與實際結果有微小的差距,如果將隨機因素考慮進模型中將是以后研究需要解決的重點。
10.3969/j.issn.1001-8972.2015.17.003