何予霄 周江
摘 要:遙感圖像的監督分類常用方法目前可以分為:平行六面體法,馬氏距離法,最大似然法,神經網絡法以及支持向量機法等。文章將就以上所述的五種常用的監督分類方法在ENVI中分別對汶川縣威州鎮同一Landsat8 OLI數據進行土地覆蓋與利用狀況分類.比較各種方法的分類精度,并對之所產生的差異的原因進行淺析,進而對實際的生產以及應用做出借鑒。
關鍵詞:監督分類;平行六面體;神經網絡;支持向量機;分類精度
中圖分類號:P407.8 文獻標志碼:A 文章編號:2095-2945(2018)13-0022-03
Abstract: The common methods of supervised classification of remote sensing images can be divided into: parallelepiped classifier method, Mahalanobis distance method, maximum likelihood method, neural network method and support vector machine method. In this paper, the land cover and utilization of the same Landsat8 OLI data in Weizhou Town, Wenchuan County are classified by the five common supervised classification methods mentioned above in ENVI. Comparing the classification accuracy of various methods, we made an analysis of the causes of the differences, and then identify their actual production and application.
Keywords: supervised classification; parallelepiped; neural network; support vector machine; classification accuracy
1 概述
遙感圖像的分類主要是利用計算機將遙感圖像中的光譜和空間信息進行分析,提出不同地物之間的特征及邊界,并利用一定的算法的各個像元劃歸到互不重疊的各個子空間之中。遙感圖像的分類的主要依據是不同地物在圖像上會反映出不同的亮度值(DN值),從而可以區分不同地物的差異。例如,河流、民宅、林地、草地、耕地等。
2 ENVI中基于遙感光譜圖像分類方法
遙感影像通過亮度值或者像元值的高低差異(反映地物的光譜信息)以及空間變化(反映地物的空間信息)來表示不同地物的差異與區別,這是區分不同影像地物的物理基礎。遙感影像分類就是利用計算機通過對遙感影像中各地類的光譜信息和空間信息進行分析,選擇其中所包含的特征,將圖像中的每個象元按照某種規則或者算法劃分成為不同的類別,之后獲得遙感影像中與實際地物所對應的信息,從而實現遙感影像的分類。
遙感圖像的分類分為監督分類與非監督分類。
非監督分類與監督分類最本質的區別是是否存在訓練樣本。若不存在訓練樣本則稱為非監督分類,非監督分類使用的算法是對影像上的光譜信息進行自動的聚合,聚合之后的所生成的不同地類需要后期人工進行判讀;若存在訓練樣本則稱為監督分類,監督分類是在計算機分類之前人工對影像選擇若干樣本區域的位置與樣本類型,之后選擇不同的分類器或不同的算法將影像中其他區域歸入不同的樣本中。無論是非監督分類還是監督分類都是基于光譜的分類方法,及基于遙感影像灰度值的分類方法。
3 實驗區選擇及實驗方法
本文所選擇的實驗區為四川省阿壩州汶川縣的Landsat-8 OLI為數據源,對原始數據進行6,5,4波段RGB真彩色合成(增強植被水域的對比)。選擇汶川縣威州鎮為實驗區,進行土地利用分類,以確定各種分類方法的精度比較。
3.1 訓練樣本可分離性判斷
在進行分類之前,先進行人工樣本選取,創建5個ROI感興趣區訓練樣本,為耕地,住宅用地,林地/草地,水域和其他,并且分別用黃色,紅色,綠色,藍色以及紫色表示。然后先計算樣本的可分離性。用Jeffries-Matusita和Transformed Divergence參數表示。這兩個參數的值在0~2.0之間,大于1.9說明樣本之間的可分離性良好,小于1.8需重新選取樣本,小于1即考慮將兩樣本合成一類樣本。本次工區樣本的可分離性為圖1所示。
本實驗工區樣本之間本分離性均大于1.85,屬于合格樣本。
3.2 分類器選擇與使用
用ENVI監督分類模塊進行監督分類時,采用不同的分類器時選擇相同的人工訓練樣本區域以比較不同分類方法的分類精度。選擇toolbox→Classification→Supervised Classification中找到不同類型的分類器。本文以支持向量機(Support vector machines,SVM)為例進行分類使用。
在Supervised Classification中選擇Support vector machines,點擊所需要分類的圖像進入SVM參數設置面板。SVM參數設置面板為圖2。
參數意義如下:
(1)Kernel Type下拉列表里選項有 Linear,Polynomial,Radial Basis Function和 Sigmoid。
a.如果選擇Polynomial,設置一個核心多項式(Degree of Kernel Polynomial)的次數用于SVM,最小值是1,最大值是6。
b.如果選擇Polynomial或者Sigmoid,使用向量機規則需要為Kernel指定the Bias,默認值是1。
c.如果選擇是 Polynomial,Radial Basis Function,Sigmoid,需要設置Gamma in Kernel Function參數。這個值是一個大于零的浮點型數據。默認值是輸入圖像波段數的倒數。
(2)Penalty Parameter:這個值是一個大于0的浮點型數據。這個參數控制了樣本錯誤與分類剛性延伸之間的平衡, 默認值是100。
(3)Pyramid Levels:設置分級處理等級,用于SVM訓練和分類處理過程。如果這個值為0,將以原始分辨率處理;最大值隨著圖像的大小而改變。
(4)Pyramid Reclassification Threshold(0~1):當Pyramid Levels值大于0時候需要設置這個重分類閾值。
(5)Classification Probability Threshold: 為分類設置概率域值,如果一個像素計算得到所有的規則概率小于該值,該像素將不被分類,范圍是0~1,默認是0。
(6)選擇分類結果的輸出路徑及文件名。
(7)設置Out Rule Images為Yes,選擇規則圖像輸出路徑及文件名。
(8)單擊OK按鈕執行分類。
4 分類結果與精度驗證
在對實驗工區進行土地分類之后,再進行分類后處理。采用混淆矩陣進行精度驗證,將不同方法的分類以及Kappa系數進行對照比較。
4.1 分類結果與后處理結果
使用平行六面體,馬氏距離,最大似然,神經網絡和支持向量機對工區進行分類及后處理后所得結果分別為圖3-圖7所示。
4.2 混淆矩陣精度驗證
在分類結束后對不同方法的分類后處理結果通過混淆矩陣進行對照。本文以水域為例,分別對相關的精度因子進行比較,如表1所示。
5 結束語
本文通過對五種監督分類方法的比較分析發現神經網絡,支持向量機在總體分類精度,錯分誤差和漏分誤差方面均明顯優于最大似然,平行六面體、馬氏距離,分類精度最高。而最大似然法次之,前三者分類精度均高于平行六面體和馬氏距離。
神經網絡和支持向量機的明顯優點:
(1)神經網絡具有學習能力和容錯特性并且無需就模型作出假定,不需要對數據考慮是否存在正態分布或者連續性分布。能夠在特征空間上形成任意的多邊界決策面,再在動態中調節決策邊界。在計算均值和方差時采用多次迭代,直到輸出結果達到與傳統的目視解譯結果滿足誤差要求。
(2)支持向量機是建立在統計學習理論上的機器學習方法。可以自動尋找在間隔區邊緣的訓練樣本點,從而區分有較大區分能力的支持向量,將類與類之間的間隔最大化。
目前,沒有哪一種分類是絕對最準確,最實用的,對于具體的問題,還是需要具體分析。每種分類方法都有各自的優劣性與實用性,選擇最適應條件的分類方法才能達到分類精度的最優化。隨著遙感技術的日新月異,綜合運用各種方法進行理論創新必將提高今后遙感影像分類精度的不斷上升。
參考文獻:
[1]趙文吉.ENVI遙感影像處理專題與實踐[M].北京:中國環境科學出版社,2007,04.
[2]童慶禧,張兵,鄭蘭芬.高光譜遙感原理、技術與應用[M].北京:高等教育出版社,2006,06.
[3]王一達,沈熙玲,謝炯.遙感圖像分類方法綜述[J].遙感信息,2006:67-71.
[4]楊樹文.遙感數字圖像處理與分析ENVI 5.x實驗教程[M].北京:電子工業出版社,2015,06.
[5]歐陽霞輝.ArcGIS地理信息系統大全[M].北京:科技出版社,2010,11.
[6]李石華,王金亮,畢艷.遙感圖像分類方法研究綜述[J].國土資源遙感,2015:1-6.