郭恒 張軍 劉安偉





關鍵詞:最大似然;神經網絡;SVM;Kappa系數
中國分類號:P237 文獻標志碼:A
0引言
隨著近些年遙感技術領域眾多新技術的不斷涌現,目前該技術已具備多平臺、大尺度、高分辨率、多波段、多時相、衛星重訪周期短等諸多優勢,影像攜帶豐富的光譜信息。遙感圖像的分類就是使用基于各類模型算法的計算機模式識別技術在遙感領域的應用。具體目的是通過先驗知識或實地踏勘數據與目視解譯的方法建立研究區不同地物類別及判別標準,通過計算機進行監督與非監督分類。目前主流較為成熟的分類方法較多,主要有最大似然、神經網絡、支持向量機等分類方法。不論使用哪一種方法,都有其局限性。所以,在實際應用中,要結合各種分類方法自身的特點及影像的實際情況,提高分類的精度與效率[1]。
1影像分類方法
在基于監督分類的影像分類方法中,馬氏距離分類法在考慮像素統計的基礎上,注重各類別中的內在變化,相對最小距離分類法更加實用,但相對的計算時間成本要大[2];最小距離分類法是基于圖像像素統計的分類法,該分類方法的優勢在于其計算量小,所有像素均被分類。其劣勢在于基于矩陣的計算相對單一,精度不高,存在一定的錯分想象。例如,同類型地物因局部像素差異過大而被錯分[3];平行六面體分類法充分考慮遙感影像各波段的光譜特征,按照光譜DN值作圖像分類處理。對植被的監督分類運用該分類方法可以得到較好的分類結果,但同種地物光譜如果與訓練樣本光譜差異較大,也會存在錯分的現象;最大似然法具有分類效率高,精度較好的優勢。但該分類方法受參數估計限制較大;神經元網絡分類法模擬人腦神經反饋機制系統建立一套數學模型。該分類方法較傳統基于統計的分類方法在分類精度上有明顯的提高,但計算非常耗時,分類運算需要多次迭代才能完成[4];支持向量機分類法也是機器學習中較為經典的一種分類法。該方法在訓練樣本較少的前提下,仍可以獲得較好的分類結果及統計規律,其缺點是計算時間會隨訓練樣本種類幾何倍增,分類難以實施。
2支持向量機算法分類原理
支持向量機(Support Vector Machine)早期是由Corinna Cortes和Vladimir Vapnik于20世紀90年代提出的經典機器學習算法理論[5]。該算法的原理是基于統計學習理論的VC維理論與結構風險最小化原則基礎之上的[6]。在已有的訓練樣本找到一個最優的折中點,就需要在所選訓練樣本的學習能力與學習精度之間權衡,從而得到較好的規則推廣能力。通過非線性變換,使分類問題轉化為高維空間的分類問題,同時在高維空間找到對應的最佳分類面,最終得到一個最優分類結果[7]。在圖像分類中,由低維分類轉化為高維分類,可以大幅度降低分類難度。分類算法的復雜性取決于訓練樣本的數量和質量,與訓練樣本中的持向量機有密切關系。運用非線性變換將低維空間的分類轉化為高維空間的分類問題。同時,在高維空間找到對應的最佳分類面是支持向量機的基本思路。在轉化過程中,非線性變化的運算較為復雜。這里需要使用訓練樣本間的積運算(x)i,yi,完成空間維度由低到高的變換。內積運算也被稱為核函數,其優勢在于坐標變換相對容易,它解決了基于維數變換的分類問題,同時,不增加整個計算過程的復雜性。根據Hilbert-Schmidt理論,只有滿足前提條件的內積函數才可以進行空間變換,該條件定義為,對于任意K(x,y),g(x)≠0,且∫g(x)2dx<∞,有:
3實驗結果分析
3.1數據處理
研究選用ENVI遙感影像處理軟件,使用Landsat8OLI_TIRS衛星數字產品,影像獲取時間為2018年6月5日,條帶號:129,行編號:36。前期對數據進行了輻射定標與大氣校正預處理工作,以還原真實的地表輻射率特征值。裁剪出甘肅省天水市三陽川新區的334.48km2土地作為研究區域,并且通過全色影像與多光譜影像的融合,提升影像分辨率至15m。根據國家標準《土地利用現狀分類》(GB/T21010-2017),結合研究區域土地利用實際情況,將訓練樣本劃分為林地、草地、耕地、水域、裸地、建設用地,前期對影像紋理特征的分析解譯,首先對遙感圖像對應的訓練樣本進行選取與實地踏勘,得到分類樣本27組,驗證樣本31組。在樣本的選取遵循以下兩點準則,一是盡量選擇單一地物類型的像元作為訓練樣本;二是根據紋理信息與光譜特征,盡可能選取一些具有代表性的地物作為樣本[8]。然后對選取樣本作可分離性分析,系統使用Jeffries-Ma?tusita分離參數表示樣本的可分離性。矩陣中行與列的焦點表示這兩類地物類型的可分離程度,數值在0~2.0之間。小于1.8說明地物之間可分離性不理想[9],需要重新調整訓練樣本;大于1.9的數值說明相應地物可分離性良好,符合要求[10]。經反復實驗與調整訓練樣本,使訓練樣本的可分離度調整到最佳狀態,見表1所列。
3.2結果分析
將研究區遙感影像7、4、6波段與5、4、3波段進行色彩合成,著重對不同類別的訓練樣本進行有效區分,可以將不同種地物差異展示出來。分別使用最大似然、神經元網絡及支持向量機等監督分類方法對研究影像作分類處理,結果如圖2所示。通過影像紋理信息及目視解譯判讀結果,對比發現,平行六面體法分類精度相對較低,在分類結果中容易出現錯分及邊界與實際情況不符的情況,最大似然、神經網絡、支持向量機分類法在整體分類上具有較好的分類效果。
4分類精度與效率評定
遙感影像分類精度評價因子主要包括:混淆矩陣、Kappa系數、總體分類精度、錯分誤差、漏分誤差、用戶精度、制圖精度等[11]。研究以總體精度與Kappa系數作為參考依據。結合驗證樣本,經數據分析,可初步得出以下分類精度評定結論:
神經網絡與支持向量機的總體分類精度較高,但神經網絡算法耗時較長,見表2所列。在選取的研究區域及當前的影像分辨率下,SVM分類方法的分類精度與效率綜合表現最佳,計算機分類時間均可在15s內完成,但不同分類方法時間消耗差異較大。
5結論
文章結合經實地踏勘的訓練樣本與驗證樣本,將研究區影像通過6種常見的分類算法進行依次的影像分類處理。可以得到:基于研究區數據與尺度,SVM分類算法在時間效率與分類精度綜合表現最佳。通過不同分類算法對實際數據處理的橫向對比,可以對不同分類器進行評定,也可以作為遙感影像解譯評定的參考依據。由于地表環境復雜多變,地表實際反射率與地球表觀反射率之間的差異,這些都給影像的分類造成難度,并且每次的實驗結果與所獲取數據的質量、實際地物類型、分類復雜度有著密切關系。如何根據實際情況,選擇最佳分類器,快速、準確的將圖像進行分類,需要我們對不同質量的數據進行分類實驗與數據分析,還需要我們對不同算法的原理進行更深入地研究。