申少格,楊渭清,楊紹靜
(西安文理學院信息工程學院,陜西西安,710065)
本文利用遙感技術獲取秦嶺生態環境變化的基本數據,如森林覆蓋狀況變化、土地利用變化、濕地資源狀況變化等,結合相應算法和模型,為保護秦嶺措施提供評估依據。
故而遙感動態監測方法顯得尤為重要,從不同時期的遙感數據中,定量的分析和確定地表變化特征與過程,它涉及到變化的類型、分布狀況與變化量,即需要確定變化前后的植被覆蓋率、界限即變化趨勢,能提供地物的空間分布及其變化的定性和定量分析。它主要包括數據源選擇,圖像輸入與瀏覽,圖像預處理,圖像信息提取,成果報告與應用等過程。在此,本文主要研究圖像信息提取,采用先進的KPCA算法和K-Means++算法進行優化,來得到更優結果。具體過程如圖1所示。

圖1 植被動態變化監測過程
在研究圖像信息提取前,本文首先對所下載的圖像進行預處理等操作,將圖像的數字量化值(DN)轉化為輻射亮度值域,改變其地類波譜曲線,并通過大氣校正將反射信息從大氣和太陽的信息中分離出來,消除其對地物反射的影響,根據RMSE與SE關系判斷是否需要幾何校正,最后再進行行政區域裁剪,將研究之外的區域去除[2]。
遙感影像通過亮度值或像元值的高低差異(反應地物的光譜信息)及空間變化(反應地物的空間信息)來表示不同地物的差異,這是區分不同影像地物的物理基礎。遙感影像分類是利用計算機通過對遙感影像中的各地地物的光譜信息和空間信息進行分析、選擇特征,將圖像中的每個像元按照某種規則或算法劃分為不同的類別,然后獲得遙感影像中與實際地物的對應信息,從而實現遙感影像的分類,即信息提取。遙感圖像信息提取又包括人工解譯、自動分類、特征提取、動態監測、反饋、高程提取等過程。本文主要對分類算法進行改進,將傳統的PCA算法改為KPCA,將K-Means算法改為K-Means++[3]。
首先考慮在一維向量(M=1)上的投影,此時映射向量U的大小為D*1,用u1代替,同時設置,(因為我們只對u1的方向感興趣,對其大小不感興趣)。數據點xn被投影到上,投影數據的均值為。其中為樣本的均值:

也就是說,我們將u1設置為矩陣S的最大特征值1λ所對應的特征向量時,此時投影數據的方差有最大值,此特征向量也被稱為第一主成分。同理,我們可以用一種增量的方式定義額外的主成分,方法為:在所有與那些已經考慮過的方向正交的所有可能方向中,將新的方向選擇為最大化投影的方向。簡單的說就是考慮矩陣S前M特征向量,組成映射矩陣U
核主成分分析(KPCA)[4]是在傳統PCA的基礎上,為了更好的圖區適合分類的特征,提出的一種改進算法,它是通過某種隱式方法將輸入數據映射到特征空間F,并在特征空間中實現統計主元分析,進而有效的提取非線性特征。

根據(10)式和(12)式分別計算投用主分量和特征向量。
設測試樣本為x,則其在vj上得投影。

K-Means使用聚類分析方法,隨機的查找聚類簇的聚類相似度相近,即中心位置,是利用各聚類中對象的均值所獲得一個“中心對象”(引力中心)來進行計算的,然后迭代地重新配置他們,完成分類過程。
但是在使用K-Means進行特征聚類的過程中發現,K-Means隨機選取初始聚類中心,導致每次聚類所產生的結果不同,導致算法收斂很慢甚至出現聚類出錯的情況[5]。
由于秦嶺地區的植被類型多樣、物種豐富,所以隨機選取聚類中心對于秦嶺地區的植被變化檢測研究存在很大的局限性。然而在K-Means基礎上改進的K-Means++方法能夠使初始聚類中心盡可能的分散開,有效的減少迭代次數,加快了運算速度[6]。
因此我們選擇K-Means++方法對特征提取后的數據進行特征聚類。
為了進一步確認改良方法的正確性,選擇西安秦嶺北麓2013年和2017年的圖像,在對圖像進行預處理之后,我們首先采用傳統的PCA算法,對信息進行分類提取,如圖2所示。

圖2 主成分分析動態監測結果
再采用改良算法KPCA和K-Means++對預處理的數據進行信息分類提取。如圖3所示。

圖3 改進方法后動態監測結果
根據圖2和圖3的結果,首先可進行目視對比法對比,其次,我們使用計算機技術,對兩次圖形信息進行分類提取,結果如圖4所示。

圖4 原始方法與改進方法對比圖
由實驗結果可看出,改進的方法得出的圖像像元更加精細,處理結果更加明顯。能夠更加精準的反映秦嶺植被動態變化,為秦嶺生態保護提供更加可靠的依據。
本文基于PCA和K-Means算法設計出改進之后的KPCA及K-Means++算法,對采集的數據進行信息分類提取,并對提取的信息進行變化檢測。將輸入數據映射到特征空間F,并在特征空間中統計主元。實驗結果顯示,改進的算法提高了準確度。運用于實際更加有利。