鄭志峰,曹建農,張雯佼
(1. 長安大學地球科學與資源學院,陜西 西安710054; 2. 陜西省測繪地理信息局,陜西 西安 710054)
早在1995年,土地利用、覆蓋變化的研究就成為全世界學者研究的焦點和趨勢[1]。主要目的是增強人們認識全球土地利用和土地覆蓋變化的力度,而且重點提高估計這種變化的能力。隨著衛星系統應用范圍的不斷擴大,遙感影像變化信息提取和變化檢測已成為地理國情監測領域的重要內容[2]。其中,遙感影像變化檢測技術作為測繪技術的重要分支,提升其技術水平已成為地理國情監測的迫切需要[3]。
遙感影像變化信息提取中構造差異影像與變化信息的閾值提取是兩個主要的研究方向。對于普通的多光譜影像來說,影像各個波段間存在數據冗余與數據相關等問題,同時影像變化信息提取的效率與試驗結果對差異影像的生成也帶來一定的挑戰。經典的遙感影像變化檢測方法有:代數計算如影像比值、影像差值法,影像變化向量分析等[4-5]。Singh利用影像比值、影像差分、影像回歸、歸一化植被指數差分等方法進行熱帶雨林植被的變化信息檢測,并采用不同時相的MSS影像對不同方法的結果進行對比分析,但直接對所有的波段影像進行運算沒有消除多波段影像間的相關性。影像變換法主要包括纓帽變換(K-T變換)、主成分分析法(PCA)[6]、獨立成分分析法(ICA)[7]、多元變化探測(MAD)[8]等。該類方法主要通過變換分析的思想,將影像中的差異信息或變化信息集中到幾組不相關的變量中,進而提取影像間的變化信息,但變化檢測結果對多時相影像間的輻射差異敏感、對變量的檢測尺度依賴較大,但當多時相影像數據間有多重共線的情況時提取變化信息效果較差。對于差異影像變化檢測閾值的提取,傳統的方法是人工選擇樣本提取變化檢測閾值,但樣本選擇的合理性難以確定,結果人為干擾因素比較大。文獻[9—10]采用SVM算法確定變化區域與非變化區域的最優分類超平面,完成遙感影像變化信息的提取,但提取結果對樣本數據的選擇比較敏感。文獻[11—12]以EM算法提取,采用PCA構造的差異影像變化檢測閾值,提取變化信息,但國外學者BAZI[13]通過試驗證明若提取區域非變化比例較大,變化檢測閾值難以準確獲取??紤]遙感成像復雜環境的影響因素及現實中地表覆蓋變化率較小的情況,變化檢測的具體閾值經常難以確定,如果僅僅考慮差異影像灰度值的整體統計問題,而不考慮影像整體變化率的影響,算法的效率、精度等較差,無法滿足地理國情監測的需求。
針對上述問題,本文提出PLS和EM算法結合的局部遙感影像確定變化檢測閾值的變化檢測算法。首先,采用偏最小二乘算法去除多波段影像間的冗余信息,提取波段間的獨立成分,有效地構造差異影像和集中變化信息,并依據PLS變換分析獲得差異信息計算獲得差異影像;然后,對整幅影像分塊選取變化率最大的區域,采用最大期望的方法將多維數據進行分類,避免傳統方法選擇訓練樣本效率低的問題,提高變換檢測的自動程度與試驗結果的精度;最后,采用形態學算子對提取的變化信息進行后處理,減弱“椒鹽現象”的影響,得到的變化檢測結果更加符合地表的真實情況。
近年來,快速發展的一種新的多元數據統計分析PLS模型是通過最小化誤差平方和找到一組數據的最佳函數匹配,在理論、方法和應用方面都有了快速的發展。PLS通過對多時相影像數據多元線性回歸分析,降低影像數據本身的相關性,同時解決前后兩組影像數據間的相關問題,有效解決多源變量間的多重共線問題。
假設有m個自變量{x1,x2,…,xm}和n個因變量{y1,y2,…,yn}。統計K個樣本組成的數據集自變量X=[x1,x2,…,xm]K×m和因變量Y=[y1,y2,…,yn]K×n間的關系。為減少數據間差異,首先分別對前后影像數據進行預處理,獲得處理后的前期影像數據矩陣E0和后期影像數據矩陣F0。在E0和后期影像數據矩陣F0中提取第一對主成分t1和μ1,且t1和μ1滿足:
(1) 確保t1和μ1分量盡可能多地提取原始影像的信息。

(1)
回歸方程的殘差矩陣采用E1和F1表示;回歸向量系數p1、r1應滿足
(2)

(3)

期望最大算法是無需外來數據和先驗知識對有數據丟失的數據集進行最大似然估計的常用算法[14-15]。針對小比例變化量區域進行變化檢測,通過樣本選擇的方法選擇整幅影像中具有大比例變化量的局部區域作為訓練樣本,利用EM算法確定變化檢測閾值。假設選擇的局部影像變換后的數據集存在變化與非變化兩個相互獨立且整體上服從混合高斯分布的數據集。因此,運用EM算法求解極大似然進行參數估計的過程如下:
(1) 初始參數的確定:由于初始參數對EM算法結果影響較大,本文選取圖上少量樣本獲得數據集的期望步的參數,即均值μk、協方差Σk、混合比例πk。
(2) 計算期望(E-step):假設模型參數已知的情況下求隱含變量Z,分別取Z1、Z2、…、Zk的概率,即在GMM中求數據點由各個成分生成的概率為
(4)
(3) 最大化期望(M-step):最大化E步得到的最大似然值重新估計分布參數為
(5)
(4) 極大似然函數估計
(6)
檢查參數與似然函數是否收斂,迭代運算步驟(2)—(3)直至收斂,實現變化與非變化的聚類。
本文采用杭州市2013年和2016年的高分一號衛星的多光譜影像數據進行試驗。選取空間分辨率為2 m的全色波段與空間分辨率為8 m的多光譜數據進行融合。為了滿足變化檢測影像一一對應關系,首先,對前后時相影像進行空間配準,配準誤差控制在0.5像素以內;然后,以2016年的遙感影像數據為基準,對2013年影像采用直方圖匹配算法進行相對輻射校正;最后,參考文獻[16]將配準后的多時相的影像進行疊加,并對疊加后的影像進行多尺度分割,將分割結果拆分成疊加前的遙感影像,由此分別得到2個時相影像的分割結果,綜合考慮了2個時相影像的光譜和空間信息,保證了不同時相相同影像位置所對應的像斑包含的像元相同,并在各自的時相中具有光譜、空間同質性,利于進行像斑級的比較和分析。圖1為杭州市2013年及2016年OLI傳感器多光譜與全色影像采用NNDiffuse Pan Sharping法融合后321波段融合生成的真彩色影像。

圖1 合成真彩色影像


圖2 成分對應變量系數

分量均值的標準差標準差的均值典型相關系數信噪比PLS_13.3546.41×10-1035.128.57PLS_22.1298.06×10-1031.827.32PLS_32.1564.24×10-1029.396.78PLS_40.5121.47×10-109.160.96
由PLS_1、PLS_2、PLS_3提取的影像采用差值法構造差異影像,影像可以看作是由符合變化和非變化兩類混合分布的像元組成,采用這個變化強度影像來進行閾值確定的試驗,利用文中公式計算出局部EM算法的變化閾值為92,小于該閾值的影像標記為非變化。圖3(e)為采用本文方法得到的變化檢測結果圖,其中白色表示變化區域,黑色表示非變化區域。試驗結果表明,本文提出的變化檢測算法能較很好地提取出耕地/荒地-道路、耕地/荒地-建筑物、水體-耕地植被覆蓋等變化。
為了驗證本文提出變化檢測算法的有效性,將PCA-EM、MAD-EM及PLS-全局EM變化檢測算法同本文試驗算法進行對比。將試驗結果同人工目視解譯結果進行對比分析,采用漏檢率、誤檢率評價變化檢測精度[17]。圖4為不同變化檢測算法的試驗結果圖。

圖3 不同算法的變化檢測結果
表2給出了不同算法的變化檢測精度。由表2可知,文中提出的基于PLS和局部EM算法變化檢測結果的正確率最高,漏檢率和誤檢率最低。這是由于PCA方法僅考慮影像內部的相關性,缺少對多時相影像間的相關性的考慮,而且PCA-EM算法對多時相影像相對輻射校正的結果有較高要求;對多時相影像的多波段的重組影像進行MAD變換,雖然消除了多時相影像間的相關性,解決了構造差異影像問題,但是難以解決變化信息有效集中的問題。PLS變換考慮多時相影像間的線性關系,提取影像間相關性較高的成分,有效地消除了影像間的多重共線性,從而解決了變化信息有效集中的問題,為整體上提高變化檢測正確率提供必需信息。另外,將局部EM(最大期望)確定閾值方法與全局EM確定閾值方法進行對比,試驗結果表明全局EM閾值確定方法對差異影像直方圖擬合效果差,而局部EM閾值方法對于小比例變化區域,能準確確定變化檢測閾值,減少了自動閾值算法的不確定性??傊?,本文提出的PLS-局部EM算法變化信息基本都能檢測出來,更加符合真實情況,提取信息結果比較理想。

表2
本文針對多時相影像間多重相關性提出了一種PLS與局部EM結合的高分辨率遙感影像變化檢測算法。該方法首先采用多時相影像PLS變換分析提取主成分影像構造差異影像,然后利用局部變化比例較大的影像確定變化檢測閾值,最后根據構造的差異影像與局部EM算法提取的閾值提取變化信息。試驗表明,文中提取的算法能夠提取絕大多數地物類別變化信息,與傳統的算法相比檢測精度最高,同時解決了小比例變化區域閾值確定問題。但文中未對地物類別信息進行變化判斷及變化趨勢的預測,這些內容有待于進一步研究。