李慶波,苗興晉
北京航空航天大學儀器科學與光電工程學院,精密光機一體化技術教育部重點實驗室,北京 100191
隨著航天領域科學技術的不斷發展,空間人造目標的觀測與識別具有重要的研究意義和價值。空間人造目標主要包括大氣外繞地運行的各種在軌工作或者停止工作的航天器、人造衛星等。空間人造目標光譜觀測是利用光譜儀獲取目標的光譜信息,可以根據目標光譜特征來識別分析目標的材料信息。光譜觀測系統靈活、方便,對空間人造目標觀測具有重要意義。由于觀測距離和觀測設備空間分辨率的限制,空間人造目標光譜通常是一個“混合光譜”,為空間人造目標的某個瞬時視場中多種純物質材料的光譜特征的組合[2]。因此,在利用光譜信息分析空間人造目標材料組成和特性之前,需要確定混合光譜中包含的純物質材料的數目,即,“端元數目”。盡管端元數目確定方法受到了廣泛關注和研究,但其仍然是一個具有挑戰性的研究領域。
目前,針對混合光譜中端元數目的確定,很多算法被開發出來。最著名的是一種基于“虛擬維度”(virtual dimension,VD)的方法[3],稱為噪聲白化(noise whitening)的Harsanyi-Farrand-Chang(NWHFC)方法。其依賴于Neyman-Pearson檢測理論,根據一個輸入的虛警概率進行決策。該方法的缺點是需要人工輸入一個錯誤警報參數,最終結果對該參數非常敏感。另一種方法是最小誤差光譜信號子空間識別方法(hyperspectral signal subspace identification by minimum error,HySime)[4]。該方法不需要輸入參數,在滿足最小均方根誤差的條件下,確定包含數據有效信息的最佳線性子空間的維數。但是該方法在信噪比較低、輸入光譜數據維度較高時會有較大誤差。此外,有學者提出了一種基于隨機矩陣理論(random matrix theory,RMT)的方法[5]。該方法基于RMT的最新研究,根據一個理論閾值以區分信號協方差矩陣中由噪聲引起的特征值和由信號引起的特征值。但是該方法需要一個由光譜數據統計分布信息所估計的閾值,當該閾值估計誤差較大時,算法結果的誤差也大。因此,本文提出了一種魯棒特征值極大似然(robust eigenvalue maximum likelihood,REML)方法實現空間人造目標混合光譜端元數目的確定,該方法能夠有效抑制高斯白噪聲和頻譜相關噪聲的干擾,且不依賴于任何輸入參數和固定閾值。
1.1.1 數據預處理
傳統的端元數目確定方法假定噪聲為獨立同分布的高斯噪聲,這對于實際的空間人造目標光譜是不正確的,其往往會受到頻譜相關噪聲的干擾。因此,需要一個預處理步驟——噪聲特性估計和噪聲白化,來抑制頻譜相關噪聲的干擾。本文采用基于多元回歸的方法來估計噪聲協方差矩陣[6-7],該方法當存在非高斯白噪聲時,效果較好。接下來,使用一個噪聲白化步驟將光譜數據轉換到一個新的主成分空間來實現抑制頻譜相關噪聲的影響,具體方法如下:

F=PTKP
(1)

(2)

(3)
則經過上述變換后,原始光譜數據即被轉換到一個新的主成分空間中,轉換光譜數據由頻帶不相關的噪聲組成,且該方法允許在噪聲協方差矩陣估計過程中存在一定誤差。
1.1.2 特征值極大似然方法
l=1,2,…,L
(4)

(5)
上述統計分布對應的離散的對數聯合似然函數見式(6)
(6)
該對數聯合似然函數將會在l=M+1時取得最大值,則混合光譜所包含的端元數目的估計值見式(7)

(7)
因此,該方法不需要任何輸入參數和固定閾值即可完成空間人造目標混合光譜端元數目自動確定。
1.2.1 仿真實驗一
為了分析評價本文提出的空間人造目標混合光譜端元數目自動確定方法(簡稱REML),使用實驗室測得的五種空間人造目標常用的材料(白漆、太陽能電池板、聚酰亞胺、鋁箔、外包覆)的可見/近紅外光譜特征作為純物質材料端元光譜進行仿真實驗。實驗裝置示意圖如圖1所示,實驗所使用的光源為Laser-1鹵鎢燈,光譜儀選用美國海洋光學公司的USB4000光纖光譜儀;使用QR400-7-VIS-BX型Y型光纖探頭測量材料的反射光譜,測量波長范圍是400~1 000 nm,光譜波長分辨力為0.2 nm。測量參數設置為:積分時間12ms,平滑度10,平均次數16,每條光譜數據包含3 091個波段,實驗測得光譜結果如圖2所示。

圖2 五種空間人造目標材料的光譜特性Fig.2 Spectral signatures of five artificial space target materials
在獲取到空間人造目標純物質材料實驗室光譜特性后,根據迪利克雷(Dirichlet)分布函數生成相應比例參數,將這五種材料光譜按該比例參數進行混合,從而形成空間人造目標混合光譜仿真數據集,共4 000條混合光譜。對該數據集分別添加20 dB,30 dB的高斯白噪聲和頻譜相關噪聲,以模擬實際光譜獲取過程中所受到的噪聲干擾。將本文提出的REML方法和一些常用的空間人造目標端元數目確定方法:噪聲白化的NWHFC方法[3],HySime方法[4],特征間隔法(noise-whitened eigengap approach,NWEGA)[5],進行比較,為了探究算法的準確性和穩定性,實驗中每種算法均重復運行50次,結果取50次運行的平均值,保留兩位小數。
1.2.2 仿真實驗二
由于未知空間人造目標的組成材料種類和數目多變,并且不完全已知,因此,需要進一步探究本文所提出的方法在空間人造目標混合光譜端元數目變化的魯棒性。本實驗使用美國地質勘測局(United States Geological Survey,USGS)光譜數據庫中隨機選擇3,5,7和9條光譜數據作為純物質材料光譜構建混合光譜仿真數據集,其包含224個波段(波長范圍是370~2 500 nm),共5 000條混合光譜。為了模仿數據采集過程,將具有不同信噪比的頻譜相關噪聲分別添加到仿真混合光譜數據中。同樣,將本文提出的REML方法和一些常用的空間人造目標端元數目確定方法(NWHFC,HySime以及NWEGA)進行比較,實驗中每個方法均重復運行50次,結果取50次運行的平均值,保留兩位小數。
表1和表2顯示了NWHFC,HySime,NWEGA以及本文提出的REML算法在不同信噪比、不同類型噪聲干擾下對由五種空間人造目標材料生成的混合光譜數據的端元數目的估計結果。其中NWHFC_1,NWHFC_2 和NWHFC_3分別表示輸入虛預警參數分別為{10-3,10-4,10-5}的NWHFC算法。圖3表示在信噪比為20dB時不同類型的噪聲干擾下,REML算法的對數聯合似然函數值關于特征值指數的變化。

圖3 信噪比為20 dB時不同類型噪聲干擾時REML的對數聯合似然函數值Fig.3 Logarithmic joint likelihood function values of REML for different types of noise (SNR: 20 dB)

表1 高斯白噪聲干擾下各個算法實驗結果比較Table 1 Comparison of experimental results of various algorithms under the Gaussian white noise

表2 頻譜相關噪聲干擾下各個算法實驗結果比較Table 2 Comparison of experimental results of various algorithms under the spectrally correlated noise
從表中實驗結果可以看出,對于不同種類和信噪比的噪聲,HySime算法的實驗結果出現較大誤差。REML算法和NWHFC算法對端元數目的確定均取得了較好的實驗結果。但是,當信噪比較低時,NWHFC算法的效果有所下降;對于NWEGA算法而言,其運行結果的穩定性較差,這可能是由于其存在一個基于數據統計信息(易受噪聲干擾)的硬閾值導致了計算結果的波動性。另外,從圖3中可以看出,REML中的對數聯合似然函數的值在不同類型噪聲干擾下均能夠在正確的特征值指數下取得最大值。因此,本文所采

表3 端元數目不同時頻譜相關噪聲干擾下各個算法實驗結果比較Table 3 Comparison of experimental results of various algorithms under the spectrally correlated noise with different numbers of endmembers
用的REML算法則展現出對頻譜相關噪聲和白噪聲干擾均有較強的魯棒性。
第二組實驗旨在探究不同算法對混合光譜端元數目變化的魯棒性,實驗結果如表3所示,為噪聲干擾為頻譜相關噪聲的實驗結果。
就端元數目變化對算法的影響而言,當混合光譜包含的純物質材料數目變多時,NWHFC出現了低估現象,NWEGA存在高估和低估現象,表明這兩種算法難以區分出不同信號源的差異性。當虛預警參數發生變化時,NWHFC算法的實驗結果也發生變化,這也是該算法一個局限性。另外,當噪聲信號存在頻譜相關性時,HySime算法出現了嚴重的高估現象,完全無法使用。REML算法的實驗結果具有很好的準確性和穩定性,展現出對端元數目變化較強的魯棒性。
提出了一種用于確定空間人造目標混合光譜純物質材料數目的全自動方法,該方法可以有效解決空間人造目標光譜觀測過程中所存在的頻譜相關噪聲的干擾問題。其優勢和特點如下:首先,該方法無輸入參數,且不基于固定閾值;其次,當光譜信號受到白噪聲和頻譜相關噪聲的干擾時,由于利用了一個有效且允許有一定估計誤差的噪聲特性估計和噪聲白化方法,能夠有效抑制噪聲對計算結果的干擾。實驗結果表明,該方法能夠準確且穩定地確定空間人造目標混合光譜中純物質材料的數目。因此,該方法在利用光譜信息進行空間人造目標材料分析領域具有廣闊應用前景。