李二森,張保明,楊 娜,楊靖宇,郭曉剛
(信息工程大學測繪學院,河南鄭州450052)
非負矩陣分解在高光譜圖像解混中的應用探討
李二森,張保明,楊 娜,楊靖宇,郭曉剛
(信息工程大學測繪學院,河南鄭州450052)
從線性混合模型與非負矩陣分解的定義出發,分析非負矩陣分解適用于高光譜圖像解混的原因,總結近年來學者們提出的基于非負矩陣分解的光譜解混算法,并重點對SC-NMF、MVC-NMF、APS-NMF算法步驟進行介紹與分析,最后總結非負矩陣分解及其應用于混合像元分解所面臨的問題。
混合像元;光譜解混;非負矩陣分解;線性混合模型;端元
混合像元在高光譜圖像中廣泛存在,傳統的硬分類方法可能會產生不準確的分類結果,而子像元分類方法能夠提供更加精確的分類結果用于確定細小的特征。如何從混合像元廣泛存在的高光譜遙感圖像中準確地提取端元,并有效地對混合像元進行分解,已成為遙感圖像定量分析的一個重要研究課題。
總的來說,混合像元分解模型可以分為兩類,即線性光譜混合模型(linear spectral mixture model,LSMM)和非線性光譜混合模型(nonlinear spectral mixture model,NLSMM)。其中線性光譜混合模型的原理簡單、效率高、物理意義明確,因而得到廣泛的研究和應用。
非負限制下的低階估計問題通常被稱作非負矩陣分解(nonnegative matrix factorization,NMF),NMF的思想可以追溯到1994年Paatero和Tapper的文章[1]。Lee和Seung在一篇關于非監督學習的文章[2]中也獨立地提出了NMF的概念,隨后他們發表在《自然》上的一篇文章給出了計算NMF的簡化算法[3],用于解決人臉識別和語義分析中的問題,而且他們以矩陣的歐氏距離和K-L散度作為目標函數,證明了NMF算法的收斂性。目前,NMF在人臉識別、數據挖掘、數據壓縮、非負數據的解譯、語音信號處理和神經生物學等領域中得到了廣泛應用[4-5]。NMF的數學模型與線性光譜混合模型十分相似,為將NMF應用于線性混合模型下的光譜解混提供了可能。文獻[6-7]將沒有附加任何限制的NMF直接應用于光譜解混,在試驗中取得了一定的成果,文獻[8-10]結合非負矩陣分解分別提出了平滑限制非負矩陣分解(smoothness constrained nonnegative matrix factorization,SC-NMF)、最小體積限制的非負矩陣分解(minimum volume constraint nonnegative matrix factorization,MVC-NMF)和交互投影子梯度非負矩陣分解(alternating projected subgradients-nonnegative matrix factorization,APS-NMF)應用于高光譜混合像元解混,在試驗中取得了較好的結果。
本文在分析線性光譜混合模型和NMF原理的基礎上,對NMF在光譜解混中的應用進行了研究,并對MVC-NMF、APS-NMF和SC-NMF三種算法進行了總結,最后分析了NMF及其應用于光譜解混面臨的問題。
線性光譜混合模型的表達式為

式中,x為l(l為影像波段數)維混合像元光譜,是已知觀測量;A為l×p(p為端元數目)端元矩陣或源矩陣,其中每一列為一個端元的光譜向量;向量s為該像元中各端元的豐度(abundance);ε為l維高斯隨機噪聲或模型誤差。如果將高光譜圖像的n個像元(n為像元個數)均考慮進式(1),則式(1)擴展為

式中,X∈Rl×n,其列向量為每個像元的光譜;S∈Rp×n,構成豐度矩陣或混合矩陣。圖1為式(2)表示的線性混合模型示意圖。對于線性混合模型而言,豐度矩陣S存在兩個限制條件:非負性限制(sij≥0,i=1,2,…,p,j=1,2,…,n) 以及其和為1的限制

圖1 線性混合模型示意圖
非負矩陣分解作為一種盲源分解(blind source separation,BSS)算法已經廣泛應用于人臉識別和語義分析中,其具體過程為:給定非負矩陣X∈Rm×n和正整數p(p<min(m,n)),非負矩陣分解的任務是尋找元素均為非負的矩陣A∈Rm×p和S∈Rp×n,滿足

或等價地寫為

式中,Xj為X的第j列列向量;Sj∈Rp;參數p為矩陣A的期望秩,并且一般情況下p為先驗信息或者可以由數據X確定。一般認為A的列向量代表了數據X中潛在的信息,如具有物理意義的非負成分。這一特性使得非負矩陣分解廣泛使用于數據分析、降維、特征提取、目標識別中。
解決NMF問題的很自然的方法就是通過最小化Y和AS之間的歐氏距離來尋找最優化途徑。

式中,符號‖‖2F代表Frobenius模。

對于代價函數式(6),許多文獻提出了學習準則,其中解決這個最優化問題的常用方法是文獻[3]中提出的乘法準則。該算法從兩個正矩陣開始,每次迭代過程中,將A和S的元素乘以一些正因子,以證明該方法 Y-AS2F在乘法準則下單調非增。為了加速NMF的迭代算法過程,文獻[4]提出了一種投影梯度限制的優化算法。非負矩陣分解經常遇到的問題就是局部最優,很明顯的是,如果矩陣D為可逆矩陣,則AS=(AD)(D-1S),因此NMF主要依賴于初始化和特定的學習策略。在很多應用中,需要通過增加限制條件來減輕NMF結果的非唯一性,將式(2)與式(3)比較不難發現,NMF具有使用于混合像元分解的潛力。
混合像元分解的步驟主要包括數據降維、端元提取和豐度估計三部分,其中端元提取是混合像元分解的關鍵。端元提取算法的分類方法較多:根據是否假定光譜數據中存在純像元,端元提取算法可分為兩類:端元識別算法(endmember identification algorithm,EIA)和端元生成算法(endmember generation algorithm,EGA),EIA直接從光譜數據中提取端元(即假定影像中存在純像元),算法的理論一般比較簡單,而EGA是從光譜數據中產生端元,算法的過程較為復雜。對于多(或高)光譜數據而言,由于地面分辨率等因素的限制,在大多數情況下,數據中并不存在純像元,因此,相對而言EGA提取的端元精度較高。NMF與線性混合模型具有一定的相似性:NMF通過線性結合尋找近似原始數據的非負基向量集,這些基向量的作用類似于端元。基于NMF的光譜解混算法不需要假定純像元的存在,并且在提取端元的同時可以獲取相應的豐度矩陣,屬于EGA算法。NMF適合應用于高光譜數據解混,主要原因包括[5]:
1)高光譜數據的空間維數和光譜維數都很高;
2)高光譜數據本身、端元光譜及其豐度均為非負;
3)高光譜圖像中,波段數大于圖像中端元的個數。
文中重點對近年來學者們提出的 SC-NMF、MVC-NMF、APS-NMF算法步驟進行總結和分析。
SC-NMF算法將平滑限制引入NMF中用于光譜解混、空間目標識別與分類。SC-NMF構建的目標函數為

SC-NMF算法的更新準則為
1) 初始化矩陣 Ai,j> 0 ,hi,j> 0 ,?i,j;
2) 當 t=1,2,…(取最大迭代次數)時則

由此可見,SC-NMF采用的是乘法更新準則,與非負矩陣分解的梯度下降算法、交互最小二乘算法相比,其效率不高。文獻[8]將SC-NMF算法應用于空間目標識別并與LEE的NMF算法[3]結果進行了比較,試驗結果表明SC-NMF算法光譜解混的結果更優。
MVC-NMF通過將體積限制加入到NMF中將最小二乘分析和凸面幾何結合起來。其提出的代價函數包括兩部分,一部分為估量觀測數據與端元和豐度重建數據之間的近似誤差,另一部分由最小體積限制組成。文獻[9]把這兩部分作為兩種力:外力(最小化近似誤差)使估計結果向點云外部移動,內力(最小化單體體積)在相反方向上使端元盡可能地相互靠近。算法具體過程為:
1)構建目標函數

式中,1p為元素全是1的p維列向量;1n為元素全是1的n維列向量;J(A)為懲罰項,計算用估計的端元構成的單體體積;λ∈R。
2)初始化:從點云數據中隨機選擇p個點并將它們構成A的初始值,S矩陣也可以隨機初始化,文獻[9]在試驗中將矩陣S初始化為零矩陣。
3)利用虛擬維(VD)估計端元數目p。
4)停止準則:給定迭代次數和誤差閾值。
5)根據一定準則計算能夠最小化目標函數的矩陣A、S,如果滿足停止準則,則迭代停止,否則,更新矩陣A、S,繼續尋找最小化目標函數的矩陣。
APS-NMF算法認為鄰域像素具有相似的豐度信息作為懲罰項引入NMF用于高光譜圖像解混。APS-NMF的目標函數為

式中,Si表示豐度矩陣 S的列向量;表示第i個像素的鄰域像素集。APSNMF利用交互投影梯度算法求解函數f(A,S)的最優解。文獻[10]將APS-NMF算法應用于 AVIRIS高光譜數據,取得了一定的試驗成果。
因為高光譜圖像空間分辨率較低,鄰域像素或許會差別比較大,將每個像素均同樣考慮鄰域像素的豐度相似性似乎不妥。
本文分析了線性混合模型與非負矩陣分解的定義及特點,總結了NMF適合應用于高光譜圖像解混的原因,重點對近年來的 SC-NMF、MVC-NMF、APS-NMF算法步驟進行了介紹與分析。雖然人們針對非負矩陣分解開展了不少的研究,并且在實際中取得了很好的應用,但非負矩陣分解及其應用于光譜解混仍然面臨一些問題。
1)初始化方法:好的初始化方法能夠提高算法運行的速度、加快算法收斂,目前大多數算法還只是采用隨機初始化方法進行初始化;
2)子空間選擇:到目前為止,還沒有確定最優p值(非負矩陣分解的最低階數)的方法,該問題比較困難且常取決于實際應用;
3)最優化問題:目前,所有的NMF方法都存在該缺點,即求取的結果并非全局最優,而是局部最優解;
4)并行算法研究:由于大多數NMF方法存在雙線性特性,因此可以研究非負矩陣分解的并行算法,提高算法的效率。
[1]PAATERO P,TAPPER U.Positive Matrix Factorization:A Non-negative Factor Model with Optimal Utilization ofError Estimates of Data Values[J].Environmetrics,1994(5):111-126.
[2]LEE D D,SEUNG H S.Unsupervised Learning by Convex and Conic Coding[J].Advances in Neural Information Processing Systems,1997(9):515-521.
[3]LEE D D,SEUNG H S.Learning the Parts of Objects by Nonnegative Matrix Factorization[J].Nature,1999,401(10),788-791.
[4]GILLIS N,GLINEUR F.Using Underapproximations for Sparse Nonnegative Matrix Factorization[J].Pattern Recognition,2010,43(4):1676-1687.
[5]賈森.非監督的高光譜圖像解混技術研究[D].杭州:浙江大學,2007.
[6]MASALMAH Y M.Unsupervised Unmixing of Hyperspectral Imagery Using the Constrained Positive Matrix Factorization[D].Puero Rico:The University of Puerto Rico Mayaguez Campus,2007.
[7]PARRA L C,SAJDA P,DU S.Recovery of Constituent Spectra Using Non-negative Matrix Factorization[J].SPIE Proceedings,2003,5207(11):321-331.
[8]PAURA V P,PIPER J,PLEMMONS R J.Nonnegative Matrix Factorization for Spectral Data Analysis[J].Linear Algebra and Applications,2006,416(7):29-47.
[9]MIAO L,QI H.Endmember Extraction from Highly Mixed Data Using Minimum Volume Constrained Nonnegative Matrix Factorization[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(3):765-777.
[10]ZYMNIS A,KIM S J,SKAF J,et al.Hyperspectral Image Unmixing via Alternating Projected Subgradients[C]∥Proceeding of 41st Asilomar Conference on Signals,Systems,and Computers.Pacific Grove,CA:[s.n.],2007.
Discussion of the NMF’s Application for Hyperspectral Imagery Unmixing
LI Ersen,ZHANG Baoming,YANG Na,YANG Jingyu,GUO Xiaogang
0494-0911(2011)03-0007-04
P237
B
2010-01-08;
2010-06-23
礦山空間信息技術國家測繪局重點實驗室(河南理工大學,河南省測繪局)開放基金資助項目(KLM200904)
李二森(1984—),男,河南新安人,博士生,主要研究方向為高光譜圖像處理和模式識別。