杜 非, 李一博, 靳世久, 曾周末
(天津大學 精密測試技術及儀器國家重點實驗室,天津 300072)
?
基于臨界特征值的MDL信源數欠估計分析方法
杜 非, 李一博, 靳世久, 曾周末
(天津大學 精密測試技術及儀器國家重點實驗室,天津 300072)
針對最小描述長度準則下的信源數欠估計問題,提出了一種基于臨界特征值的欠估計分析方法,通過對信源數估計算法進行分析,給出了臨界特征值的求解表達式及唯一性證明。相比現有方法,臨界特征值方法可對不同漏檢數下的欠估計邊界進行預測,并評估陣列參數對信源數估計性能的影響。為解決大漏檢數下的臨界特征值的求解復雜問題,提出了一種近似方法,分析了近似誤差的影響因素。仿真數值實驗結果表明,臨界特征值方法可準確描述算法在不同漏檢數下的欠估計邊界,為基于信息論準則的信源數估計算法提供了一種新的具有普適性的分析手段。
MDL準則;信源數估計;欠估計;陣列信號處理
陣列信號處理技術廣泛應用于雷達、通信、聲納、無損檢測等多個領域。信源數估計是陣列信號處理中的重要問題,估計結果的準確度及傾向性對如空間譜估計、到達角定向等后繼算法的性能和策略具有重要影響[1]。
信源數估計方法的原理包括假設檢驗、信息論、特征向量正交性等[2]。其中以Akaike信息論準則(Akaike Information Criterion,AIC)[3]和最小描述長度準則(Minimum Description Length Criterion,MDL)[4-5]為代表的信息論方法由于其符合最大似然估計理論,計算相對簡單,在工程實踐中得到廣泛應用。WAX等[6]指出盡管AIC準則在小快拍數下具有相對更好的性能,但無法實現一致估計,呈漸近的過估計趨勢;而MDL信源數估計算法在快拍數較大時具有估計一致性,在對快拍數要求不高的場合下具有更好的性能優勢。然而,在信號具有相似的子空間時,MDL信源數估計算法容易發生欠估計現象,導致信號源的漏檢,是制約其應用的主要問題。研究MDL信源數估計算法的欠估計條件,對改善其在低信噪比等惡劣條件下的性能,以及后繼算法的研究具有重要的指導價值。
現有方法多基于概率理論對MDL信源數估計算法的欠估計現象進行研究。ZHANG等[7]指出相關矩陣特征值與噪聲功率的比值,以及采樣快拍數會影響MDL信源數估計算法的欠估計條件,但只給出了定性的結果。KRITCHMAN等[8]給出了基于相關矩陣特征值描述的欠估計條件的近似表達式, NADLER等[9]后繼又提出了算法正確檢測概率不低于0.5的近似條件。LU等[10]得到了基于信號特征值與噪聲特征值均值之比表示的算法欠估計條件,并分析了算法的欠估計邊界,但并未對算法性能的影響因素進行討論。此外,現有方法均主要針對算法的欠估計條件進行研究,而對于算法的欠估計程度未做深入探討。
本文提出了一種基于臨界特征值的MDL信源數估計算法的欠估計分析方法,給出了臨界特征值的唯一性證明,分析了快拍數和陣元數量對算法性能的影響,并基于仿真實驗驗證了本文方法的有效性。相比現有方法,本文提出的方法能夠準確描述不同漏檢數下算法的欠估計邊界,可評估特定參數下信噪比對信源數估計結果的影響,具有較高的應用價值。由于大多數信息論方法與MDL準則具有相似的表達形式,因此本文提出的方法具有良好的普適性,可用于如HQ[11], WIC[12], FDC[10]等算法的性能分析和評估。
K個遠場窄帶信號源傳播到具有N(N>K)個陣元的線陣列的信號模型可描述為
x(t)=A(θ)s(t)+n(t)
(1)
式中:x(t)為各陣元所觀測到的時域信號,A(θ)為N×K的陣列流形矢量矩陣
A(θ)=[a(θ1),a(θ2)…a(θK)]
(2)

R=E{x(t)xH(t)}=
(3)
記無噪聲矩陣=A(θ)RSAH(θ)的特征值為λi,并降序排列有
(4)
式中:
λ1≥λ2≥…≥λK
(5)
則R的特征值為
(6)
并且
(7)

(8)
相應的特征值記為
(9)

2.1 MDL信源數估計算法的欠估計條件
獨立高斯條件下,基于理想相關矩陣R的特征值表示的MDL信源數估計算法的計算方法為
MDL(k)=-L(k)+y(k)=
(10)
式中:T為信號采樣的快拍數,L(k)為最大似然項,y(k)為懲罰項,則估計信源數K′為

(11)
理想情況下,當快拍數T趨于無窮大時,算法將得到信源數量的真實估計。然而在實際應用中,快拍數T過大將對算法的實時性產生影響,陣元數量亦受到應用條件的制約。因此,需對算法的欠估計發生條件進行研究,并分析快拍數、陣元數量和信噪比等參數對算法性能的影響。
假設真實信源數量為K,算法估計得到的信源數量為K′,當K′≤K-1時,即存在欠估計的情況,有
MDL(K-1) (12) 將式(10)代入式(12),得到 (13) 化簡有 (14) 為進一步簡化,定義 (15) 則式(14)可改寫為 (16) 式(16)即為算法發生信源數欠估計的必要條件。為進一步分析,左式對bK求導有 (17) 2.2 不同漏檢數下算法的欠估計條件 多信源條件下,漏檢數可有效描述算法的欠估計程度??紤]估計信源數K′≤K-d的情況,d為最小漏檢數,有 MDL(K-d) (18) 將式(10)代入式(18),得到 (19) 與式(15)類似,假設 (20) 有 (21) 式(21)即為漏檢數大于等于d的必要條件。當不等式取等時,解得的bK-d+1即為最小漏檢數d所對應的臨界特征值bK-d+1,CRT。將bK-d+2,bK-d+3…bK視為常數,式(21)左側對bK-d+1求導有 (22) 因為bK-d+1>bi,i≥K-d+2,所以有 (23) 式(22)在bK-d+1的取值區間內大于零,因此式(21)的左式隨bK-d+1單調遞增,可求出其唯一解bK-d+1,CRT。臨界特征值bK-d+1,CRT除與快拍數T,信源數量K及陣元數量N有關外,還與bK-d+2…bK等d-1個特征值與噪聲功率之比有關。臨界特征值bK-d+1,CRT越小,算法對噪聲的抗性越好。 2.3 欠估計概率分析 (24) 即不發生相位反轉的條件下服從以下正態分布: (26) 根據式(16)中左式的單調遞增特性,其成立的概率等價于 (27) 臨界特征值bK,CRT僅與陣列參數有關,因此可根據正態分布累積分布函數直接求得信源數欠估計概率隨信噪比的變化。同理,式(21)成立的概率為 (28) 值得注意的是,臨界特征值bK-d+1,CRT不僅取決于陣列參數,還和bK-d+2…bK之和有關。為便于計算,本文中假設僅考慮信噪比對bK-d+2…bK期望值的影響,忽略其隨機誤差。根據式(26)可以得知,在快拍數較大的情況下,這一假設將具有較好的近似性。 上文中提到快拍數T,陣元數量N和信源數量K等參數對MDL信源數估計算法的性能存在明顯影響,本節將基于臨界特征值理論對算法性能的影響因素進行研究。 3.1 最小漏檢數為1時的算法性能分析 首先對估計信源數K′≤K-1,即算法存在欠估計的情況進行研究。對于快拍數量T,根據式(16)可知,由于lnT/T項的存在,當快拍數T增大時臨界特征值bK,CRT將逐漸變小,算法性能得到改善。當快拍數T無 限大時, 臨界特征值bK,CRT等于1。由于bK>1,此時算法將不存在欠估計現象,可正確估計信號源的真實數量。然而,實際應用中快拍數不可能無限大,為控制算法發生欠估計的概率,可基于臨界特征值方法計算得到所需的最小采樣快拍數。 對于信源數量K和陣元數量N,從式(16)中可以看出,當其他參數保持不變,N-K為相同值時,所求得的臨界特征值bK,CRT理應相同,直觀上兩者對算法性能應具有相反影響。然而,陣元數量N與相關矩陣R的跡呈線性正相關,N增加時R的特征值也會增加,因此在分析陣元數量N的影響時需對臨界特征值bK,CRT進行歸一化處理。信源數量K與R的跡同樣具有正相關性,但并非線性相關,具體與陣元數量N和信噪比有關,無法簡單的對其進行歸一化處理;并且在實際應用中,信源數量K的增加可能使信號具有相近的子空間,使相關矩陣特征值發生變化,因此本文僅針對快拍數量T和陣元數量N對算法性能的影響進行討論。圖1為不同信源數量K下,快拍數T和陣元數量N對歸一化臨界特征值的影響,經過歸一化處理的bK,CRT隨著快拍數T和陣元數量N的增加而降低,預示著算法性能的提高。隨著快拍數T的增加,提高快拍數所帶來的邊際效益有所下降,這是由于lnT/T項的減小速率變緩導致的。 圖1 歸一化臨界特征值bK,CRT隨快拍數和陣元數量的變化Fig.1 The variation of normalized bK,CRT with the number of snapshots and array elements 3.2 多漏檢數下的算法性能分析 當最小漏檢數d>1時,由式(21)可以得知,臨界特征值bK-d+1,CRT除受到快拍數T,陣元數量N和信源數量K的影響以外,還與bK-d+2…bK等d-1個特征值與噪聲功率的比值有關。為表述方便,在對臨界特征值bK-d+1,CRT進行分析時,假設bK-d+2…bK的取值分別為其對應的臨界特征值bK-d+2,CRT…bK,CRT,在這一假設下研究各項參數對算法性能的影響。 圖2為最小漏檢數d=2時,不同信源數量K下歸一化的臨界特征值bK-d+1,CRT隨快拍數T和陣元數量N的變化。與最小漏檢數為1的情況類似,歸一化的bK-1,CRT隨著快拍數T和陣元數量N的增加而降低,算法性能相應提高。當最小漏檢數d為其他值時,對應的歸一化臨界特征值bK-d+1,CRT同樣具有類似規律,本文中不再逐一列出。 圖3為信源數量K=6時,不同快拍數T以及陣元數量N下歸一化臨界特征值隨最小漏檢數d的變化,可以看到歸一化的bK-d+1,CRT隨d的增加而上升,符合bi的降序排列規律。當快拍數T和陣元數量N增加時,歸一化的臨界特征值bK-d+1,CRT具有更低的取值,與上文結論相符。值得注意的是,隨著上述參數的增加,曲線的斜率將變得平緩,表明漏檢數d對bK-d+1,CRT的影響變弱。 圖2 歸一化臨界特征值bK-1,CRT隨快拍數和陣元數量的變化Fig.2 The variation of normalized bK-1,CRT with the number of snapshots and array elements 圖3 不同快拍數及陣元數下歸一化的bK-d+1,CRT隨d的變化Fig.3 The variation of normalized bK-d+1,CRTwith d under different numbers of snapshots and array elements (29) 由于臨界特征值在評價算法性能時不夠直觀,將式(29)代入式(16)和式(21)中可求得信源估計數小于K-d時的信噪比臨界值,記為SNRK-d,CRT,可作為評價算法性能的有效指標。PC表示信源數的正確估計概率,E(K′)表示信源數估計結果的期望值,所有的仿真結果均基于5 000次的蒙特卡洛模擬獲得。 4.1 最小漏檢數為1的實驗結果 圖4 不同快拍數下PC隨SNR的變化Fig.4 The variation of PC with SNR for different values of snapshots 圖5 不同陣元數量下PC隨SNR的變化Fig.5 The variation of PC with SNR for different numbers of array elements 圖5為不同陣元數N下算法的信源數正確估計概率PC隨信噪比SNR的變化曲線,實驗參數為θ={-3°, 3°},K=2,N=[14,16,18,20],T=1 000。本文所提出的基于臨界特征值的分析方法和參照方法均能有效預測算法的欠估計邊界。本文方法與參照方法在不同的陣元數量下的預測精度互有優劣,與兩者采用的樣本特征值分布模型有關。與圖4相似,隨著陣元數量N的增加,欠估計邊界所對應的信噪比呈下降趨勢,表明算法具有更好的性能,與上文分析相符。 4.2 多漏檢數的實驗結果 為研究算法在不同漏檢數下信源數欠估計程度隨信噪比的變化,本文采用信源數估計結果的期望值E(K′)代替正確估計概率PC對算法性能進行分析,可同時描述不同漏檢數下算法的欠估計邊界。由于式(21)兩側均包含bi項,其取值與信噪比相關,在計算bK-d+1,CRT和SNRK-d,CRT時需將式(29)代入式(21)兩側進行復雜求解。為簡化計算,假設式(21)右側的bi近似等于其所對應的臨界特征值bi,CRT,則可通過簡單遞推計算得到臨界特征值bK-d+1,CRT。記基于該近似方法計算得到的信噪比臨界值為SNRK-d,CRT,C,其與精確求解所得到的臨界信噪比SNRK-d,CRT之間的差值記為 ΔSNRK-d,CRT=SNRK-d,CRT,C-SNRK-d,CRT (30) ΔSNRK-d,CRT越小,近似所產生的誤差就越小。 仿真實驗中,本文分別基于所提出的精確方法及近似方法對算法的信源數估計結果進行預測。圖6為不同快拍數T下估計信源數期望E(K′)隨信噪比SNR的變化,實驗參數為θ={-7°,-4°,0°,4°,7°},K=5,N=11,T=[500,1 000,5 000,10 000]??梢钥吹奖疚乃岢龅姆椒軌驕蚀_預測不同漏檢數下算法的信源數欠估計邊界,驗證了本文方法的有效性。近似方法同樣能夠反映算法的欠估計程度隨信噪比的變化,但在d>1時與仿真結果存在一定的偏移誤差。基于圖6的實驗參數,表1為不同最小漏檢數d和快拍數T下臨界信噪比近似誤差ΔSNRK-d,CRT的值。該值隨著最小漏檢數d的增加而增加,這是由于bi與bi,CRT之間的誤差累積所致。隨著快拍數T的增加,同一最小漏檢數d下的ΔSNRK-d,CRT呈變小趨勢,與圖3所描述的規律相符,驗證了臨界特征值分析方法的有效性。 圖6 不同快拍數下E(K′)隨SNR的變化Fig.6 The variation of E(K′) with SNR for different values of snapshots 圖7為不同陣元數量N下估計信源數期望E(K′)隨信噪比SNR的變化曲線,實驗參數為θ={-7°,-4°,0°,4°,7°},K=5,N=[8,9,10,11],T=1 000。與圖6類似,本文提出的方法能夠準確預測不同漏檢數下算法的信源數欠估計邊界,近似方法在最小漏檢數d>1時與仿真結果之間存在偏移誤差。表2中列出了基于圖7實驗參數,在不同最小漏檢數d和陣元數量N下ΔSNRK-d,CRT的值。該值同樣隨著最小漏檢數d的增加而變大,同一d值下近似誤差ΔSNRK-d,CRT隨陣元數的增加逐漸變小,與圖3所描述的規律相符。因此,在陣元數量N和快拍數T較大時,對于較小漏檢數,可用近似方法對算法性能進行分析以簡化計算;其他條件下則需對臨界特征值bK-d+1,CRT進行精確求解以準確預測算法的信源數估計結果。 圖7 不同陣元數量下E(K′)隨SNR的變化Fig.6 The variation of E(K′) with SNR for different numbers of array elements ΔSNRK-d,CRT/dBd=2d=3d=4T=5000.8021.4231.852T=10000.7281.2851.664T=50000.6281.0981.411T=100000.6031.0521.349 表2 ΔSNRK-d,CRT隨最小漏檢數d和陣元數量N的變化 本文通過對MDL準則下的信源數估計算法進行研究,提出了一種基于臨界特征值的信源數欠估計分析方法,指出相關矩陣的特征值與噪聲功率之比是描述欠估計條件的有效指標,并給出了臨界特征值的求解方法及唯一性證明。結合隨機矩陣理論,該方法可準確預測不同漏檢數下算法的欠估計邊界,并分析陣列參數對算法性能的影響。為降低大漏檢數下臨界特征值的求解復雜度,提出了一種基于遞推求解的近似分析方法,在快拍數和陣元數量較大時對于小漏檢數欠估計邊界具有較好的近似預測效果。仿真實驗與理論分析結果相符,驗證了臨界特征值方法的有效性和準確性。該方法可應用于多種基于信息論的信源數估計算法,具有廣泛的適用性,為相關算法的研究和陣列設計提供了參考依據。 [1] KRIM H, VIBERG M. Two decades of array signal processing research: The parametric approach [J]. IEEE Signal Processing Magazine, 1996, 13(4): 67-94. [2] AOUADA S, ZOUBIR A M, SEE C M S. A comparative study on source number detection [C]// IEEE. Signal Processing and Its Applications, 2003. Proceedings. Seventh International Symposium on. USA: IEEE, 2003:173-176. [3] AKAIKE H. Information theory and an extension of the maximum likelihood principle [C]// Petrov B N, Csaki F. 2nd Int. Symp. Inform. Theory, suppl. Problems of Control and Inform. Theory. Budapest: Akadémiai Kiadó,1973: 267-281. [4] RISSANEN J. Modeling by shortest data description [J]. Automatica, 1978, 14(5): 465-471. [5] SCHWARZ G. Estimating the dimension of a model [J]. Annals of Statistics, 1978, 6(2): 461-464. [6] WAX M, KAILATH T. Detection of signals by information theoretic criteria [J]. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1985, 33(2): 387-392. [7] ZHANG Q T, WONG K M, YIP P C, et al. Statistical analysis of the performance of information theoretic criteria in the detection of the number of signals in array processing [J]. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1989, 37(10): 1557-1567. [8] KRITCHMAN S, NADLER B. Non-parametric detection of the number of signals: hypothesis testing and random matrix theory [J]. IEEE Transactions on Signal Processing, 2009, 57(10): 3930-3941. [9] NADLER B. Nonparametric detection of signals by information theoretic criteria: performance analysis and an improved estimator [J]. IEEE Transactions on Signal Processing, 2010,58(5): 2746-2756. [10] LU Z, ZOUBIR A M. Flexible detection criterion for source enumeration in array processing [J]. IEEE Transactions on Signal Processing, 2013, 61(6):1303-1314. [11] HANNAN E J, QUINN B G. The determination of the order of an autoregression [J]. Julia Campos Fernández, 1979, 41(2): 190-195. [12] WU T J, SEPULVEDA A. The weighted average information criterion for order selection in time series and regression models [J]. Statistics & Probability Letters, 1998, 39(1): 1-10. [13] NADAKUDITI R R, EDELMAN A. Sample eigenvalue based detection of high-dimensional signals in white noise using relatively few samples[J]. IEEE Transactions on Signal Processing, 2008, 56(7): 2625-2638. Underestimation analysis for MDL source enumeration based on critical eigenvalues DU Fei, LI Yibo, JIN Shijiu, ZENG Zhoumo (State Key Laboratory of Precision Measurement Technology and Instruments, Tianjin University, Tianjin 300072, China) A method based on critical eigenvalues was proposed to evaluate the underestimation problem of source enumeration under the minimum description length (MDL) criterion. The uniqueness of critical eigenvalues was proved and their solution expression was presented with the analysis of the enumeration algorithm. It was shown that the critical eigenvalue method can predict the boundary of underestimation for different numbers of undetected sources and evaluate the influences of array parameters on the performance of source enumeration, compared with the existing methods. An approximation method was proposed to reduce the calculation complexity of solving critical eigenvalues under the condition of large numbers of undetected sources and the factors affecting the approximation errors were also analyzed. Simulation results indicated that the critical eigenvalue method can exactly describe the boundary of underestimation of source enumeration. The results provided a new analysis tool for other source enumeration methods based on information criteria. minimum description length (MDL) criterion; source enumeration; underestimation; array signal processing 國家自然科學基金青年科學基金(61304244;61201039);國家重點實驗室成果培育項目;天津市自然科學基金(13JCYBJC18000) 2015-05-05 修改稿收到日期:2015-10-28 杜非 男,博士生,1986年生 靳世久 男,教授,博士生導師,1946年生 TH76;TN95 A 10.13465/j.cnki.jvs.2016.21.017



3 基于臨界特征值的算法性能分析



4 數值仿真實驗









5 結 論