李 宗,馮志鵬,褚福磊
(1.清華大學 精密儀器與機械學系,北京 100084;2.北京科技大學 車輛工程研究所,北京 100083)
為了對盲信號的分離結果進行評價,目前有多種盲分離評價指標,如描述全局矩陣和單位矩陣接近程度的串音誤差[1](性能指標PI)、測度源波形估計誤差的二次殘差[2]、評價分離信號與源信號相關程度的相關系數指標[3]等。在仿真實驗中,多數指標需要找出與分離信號分量對應的源信號分量,但由于盲分離排序的不確定性,這在低信噪比時往往很難做到。串音誤差不需要這種對應關系,能通過全局矩陣直接評價分離結果,是應用的最廣泛的指標之一。但它對于各分量能量差異大的源信號和全局矩陣為某些非行元素優勢矩陣的情況,往往不能給出和實際分離結果一致的評價。
本文通過構造全局權重矩陣和引入相關系數來改進上述不足。改進后的指標擴大了串音誤差的使用范圍,并能更準確有效的評價仿真實驗分離結果。
全局矩陣是分離矩陣和混合矩陣的乘積。在獲得理想分離時,全局矩陣可以表示為置換矩陣和滿秩對角矩陣相乘,即:
C=BA 理想情況下,G=PΔ
式中:A為混合矩陣,B為分離矩陣,Δ為滿秩對角矩陣,P為置換矩陣。置換矩陣定義為每行和每列中只有一個元素等于1,而其他元素都為零的矩陣[4]。
串音誤差用來衡量G接近對角化的程度,計算公式如下:
首先在文獻[5]的基礎上,引入如下概念。設矩陣G=[gij]∈Cn*n
通過全局矩陣G,我們可以建立估計信號y和源信號s的關系:
y=Bx=BAs=Gs
式中,x為觀測信號。若寫成分量形式則有:

如果源信號各分量能量差異不大,則PI越小,說明式(2)右側某一項giksk越大于其他項,可以得yi(giksk,即信號得到很好的分離。但是,在源信號各分量能量差異大的情況下,較小的PI只表示gik遠大于其他gij,j=1,2,…,k-1,k+1,…,n,并不表示 giksk遠大于其他 gijsj,j=1,2,…,k-1,k+1,…,n。也就是說,在源信號各分量能量差異大的情況下,小的PI并不能說明分離結果好。
串音誤差還存在另一個問題。文獻[6]構造出了一些特殊的全局矩陣:

針對串音誤差的這兩個問題,本文通過構造全局權重矩陣和引入相關系數兩種方法分別進行解決,并在最后將兩種方法進行了綜合。
由上面分析可知,整體考慮giksk比只考慮gik更準確。所以我們將源信號各分量的能量平方根帶入全局矩陣整體考慮,得到全局權重矩陣Gw:



在全局矩陣中引入權重:源信號各分量的能量平方根,即幅值,我們構造出了全局權重矩陣,由此得改進的串音誤差Im1。Im1越小,說明式(2)中優勢元素越顯著,即式(2)右側某一項giksk越大于其他項gijsj,j=1,2…,k-1,k+1,…,n,yi越接近單一源信號分量,分離結果越好。而PI越小,說明的是gik越大于其他gij,j=1,2,…,k-1,k+1,…,n,全局矩陣越接近對角陣或其置換陣。即PI評價的是全局矩陣和對角陣的接近程度,Im1評價的是 yi和 giksk(i=1,2,…n)的接近程度。Im1比PI更能準確反映分離結果。
對于如:

這樣的全局矩陣,PI給出的結果過小,和實際分離結果大相徑庭。因為,以(4)式為例,優勢元素在同一列的情況下,估計信號各分量的說明見后面)得到的是對同一源信號分量s1的估計,這樣的分離結果是非常差的。因此,要改進的是在這種情況下如何提高PI的結果。注意到,由于都是s1的線性組合,三者之間必然存在相關性。因此我們引入相關系數衡量各估計信號間的相關程度,并將其加入到PI的計算式中。這里需要注意的是,相關系數計算的是=Gs中的,而不是通過如FastICA等算法直接得到的y。具體計算流程如下:
(1)計算全局矩陣第一行和第一列的串音誤差。和式(1)中計算第一行和第一列表達式相同。為了區分 PI,記為 Im2。

(2)判斷全局矩陣第二行優勢元素所在列,如果和第一行優勢元素不在同一列,則用式(1)計算第二行和第二列串音誤差。如果和第一行優勢元素在同一列,引入相關系數來增大評價結果,得:

式中,ρ12是和的相關系數,α為設置參數,目前取為0.78,選取方法見后面分析。
針對學生的不同情況,定制不同的學習任務,明確奮斗的目標。上述三例中,小袁的學習方法欠缺,淺嘗輒止,學的不扎實。學習任務中的讀、寫、練習集中在錯例糾正上,學習目標是反復練習、鞏固。小李、小江以技能賽英語詞匯、句子訓練為主要任務,重點完成技能賽必備知識、技能練習,以口語訓練作為重點,配以寫作練習。小李英語基本功稍好,要求高一些,小江底子薄,就從口語練習上突破,以讀、背為主。在聽力練習方面同步進行。由于為他們量身定制了不同的學習任務,三位同學都取得了良好的學習效果。
(3)判斷全局矩陣第三行優勢元素所在列,如果和前兩行都不在同一列,則用式(1)計算第三行和第三列串音誤差。如果和其中一行優勢元素(如第一行)在同一列,則有:

如果三行優勢元素都在同一列,則有:

以此類推,最后得:

Im1提高了源信號能量差異大時評價的準確性;Im2提高了全局矩陣為某些非行元素優勢矩陣時評價的準確性。因此,將兩種方法綜合,即用2.1中全局權重矩陣的元素gwij代替2.2計算流程中的gij,我們得到了應用范圍更廣、評價更準確的串音誤差,記為IPI。IPI既考慮了源信號各分量的能量差異,又可以解決PI和Im1不能準確評價全局矩陣為某些非行元素優勢矩陣的問題,因此評價最準確,給出的值最能真實反映分離結果。

表1 四個指標的比較Tab.1 Comparison of four indexes
為了驗證基于全局權重矩陣改進的有效性,構造源信號為常用仿真信號,由兩個正弦波和一個方波組成,其中第一個正弦波的能量是第二個正弦波的100倍,能量差異大。


式中:f0=100。經矩陣A混合和SNR=5 dB加噪,然后進行分離,結果如下。

矩陣G中,第一行和第二行優勢元素同列,第三行優勢元素不顯著,計算得PI=0.341 1值較大,即PI評價分離結果不好。實際上,由于s1和s3的能量遠大于s2,所以評價分離結果時應考慮各gijsj的相對大小而不只是gij。觀察Gw,Gw是行元素優勢矩陣,各行優勢元素顯著,計算Im1=0.108 3值較小,即Im1評價分離結果是較好的。對比圖1和圖2可以發現估計信號基本重現了源信號的幅值和波形。Im1比PI評價的更準確。
實驗一,對式(4)計算 PI和 Im2,得 PI=0.0067,Im2=0.6733??梢奍m2更準確的反映了分離情況。
實驗二,為了減少源信號能量差異對評價的影響,調整3.1中仿真源信號幅值使各分量能量相等。

式中,f0=100 Hz。將s經矩陣A混合和SNR=10 dB加噪,然后進行分離。


計算得 PI=0.279 8,Im2=0.459 4。本例 PI小于3.1的PI=0.341 1,但從圖3和圖4可以看出,本例的分離結果沒有3.1的好,PI給出的結果偏小。觀察G,第二行和第三行的優勢元素在同一列,對于這種非行元素優勢矩陣,Im2中相關系數增大評價結果,計算得Im2=0.459 4是一個較大的值。和PI相比Im2更真實反映了本例的實際分離情況。
此外,我們可以看出,PI沒有絕對的衡量標準,缺乏可比性。進而考慮Im1,本例中源信號各分量能量相同,所以Im1=PI=0.279 8,比上例的Im1大,即從Im1的值我們可推斷本例的分離結果沒有上例好。

經矩陣A混合和SNR=[-10-5 0 5 10 15 20]dB加噪,共進行7組實驗,并畫出4種指標隨SNR變化的圖形,如圖5所示。
分析圖中的三個信噪比,SNR=-10、-5、0 dB。SNR從-10 dB到-5 dB和從-5 dB到0 dB,PI值基本均勻下降,IPI是先緩降再陡降。觀察三種信噪比下分離信號波形,如圖6~圖8,SNR=-10 dB和SNR=-5 dB的分離信號波形相差并不大,改善效果不明顯;而SNR=-5 dB和SNR=0 dB的分離信號波形相差大,改善明顯。定量分析三個信噪比下分離波形的相異程度,計算輸出信噪比指標:

得:SNRout-10=0.813 5,SNRout-5=0.948 1,SNRout0=2.194 5??芍獜腟NR=-5到SNR=0分離結果的改善好于從SNR=-10到SNR=-5。IPI先緩降再陡降的變化趨勢和此相吻合,IPI比PI評價的更準確。

此外,我們從圖5上還可以得到其他一些信息。以SNR=-10為例,Im2>PI說明G是非行元素優勢矩陣。Im1<PI說明源信號各分量能量有差異。IPI=Im1說明Gw是行元素優勢矩陣。
為了進一步驗證評價指標IPI的有效性,下面用它對真實機械設備故障信號的分離進行評價。兩個源信號為齒輪斷齒故障信號和齒輪輕微磨損故障信號,混合信號如圖10所示。
分別用sons算法和fastica算法進行分離,分離結果如圖11所示,sons分離出的兩信號差異大,且其中一個信號呈現幅值很大的有規律的沖擊振動,顯示出了斷齒故障。fastica算法分離出的兩信號差異小,無法正確判斷信號對應的故障。再從斷齒信號的頻譜圖(圖12)分析,理論計算得斷齒嚙合頻率為120 Hz,源信號幅頻圖上在120 Hz、180 Hz及240 Hz上均呈現大的幅值,sons分離結果和其一致,但fastica分離信號頻譜上故障特征頻率不明顯。由以上分析可知sons分離結果比fastica更理想。用IPI評價分離結果,得IPIsons=0.557 1,IPIfastica=1.133 4,即 sons的分離結果遠好于fastica。IPI的評價結果和信號表現一致,IPI正確的評價了分離結果。

下面用IPI指標對機械設備故障診斷中的常用盲分離算法 FastICA,SOBI,SONS,JADE進行評價。旋轉機械有2個關鍵零部件:軸承和齒輪。軸承支持機械的旋轉部分,而齒輪使轉動軸轉速變化,依照旋轉機械軸承和齒輪嚙合振動模型[7],構造仿真源為:

式中,s1為齒輪嚙合信號,s2為軸承振動信號,fm=400 Hz為嚙合頻率,fb=170 Hz為與故障有關的特征頻率,fr=20 Hz為軸的轉速。用上述4種算法在SNR=[-10-5 0 5 10 15 20]dB下進行分離。

圖13 IPI指標下常用算法隨SNR變化的比較Fig.13 Comparision of common used algorithms with the variation of SNR by IPI index
圖13中可以看出,從-10 dB到0 dB,SONS算法的分離性能最好。這是因為SONS算法對加性白噪聲是非常穩健的。SOBI算法雖然對于不同功率譜的源信號有好的分離,但是由于源信號中有白噪聲,所以分離結果次于SONS算法。FastICA和JADE算法對白噪聲不穩健,在低信噪比時表現不理想。從0 dB到10 dB,隨著信噪比的增大,JADE法和FastICA的良好分離性能得以發揮,分離結果接近或超過其他兩種算法。隨著信噪比的繼續提高,各分離算法分離結果差異不大,基本都能很好的分離信號。
所以,對于低信噪比信號,優先考慮使用SONS算法進行分離。對于高信噪比信號,各分離算法分離效果接近,由于FastICA結構簡單,收斂速度快,優先考慮使用。
現有的盲分離評價指標串音誤差評價的是全局矩陣對角化的程度,在源信號各分量能量差異大或全局矩陣為某些非行元素優勢矩陣時評價結果不準確。本文通過構造全局權重矩陣直接評價分離結果、引入相關系數處理非行元素優勢矩陣,解決了上述問題,并將兩種方法進行了綜合,提高了評價的準確性,擴大了串音誤差的應用范圍。尋找絕對的衡量標準,使得改進的指標在處理不同問題時具有更可靠的可比性是要進一步研究的內容。
[1] Cichocki A,Amari S I.Adaptive Blind Signal and Image Processing[M].New York:John Wiley & Sons,INC,2002:161-161.
[2] 焦衛東.基于獨立分量分析的旋轉機械故障診斷方法研究[D].杭州:浙江大學,2003.
[3] 肖文書,張興敢,都思丹.雷達信號的盲分離[J].南京大學學報,2006,42(1):38-43.
[4] Hyvarinen A,Karhunen J,Oja E.Independent component analysis[M].New York:JohnWiley & Sons,INC,2001:281.
[5] 徐明彪,朱維彰.關于信號盲分離分離效果評判指標的分析[J].杭州電子工業學院學報,2002,22(3):177-180.
[6] Mansour A,Kawamoto M,Ohnishi N.A survey of the performance indexes of ICA algorithms[C]//.Proceedings of the IASTED International Conference Modeling,Identification,And Control,Innsbruck,Austria,2002:660-666.
[7] Ypma A.Learning methods for machine vibration analysis and health monitoring[D].Delft University of Technology,2001.