摘 要:利用稀疏分量的直線聚類性,提出了欠定盲源分離中估計混合矩陣的一種方法。該方法通過構造比率矩陣對觀測信號進行分選,剔除了源信號頻譜重疊的部分,然后利用魯棒競爭的聚類學習算法獲得對混合矩陣的精確估計,解決了源信號在頻域不充分稀疏的條件下準確估計混合矩陣的問題。在估計出混合矩陣的基礎上,利用最短路徑法分離出源信號。由仿真結果可以看出,與傳統的K均值估計混合矩陣的方法相比,方法具有更好的魯棒性。
關鍵詞:欠定盲源分離;稀疏分量;比率矩陣;最短路徑法
中圖分類號:TN911.7文獻標識碼:A文章編號:1004373X(2008)1900103
Underdetermined Blind Separation Based on Ratio Matrix Clustering
CHEN Xiaojun,ZHANG Yang,TANG Bin
(College of Electronic Engineering,University of Electronic Science Technology of China,Chengdu,610054,China)
Abstract:A method of the mixing matrix estimation in underdetermined source separation is proposed,which is based on the linear clustering of sparse component.Removing the overlapped source signals spectrum through choosing observation signals and constructing ratio matrix,the mixing matrix is estimated precisely by using Robust Competitive Agglomeration.Then,the source signals can be recovered by the shortest path method.The experiment proves that the method has better accuracy than K-means in estimating the mixing matrix.
Keywords:underdetermined source separation;sparse component;ratio matrix;shortest path method
1 引 言
目前,很多盲分離的算法都假設觀測信號的數目不少于源信號的數目。然而在實際應用中,由于觀測條件有限,有可能會發生源信號數目多于觀測信號數目的欠定情況。國內外針對欠定條件下盲分離算法的研究主要是集中在稀疏源上[1-6]。這些算法一般是通過聚類的方法估計混合矩陣,然后再分離出源信號。當源信號的稀疏性并不是很好時,可以通過FFT變換將源信號變換到頻域上進行盲分離。但是很多信號在頻域上并不嚴格滿足稀疏特性,此時通過聚類的方法不能得到混合矩陣的精確估計。
本文針對源信號頻譜部分重疊的情況提出了一種新的估計混合矩陣的方法。利用稀疏分量的直線聚類性將構造出的比率矩陣劃分為不同的子矩陣,并對子矩陣進行分選;然后利用分選后的子矩陣構成新的比率矩陣,并應用魯棒競爭聚類學習算法精確估計混合矩陣;最后利用最短路徑法對源信號進行估計。
2 算法介紹
2.1 盲源分離模型
為了清楚地闡述盲分離算法,本文考慮一般的線性瞬時混疊模型:
x(t)=As(t)+n(t)
(1)
在上述混合模型中,s(t)=(s1(t),…,sn(t))T為源信號矢量,x(t)=(x1(t),…,xm(t))T為觀測信號矢量,n(t)=[n1(t),…,nm(t)]T為噪聲矢量。為了描述方便,將混合矩陣A寫作A=[a1,…,an]。當源信號是稀疏信號時,它們的混合信號具有線性聚類特性。當某一時刻只有一個源信號(如只有s1(t))起作用時,忽略噪聲的影響,x(t)=a1s(t),它在m維空間中是一條直線,斜率取決于混合矩陣的列矢量a1。
2.2 混合矩陣的估計
首先,來估計混合矩陣的列向量。假設在t1,…,tL時刻只有信號s1(t)不為零,因此:
[x(t1),…,x(tL)]=A[s(t1),…,s(tL)]
=[a1s1(t1),…,a1s1(tL)]
(2)
為了分析計算方便,假設只有兩個觀測信號(m=2)。此時,定義比率向量為:
θ1=x2(t1)x1(t1),…,x2(tL)x1(tL)=a21a11[1,…,1]
(3)
由式(3)得到a1的估計為:
a1=a111,x2(tj)x1(tj)T,j=1,…,L
(4)
以同樣的方法在所有的觀測時刻構造比率向量:
π=x2(1)x1(1),…,x2(K)x1(K)
(5)
同理,可以構造出θ2,…,θn,如果能在π中找到子向量θ1,…,θn,就能估計出列向量a1,…,an。
假設x2(k)x1(k)∈[r,R],k=1,…,K,r為π的最小值,R為π的最大值。然后把π分為M個子區間,M為正整數。此時,θi,i=1,…,n中所有元素都屬于某一個子區間。如果某個子區間元素的個數小于J(J為正整數,需要根據實際情況預先設定),將子區間內所有元素刪除。將余下的元素構成一個新的向量。然而由于源信號并不充分稀疏,因此只能剔除部分重疊的分量。
為了進一步提高混合矩陣的精確度,對再使用魯棒競爭聚類學習算法(RCA)。RCA算法是從C均值算法演化過來的,但比C均值算法更具魯棒性,而且對孤立數據點不敏感。設B=[β1,…,βc],其中βi為第i個聚類中心參數。
C均值算法是最小化下列目標函數:
JC(B,U;) = ∑Ci = 1∑Nj = 1(uij)2d2ij
(6)
使得:
∑Ci=1uij=1,j=1,…,N
(7)
在式(6)中,d2ij表示j到βi距離的平方。U=uij中的每個元素表示j與βi的關聯程度。為了減少模型參數的個數,同時更準確地估計出聚類的中心,將代價函數變下式:
JR(B,U;) = ∑Ci = 1∑Nj = 1(uij)2ρi(d2ij)-
α∑Ci = 1∑Nj = 1wijuij2-
λj(∑Ci = 1uij-1)
(8)
式(8)中,ρi(·)是關于第i個聚類中心的魯棒代價函數,wij= wi(d2ij)=ρi(d2ij)d2ij為權重矢量。關于如何選取ρi,α和λj,詳見文獻[7],這里不再贅述。應用RCA算法可以獲得n個聚類的中心,由此可以估計出混合矩陣的列向量。
2.3 源信號的估計
對于欠定盲源分離,估計出混合矩陣后,由于混合矩陣是不可逆的,因此并不能直接估計出源信號。此時可以利用源信號在變換域上的稀疏特性,采用最短路徑法[8]對源信號進行估計。最短路徑法從估計得到的混合矩陣中選取出逼近觀測信號角度的兩個列矢量,把分離矩陣降維后再估計源信號。
設選取的列向量為ab和aa,令Ar=[ab aa],Wr=A-1r,估計出的源信號矢量為:
str=Wrxt stj=0j≠b,at=1,…,K
(9)
2.4 盲分離算法
本文的盲分離算法可以總結為以下步驟實現:
(1) 對觀測信號進行FFT變換,記變換后的復信號的實部為X(t),虛部為X′(t),t=1,…,K;
(2) 構造出向量π=X2(1)X1(1),…,X2(K)X1(K),同時將矩陣中每個元素取反正切變換,得到向量;
(3) 若(t)<ζ,(ζ>0),t=1,…,K,將(t)刪去,將余下的元素組成;
(4) 的最大值r和最小值R,將[r,R]等分成M個間隔,記每個子向量為1,…,M;
(5) 如果j j=1,…,M中某個向量元素的個數小于J,將其刪去,將剩下的向量組合為一個新的向量;
(6) 將作為輸入矢量,應用RCA算法估計混合矩陣;
(7) 對X(t)和X′(t)應用最短路徑法估計出源信號FFT變換后的實部和虛部,然后再進行逆FFT變換重構出源信號。
3 仿真結果及其分析
為了說明算法的有效性,選取兩個LFM信號,一個FM信號做仿真實驗。FM信號的載波頻率為1 kHz,一個LFM信號的起始頻率為1.5 kHz,截止頻率為4 kHz,另一個LFM信號起始頻率為3.5 kHz,截止頻率為5 kHz。混合矩陣為:
A=0.148 4-0.962 50.743 00.988 90.122 10.652 2
如圖1所示,源信號的頻譜圖在一定頻率范圍內有所重疊。應用K均值算法[9,10]估計出的混合矩陣為:
=0.345 30.988 00.653 9-0.938 5-0.154 30.802 5
由于源信號在頻域上并不是嚴格地滿足稀疏特性,因此應用K均值的方法并不能準確地估計出混合矩陣。
在應用本文算法估計混合矩陣時,要特別注意子區間數目M和閾值J的選取。如果M選取過大,J選取過小,頻譜重疊的分量就不會被剔除,估計混合矩陣就有了很大的誤差。
恰當選取M和J估計出的混合矩陣為:
=0.737 10.153 00.992 10.675 70.988 2-0.125 6
雖然估計出的混合矩陣的列向量和原混合矩陣相比有順序和符號上的差異性,但這并不影響源信號的估計。
圖1 源信號頻譜
最后應用最短路徑法對源信號進行估計,源信號,觀測信號和分離出的信號如圖2所示。
圖2 源信號,觀測信號和分離信號
為了定量評價分離,采用分離信號和源信號的相似系數ξij作為分離的性能指標:
ξij=ξ(yi,sj)
=∑Kt=1yi(t)sj(t)/∑Kt=1y2i(t)∑Kt=1s2j(t)
(10)
式(10)中:i=1,…,n;j=1,…,n。如果ξij的值等于1,說明第i個分離輸出與第j個源信號完全相同,由于估計誤差不可避免,當分離完成后,ξij的值接近1;ξij的值趨于零,說明不相關;如果所有ξij的值距1較遠,說明分離未完成。一般認為在實際信號分離過程中ξij達到0.8以上,就可以認為達到分離目的了。
按照式(10)計算出來的源信號和分離信號的相關系數矩陣ξ為:
ξ=0.117 80.949 90.104 10.061 10.061 90.923 70.906 80.091 10.015 4
從ξ可以看出,其每行每列都有且只有一個元素接近1,其他元素都接近0,這說明在應用本文算法估計出的混合矩陣基礎上分離效果是比較理想的。
4 結 語
在欠定盲源分離問題中,準確估計混合矩陣是整個盲分離算法的關鍵步驟。如果混合矩陣估計不準確,分離源信號根本無法進行。本文針對源信號在頻域上不充分稀疏的情況下,給出了一種盲分離混疊矩陣的估計方法。通過精確估計混疊矩陣,從而有效地實現盲分離。
參考文獻
[1]Zhang X.A Unified Method for Blind Separation of Sparse Sources with Unknown Source Number[J].IEEE Signal Processing Letters,2006,13(1):49-51.
[2]He Z Y,Yang L X,Liu J.Blind Source Separation Using Cluster-based Multivariate Density Estimation Algorithm\\[J\\].IEEE Trans.on Signal Process,2000,48(2): 575-579.
[3]Zibulevsky M,Pearlmutter B A.Blind Source Separation by Sparse Decomposition in Signal Dictionary.Neural Comput.,2001,13(4): 863-882.
[4]Lee T-W,Lewicki M,Girolami M,et al.Blind Source Separation of more Sources than Mixtures Using Overcomplete Representations\\[J\\].IEEE Signal Process.Lett.,1999,6(4):87-90.
[5]Olshausen B A,Sallee P,Lewicki M S.Learning Sparse Image Codes Using a Wavelet Pyramid Architecture.Adv.Neural Inform.Process Syst.2001,13: 887-893.
[6]Li Y,Wang J.Sequential Blind Extraction of Instantaneously Mixed Sources\\[J\\].IEEE Trans.Signal Process.,2002,50(5):997-1 006.
[7]Frigui H,Krishnapuram R.A Robust Competitive Cluster[CD*3]ing Algorithm With Applications in Computer Vision [J].IEEE Trans.on Pattern Analysis and Machine Intelligence,1999,21(5):450-465.
[8]Bofill P,Zibulevsky M.Undetermined Blind Source Separation Using Sparse Representations[J].Signal Processing,2001,81:2 353-2 362.
[9]Li Y,Andrzej C,Amari S.Analysis of Sparse Representation and Blind Source Separation.Neural Comput.,2004,16(6):
1 193-1 234.
[10]O′Grady P D,Pearlmutter B A.Hard-LOST:Modified K-means for Oriented Lines[C].In Proceedings of the IrishSignals and Systems Conference,2004:247-252.
作者簡介 陳曉軍 男,1983年出生,山西大同人,碩士研究生。主要從事信號盲分離方向
的研究。
張 揚 男,1963年出生,四川人,教授,主要從事衛星通信,雷達信號處理方向的研究。
唐 斌 男,1964年出生,四川廣安人,教授。長期從事電子對抗技術和系統、雷達抗干擾能力提高及效能評估,以及信號盲分離方向的研究。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文