趙志強,顏學龍
(桂林電子科技大學電子工程與自動化學院,廣西桂林 541004)
近年來,盲源分離的研究已成為信號處理領域的熱點問題。盲源分離是指在不知源信號和傳輸通道參數的情況下,根據輸入源信號的統計特性,由觀測信號恢復出源信號各個獨立成分的過程。這過程又稱為獨立分量分析(ICA)?,F在所指的盲源分離通常是對觀測到的源信號的線性瞬時混迭信號進行分離。盲源分離方法的研究在語音、通信、生物醫學工程和地震各個領域具有重要的理論價值和實際意義[1]。
正因為信號盲分離技術具有廣闊的應用前景,促使國內外廣大的科研工作者關注這一領域研究,盲分離技術也因此獲得了飛速的發展,現在的研究多數都假設傳感器個數不少于源信號的個數,對源信號個數多于傳感器個數的問題如何解是又一個困難的問題。此前關于多路輸入-單路輸出的盲源分離成果是較少的[1]。
假設接收到的信號XM是有M路信號S(t)=[S1(t),…,SN(t)]T通過某種方式混合而成,并受到加性噪聲的干擾

其中,A(·)為混合方程V(t)為加性噪聲;XM和S(t)中,M表示觀察信號的維數。當M=1時就是一個觀察信號,即形成了單通道信號,因此單通道信號處理問題都可以用式(1)來表示,對于不同的應用,區別在于源信號S(t):類型、數目的差異,以及混合方式A(·)的差異。針對不同的情況,單通道信號分離可以分為以下幾類問題[3]:
(1)N=1,混合方程A(·)己知,模型轉化為信號去噪問題,即由接收信號X1(T)通過去噪算法,盡量精確地恢復出源信號。
(2)N=1,混合方程A(·)未知,模型轉化為信號的盲估計問題,或是混合方程和源信號的聯合估計問題,即由接收信號X1(t)估計出混合方程A(·)和源信號。
(3)N>1,混合方程A(·)己知,模型轉化為多路混合信號的分離問題,即由接收信號X1(t),通過分離算法,估計多路源信號。
(4)N>1,混合方程A(·)未知,模型轉化為多路混合信號的盲分離問題,用盲分離的方法根據單路接收信號估計多路信號,即特殊的欠定盲信號分離問題[1]。文中根據情況(1)進行分析研究。
為實現單通道信號的盲分離,首先要求估計系統的源信號數。在此提出基于 EMD的源數估計方法[4]。
首先,單通道觀測信號x1(t)進行 EMD分解[12],并得到其本征模函數 xlimf=(c1,c2,…,cn,r1n)T。其次,將單通道信號x1(t)和其IMF組合成為新的多維信號 ximf=(x1,c1,c2,…,cn,r1n)T,即可解決源信號數目大于觀測信號數目的難題[4,9-11]。
ximf=(x1,c1,c2,…,cn,r1n)T的相關矩陣為

當噪聲是白色信號,且其對應的本征函數和源信號對應的本征模函數不相關時,ximf=(x1,c1,c2,…,cn,r1n)T的相關矩陣為 Rx=E[sH(t)s(t)]+ δ2IM-N式中,M 是 ximf=(x1,c1,c2,…,cn,r1n)T的維數,IM-N是單位矩陣,δ2是噪聲的功率。
Rx奇異值分解為

式中,Λs是 n 個主特征值,Λs=diag{λ1≥λ2,…,λn},Λb是M-n個噪聲特征值,Λb=diag{λn+1,…,λM}=δ2I。
在假設噪聲方差相對小和精度估計協方差矩陣的前提下,通過判斷Rx最小特征值的個數即可確定其噪聲子空間的維數,進而估計源信號的數目。文中將利用Bayesian信息準則(BIC)來判斷源信號的數目[4,10]。
基于貝葉斯模型,MINKA提出一個真實維數估值的有效準則:Minka Bayesian選擇模型(MIBS)。其目標函數是尋找一個能使代價函數最大的序號k=n,1≤k≤l,l為非零特征值個數。該序號n即為觀測數據x(t)隱含的維數。MIBS可用Bayesian信息準則近似

Bayesian信息準則可以分析非高斯源信號,因此文中利用BIC進行語音源數估計的研究。
(1)單通道觀測信號 x1(t)的 EMD分解[4],單通道觀測信號的EMD分解將得到IMF分量ximf=(c1,c2,…,cn,r1n)T。
(2)源數估計[4,10]。單通道信號 x1(t)和其 IMF組合成為新的多維信號 ximf=(x1,c1,c2,…,cn,r1n)T,其相關矩陣為Rx=E[ximf(t)xHimf(t)],并奇異值分解,根據其特征值估計源信號數目。
(3)合成新的多維信號[1,10-12]。將單通道信號x1(t)和其IMF組合成為新的多維信號 x=(x1,c1,c2,…,cn,r1n)T,并使其維數等于估計的源信號數。
(4)的盲信號分離[2-3,5-8]。針對新的多維信號x=(x1,c1,c2,…,cn,r1n)T,應用 ICA 相關算法實現盲源分離[2,5],得到分離后的源信號 y。
仿真實驗中使用的語音信號為:WAV文件,PCM音頻格式,采樣大小16位,單聲道,采樣頻率為8 kHz,數據長度156 kB,語音信號10 s,語音信號作為源信號。

研究試驗中假設只知道觀察信號x1,根據盲分離的步驟,利用 EMD 分離出imf信號[4,9-12]并完成步驟(1)。
根據圖3的分層結果,按照步驟(2)對相關矩陣Rx奇異值分解[4,10],得到特征值矢量 Λ =diag(λ1,λ2,…,λ11)根據特征值的數值利用BIC估計語音源數目為3,與提供的參考數據相符。在此基礎上重新取用觀察信號的本征函數的前兩位并組成新的3維信號x=(x1,c1,c2)T。再將此3維信號進行 FastICA盲分離[2-3,5],圖 4 為分離后的信號。

圖3 觀察信號分層結果的波形

圖4 盲信分離結果
運用相似系數來評估分離效果[1],定義為

當 yi=CSj時,C 為常數,ξij=1;當 yi與 sj相互獨立時,ξij=0。由式(5)可知,相似系數抵消了盲源分離結果在幅值尺度上存在的差異,從而避免了幅值尺度不確定性的影響。當由相似系數構成的矩陣每行每列都有且僅有一個元素接近于1,其他元素接近于0時,則可認為分離算法效果較為理想。

從分離系數看,結果比較理想。
文中采用貝葉斯準則估算出盲源數目,這為后面的工作做了鋪墊,然后利用EMD分解為相同長度的IMF信號,對IMF信號和觀察信號結合后再進行獨立分量分析及篩選得到的源信號的估計。但研究過程中還存在一些問題,如采樣率高低影響信號的包絡完整性,當采樣率提高時又影響迭代次數而增加運算量。
[1]楊海濱,張軍.基于模型的單通道語音分離綜述[J].計算機應用研究,2010(11):4025-4031.
[2]賈云龍,張永剛,姚忠山.基于FastICA算法的混合聲信號分離技術[J].聲學技術,2009(2):18-20.
[3]劉凱.粒子濾波在單通道信號分離中的應用[D].合肥:中國科學技術大學,2007.
[4]BOGDAN M,MAARTEN D V,IVAN G C,et al.Combining EMD with ICA for extracting independent sources fromsingle channel and two-channel data[C].Argentina:32nd Annual International Conference of the IEEE EMBSBuenos Aires,August 31 - September 4,2010.
[5]COMON P.Independent component analysis:a new concept[J].Signal Processing,1994,36(3):287 -314.
[6]Lü Yao,LI Shuangtian.Under determined blind source separation of anechoic speech mixtures in the time-frequency domain[C].ICSP2008 Proceedings,2008:22 -25.
[7]LI Yuanqing,AMARI SI,ANDRZEJ C,et al.Probability estimation for recoverability analysis of blind source separation based on sparse representation [J].IEEE Transactions on Information Theory,2006,52(7):3139 -3152.
[8]DAVIES M E,JAMES C J.Source separateion using single channel ICA[J].Signal Processing,2007,87(8):1819 -1832.
[9]李晉,王景芳,高金定.基于經驗模態分解和遞歸圖的語音端點檢測算法[J].計算機工程與應用,2010,46(34):132 -135.
[10]毋文峰,陳小虎,蘇勛家.基于經驗模式分解的單通道機械信號盲分離[J].機械工程學報,2011,4(47):13 -16.
[11]劉佳,楊士莪,樸勝春.基于EEMD的地聲信號單通道盲源分離算法[J].哈爾濱工程大學學報,2011,32(2):194-199.
[12]王輝,李生華.基于EMD的語音特征信息提?。跩].計算機科學,2011,38(z10):434-436.