摘 要:語音信號處理是欠定盲源分離的一個重要研究領域。本文基于混合語音的基本模型,分析并討論了兩種欠定盲源分離方法在語音信號處理中的應用思路。欠定混合語音信號分離更接近實際情況,有著重要的研究意義。
關鍵詞:盲源分離語音信號欠定盲源
中圖分類號:TN912文獻標識碼:A文章編號:1674-098X(2011)02(c)-0004-01
1 引言
盲源分離是指在源信號和傳輸通道參數(shù)未知的情況下,根據輸入源信號的統(tǒng)計特征,僅由觀測信號恢復出各個源信號。盲源分離是近年來信號處理領域的研究熱點,已經被廣泛應用于生物醫(yī)學、醫(yī)療圖像、語音信號處理、通信系統(tǒng)、地球物理信號處理等多個研究領域。
欠定模型的盲信號處理算法要解決源信號數(shù)目多于觀測信號數(shù)目情況下的問題,更接近盲源分離實際情況。目前研究欠定盲源分離的主要方法是基于稀疏特征的分離算法和基于統(tǒng)計概率模型的過完備描述算法。
在語音信號處理領域中,從混合語音信號中分離出各個語音源信號或提取出人們感興趣的目標語音,來模仿人類的語音分離能力,對語音識別、語音增強等都有著非常積極的理論意義和實用價值。
2 混合語音信號分離原理
假設有n個統(tǒng)計獨立的語音源信號和m個觀測信號,在不考慮噪聲的情況下,觀測信號x和未知的源信號s之間有如下關系:
x(t)=As(t) (1)
其中x(t)=[x1(t),x2(t),…,xm(t)]T是m維的觀測信號向量,A為未知的m×n的混合矩陣,s(t)=[s1,s2,…,sn]T是未知的n維獨立源信號向量。
盲源分離的思路就是求解分離矩陣W,根據觀測信號向量x(t),從而恢復出未知的源信號s(t),分離系統(tǒng)輸出可通過下式表示:
y(t)=Wx(t)(2)
其中式y(tǒng)(t)=[y1(t),y2(t),…,ym(t)]T為源信號的估計矢量,即:
y(t)=(3)
欠定情況下混合語音的分離識別是在m 3 欠定混合語音信號盲源分離算法 3.1 基于稀疏特征的欠定盲源分離算法 稀疏信號處理是研究欠定信號分離的有效手段,利用稀疏性弱化欠定模型為正定模型,是解決欠定情況下混合語音信號分離問題的關鍵所在。基本方法是采用時頻線性變換進行稀疏處理,然后通過聚類的方法實現(xiàn)混疊矩陣A的估計,在最大后驗概率法準則下實現(xiàn)分離。 在線性變換中,短時傅里葉變換后的實部和虛部組成的觀測向量具有較好的稀疏性,可以實現(xiàn)混疊矩陣的精確估計。對m=2的情況,假設A的列向量長度1,即可寫成(cosα,sinα)T的形式,采用角度來描述聚類方向,其中α為偏移聚類方向θ的角度。 (4) 其中,θ為待定聚類中心的角度;θi為散圖中各觀測樣本點的角度;η為尺度因子,li為各個樣本點的權重。通過對函數(shù)φ(θ)的極大值的個數(shù)來確定源信號的個數(shù),并利用φ(θ)局部極大值所處的位置來估計各個向量aj,從而估計出混疊矩陣A。 對于具有稀疏分布特征的信號,可以假設信號有如下概率密度分布函數(shù),其中β為方差參數(shù): (5) 己知A,當信源符合超高斯分布的情況下,通過最小化信源s的1范數(shù)可實現(xiàn)分離。 (6) 3.2 基于過完備描述的欠定盲源分離算法 在過完備描述算法中,同樣是利用信號稀疏性的特點,假設觀測信號向量在一個過完備基上進行分解所得到的系數(shù)向量是稀疏的,從而得到有效描述信號的基函數(shù)。 過完備描述算法基于概率統(tǒng)計原理,是在x和A均未知的情況下估計s和A,首先從觀察信號x概率P(x|s,A),由貝葉斯公式可以得到s的后驗概率分布為: (7) 由于系統(tǒng)的不可逆性,s的估計采用非線性算法,最大化上式得到s的估計。然后在觀測數(shù)據概率最大化的情況下估計A,定義目標函數(shù)為: (8) 通過梯度迭代算法最大化樣本的對數(shù)似然函數(shù),推斷出過完備描述的基函數(shù)A,同時給出源信號s。 4 結語 本文討論了欠定盲源分離技術在語音信號分離中的主要思路和方法。欠定盲源分離算法更符合實際情況,具有更廣泛的應用,但其分離理論尚不成熟,還需要進一步研究完善。 參考文獻 [1]M.S.Lewieki and T.J.Sejnowski.Learning overcomplete representations[J]networks,Neural Comput.,2000:337-365. [2]P.Bofill nd M.Zibulevsky.Underdetermined blind source separation using Sparse representations [J],Signal Proeess.,2001,81(11):2353-2362. [3]M.Zibulevsky and B.A.Pearlmutter.Blind source separation by Sparse Decomposition in a Signal Dictionary[J],NeuralComPut.,2001,13(4):863-882. [4]馬建倉,牛奕龍,陳海洋.盲信號處理[M].國防工業(yè)出版社.2006.