呂麗鵬 張歆奕
(五邑大學(xué),廣東 江門 529020)
語音信號(hào)的處理是我們語音學(xué)中很重要的一項(xiàng),它以語音學(xué)和數(shù)字信號(hào)處理為基礎(chǔ)而形成的一個(gè)綜合性的學(xué)科?,F(xiàn)有的時(shí)頻分析方法有很多,針對(duì)我們語音信號(hào),常用的時(shí)頻分析方法有短時(shí)傅里葉變換,窗口傅里葉變換,連續(xù)小波變換,希爾伯特變換等[1]。本文針對(duì)語音信號(hào)的特點(diǎn),結(jié)合常用的得到語音信號(hào)時(shí)頻圖的語譜圖方法,把小波脊提取方法運(yùn)用到語音信號(hào)的頻譜提取中,并對(duì)兩種方法進(jìn)行了對(duì)比。
現(xiàn)代語音信號(hào)處理中,我們常用語譜圖方法得到語音信號(hào)的時(shí)頻譜,小波在語音信號(hào)的處理中運(yùn)用的比較多,但是在語音信號(hào)的時(shí)頻圖取得方面運(yùn)用比較少。
待分析的信號(hào)形式如下:

以上各個(gè)變量的物理意義是:b表示平移因子,如果變換過程中消除了偏移,b和時(shí)間t是意義對(duì)應(yīng)的,因此A(b)表示時(shí)間點(diǎn)b上的振幅大小,Φ′(b)表示時(shí)間點(diǎn)b上的瞬時(shí)頻率,Φ(b)表示時(shí)間點(diǎn)b上的瞬時(shí)相位[2]。
信號(hào)經(jīng)過多個(gè)尺度的連續(xù)小波變換后,得到一個(gè)小波變換平面(小波變換域),小波變換域點(diǎn)的位置有平移因子b和尺度因子a決定,當(dāng)信號(hào)的振幅A(t)和瞬時(shí)頻率Φ′(b)在窗函數(shù)g(t)的支集上有較小的變化,并且假定式成立忽略一些誤差,因此G(ω)在ω=0時(shí)最大,由式子可知,對(duì)每個(gè)b值,信號(hào)的連續(xù)小波變換模在ξ(b)=Φ′(b)處最大,相應(yīng)的小波變換域上的時(shí)頻點(diǎn)(b,ab)=(b,ω0/Φ′(b))成為脊點(diǎn),其中ω0是小波基的匯總新頻率,ab表示脊點(diǎn)上的尺度值。在每一個(gè)脊點(diǎn),式子近似為

對(duì)上式做進(jìn)一步分析可知,脊上的數(shù)據(jù)表現(xiàn)出和原信號(hào)最相似的特性,脊的起伏變化對(duì)應(yīng)著信號(hào)幅度的變化;脊所在的位置的尺度值對(duì)應(yīng)著信號(hào)瞬時(shí)頻率的變化,各個(gè)信號(hào)分量的主要參數(shù)均可以從各自對(duì)應(yīng)的脊上的信息中提取出來。
常用的小波脊線提取方法有兩種:基于模極大值的小波脊線提取算法以及基于相位信息的小波脊線提取算法。本文主要針對(duì)前者進(jìn)行論述,至于后者有興趣的讀者可見參考文獻(xiàn)[4]。
由小波脊線理論可知,形式如下的信號(hào):

當(dāng)選擇解析小波 φ(t)=g(t)exp(iω0t)對(duì)其進(jìn)行連續(xù)小波變換時(shí),在滿足定的條件下,其連續(xù)小波變換的近似結(jié)果如下:

式子中,a是尺度因子,b是平移因子,A(b)是信號(hào)在b點(diǎn)的瞬時(shí)幅度,Φ′(b)是信號(hào)在 b 點(diǎn)的瞬時(shí)頻率,G 是 g(t)的傅里葉變換,ξ=ω0/a 對(duì)上式求模,并作歸一化處理有:

(1)首先對(duì)信號(hào)的帶寬范圍進(jìn)行粗估計(jì),然后設(shè)定小波變換的尺度因子范圍。
(2)離散化尺度因子。選定一個(gè)尺度因子間隔△a,在尺度因子范圍內(nèi),每隔△a,對(duì)信號(hào)作一個(gè)尺度的連續(xù)小波變換。一共要做a個(gè)尺度的連續(xù)小波變換。
(3)對(duì)于每一個(gè)b點(diǎn),搜索小波變換結(jié)果的模極大值所對(duì)應(yīng)的尺度ab,然后將搜索得到所有點(diǎn)(b,ab)連接起來,作為提取到的小波脊線。
這種求模極大值的方法由于要計(jì)算多個(gè)尺度下的連續(xù)小波變換,因此它的計(jì)算速度慢[5]。另外,這種方法適用的條件是:在連續(xù)小波變換域上,模極大值對(duì)應(yīng)的位置是唯一確定的,是對(duì)應(yīng)著信號(hào)脊線的位置,如果噪聲較弱,該條件還能滿足,但是當(dāng)噪聲比較強(qiáng)是,則在變換域上不僅有信號(hào)對(duì)應(yīng)的脊,而且會(huì)因?yàn)樵肼暤挠绊懏a(chǎn)生一些局部的極值點(diǎn),從而對(duì)脊的提取造成影響,使得提取到的脊停留在局部極值上,而不能提取到真正的脊線,因此我們總結(jié)一下為了使我們?cè)谛〔箤⑿盘?hào)的瞬時(shí)頻率和瞬時(shí)幅度分離出來時(shí)取得一條明顯的小波脊線,由小波脊的公式可得,必須滿足兩個(gè)根本條件:
(1)只有當(dāng)小波的調(diào)制頻率等于信號(hào)的載波頻率時(shí)才能在小波變換域上呈現(xiàn)出小波脊,在小波脊上的信號(hào)的瞬時(shí)頻率和小波的中心頻率滿足下式子:

其中ω0是弧度表示的小波基中心頻率,ω是弧度表示的信號(hào)的瞬時(shí)頻率,a是尺度因子。
(2)在小波的時(shí)窗范圍內(nèi),信號(hào)的瞬時(shí)頻率保持不變。
下圖為一個(gè)運(yùn)用小波脊提取方法提取獲得頻譜圖的實(shí)例。本文利用MATLAB軟件對(duì)信號(hào)進(jìn)行仿真。所取仿真信號(hào)為兩個(gè)信號(hào)連接起來的信號(hào),其中為兩個(gè)信號(hào)分別為:



圖1 小波脊提取時(shí)頻圖

圖2 小波脊提取時(shí)間尺度三維圖

圖3 小波脊提取的脊線圖
由圖1可以看出,原來含有多個(gè)諧波分量的信號(hào)在經(jīng)過小波脊方法得到的頻譜圖中,各個(gè)諧波分量十分清晰,其他噪音干擾等比較少,而后利用模極大值法可以得到兩條很清晰的脊線,圖4為小波脊提取的時(shí)間尺度和幅值的三維圖。圖3為最終得到的脊線圖。
與語譜圖方法的對(duì)比
本研究所采用的語音信號(hào)為阿拉伯?dāng)?shù)字的5,由錄音軟件cool edit完成,錄音者為男性,采樣頻率為16000Hz。
通過MATLAB編程分別運(yùn)用快速傅里葉變換得到語譜圖以及通過小波脊提取方法得到語音信號(hào)的頻譜圖。
方法一為語音信號(hào)進(jìn)行加窗分幀然后進(jìn)行快速傅里葉變換得到其語譜圖。其中窗口函數(shù)為hanning窗,一幀處理2048個(gè)點(diǎn),幀移值為32,得到的語譜圖如下:
下圖為同樣的信號(hào)經(jīng)過方法二小波脊提取方法得到的頻譜圖:

圖4 語音信號(hào)的語譜圖

圖5 小波脊提取方法得到的時(shí)頻圖

圖6 小波脊提取得到的時(shí)間尺度三維圖
圖4為語音信號(hào)進(jìn)行加窗分幀時(shí)為了得到較好的頻率特性,運(yùn)用了hanning窗,并且窗長(zhǎng)為2048,得出的頻率分辨率為7.8125Hz。在窄帶濾波語譜圖中分辨率也相當(dāng)高了,但是相對(duì)于圖五通過小波脊提取得到的時(shí)頻圖來說,精細(xì)度就差了很多。小波脊的提取方法很好分辨出每個(gè)諧波,并且在非諧波以外的頻率信號(hào)得到了很好的抑制,因此得到的時(shí)頻圖中看起來特別“干凈”。
對(duì)于小波脊線的提取,因?yàn)檎Z音信號(hào)中的諧波分量比較多所以得到的脊線也比較多,因此在脊線的提取時(shí)需要參照由小波脊提取方法得到的頻譜圖后對(duì)頻率進(jìn)行分段然后提取,這里就不一一贅述,有興趣的讀者可以參看文獻(xiàn)[2]。
兩者進(jìn)行對(duì)比很容易得出,小波脊提取方法用于語音信號(hào)處理時(shí),通過時(shí)頻分析可以得到低頻頻率部分光滑平整,局部單點(diǎn)少整個(gè)畫面清晰,頻率分辨率高,這對(duì)于得到的時(shí)頻參數(shù)后續(xù)用來進(jìn)行基頻分析,共振峰提取等有極大的幫助。
本文針對(duì)語音信號(hào)的特點(diǎn)為了得到語音信號(hào)的頻譜圖,分別介紹了常用的語譜圖方法以及小波脊提取方法,并著重介紹了小波脊提取方法對(duì)信號(hào)處理的實(shí)現(xiàn)方法,最后把小波脊提取的方法運(yùn)用到語音信號(hào)處理中,并與語譜圖方法得到的結(jié)果進(jìn)行了對(duì)比,突出了小波脊提取方法在時(shí)頻處理中的優(yōu)點(diǎn)。
[1]蔡蓮紅,黃德智,蔡銳.現(xiàn)代語音技術(shù)基礎(chǔ)與應(yīng)用[M].北京:清華大學(xué)出版社,2003:236-238.
[2]張緒省,朱貽盛,成曉雄,等.信號(hào)包絡(luò)提?。簭南柌刈儞Q到小波變換[J].電子科學(xué)周刊.
[3]Nathalie Delprat,Bernard Escudie Guillemain,Richard Kronland-Martinet,Philippe Ichamitechian,Bruno Torresani Asymptoic Wavelet and Gabor Analysis:Extraction of Instantaneous Frequencies[J].IEEE Transactions on information theory 1992,38(2):644-664.
[4]王兵,羿旭明.一種提取小波脊線的迭代算法[J].數(shù)學(xué)雜志,2005,25(3):295-298.
[5]袁曉,虞突厥邦.復(fù)解析小波變換與語音信號(hào)包絡(luò)提取和分析[J].電子學(xué)報(bào),1999,27(5):142-144.