999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種魯棒的基于小波變換的語音參數提取算法

2008-12-31 00:00:00唐煥華劉錦高
計算機應用研究 2008年10期

收稿日期:2007-12-07;修回日期:2008-03-10

基金項目:上海市2007年科技攻關重點項目(075115002);華東師范大學優秀博士研究生配陽基金

作者簡介:吳翔(1982-),男,博士,主要研究方向為信號處理(52061202003@ecnu.cn);唐煥華(1984-),女,江蘇蘇州人,碩士,主要研究方向為數字信號處理;劉錦高(1948-),男,教授,博導,主要研究方向為高頻地波雷達海洋遙感、光纖通信、移動通信*

(華東師范大學 電子科學與技術系,上海 200241)

摘 要:提出了一種基于小波變換的新型語音參數提取算法,提高語音識別系統對環境噪聲的魯棒性。由于引入了多分辨率小波分析技術,識別既在高頻提供高的頻率分辨又在低頻提供高的時間分辨率。這樣,提出的改進算法在語音詞匯的識別更準確的同時,還大大簡化了計算。將該算法和傳統提取MFCC系數的算法進行了比較,實驗結果表明,利用小波計算語音特征具有更優的性能。

關鍵詞:語音識別;離散小波變換;漢明窗;動態時間彎折算法

中圖分類號:TP391

文獻標志碼:A

文章編號:1001-3695(2008)10-2984-03

Robust algorithm for speech feature extraction based on wavelet transform

WU Xiang, TANG Huan-hua, LIU Jin-gao

(Dept. of Electronic Science Technology, East China Normal University, Shanghai 200241, China)

Abstract:This paper proposed a novel approach for speech feature extraction, which promoted the robustness of speech recog-nition to noise. Wavelet transform was adopted to get both highest temporal resolution and frequency resolution in different position. So the algorithm not only yield accurate measurements, but also exhibit a low computational cost. The experiment compared traditional MFCC algorithm and this method, results demonstrate that the proposed algorithm is robust and efficient for applications in speech recognition.

Key words:speech recognition; discrete wavelet translation; Hamming window; dynamic time warping

在模式識別中,語音的識別是一個很重要的內容。而參數的提取一直是構成整個識別系統最重要的一環?;诟兄膮等缑窢柕棺V系數是特定人語音識別的一個重要特征參數[1],但運算復雜度和噪聲魯棒性都有待進一步提高。開發魯棒性強的語音識別系統是這項技術走向實用的關鍵所在。因此近年關于魯棒性的語音識別研究正逐漸成為研究熱點。

近年來,小波變換被廣泛應用于數據壓縮和編碼[2~4],小波分析是一種非平穩信號分析的有力數學工具,它可以看做是一種廣義信號時頻分析方法,具有多分辨率分析的特點,而且在時頻兩域都具有表征信號局部特征的能力。因此當前小波分析在眾多研究領域已得到重視與應用[5]。

本文將小波變換用于語音參數的提取,就如何構建特征參數這一問題進行了深入的討論。與傳統的梅爾倒譜系數計算相比,這里提出的算法無須在時域內將語音分塊及FFT運算[6],而是充分利用小波變換本身具備時間刻度的特性,簡化了復雜度。另一方面,由于時間和頻率的局部變換,能有效地從信號中提取信息。通過小波變換,在信號的高頻域部分,可以取得較好的時間分辨率;在信號的低頻域部分,可以取得較好的頻率分辨率。

1 語音信號的小波處理

對語音信號進行處理前先需要進行電壓放大、A/D轉換、去除噪聲等措施。值得指出的是,小波變換在語音去噪算法中使用效果很好[7],本文所使用算法可在基本不增加復雜度情況下較好的去噪,這是傳統算法所不具備的。語音信號小波處理框圖如圖1所示,在DWT之前先通過分幀、加窗及預加重等預處理方法,使信號更適合后面的數據處理。

離散小波變換(DWT)的快速算法由Mallat算法給出[8]。設f(x)為語音輸入信號,記

jk(x)=2-j/2(2-jx-k)(1)

ψjk(x)=2-j/2ψ(x-jx-k)(2)

這里(x)與ψ(x)分別為定標函數與子波函數,{jk(x)}與{ψjk(x)}為兩個正交基函數的集合。記P0f=f,在第j級上的一維離散小波變換通過正交投影Pjf與Qjf將Pj-1f分解為Pj-1f=Pjf+Qjf=∑kcjkjk+∑kdjkψjk(3)其中:cjk=∑p-1n=0h(n)cj-12k+n,djk=∑p-1n=0g(n)cj-12k+n

j=1,2,…,L;k=0,1,…,N/2j-1(4)

這里,{h(n)}與{g(n)}分別為低通與高通權系數,它們由基函數{jk(x)}與{ψjk(x)}來確定,p為權系數的長度。{C0n}為語音信號的輸入數據,N為輸入信號的長度,L為所需的級數。由上式可見,每級一維DWT除了間隔取樣外與一維卷積計算很相似。

經過上述DWT運算后,得到一個關于j和k的二維矩陣。這里變量j決定不同尺度的小波對信號進行分解,是語音頻率成分的表征量。其中:j=1對應于分析中最低分辨率,j從小到大表示了語音頻譜從高到低各段的特征。而k是表示時間局部性的參數,由于各個頻段k的取值不同,得到的參數個數逐層遞減,得到金字塔形的結構。正是這種結構,一方面減少了需要進行匹配運算的數據量;另一方面由于在低時間分辨率上有高的頻率分辨率,低頻率分辨率上有高的時間分辨率的多分辨率性質[9],保證提取的參數作為識別的可靠性。

對一段語音“7”小波處理后各級波形如圖2所示,顯然不同頻段有著不同的時間—能量曲線。由此可得到特征參數,計算方法將在下章中詳述。

2 特征參數的獲取與匹配

21 計算特征參數矩陣

為了準確識別,作為表征語音特征的參數要求在文獻[10]中闡明:a)提取的特征參數能有效地代表語音特征,具有很好的區分性;b)各階參數之間有良好的獨立性;c)特征參數要計算方便,最好有高效的計算方法,以保證語音識別的實時實現。

傳統采用的特征參數為Mel倒譜頻率參數MFCC(另外還可以用線性預測系數和線性預測倒譜系數),是以“bark”為其頻率基準的,它與線性頻率的轉換關系在文獻[11]中提到,如式(5)所示。fmel=2 595 log10(1+f/700)(5) 

傳統算法利用24個在頻率軸上處于不同位置的帶通濾波器組對各個特征進行篩選。事實上這一系列帶通濾波器的作用就是取各個頻率段的信號能量作為這個短時語音的特征。這種方法既要將信號分成許多短時塊又要在頻域中對各個頻段進行分離。計算涉及到了時域信息和頻域分離,直接利用小波變換輸出結果更加理想。特征參數矩陣為

d00 d01 … d0N/2 … d0N

d10d11…d1N/2

dL1…dLN/2L-1

cL1…cLN/2L-1(6)

對于嵌入式系統實現,為了盡量使用少的資源,可用串行處理策略。因為每級的d系數都由上級c系數分離出來,可以完成一級匹配運算后立刻計算下一級,始終占用一層的內存空間。

22 參數匹配

在孤立詞語音識別中,最為簡單有效的方法就是DTW算法[11,12]。本文提出的方法具有一些與傳統匹配不同的特性。通過小波變換語音中不同尺度上的變化趨勢被提取出來,由于小波的壓縮特性[13],小波系數將是稀疏的,在大多數點系數的值相對很小,而少數點的值比較大。另外高斯噪聲的各級小波系數方差均等于原信號的方差,實際上小波變換對語音信號進行了壓縮,并且噪聲的系數方差等于原信號方差可知其平均幅度很小,這樣量化可以去噪,提高分析信噪比。這也正是前面提到的本算法的優勢之一。

匹配階段,將特征參數序列依次與模板庫中的每一個模板進行相似度的比較,相似度最高者作為識別結果輸出。通過時間規整和距離測度計算結合的非線性規整技術解決孤立詞說話速度不均勻的問題。一個I幀矢量{T(i)}和J幀的模板矢量{R(j)}進行匹配,其中,I和J不等。匹配算法尋求時間規整函數j=f(i),將測試矢量時間軸i非線性映射到模板時間軸j上。規整函數應滿足:D=minIw(i) i=1∑d[T(i), R(ω(i))](7)其中:d[T(i), R(ω(i))]是第i幀測試矢量T(i)和第j幀模板矢量R(ω(i))之間的距離測量。根據式(7)可得到最優時間規整的兩矢量距離。通過不斷計算兩矢量的距離并尋找最優匹配路徑。

或者,在精度要求不是非常高而對算法速度有要求的場合,也可以采取對低頻特征系數先進行一次匹配,當匹配距離處于不明確的范圍時,再取高頻系數匹配。這種有條件漸進精確匹配的方法,可以有效提高效率。本算法這種靈活的方式也是傳統算法中采用FFT所不具備的。

3 實驗結果

在本實驗中,測試語音信號采用8 kHz的抽樣率,每個采樣值用16 bit進行編碼。如果采用更高精度的采樣,識別效果也會更好,但是以增加運算復雜度為代價。與本文算法性能作比較的是使用傳統MFCC參數的算法, MFCC的階數選12階,模板匹配使用動態時間彎折(DTW)算法,動態參數選取1階和2階差分MFCC,即特征參數選用c+Δc(共24維)[14]。在小波處理中,選10階的Db6小波[15],門限值由上述公式所定。

圖3是分別用FFT算法和小波算法獲得的二維系數圖比較。小波處理的參數分布更稀疏,這是由于它的多分辨率的性質,計算量也大大減少。

圖4是兩者和文獻[16]中提到的RAS-MFCC參數在加入服從高斯分布的不同背景噪聲后對相同語音片段識別錯誤率的比較。顯然,本文提出的改進算法在性能上優于傳統算法,完全可以作為特征參數用于語音識別,且省去多個帶通濾波器的設計,計算量簡化很多。

4 結束語

本文利用離散小波變換的特性,結合多分辨率分析技術在時間—頻率域上提出一種具有魯棒性的新型語音特征參數。并對這種算法與傳統的識別算法的性能進行了比較。實驗結果證明了本算法的優越性,在提高識別率的同時大大縮短了識別速度。

利用小波變換對語音信號進行處理本身有很大的潛力,尤其在去噪方面有其不可比擬的優勢[17~19]。但是傳統MFCC系數是考慮了人耳聽覺特性的一種特征參數。所以如何在小波處理的參數中放大人耳敏感的頻率部分,使多分辨率和人的主觀感知頻域達到一致,是本文將來值得進一步研究的地方。

參考文獻:

[1]NASERSHARIF B, AKBARI A. SNR-dependent compression of enhanced Mel sub-band energies for compensation of noise effects on MFCC features[J]. Pattern Recognition Letters , 2007,11(1):1320-1326.

[2]WANG Da-kai. The application of wavelet in signal processing[M]. Beijing: Publishing House of Electronics industry, 2006:157-173.

[3]YANG L H. Wavelet analysis and its applications[M].[S.l.]:Springer, 2002:234-305.

[4]MEYER Y. Wavelets: algorithms and applications, society for industrial and applied mathematics[M]. Philadelphia:[s.n.],1993:13-31, 101-105.

[5]YAO Tian-ren. Digital voice processing[M]. Shanghai: East China

University of Science Technology Press,2002:40-64.

[6]崔錦泰.小波分析導論[M].西安:西安交通大學出版社,1995:15-18.

[7]KOTNIK B, KACIC Z. A noise robust feature extraction algorithm using joint wavelet packet subband decomposition and AR modeling of speech signals[J]. Signal Processing, 2007,87(6):1202-1223.

[8]DWIGHTF M. Wavelets for engineer[M].[S.l.]: Wiley-Interscience, 2006:234-305.

[9]李建平.小波分析與信號處理[M].重慶:重慶出版社,1997:157-173.

[10]楊行峻,遲惠生.語音信號數字處理[M].北京:電子工業出版社,1995:40-64.

[11]何強,何英. MATLAB擴展編程 [M]. 北京:清華大學出版社,2002:330-349.

[12]FURLANELLO C, MERLER S, JURMAN G. Combining feature selection and DTW for time-varying functional genomics[J]. IEEE Trans on Signal Processing, 2006,54(6):2436-2443.

[13]YANG L H. Wavelet theory and its application to pattern recognition[M].[S.l.]: World Scientific,1995:15-18.

[14]ABDULLA W H. Robust speaker modeling using perceptually motivated feature[J]. Pattern Recognition Letters, 2007,28(11):1333-1342.

[15]HE Qiang, HE Ying. MATLAB extended programme[M]. Beijing: Tsinghua University Press,2002:330-349.

[16]劉鳴,戴蓓倩,李輝.基于離散小波變換和感知頻域濾波的語音特征參數[J].電路與系統學報,2000,5(1):21-25.

[17]GHANBARI Y, KARAMI-MOLLAEI M R. A new approach for speech enhancement based on the adaptive thresholding of the wavelet packets[J]. Speech Communication,2006,48(8):927- 940.

[18]YAN Long, LIU Gang, GUO Jun. A study on robustness of large vocabulary mandarin Chinese continuous speech recognition system based on wavelet analysis[C]//Proc of ICAPR’05. Berlon: Springer-Verlag, 2005:497-504.

[19]ZHANG Xue-ying, JIAO Zhi-ping, ZHAO Zhe-feng. The speech recog-nition based on the bark wavelet front-end processing[C]//Proc of the 2nd Conference on Fuzzy Systems and Knowledge Discovery. Changsha: [s.n.], 2005:302-305.

主站蜘蛛池模板: 亚洲人成网站色7799在线播放 | 亚洲精品国产综合99久久夜夜嗨| 四虎综合网| 欧美一区中文字幕| 国产99视频在线| 国产一区二区福利| 高清乱码精品福利在线视频| 国产精品欧美日本韩免费一区二区三区不卡| 亚洲精品欧美日韩在线| 欧美色图久久| 九九热在线视频| 中文字幕天无码久久精品视频免费| 91亚瑟视频| 精品久久人人爽人人玩人人妻| 成年A级毛片| 国产网站一区二区三区| 亚洲第一成年人网站| 91久久偷偷做嫩草影院精品| 亚洲欧洲日产国产无码AV| 亚洲av综合网| 114级毛片免费观看| a级毛片视频免费观看| 午夜精品国产自在| www亚洲天堂| 亚洲高清中文字幕| 青青操视频在线| 69免费在线视频| 久久五月视频| 日本www在线视频| 亚洲日韩高清无码| 亚洲第一福利视频导航| 国产小视频免费| 九九热精品在线视频| 亚洲色图综合在线| 国产无码网站在线观看| 亚洲av中文无码乱人伦在线r| 国产欧美日韩在线一区| 在线精品自拍| AV熟女乱| 91精品国产自产91精品资源| 久久久久中文字幕精品视频| 天天视频在线91频| 色综合色国产热无码一| 国产精品毛片一区视频播| 亚洲清纯自偷自拍另类专区| 91亚洲影院| 日本爱爱精品一区二区| 成人福利视频网| 亚洲欧美日韩综合二区三区| 欧美五月婷婷| 久久久亚洲国产美女国产盗摄| 久久国产高清视频| 国产女主播一区| a毛片在线播放| AV老司机AV天堂| 国产美女叼嘿视频免费看| 久久伊人久久亚洲综合| 日韩一级毛一欧美一国产| 国产理论最新国产精品视频| 免费 国产 无码久久久| 欧美a在线| 免费播放毛片| 亚洲无码电影| 亚洲免费黄色网| 中文字幕第4页| 一区二区三区四区在线| 高清码无在线看| 日韩欧美亚洲国产成人综合| 国产视频一区二区在线观看| 伊人久久综在合线亚洲91| 亚洲第一区在线| 天天躁夜夜躁狠狠躁图片| 免费毛片网站在线观看| 欧美一区二区福利视频| 久久人人爽人人爽人人片aV东京热 | 2022精品国偷自产免费观看| 91精品专区| 成人无码一区二区三区视频在线观看| av一区二区人妻无码| 99一级毛片| 在线看国产精品| 国产精品一区二区不卡的视频|