王賢波 李盛 張緩緩



摘要:在語音通信中,常常會受到外界環境干擾,傳統的譜減法雖可抑制噪聲,但信號處理的過程中伴隨著音頻噪聲。背景很強的機械噪聲采用譜減法會產生很強的音樂噪聲。文章基于DSP實現的多頻段譜減法,結果表明,利用DSP實現多頻段譜減法的語音增強系統能夠減少背景很強的機械噪聲產生的音樂噪聲。
關鍵詞:語音增強;多頻段;譜減法;DSP
隨著數字信號處理的發展,語音信號處理領域越來越受到關注,語音信號處理是實現人機交互和通信技術的必要方法[1]。但語音通信過程中噪聲的污染是不可避免的,尤其是在一些強的噪聲環境中,語音識別系統的識別率將會受到嚴重影響。譜減法是語音增強去噪的主要方法之一,它是通過從含噪的功率譜中直接減去噪聲功率譜,來估計純凈功率譜。譜減法雖然可以成功地衰減原始帶噪語音中的噪聲,但由于噪聲是有色的,并且不會在整個頻譜均勻地影響語音信號,因此,帶來“音樂噪聲”,且有可能聽者會發現處理后的比原始信號中的噪聲更為清晰[2]。因此,這里提出了基于多頻帶的譜減法,譜減法及其改進算法是一種基于短時譜估計的語音增強算法,它的運算量相對較小,容易實時實現,而且增強的效果明顯,是最常用的語音增強算法。本文采用TMS320VC5509 DSP和TLV320AIC23組成實時系統,實時實現了多頻段譜減法的語音增強。
1 多頻帶譜減法
譜減法的原理是基于假設信號中附加性噪聲是固定的。令y(n)是嘈雜的語音信號,則它是由純凈的語音信號x(n)和噪聲信號d(n)的相加。
即:y(n)=x(n)+d(n)(1)
大多數的減法型算法有不同的變化,允許靈活的光譜減法的變化。Berouti提出的廣義譜減法方案如下:當α>1是超減法因子[3],這是由于信噪比的作用。β(0<β<1)則是光頻譜段,y是指數取決于過度清晰度。取γ=2,β=0.002。多頻段譜減法是將帶噪語音、估計的噪聲信號按頻率劃分Ⅳ個互不相交的頻帶,然后根據每個頻帶內帶噪語音與估計噪聲信號的信噪比,來確定該頻帶噪聲的譜減參數[4-5]。語音頻譜被劃分為N個無重疊帶,而譜減法在每個頻帶中獨立執行。因此,第i波段的清潔語音頻譜的估計是:
因此,多頻段譜減法的系統結構框如圖1所示。
2 多頻段譜減法的DSP實現
本文采用TMS320VC559 DSP和TLV320AIC23 Codec組成實時系統,實現了多頻段譜減法的語音增強系統,系統的結構框如圖2所示。
本系統所述硬件系統有:帶噪音音頻輸入,增強后音頻輸出,電源模塊,TLV320AI23,TMS320VC5509芯片,利用TLV320AIC23完成信號的A/D,D/A轉換,并利用TMS320VC5509中的多通道緩沖串口MCBSPI與DMA通道配合時鐘工作,從而完成TLV320AI23與TMS320VC5509串口收發數據的同步。同時再利用TMS320VC5509進行對TLV320AI23端口的配置。系統使用配套套電源模塊對整個系統供電,簡化了電源模塊的設計。電源模塊帶有電壓監控芯片,當供電不足時可自動進行操作,使系統能夠應對各種突發事件。
3 系統的軟件設計
在本系統中,語音是按Bark頻帶劃分5個頻段(60~300 Hz,300~1 kHz,1~2 kHz,2-3kHz,3~5 kHz)。然后根據譜減參數的確定方法,逐幀逐頻帶進行參數確定和譜減,最后結合含噪語音的相位,得到輸出語音。軟件算法框如圖3所示。
4 實驗結果及分析
實驗所用的純潔語音信號來自普通話訓練學習庫,噪聲取自機械噪聲,含噪語音信號采樣頻率均為16 kHz,程序中窗口選取漢明窗,每幀取512個點,機械背景噪聲的仿真,以及DSP多頻段譜減法系統處理后刻錄語音的波形如圖4-5所示。
通過對比機械背景噪聲下多頻帶MATLAB語音信號的仿真圖和DSP多頻帶增強系統處理后波形,發現波形基本一致,采用主觀評價方法,將刻錄的DSP多帶增強系統處理后的波形,播放給聽眾,并讓聽眾復述播放的內容,以聽眾復述的字的個數統計,發現DSP多頻帶系統處理后聽眾的復述正確率達到90.93%。表明DSP多頻段譜減法的語音增強系統能夠減少背景很強的機械噪聲產生的音樂噪聲。
[參考文獻]
[1]楊毅,李澤偉語音信號處理的實驗的改革實踐[J].實驗室研究與探索,2014 (4):123-126.
[2]王龍基于DSP的語音增強系統的研究與設計[D]上海:華東大學,2011
[3]李圓,趙振東,楊超基于多帶譜相減的語音端點檢測算法[J].通信技術,2007 (11):353-356
[4]BEROUTI M, SCHWARTZ R, MAKHOUL J.Enhancement of speech corrupted by acoustic noise[Cl.Washington: Acoustics, Speech,and Signal Processing IEEE International Conference on ICASSP. IEEE Xplore, 1979: 208-211[5]SHENG L, MING N, JIANQI W,et al.Enhancement of non-air con-duct speech based on muki-band spectral subtraction method[C].Washington: Processing IEEE International Conference on Image and Signal Processing, 2008: 338-341