朱宗明,姜占才(.中國人民解放軍690部隊,阿克蘇 843000;.青海師范大學物理系,西寧 90008)
小波遞歸最小二乘語音自適應增強
朱宗明1,姜占才2
(1.中國人民解放軍69220部隊,阿克蘇843000;2.青海師范大學物理系,西寧910008)
摘要:針對語音自適應增強的遞歸最小二乘算法必須已知參考信號的約束條件,將小波技術引入RLS算法中,提出了一種語音自適應增強算法—小波遞歸最小二乘算法(WRLS)。無需參考輸入和輸入信號的延時量,而是用小波分解、合成技術初估期望信號,以此獲得先驗誤差;再用RLS算法求解濾波器權系數修正量;同時采用“塊”和“符號”技術減少權系數修正的運算量,提高算法的收斂速度。仿真實驗表明該算法的增強效果明顯優于譜減法和小波增強法。
關鍵詞:語音;自適應增強;小波;RLS算法;濾波器權系數
本文引用格式:朱宗明,姜占才.小波遞歸最小二乘語音自適應增強[J].新型工業化,2015,5(7):18-23
Citation:ZHUZong-ming,JIANGZhan-cai.AlgorithmforSpeechAdaptiveEnhancementofWaveletRecursive LeastSquare[J].TheJournalofNewIndustrialization,2015,5(7):18-23.
語音信號常常不可避免地受到背景噪聲的污染。語音增強是從被噪聲污染的語音中提取盡可能干凈的語音,這在通信尤其是軍事通信中尤為重要。噪聲信號和語音信號都是隨機信號,沒有一種方法能達到完全濾除噪聲的目的。譜減法和相應的變形方法具有運算量小、實時性強、增強效果顯著等優點,成為此前和目前主要的增強方法而得到了廣泛的應用;小波域語音增強效果顯著;Wiener濾波對平穩信號的增強效果顯著,但語音是非平穩的,對此,人們提出了許多改進的或綜合算法[1-3]。背景噪聲對語音是加性的隨機信號,語音增強應基于非平穩假設,因此,基于優化算法的自適應濾波技術是語音增強最根本的方法[4-6]。最小均方誤差(LMS)和遞歸最小二乘(RLS)是兩種最基本的自適應濾波算法,每一種又有FIR和IIR兩種實現類型。將自適應濾波技術應用于語音增強,目前尚存在一些比較困難的問題。文獻[5]探討了LMS類自適應語音增強,本文以基本RLS算法為基礎,提出了一種利用小波技術、輔以“塊”和“符號”技術的語音自適應增強算法,并對其進行了大量的仿真實驗,證明該方法對語音有顯著的增強效果。
受到噪聲污染的語音信號用下式表示:

其中d(n)是未收污染的語音即干凈語音;v(n)是背景噪聲干擾;x(n)是受噪聲污染的語音即語音的噪聲觀測。背景噪聲一般是寬帶的,可用零均值的高斯白噪聲來模擬。語音增強的目的是從語音的噪聲觀測中提取原始語音,盡可能地減小噪聲的干擾。常用的方法有兩種,一是設法得到噪聲的估計,然后從含噪語音即語音的噪聲觀測中減去噪聲估計,這種方法稱為噪聲對消法;另一種是對含早語音即語音的噪聲觀測信號進行濾波,直接得到語音的估計,稱為濾波法。如圖1所示。

圖1 自適應濾波原理Fig1. Principle of adaptive filtering
自適應濾波的遞歸最小二乘(RLS)算法是一種遞歸修正算法,是在最小二乘意義上最優的濾波器對含噪語音進行濾波,其FIR型實現的濾波器是線性相位、因果、穩定的。RLS算法可歸納為如下過程:
算法參數:p——濾波器的階數;λ——指數加權因子(遺忘因子);δ——用于初始化)0(P→的值;

計算公式:對n=1,2,3,...,計算濾波后信息矢量

增益矢量

先驗誤差
修正濾波器


修正逆矩陣→

小波作為一種有效的時間(空間)/尺度分析工具,為信號分析提供了一種有效的多分辨(多尺度)的表示方法。小波變換能夠同時給出信號的時/空域和頻域信息,具有良好的時頻局部化性能。小波域信號增強能夠兼容去噪和保留信號有意義特征。從信號的噪聲觀測x(n)中求得期望信號的估計)(?nd,可以利用小波分解和小波重構技術,其基本原理和過程是:①選用適當的小波函數和小波分解層次,對觀測數據進行小波分解,分別得到低頻和高頻分解系數向量{cai}、{cdi},i=1,2,…,N,N是選定的分解層數;②對從第1層到第N層的每一層,采用Stein的無偏似然估計原理,選用一個自適應閾值,對高頻系數向量進行軟閾值處理。③根據第N層的低頻系數和所有經過處理的高頻系數,計算出信號的小波重建,即為期望的估計)(?nd。小波分解如圖2所示。
4.1RLS算法語音增強核心技術
將RLS算法應用于語音自適應增強時遇到一個關鍵問題:欲得到先驗誤差,必先求得參考信號d(n),d(n)就是干凈語音,當然是未知的。大量文獻給出了兩種假設下的情況:①除了主觀測(語音的噪聲觀測)或稱主輸入外,還可獲得輔觀測,它是與主觀測中的噪聲強相關的隨機噪聲,該假設在飛行員通信中容易實現;②將觀測信號的適當延時信號作為自適應濾波器的輸入,該假設在非語音信號且允許事后處理中容易實現。顯然,兩種假設在實時語音處理(如通信)中都是難以實現的。4.2語音自適應增強的WRLS算法
像移動通信這樣的語音實時處理,輔觀測法和數據延時法是不現實的。欲實現自適應濾波的RLS算法,必須由輸入數據即語音的噪聲觀測x(n)直接獲得先驗誤差α(n),參考信號(期望信號)d(n)雖然未知,但可以先對其進行估計。當然,若果該估計效果理想,即可將該估計直接輸出;若果估計效果不佳,則可將該估計作為參考信號,然后用迭代法修正濾波器,使其在最小二乘意義上達到最優。
小波期望估計法雖然具有算法比較簡單、去噪效果比較顯著等優點,但由于其算法是基于分層高頻系數閾值門限處理,其去噪效果仍然是有限的。將小波去噪引入RLS算法中,用于參考信號d(n)的估計,以此獲得先驗誤差α(n),進而對時變濾波器遞歸修正。這種基于小波和RLS的自適應語音增強算法稱為WRLS算法,如圖3所示。

圖2 小波分解原理圖Fig 2. Principle of wavelet decomposition

圖3 WRLS語音自適應增強原理圖Fig 3. Principle of WRLS speech adaptive enhancement
為了提高WRLS的運算速度,采取兩項技術。一是將先驗誤差α(n)取“符號”運算;二是濾波器修正時采用“塊”技術,即將一幀數據視為塊,對塊用迭代法得到最優濾波器,而不是在幀的每個樣點上進行迭代。
4.3WRLS算法步驟
4.3.1初始化
先對時變濾波器的權系數向量和自相關逆矩陣作初始化處理,分別得到初始權系數w→=0→和→→0
P(0)=δ?1I,δ是由試驗確定的很小的正數。初始化只在一段語音的最前幾幀上進行,不必對一段語音都進行。
4.3.2修正濾波器

①估計期望信號:對當前輸入的含噪語音即語音的噪聲觀測幀,由小波期望估計器求出原始語音的估計d?(n),將其作為自適應濾波器的期望信號;②求濾波后信息矢量→z(n);③求增益矢量g→(n)并對取其符號;對g→(n)取符號運算sign(g),如下式:④修正自相關逆矩陣:用(7)式對自相關逆矩陣進行修正,得到自相關逆矩陣;之后視先驗誤差的情況,需要對矩陣進行第二、三等多次的迭代修正,依次得到,直到濾波器達到最優為止。⑤求α(n):用初始化的濾波器對當前幀濾波,求得濾波器輸出,由(5)式求α(1),其中括號中的數字表示幀序號;先驗誤差經過比較器比較后,再確定是否對濾波器進行再修正;⑥濾波器的修正:若果先驗誤差大于閾值T,則按(6)式對濾波器進行修正,得到修正后的濾波器的權重向復量上述②;~再⑥用的新全的部濾過波程器,再依次次對得當到前指幀向濾當波前,幀求的的濾先波驗器誤權差系α數(1.2)。、、 …、,直到濾波器權系數達到最優為止。下一幀緩沖完成并到達當前位置,系統接受為當前幀,剛剛處理完的幀的最優濾波器權系數w→、和再自重相復關②逆~矩⑥陣全部P→( 1過.N 程)成,為得當到前第幀2幀的初的始值,重復前述。①對~之⑥后全的過各程個后幀依,次依得次到迭代,依次得到等參1數. N ,當前幀是第1幀時,就是初始值;如果是第2、3、…幀,則將前一幀的最優參數作為當前幀的初始值,顯然,無須對每一幀都作繁雜的初始化處理。語音信號的幀間的相關性很強,這種初始化方案將極大地縮短RLS算法的收斂時間,整體上體現為算法速度大幅提高。
5.1實驗方案
①直接仿真實驗:對同一段語音樣本,在不同的噪聲強度下,分別用譜減法和WRLS法進行仿真實驗;在同一噪聲強度下,用ISS算法和WRLS算法對不同的語音樣本進行濾波仿真實驗。
②應用仿真實驗:將WRLS增強算法移植到低速率聲碼器中,觀察比較未經增強環節和經WRLS法增強環節,再經過編碼、傳輸、解碼后,合成語音的音質效果。
5.2實驗語音樣本
實驗語音樣本取自筆者建立的語音庫yyk2.wav,庫中語音為8kHz采樣、8bit量化、線性PCM編碼的碼率為64kbps的數字語音。實驗時從語音庫隨機抽取語音段,加入不同信噪比的高斯白噪聲后形成含噪語音。分幀幀長和幀移都取20ms即160點,幀與幀之間無重疊。
5.3實驗系統
分別對改進的譜減法和WRLS法用M語言編程,以文件名iss.m和wrls.m存盤;在PC機上仿真實驗。
5.4實驗結果及其分析
實驗結果如圖4、5、6、7所示。圖4和圖5是同一段語音在信噪比為3dB時,ISS法和WRLS法的增強結果。大量實驗都顯示,當信噪比大于10dB時,改進的譜減法與小波遞歸最小二乘法的增強效果相差不明顯;但當信噪比降到10dB以下時,小波遞歸最小二乘法增強的效果明顯優于改進的譜減法;當信噪比進一步降低到3dB時(信號幾乎被噪聲淹沒),改進的譜減法增強效果明顯欠佳,但小波遞歸最小二乘法仍然顯示比較顯著的增強效果。
圖6和圖7分別是在信噪比為10dB時,沒有增強和經小波遞歸最小二乘法增強的語音,分別經過編碼速率為2.4kb/s的混合激勵線性預測聲碼器后的合成語音。試聽者由仿真實驗試聽得出:未經增強的語音經聲碼器編、解碼,其合成語音中含有明顯的噪聲;經小波遞歸最小二乘法(WRLS)增強環節、再經聲碼器編、碼,其合成語音的噪聲明顯減少,使得合成語音的可懂度和自然度得到顯著的提高,這對通信是非常有益的。

圖4 3dB時譜減法語音增強增強Fig 4. Speech enhancement of ISS under 3dB

圖6 10dB時未經增強環節的解碼語音Fig 6. Decoding speech without enhancement link under 10dB

圖7 10dB時經WRLS增強環節的解碼語音Fig 7. Decoding speech with WRLS enhancement link under 10dB
將自適應濾波的RLS算法移植到語音增強算法中,期望信號的獲得是實現增強目的的關鍵技術。將小波分解與合成技術引入自適應濾波的遞歸最小二乘算法中,得到的小波遞歸最小二乘算法(WRLS),是求解自適應增強濾波器的參考信號的一個比較有效的方法,從而實現了非平穩語音的自適應增強。計算機仿真實驗表明,小波遞歸最小二乘算法(WRLS)對含有背景噪聲的語音信號,有顯著的增強效果,增強效果優于改進的譜減法;在信噪比接近3dB的較強噪聲環境中,其增強效果仍比較明顯。
參考文獻
[1]李野,吳亞鋒,劉雪飛.基于感知小波變換的語音增強方法研究[J].計算機應用研究,2009,26(4),1413-1415.
YeLI,Ya-fengWU,Xue-feiLIU.Researchonspeechenhancementbasedonperceptualwavelettransform[J].ApplicationResearchof Computers,2009,26(4):1313-1315.
[2]王振力,張雄偉,劉守生,韓彥明.基于離散小波變換與小波包分解的語音增強算法[J].解放軍理工大學學報(自然科學版),2005,6(5),424-427.
Zhen-liWANG,Xiong-weiZHANG,Shou-shengLIU,Yan-mingHAN.Algorithmforspeechenhancementbasedondiscretewavelet transformandwaveletpacketdecomposition[J].JournalofPLAUniversityofScienceandTechnology,2006,6(5):424-427.
[3]王娜,鄭德忠,劉永紅.雙樹復小波包變換語音增強新算法[J].傳感技術學報,2009,22(7),983-987.
NaWANG,De-zhongZHENG,Yong-hongLIU.NewMethodforSpeechEnhancementBasedonDual-TreeComplexWaveletPacket Transform[J].ChineseJournalofSensorsandActuators,2009,22(7):983-987.
[4]柳林,李輝,戴蓓蓓,等.基于多脈沖激勵和卡爾曼濾波的語音增強算法[J].數據采集與處理,2009,24(1),100-104.
LinLIU,HuiLI,Bei-qianDAI,WeiLU.SpeechEnhancementMethodBasedonKalmanFilteringandMultipluseExcitation[J].Journal0f DataAcquisition&Processing,2009,24(1):100-104.
[5]姜占才,孫燕,王得芳.基于譜減和LMS的語音自適應增強[J].計算機工程與應用,2011,47(7),145-148.
Zhan-caiJIANG,YanSUN,De-fangWANG.AdaptivespeechenhancementbasedonspectralsubtractionandLMS[J].Computer EngineeringandApplications,2012,48(7):142-145.
[6]姜波,楊軍,張爾揚.稀疏自適應Volterra濾波的QRD-RLS算法[J].信號處理,2008,24(4),595-599.
BoJIANG,JunYANG,Er-yangZHANG.QRD-RLSAlgorithmforSparseAdaptiveVolterrafiltering[J].SignalProcessing,2008,24 (4):595-599.
DOI:10.3969/j.issn.2095-6649.2015.07.03
基金項目:*國家社科基金(15XYY026)資助項目。
作者簡介:朱宗明(1985-),男,青海西寧人,助理工程師,從事軍事通信和軍械保障方面的研究。
通信作者:姜占才(1958-),男,青海西寧人,教授,主要從事通信語音處理與保密通信方面的研究。
Algorithm for Speech Adaptive Enhancement of Wavelet Recursive Least Square
ZHUZong-ming1,JIANGZhan-cai2
(1.The Chinese people’s liberation army 69220 troops, Akzo 843000; 2.Physics Department of Qinghai Normal University, Xining 810008)
Abstract:Anewspeechadaptiveenhancementalgorithm,basedonwaveletrecursiveleastsquare(WRLS)isproposed, accordingtorecursiveleastsquare(RLS)algorithmofspeechadaptiveenhancement,withtheknownconstraintsofthe referencesignalandemployingthewavelettechniqueinintheRLSalgorithm.Withoutthereferenceinputandthetimedelay oftheinputsignal,desiredsignalisestimatedbywaveletdecomposition,synthesistechnology,thusobtainingapriorierror;the weightcoefficientscorrectionofthefilterisobtainedadoptingRLSalgorithm;meanwhile,adoptingthetechniqueof"block" and"symbol"reducestheamountofoperationofweightcoefficientscorrection,andimprovestherateofconvergenceofthe algorithm.Simulationresultsshowthattheenhancementeffectofthealgorithmisobviouslysuperiortothespectralsubtraction andwaveletenhancementalgorithm.
Keywords:Speech;Adaptiveenhancement;Wavelet;RLSalgorithm;Weightcoefficientsoffilter