暢江++張雪英++李鳳蓮



摘 要: 針對應用壓縮感知理論對含噪語音進行去噪其信噪比低的問題,以及應用譜減法對含噪語音去噪后語音信號仍不清晰的情況,提出幀間自適應的壓縮感知譜減去噪方法。同時,由于傳統壓縮感知理論不能使語音信號在重構時實現幀間自適應的去噪效果,對此缺陷提出一種改進算法,并且將該算法應用到譜減法的去噪過程中。相比于經典的譜減法,實驗結果表明,所提算法對含噪語音進行去噪不僅可以提高含噪語音的去噪效果,還可以有效地解決譜減法無法去除背景噪聲及音樂噪聲的問題。
關鍵詞: 壓縮感知; 譜減法; 語音去噪; 正交匹配追蹤算法
中圖分類號: TN912.3?34 文獻標識碼: A 文章編號: 1004?373X(2017)09?0014?04
Abstract: Since the noisy speech denoising based on compressed sensing theory has low signal?to?noise ratio, and the spectrum subtraction used to denoise the noisy speech still has poor speech signal, a speech denoising method based on adaptive inter?frame compressed sensing of spectrum subtraction is put forward. The traditional compressed sensing theory can′t realize the adaptive inter?frame denoising effect while reconstructing the speech signal, so an improved algorithm is proposed, and applied to the denoising process of the spectrum subtraction. The experimental results show that, in comparison with the classical spectrum subtraction, the proposed algorithm used to denoise the noisy speech can improve the denoising effect of the noisy speech, and effectively eliminate the background noise and music noise that the spectrum subtraction can′t do.
Keywords: compressed sensing; spectrum subtraction; speech denoising; orthogonal matching pursuit algorithm
0 引 言
目前,有越來越多的研究已證明壓縮感知(Compressed Sensing,CS)理論[1]能夠使語音信號在較大的壓縮比下達到較好的重構效果[2?4]。此外,還有研究指出該理論可以提高語音信號的抗噪性能,例如文獻[5]指出,若噪聲分布已知時,通過修改壓縮感知的約束條件,用基追蹤(Basis pursuit,BP)算法就可抑制噪聲。文獻[6?8]提出可采用自適應基追蹤的方法對語音信號進行去噪。雖然CS理論可以被用來進行語音去噪,但對于噪聲較強的語音信號,單獨使用CS理論無法獲得理想的去噪效果,因此要想采用CS理論對語音信號進行去噪,就需要對該理論本身進行改進,或結合其他理論[9]。
本文根據譜減法[10]能簡單有效地去除語音信號中多數噪聲的優點以及去噪后的語音仍含有大量背景噪聲和音樂噪聲的缺點,提出幀間自適應的壓縮感知譜減(Adaptive Inter?frame Compressed Sensing of Spectrum Subtraction,AICSSS)去噪方法,并將該方法用于含噪語音的去噪處理中,其中CS的重構算法采用正交匹配追蹤(Orthogonal Matching Pursuit,OMP)算法,但OMP算法在重構時必須根據預先估計好的稀疏度進行重構,而實際上,稀疏度通常不可知,對于語音信號而言,語音信號經分幀進行稀疏化處理后,其每一幀的稀疏度都是完全不同的,所以不能用一個固定的稀疏個數對每一幀語音信號進行重構。為此本文進一步提出了一種幀間自適應的OMP算法,并將該算法與譜減法結合對含噪語音進行去噪處理。實驗結果表明,本文的方法能有效修正應用譜減法對含噪語音去噪后存在背景噪聲和音樂噪聲的缺陷,并且還能改進單獨使用CS理論對含噪語音信號的處理效果。
1 壓縮感知理論模型
2 語音信號的幀間自適應OMP算法
2.1 幀間自適應OMP算法的基本原理
雖然傳統的OMP[12?13]算法具有重構效果好,算法復雜度低的優點,但它卻無法在稀疏度未知的情況下進行重構。在實際的仿真實驗中,語音信號經分幀稀疏化處理以后,不僅稀疏個數是未知的,而且對于每一幀的語音信號來說,其稀疏度都有很大不同。為此,本文對傳統的OMP算法進行改進,提出一種幀間自適應的OMP算法。
所謂的幀間自適應就是在應用CS理論重構語音信號時,根據每幀語音信號稀疏度的不同,自動估算出語音信號重構時所需要的稀疏個數從而達到自適應重構語音信號的目的。
幀間自適應OMP算法是在傳統OMP算法的基礎上去掉預先設定好的稀疏度,并在每次重構信號時采用殘差逐步逼近的方法自動終止迭代,而程序的迭代次數即為所需要的稀疏度。
圖1為該算法的流程框圖,其中,為每次迭代時重構信號的殘差,如果殘差小于某個設定值則停止迭代,但為了防止迭代過程中殘差未能小于某個設定值而出現反復迭代的現象,又設定了一個迭代次數的最大值作為終止條件,這樣就完成了語音信號的幀間自適應重構。
2.2 幀間自適應OMP算法的去噪原理
由于語音信號經稀疏化后,其噪聲信號的稀疏度非常大,且明顯大于其有用信號的稀疏度,為了能使改進后的OMP算法在重構時就達到對語音信號進行去噪的目的,需要分別進行兩方面的操作:一是在信號進行稀疏化時,通過設置信號的壓縮比,就可先濾除部分噪聲;二是在重構語音信號時,需要估算出信號的稀疏個數,若當某一幀的稀疏個數遠小于其他幀的稀疏個數時,則可認為該段語音幀為噪聲幀,可通過限制其稀疏度閾值的方式將噪聲濾除。
通過上述原理就可以濾除語音信號中的部分噪聲,經實驗發現,在低噪聲背景下,采用OMP算法去噪可以得到更高的PESQ值,這說明其主觀質量評價要好于經典的譜減法,從實際聽覺效果來說它能有效濾除背景噪聲,但是對于背景噪聲較強的語音噪聲,OMP算法去噪重構后的效果并不好。
3 譜減法去噪模型
4 AICSSS去噪方法
由于譜減法計算簡單,去噪后的信噪比較高,但主觀語音質量評價較低,而CS重建后的語音雖然在強噪聲環境下信噪比較低,但其主觀質量評價要高于譜減法去噪。基于二者的優缺點,本文提出AICSSS去噪方法。該方法能夠有效改善上述兩種方法的缺點,提高語音信號的抗噪性能。
原始語音信號經過譜減法去噪后仍然含有大量背景噪聲,而這些噪聲經變換域變換后得到的稀疏個數要遠小于有效信號的稀疏個數,根據這個原理,就可以依據CS理論,調整稀疏度的閾值對語音信號進行去噪。該閾值的選取為實驗得出,閾值選取的越大,去噪效果也就越明顯,但閾值太大就會影響到所需語音的重構效果,因此在選取閾值方面要根據噪聲的強度而定,噪聲強度大那么設定的閾值就大,噪聲強度小,設定的閾值就小。該方法的具體步驟為:
步驟1:將讀入的語音信號進行分幀加窗,采用DCT矩陣對信號進行稀疏化,調節其壓縮比,并求出帶噪語音的功率譜和噪聲功率譜
步驟2:用得到降噪后語音的功率譜開方后即為譜減法初步降噪的語音幅度譜
步驟3:采用高斯隨機矩陣對初步降噪的語音幅度譜進行觀測,得到觀測值同時初始化殘差索引集為空集,迭代次數設置迭代終止條件
步驟4:找出殘差和感知矩陣乘積中最大值所對應的位置;根據噪聲強度,設置稀疏度的閾值,并且更新索引集
步驟5:通過最小二乘法得到的系數逼近并求出每幀信號的稀疏度,把稀疏度大于的信號幀置零,同時更新殘差和迭代次數
步驟6:判斷是否滿足若滿足則停止迭代,不滿足則跳至步驟(4)。
5 實驗的仿真結果及分析
本文采用信噪比SNR和PESQ值的方法評估去噪后的語音質量,其中壓縮比和信噪比SNR的公式為:
實驗的測試軟件為Matlab,對象為10個男生和10個女生的語音。由于實際的噪聲經白化及同態濾波處理后,都可以轉化為高斯白噪聲,所以本文采用Noisex92數據庫中的高斯白噪聲作為噪聲語音。
實驗1:取512個樣點為語音信號的幀長,當含噪語音的信噪比為0 dB,5 dB,10 dB,15 dB,20 dB時,分別考察譜減法、幀間自適應OMP算法以及AICSSS去噪方法的去噪效果,得到的實驗結果如表1所示,在本實驗中,除譜減法外,剩下兩種算法的壓縮比統一設定為0.3。
由表1可知,雖然譜減法的信噪比都優于幀間自適應OMP算法的信噪比,然而對于語音質量而言,當原始語音的信噪比大于15 dB時,即使譜減法的信噪比好于幀間自適應OMP算法的信噪比,幀間自適應OMP算法的主觀語音質量PESQ值都要好于譜減法?;谶@個原因,本文提出AICSSS方法就可以有效改善它們的缺陷,從表1最后一列可以看出AICSSS方法不論是從信噪比方面還是從PESQ值上效果都有所提高,在20 dB時,AICSSS方法在信噪比方面提高不大,這是因為原始語音信號進行去噪以后語音的噪聲強度低,所以對含噪語音信號去噪后的信噪比改善不明顯。
圖2為上述三種方法在信噪比為5 dB時的效果圖,其中語音信號的壓縮比仍然為0.3,從圖中可以看出,AICSSS去噪后的效果明顯好于其他兩種方法,在實際的主觀聽音測試時,語音信號的背景噪聲大大減小,并且無不連續的聲音狀態存在。
實驗2:在與實驗1相同的條件下,設置原始語音噪聲的信噪比為10 dB,改變壓縮比分析AICSSS算法的實驗結果。當原始語音的信噪比固定為10 dB時,由于單獨使用譜減法時不會考慮壓縮比的變化,所以,這時單獨使用譜減法的信噪比恒為16.688,PESQ值恒為1.633。
從表2可以看出,在原始語音的信噪比為10 dB的情況下,本文算法在壓縮比為0.4時的效果最好,PESQ值最高,在壓縮比沿著0.4增大或減小時,語音質量都會逐步下降,這是因為當增大時,含噪語音的一部分噪聲信號也被重構出來??梢娫趬嚎s比不同時,AICSSS方法的去噪效果也會有所變化。
6 結 論
本文進一步證明了壓縮感知理論在語音信號去噪領域中的可行性,基于經典的譜減法和壓縮感知的去噪重構方法的不同優缺點,本文提出一種幀間自適應的壓縮感知譜減去噪方法,該方法不僅克服了譜減法具有背景噪聲和音樂噪聲的缺點,同時也相對的改善了壓縮感知理論在較大背景噪聲下重構效果不理想的情況。另外,本文還比較了在不同壓縮比的情況下本文算法的實驗效果,實驗結果表明,在相同的背景噪聲下,信號重構時壓縮比不同會對語音信號的去噪效果有直接影響。關于壓縮感知理論在含噪語音中的應用還有待進一步的研究。
參考文獻
[1] DONOHO D. Compressive sampling [J]. IEEE transactions on information theory, 2006, 52(4): 1289?1306.
[2] LOW S Y, PHAM D S, VENKATESH S. Compressive speech enhancement [J]. Speech communication, 2013, 55(6): 757?768.
[3] DONOHO D L, ELAD M, TEMLYAKOV V N. Stable recovery of sparse overcomplete representations in the presence of noise [J]. IEEE transactions on information theory, 2006, 52(1): 6?18.
[4] SHARMA P, ABROL V, SAO A K. Compressed sensing for unit selection based speech synthesis [C]// Proceedings of 2015 23rd European Signal Processing Conference. [S.l.]: IEEE, 2015: 1731?1735.
[5] TSAIG Y, DONOHO D L. Extension of compressed sensing [J]. Signal processing, 2006, 86(3): 549?571.
[6] 孫林慧,楊震.基于自適應基追蹤去噪的含噪語音壓縮感知[J].南京郵電大學學報(自然科學版),2011,31(5):1?6.
[7] 程經士.壓縮感知理論在語音信號去噪中的應用[J].現代電子技術,2012,35(7):84?85.
[8] DO T T, LU G, NAM N, et al. Sparsity adaptive mating pursuit algorithm for practical compressed sensing [C]// Proceedings of 2008 42nd Asilomar Conference on Signals, Systems and Computers. Pacific Grove: IEEE, 2008: 581?587.
[9] 李鳳蓮,暢江,張雪英,等.基于壓縮感知的語音盲稀疏重構算法及其去噪應用[J].中南大學學報(自然科學版),2015(1):164?170.
[10] PARDEDE H, IWANO K, SHINODA K. Spectral subtraction based on non?extensive statistics for speech recognition [J]. IEICE transactions on information & systems, 2013, 96(8): 1774?1782.
[11] JI Y, YANG Z. Study on adaptive compressed sensing & reconstruction of quantized speech signals [J]. Journal on advances in signal processing, 2012(1): 1?21.
[12] TROPP J, GILBERT A C. Signal recovery from random measurements via orthogonal matching pursuit [J]. IEEE transactions on information theory, 2008, 53(12): 4655?4666.
[13] 劉記紅,黎湘,徐少坤,等.基于改進正交匹配追蹤算法的壓縮感知雷達成像方法[J].電子與信息學報,2012,34(6):1344?1350.
[14] YKHLEF F. An efficient solution to improve the spectral noise suppression rules [J]. Digital signal processing, 2013, 23(5): 1578?1584.
[15] 高留洋,朱文,桑振夏,等.一種基于改進的譜減法的語音增強算法[J].現代電子技術,2012,35(7):60?62.