999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

語音增強算法的研究與改進

2020-12-07 06:12:45鄭展恒曾慶寧
現代電子技術 2020年21期

鄭展恒 曾慶寧

摘? 要: 為了研究和提高語音增強的效果,針對語音信號的非平穩性,根據卡爾曼濾波能處理非平穩信號,其是以最小均方誤差為估計的最優準則,提出一種改進的卡爾曼濾波語音增強算法。該方法首先在改進譜減法和人耳掩蔽效應增強的基礎上,利用語音信號的生成模型,通過線性預測系數組成狀態轉移矩陣,采用基于聽覺掩蔽效應改進的譜減法估計語音和噪聲的AR參數,該分析改進后的參數更加準確并提供給卡爾曼增強算法,最終實現卡爾曼濾波的語音增強。仿真實驗表明,在不同信噪比下該算法均有效地實現了語音增強,去噪效果較好,提高了語音質量。

關鍵詞: 語音增強; AR參數估計; 聽覺掩蔽; 基本譜減法; 狀態轉移矩陣; 仿真結果分析

中圖分類號: TN912.35?34? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)21?0027?04

Research and improvement of speech enhancement algorithms

ZHENG Zhanheng1, 2, ZENG Qingning2

(1. MOE Key Laboratory of Cognitive Radio and Information Processing, Guilin 541004, China;

2. School of Information and Communication, Guilin University of Electronic Technology, Guilin 541004, China)

Abstract: In view of the non?stationary of speech signals, an improved speech enhancement algorithm based on Kalman filtering, which can process non?stationary signals according to the optimal criterion of minimum mean square error estimation, is proposed to study and improve the effects of speech enhancement. In this method, a speech signal generation model is used to build the state transition matrix by linear prediction coefficients on the basis of improving spectral subtraction and enhancing human ear masking effect, and then the AR parameters of speech and noise are estimated by the improved spectral subtraction based on the auditory masking effect. It is found in the analysis that the improved parameters are more accurate and can be provided for the Kalman enhancement algorithm to achieve the speech enhancement based on the Kalman filtering. The simulation results show that the proposed algorithm has a good denoising effect, and can effectively enhance the speech and improve the speech quality at different SNR.

Keywords: speech enhancement; AR parameter estimation; auditory masking; basic spectral subtraction; state?transition matrix; simulation result analysis

0? 引? 言

近年來,現代科技的不斷發展以及AI的不斷突破和進步,語音處理的相關技術與應用更加廣泛地深入到人們的日常生活與科技生產中,語音信號處理以及語音增強算法在這些方面的應用越來越廣泛,人們更加重視語音增強算法的研究和實際應用。

對語音信號進行增強就是要改善語音信號質量,盡可能減少噪聲影響,提高語音可懂度,及對語音信號后續做進一步處理。當前具有代表性的語音增強方法有:譜減法[1?3]、維納濾波[4]、麥克風陣列[5?6]、人耳掩蔽效應[1]、卡爾曼濾波法等增強算法[5?11]。卡爾曼濾波起初由匈牙利人Rudolf Emil Kalman提出用于控制方面,因其具有處理非平穩信號的能力,符合語音的特性,后來許多學者陸續對其開展算法研究。

實際的處理中,若對模型參數在含噪語音中估計,會帶來較大誤差,本文先對基本譜減法進行研究,采用基于人耳掩蔽效應的譜減法先對其做預處理,以獲得接近純凈的語音,為卡爾曼濾波提供所需的AR參數。采用人耳掩蔽效應與譜減法相結合能有效對語音去噪且不失真,將其作為預處理方法最終能夠取得較好的增強效果。

1? 語音增強算法分析與實現

1.1? 基本譜減法及改進算法

S.Boll假設噪聲信號是平穩的或變化緩慢的加性噪聲,且在語音信號和噪聲信號不相關的前提下提出譜減法,假定噪聲是平穩的,人耳對相位信息不敏感,將含噪語音的相位作為處理后語音的相位,根據處理后的幅度和相位進行IFFT變換,得到增強后的時域信號。

設含噪語音為[y(n)],純凈語音為[s(n)],平穩加性高斯白噪聲為[d(n)],有:

[y(n)=s(n)+d(n),? ?0≤n≤N-1] (1)

由傅里葉變換和純凈語音與含噪語音不相關,有:

[EY(k)2=ES(k)2+ED(k)2] (2)

選取適當幀長語音信號為短時平穩過程后:

[Y(k)2=S(k)2+λn(k)] (3)

式中[λn(k)]為[D(k)2]的統計平均,這樣就得到基本譜減法求出原始語音信號的估計值[S(k)]。

實際上,噪聲的幀功率譜在譜減聽覺上形成殘留噪聲;語音信號頻譜中殘存的寬帶噪聲從聽覺方面發揮著掩蔽純音噪聲的功能。基于這些因素的考慮,對基本譜減法進行改進,有:

[S(k)2=maxY(k)2-α*λn(k),β*λn(k),? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?α>1,β?1] (4)

1.2? 基于人耳掩蔽效應的語音增強

人耳聽覺只能感受到一定聲壓和頻率范圍的聲音,并不能感受所有頻率和所有聲強的聲音,研究人耳特性對語音增強有著十分重要的作用,這個特性就是聽覺掩蔽效應,是心理聲學現象,它由人耳對聲音的頻率分辨機制決定的。據聲學手冊的定義:掩蔽是一個聲音的聽閾因另一個聲音的存在而上升的現象,掩蔽大小就是聽閾上升的分貝數。

現在針對實際情況,研究建立在噪聲環境下的語音壓縮聽覺模型,即采用一個建立在Bark關鍵頻率段基礎上常用的音頻信號聽覺掩蔽模型——Johnston模型,按照臨界帶寬劃分信號頻域。在Bark頻域中各個臨界帶間的間隔,要考慮到掩蔽音的純音特性即掩蔽音信號是偏純音的還是偏噪聲的,進一步得到掩蔽閾值偏移量,并最終求出擴展前掩蔽閾值,將計算出的掩蔽閾值與人耳聽力絕對閾值比較得到最終的掩蔽閾值。

實際中在所有頻段和語音幀內采取固定的譜減系數語音增強的效果并不理想,現在在人耳掩蔽效應模型的基礎上進行譜減,對不同頻段和不同的語音幀動態調整譜減系數。基于譜減的聽覺掩蔽增強算法原理圖如圖1所示。

這種方法是利用人耳掩蔽效應直接對傳統的增強方法進行改進:

1) 對輸入的含噪語音進行分幀和加窗、FFT,對其做譜分析;

2) 端點檢測后通過基本譜減增強法對含噪信號初步估計;

3) 對建立的聽覺掩蔽模型求出具體的掩蔽閾值;

4) 進一步得到信號每一幀的動態譜減參數;

5) 通過對動態譜減參數自適應的調節,實現對含噪信號參數的調節;

6) 引入相位信息后,對頻域增強處理后的信號作IFFT變換等,求出增強后的時域語音信號。

1.3? 基于卡爾曼濾波的語音增強

現實中的噪聲大都是非平穩的,因而研究非平穩噪聲狀態下的語音增強具有重要意義。

卡爾曼濾波在語音去噪已有許多研究應用,其結合語音生成模型,用信號的線性預測系數作為狀態轉移矩陣,增強后語音中殘留的音樂噪聲減少,語音自然度提高,其模型參數估計的準確與否直接影響增強語音的質量。卡爾曼濾波算法在語音信號去噪方面的應用研究較多,主要歸功于其處理數據和計算算法實現等較為方便。

卡爾曼濾波器的主要過程有兩個,分別是預估和校正。預估就是根據時間更新方程建立對當前狀態的先驗估計,方便構造下一狀態的先驗估計值;校正即是反饋過程,根據更新方程預估的先驗估計值和當前測量值對現狀態分析,改進后驗估計值。

對含噪語音信號的計算式為:

[y(k)=s(k)+n(k)] (5)

式中:[s(k)]為純凈語音;[n(k)]為與[s(k)]不相關的背景噪聲。純凈語音[s(k)]在短時間段內認為是平穩的,其[p]階AR預測方程為:

[s(k)=i=1pai(k)s(k-i)+u(k)] (6)

進一步得到系統的狀態空間方程為:

[S(k)=FS(k-1)+Gu(k)y(k)=HS(k)+n(k)] (7)

式中:[S(k)]是[k]時刻的系統狀態,即語音實際值;[F]是LPC系數構成的狀態轉移矩陣;[y(k)]是[k]時刻的測量值;[n(k)]和[u(k)]分別為測量噪聲和過程噪聲,均值始終為零,且其方差分別為[δ2n]和[δ2u]的不相關白噪聲;[H]和[G]分別為觀測向量和輸入向量。

[H=GT=0,0,…,0,11×p] (8)

[S(k)=s(k-p+1),s(k-p+2),…,s(k)T]? (9)

[F=010…0001…0?????000…1apap-1ap-2…a1p×p] (10)

分幀后的語音信號在假設初始條件值后,通過卡爾曼濾波遞推求出相應的結果:

[S(00)=0,P(00)=0S(kk-1)=FS(k-1k-1)P(kk-1)=FP(k-1k-1)FT+δ2uGGTK(k)=P(kk-1)HTHP(kk-1)HT+δ2n-1S(kk)=S(kk-1)+K(k)y(k)-HS(kk-1)P(kk)=I-K(k)HP(kk-1)]

迭代計算后最終得出增強后的語音信號在[k]時刻的最佳估值:

[S(k)=HS(kk)] (11)

2? 實驗仿真結果與分析

根據前文分析研究的增強算法,分別進行實驗仿真,算法測試所用語音信號是在實驗室安靜環境下錄制的,將錄制的語音信號作為原始純凈語音,其采樣率為8 kHz,幀長為1 024,幀移是512,選取的窗函數為海明窗,求解掩蔽閾值的臨界頻帶數為24,采用高斯白噪聲作為背景噪聲。

首先是基本譜減法的語音增強,其仿真測試結果如圖2所示(0 dB時)。

通過圖2的仿真結果發現,基本譜減法增強效果不是很明顯,增強后的語音仍保留了大量噪聲。試聽發現有流水噪聲伴隨語音,有時或掩蓋原來的語音,聽覺效果較差。

下面對改進譜減法和基于人耳掩蔽效應的譜減法進行仿真,測試結果如圖3所示。

從圖3所示的實驗結果得出:被0 dB白噪聲污染的信號,基于掩蔽效應算法的增強結果圖相比傳統譜減法增強結果圖更接近原始的語音信號波形圖。試聽表明:新算法語音增強后的噪聲減少較為明顯,音樂噪聲相比基本譜減法不怎么突出,語音信號質量改善很大,基于人耳掩蔽的語音增強算法在去除音樂噪聲方面效果更好,但是噪聲濾除仍不太理想。觀察去噪后的信噪比可以發現:基于人耳掩蔽效應的譜減法相比基本譜減法信噪比非但沒增加反而有些減少。流水噪聲雖沒那么明顯,但聽音測試發現局部的噪聲有些許增強,特別是在低信噪比時測定效果較差。

因此基于以上情況,現在將譜減法作為預處理,為使得去噪后語音效果更好,這里對預處理得到的語音進行卡爾曼濾波增強,仿真結果如圖4所示。

從圖4的仿真結果看出,利用改進卡爾曼濾波算法去噪后,語音質量比上述幾種增強算法都有所提高。其語音波形比改進譜減法和基于人耳掩蔽效應的譜減法得到的波形更加飽滿,寂靜段噪聲的幅度也有明顯減小。試聽發現基本不存在流水噪聲,這主要歸功于人耳掩蔽,它使流水噪聲沒那么明顯,其次,歸功于卡爾曼濾波以最小均方誤差為估計的最優準則,去噪實驗效果好。

綜上,實驗分別對采用不同的高斯白噪聲,運用前文的幾種語音增強算法分別求出相應的輸出信噪比,具體結果如表1所示。

從表1列出的測試結果可以看出,在不同信噪比的情況下,改進后的卡爾曼濾波語音增強算法較其他幾種算法效果好。

3? 結? 語

本文主要研究了語音信號增強的幾種算法,及噪聲的產生機理,對語音信號進行預處理得到初步去噪后的語音,為卡爾曼濾波算法提供較準確的AR參數,利用Matlab R2014a編程對增強算法進行實驗測試,所用語音信號為實驗室安靜環境下錄制。實驗結果和數據表明,用基于人耳掩蔽效應的譜減法對含噪語音作預處理,然后通過卡爾曼濾波可以取得更好的效果,流水噪聲得到較好的抑制,增強后語音聽起來較為舒適。

注:本文通訊作者為曾慶寧。

參考文獻

[1] PALIWAL K, W?JCICKI K, SCHWERIN B. Single?channel speech enhancement using spectral subtraction in the short?time modulation domain [J]. Speech communication, 2010, 52(5): 450?475.

[2] ZHANG Yi, ZHAO Yunxin. Real and imaginary modulation spectral subtraction for speech enhancement [J]. Speech communication, 2013, 55(4): 509?522.

[3] 蔡文堅,王輔忠,張慧春,等.基于隨機共振的微弱語音譜減降噪方法[J].計算機工程與設計,2018,39(2):499?502.

[4] 王群,曾慶寧,鄭展恒,等.低信噪比環境下的麥克風陣列語音識別算法研究[J].科學技術與工程,2017,17(31):101?107.

[5] 毛維,曾慶寧,龍超.基于雙微陣列的語音增強算法[J].計算機工程與設計,2018,39(8):2490?2494.

[6] 馬金龍,曾慶寧,龍超,等.多噪聲環境下可懂度提升的助聽器語音增強[J].計算機工程與設計,2016,37(8):2160?2164.

[7] 章旭景,李輝,陸偉.基于子帶卡爾曼濾波的語音增強方法[J].信號處理,2009,25(9):1474?1478.

[8] 黃小平,王巖.卡爾曼濾波原理及應用[M].北京:電子工業出版社,2015:30?76.

[9] 馬麗麗,張曼,陳金廣,等.有色噪聲條件下的高斯和卡爾曼濾波算法[J].計算機工程與設計,2015,36(10):2856?2859.

[10] 亓賀,張雪英,武奕峰.頻域內的卡爾曼濾波語音增強算法[J].電聲技術,2011,35(10):55?58.

[11] 張勇,劉軼.非平穩噪聲環境下結合聽覺掩蔽的語音增強[J].計算機工程與設計,2015,36(5):1279?1284.

[12] CHEN Jingdong, BENESTY J, HUANG Yiteng, et al. New insights into the noise reduction Wiener filter [J]. IEEE tran?sactions on audio, speech, and language processing, 2006, 14(4): 1218?1234.

作者簡介:鄭展恒(1978—),男,碩士,高級實驗師,研究方向為信號處理。

曾慶寧(1963—),男,博士,教授,碩導,主要研究方向為信號處理及語音、圖像等。

主站蜘蛛池模板: 久久香蕉国产线看观看式| 午夜激情福利视频| 日日摸夜夜爽无码| 亚洲第一成年网| 国产欧美自拍视频| 亚洲乱码在线播放| 国产美女一级毛片| 亚洲 欧美 日韩综合一区| 四虎成人精品| 国产一区二区三区在线精品专区| 亚洲色图欧美视频| 亚洲动漫h| 毛片视频网| 久久青草精品一区二区三区| 欧美一级视频免费| 日韩欧美中文在线| 激情综合网址| 欧美特级AAAAAA视频免费观看| 久久青草精品一区二区三区| 久久国产av麻豆| 日韩精品无码一级毛片免费| 国产激情影院| 亚洲精品自产拍在线观看APP| 亚洲精品无码久久久久苍井空| 国产高清国内精品福利| 日韩天堂视频| 中文一级毛片| 国产永久在线观看| 精品国产aⅴ一区二区三区| 热这里只有精品国产热门精品| 国产成年无码AⅤ片在线| 国产欧美日韩综合一区在线播放| 国产另类视频| 国产一区二区在线视频观看| 国产麻豆91网在线看| 国产丝袜91| 91精品最新国内在线播放| 狼友av永久网站免费观看| 国产精品无码一区二区桃花视频| 精品福利视频网| 亚洲,国产,日韩,综合一区| 久久国产亚洲欧美日韩精品| 美女啪啪无遮挡| 亚洲第一中文字幕| 精品视频一区二区三区在线播| 91系列在线观看| 国产成人啪视频一区二区三区| 福利一区在线| 日韩a在线观看免费观看| 四虎在线观看视频高清无码| 亚洲自拍另类| 制服丝袜一区| 浮力影院国产第一页| 国产精品无码制服丝袜| 午夜国产精品视频| 91www在线观看| 国产极品美女在线观看| 日韩中文字幕亚洲无线码| 亚洲无码A视频在线| 国产精品yjizz视频网一二区| 国产精品爆乳99久久| 亚洲h视频在线| 美女裸体18禁网站| 精品无码人妻一区二区| 久久婷婷综合色一区二区| 国产精品美女免费视频大全| 亚洲码一区二区三区| 97免费在线观看视频| 国产精品香蕉| 亚洲国产无码有码| 亚洲三级网站| 波多野结衣久久精品| 97视频精品全国在线观看| 天天躁夜夜躁狠狠躁图片| 白浆免费视频国产精品视频| 欧美不卡在线视频| 九九热这里只有国产精品| 国产精品午夜福利麻豆| 日韩高清一区 | 精品久久久久无码| 国产精品黄色片| 无码免费试看|