999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

新型拉普拉斯模型因子估計(jì)語音增強(qiáng)算法

2010-04-12 00:00:00v
現(xiàn)代電子技術(shù) 2010年21期

摘 要:針對(duì)拉普拉斯先驗(yàn)?zāi)P拖碌恼Z音增強(qiáng)問題,給出了一種模型因子估計(jì)算法,它利用語音分量方差與模型因子的對(duì)應(yīng)關(guān)系來獲取模型因子的估計(jì);在語音分量方差的估計(jì)過程中,通過利用帶噪語音分量與先前幀語音方差計(jì)算當(dāng)前幀語音分量方差,提出一種新的語音分量方差估計(jì)算法。通過結(jié)合這兩種新算法獲得的拉普拉斯模型因子估計(jì)能夠有效消除噪聲分量能量對(duì)估計(jì)精度的影響,且提高系統(tǒng)的語音增強(qiáng)性能。多種噪聲背景下的仿真結(jié)果表明,基于該模型因子估計(jì)方案的方法的語音增強(qiáng)算法具有更好的增強(qiáng)效果。關(guān)鍵詞:語音增強(qiáng); 語音分量估計(jì); 離散余弦變換; 拉普拉斯模型; 因子估計(jì)

中圖分類號(hào):TN912.3文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1004-373X(2010)21-0100-04

Novel Algorithm of Laplacian Model Factor Estimation for Speech Enhancement

HUANG Wei1, OU Shi-feng2

(1. Institute of Humanities and Economics, Yantai University, Yantai 264005, China;

2. Institute of Optoelectronic Information, Yantai University, Yantai 264005, China)

Abstract: An algorithm of Laplacian factor estimation is proposed for solving the problem of speech enhancement using Laplacian apriori model. The estimation of Laplacian model factor is attained by the relation between the variance of clean speech components and the model factor. As for the estimation for speech component variance, a new adaptive algorithm that makes use of the noisy speech components and clean speech variance in previous frame is put forward to compute the current frame′s speech variance. In combination with the mentioned two approaches, the estimated Laplacian factor can effectively eliminate the effect of noise components energy on the estimation accuracy. The simulation results demonstrate that the proposed algorithm possesses a good effect on speech enhancement.Keywords: speech enhancement; speech component estimation; discrete cosine transform; Laplacian model; factor estimation

0 引 言

有效的語音增強(qiáng)算法能夠大大提高語音通訊的抗噪聲干擾能力,改善語音質(zhì)量,提高語音可懂度。單通道語音增強(qiáng)算法以其簡(jiǎn)單、有效和利于硬件實(shí)現(xiàn)等優(yōu)點(diǎn),而長(zhǎng)期以來都是國內(nèi)外學(xué)者的研究熱點(diǎn),代表性的算法有減譜法、最小均方誤差算法、維納濾波算法等[1-4]。這些單通道算法大都在變換域中結(jié)合語音和噪聲的不同特征來研究具有針對(duì)性的噪聲消除算法,通常所用的變換有DFT,DCT變換等。相對(duì)于DFT變換,由于DCT變換具有信號(hào)譜分量豐富,能量集中,且無需對(duì)語音相位進(jìn)行估計(jì)等優(yōu)點(diǎn),近年來在語音增強(qiáng)領(lǐng)域中得到了廣泛的研究與應(yīng)用[5-6]。

語音增強(qiáng)算法往往在變換域中假定純凈語音和噪聲譜分量皆服從零均值的高斯分布模型[2,5],這一假設(shè)的理論依據(jù)源自中心極限定理最近的研究結(jié)果,它表明DCT域中純凈語音信號(hào)譜分量的拉普拉斯分布也是一種很好的擬合模型[7]。基于這一結(jié)果,Gazor等人在DCT域中運(yùn)用MMSE估計(jì)得到了一種非線性濾波算法[8],其實(shí)驗(yàn)仿真顯示,該算法在保持低運(yùn)算復(fù)雜度的情況下取得了相對(duì)較為理想的語音增強(qiáng)效果。但由于在語音分量拉普拉斯模型因子的估計(jì)過程中,由于無法直接獲得純凈語音分量的真實(shí)值,該算法采用帶噪語音分量來代替純凈語音分量對(duì)模型因子進(jìn)行估計(jì),這種替代方法雖然簡(jiǎn)化了估計(jì)過程,但其估計(jì)結(jié)果不可避免地受到噪聲的影響,從而影響算法的語音增強(qiáng)性能。

針對(duì)語音增強(qiáng)算法中的模型因子估計(jì)問題,本文首先給出了一種間接拉普拉斯模型因子估計(jì)算法,它能有效消除噪聲的影響,但該算法卻又會(huì)引入加權(quán)系數(shù)對(duì)于估計(jì)精度的干擾。為提高算法的性能,本文在對(duì)語音分量方差的估計(jì)過程中提出一種新型的估計(jì)算法,通過與間接拉普拉斯模型因子估計(jì)算法相結(jié)合,可同時(shí)避免噪聲與加權(quán)系數(shù)對(duì)算法性能的影響。仿真結(jié)果表明,本文算法在多種噪聲背景下都具有較好的語音增強(qiáng)性能。

1 拉普拉斯模型語音增強(qiáng)算法

用y(m),x(m)和n(m)分別表示m時(shí)刻K維帶噪語音、純凈語音和加性噪聲向量,假設(shè)純凈語音信號(hào)與噪聲互不相關(guān),有:

y(m)=x(m)+n(n),E{x(i)nT(j)}=0,i,j(1)

對(duì)式(1)進(jìn)行DCT變換,得:

vk(m)=sk(m)+uk(m)

式中:vk(m),sk(m)與uk(m)分別表示向量y(m),x(m)和n(m)在m時(shí)刻的第k個(gè)DCT分量,此時(shí)語音增強(qiáng)的任務(wù)即是設(shè)計(jì)算法從帶噪語音分量vk(m)中獲取純凈語音分量sk(m)的估計(jì)。定義語音分量sk(m)與估計(jì)值k(m)的誤差為ε=sk(m)-k(m),則在最小均方誤差意義下ε的貝葉斯風(fēng)險(xiǎn)函數(shù)為R=E(ε2),將其最小化可得語音分量的MMSE估計(jì)為[5]:

k(m)=E{sk(m)|vk(m)}(2)

為方便起見,下面的公式中省略了時(shí)間和頻率標(biāo)量m,k。設(shè)DCT域純凈語音分量s和噪聲分量u可分別用拉普拉斯模型與高斯模型描述,則它們的概率密度函數(shù)分別為p{s},p{u}[7]:

p{s}=12aexp-sa(3)

p{u}=12πλuexp-u22λu(4)

式中:λu=E{u2}表示噪聲分量u的方差;a=E{s}為純凈語音分量s的拉普拉斯模型因子。由于s,u之間相互獨(dú)立,根據(jù)貝葉斯估計(jì)理論,結(jié)合式(2)~式(4)可推導(dǎo)出拉普拉斯-高斯混合模型下純凈語音分量s的MMSE估計(jì)為[8]:

=aeψ/2(ψ+ξ)eξerfcψ+ξ2ψ-ψ-ξe-ξerfcψ-ξ2ψeξerfc ψ+ξ2ψ+e-ξerfc ψ-ξ2ψ(5)

式中:erfc(t)=2π∫∞texp(-x2)dx表示補(bǔ)充誤差函數(shù);ξ=va;ψ=λua2。

2 新型拉普拉斯模型因子估計(jì)

對(duì)式(5)的估計(jì)需要噪聲方差σu與模型因子a的先驗(yàn)估計(jì),對(duì)于σu一般可在帶噪語音的起始階段或語音信號(hào)的非活動(dòng)期間對(duì)其進(jìn)行估計(jì)或更新,實(shí)現(xiàn)較為簡(jiǎn)單,多視其為已知條件。對(duì)于在m時(shí)刻對(duì)模型因子a(m)的估計(jì),文獻(xiàn)[8]提出通過利用帶噪語音分量v(m)代替s(m)對(duì)a(m)進(jìn)行估計(jì):

(m)=β (m-1)-(1-β)v(m)(6)

式中:β為加權(quán)系數(shù);(m-1)為前一幀對(duì)于模型因子的估計(jì)。利用v代替s對(duì)模型因子進(jìn)行估計(jì)雖然方便簡(jiǎn)單,但對(duì)于a的估計(jì)過程中不可避免地要受到噪聲的影響,從而導(dǎo)致估計(jì)結(jié)果準(zhǔn)確度的降低。考慮到系統(tǒng)無法獲得s的真實(shí)值,通過一般方法直接對(duì)模型因子進(jìn)行估計(jì)較為困難。根據(jù)廣義高斯分布模型及其形態(tài)參數(shù)的概念與性質(zhì), 文獻(xiàn)[9]推導(dǎo)了拉普拉斯模型因子a與語音方差λs之間的對(duì)應(yīng)關(guān)系,其采用間接的方式來實(shí)現(xiàn)算法對(duì)a的估計(jì),有效消除了背景噪聲的影響,該估計(jì)公式為[9]:

a=22λs(7)

式中:λs=E{s2},即純凈語音分量s的方差,文獻(xiàn)[9]中采用直接判決方法對(duì)其進(jìn)行估計(jì):

s(m)=η 2(m-1)+(1-η)max{v2(m)-λu,0}(8)

式中:(m-1)表示前一幀對(duì)于語音分量s(m-1)的估計(jì);η為加權(quán)系數(shù),其取值范圍為η∈[0,1]。該算法可以有效地消除系統(tǒng)輸出語音中殘留的音樂噪聲,但估計(jì)性能對(duì)于加權(quán)系數(shù)η的選值較為敏感,較小的η值將導(dǎo)致算法輸出語音中信號(hào)的失真程度減少,但會(huì)殘留較多的音樂噪聲;當(dāng)其數(shù)值較大,即接近1時(shí),算法在提高音樂噪聲消除能力的同時(shí),將會(huì)帶來較為嚴(yán)重的語音信號(hào)失真[10]。因此為平衡這兩種關(guān)系,提高算法估計(jì)性能,本文提出一種新的語音方差估計(jì)方法,其無需η值的設(shè)定,從而消除了η對(duì)于算法性能的影響:

假設(shè)前一幀(第m-1幀)估計(jì)的語音方差為λs(m-1),則λs(m)只依賴以下3個(gè)參數(shù):當(dāng)前幀帶噪語音分量v(m)、噪聲分量方差σu以及s(m-1)。根據(jù)方差的定義λs(m)=E{s(m)2}可得,在以上3個(gè)參數(shù)條件下當(dāng)前幀語音分量方差λs(m)的估計(jì)為:

s(m)={s(m)2v(m),λs(m-1),σu(m)}(9)

為方便起見,以下公式推導(dǎo)中省略了m,并將λs(m-1)表示為λs,p,故上式可寫為:

s={s2v,λs,p,σu}=∫∞-∞s2p(s,v)ds∫∞-∞p(s,v)ds(10)

由于在拉普拉斯模型下式(10)結(jié)果涉及到復(fù)雜的數(shù)字積分求和運(yùn)算,計(jì)算量過大,為此本文考慮采用語音分量分布的另一種模型——高斯分布模型為:

p{s}=12πλsexp-s22λs(11)

將其結(jié)合式(4)的噪聲分量分布,可得:

p{s,v}=12πλsλuexp-s22λs-(v-s)22λu(12)

由于相鄰幀中純凈語音分量的能量變化比較緩慢,且s(m)與s(m-1)均服從相同參數(shù)的高斯分布,實(shí)際計(jì)算中λs,p可近似等于λs。將式(12)代入式(10)并經(jīng)推導(dǎo)可得:

s=∫∞-∞s2exp-s22λs,p-(v-s)22λuds∫∞-∞exp-s22λs,p-(v-s)22λuds

=∫∞-∞2λs,pλuλs,p+λut+λs,pλs,p+λuv2exp{-t2}dt∫∞-∞exp{-t2}dt

=Γ (1.5)2λs,pλuπ(λs,p+λu)+λ2s,pv2(λs,p+λu)2(13)

式中:Γ(1.5)=π/2,將其代入上式,可得本文算法對(duì)于λs(m)的估計(jì)為:

s(m)=λs,p(m)λu(m)λs(m-1)+λu(m)+λ2s(m-1)v2(m)[(λs(m-1)+λu(m)]2(14)

最終可得本文算法對(duì)于a(m)的估計(jì)為:

(m)=22s(m)(15)

式中:λs(m)采用式(14)對(duì)其進(jìn)行更新。從以上兩式可以看出,本文算法無需加權(quán)系數(shù)的設(shè)定,從而有效避免了其值對(duì)于算法估計(jì)精度的影響。

3 仿真結(jié)果

為驗(yàn)證本文提出算法的有效性,將本文提出的新型拉普拉斯模型因子估計(jì)語音增強(qiáng)算法與文獻(xiàn)[9]中算法進(jìn)行性能對(duì)比,4種不同類型的噪聲信號(hào)為白噪聲、Volvo汽車駕駛室內(nèi)噪聲、F16飛機(jī)駕駛艙內(nèi)噪聲以及Babble噪聲,它們均取自標(biāo)準(zhǔn)噪聲庫NOISEX-92。純凈語音為4段(男女聲各2段),噪聲與語音信號(hào)的采樣頻率均為8 kHz,將不同噪聲信號(hào)疊加到純凈語音信號(hào)上,分別產(chǎn)生輸入信噪比為0 dB,5 dB和10 dB的帶噪語音信號(hào)。仿真中選取語音幀的長(zhǎng)度為K=128,幀間重疊64點(diǎn)。語音增強(qiáng)算法的性能采用分段信噪比和對(duì)數(shù)譜距離兩種客觀評(píng)價(jià)標(biāo)準(zhǔn)。表1,表2分別給出了經(jīng)兩種算法處理后語音信號(hào)的Seg SNR和LSD對(duì)比。從中不難看出,在各種噪聲背景和不同衡量標(biāo)準(zhǔn)下,相對(duì)于文獻(xiàn)[9]中算法,本文算法具有更好的噪聲消除性能。

表1 算法輸出語音分段信噪比(Seg SNR)對(duì)比

噪聲類型輸入SNR /dB文獻(xiàn)[9]算法 本文算法

白噪聲04.835.72

57.538.37

1010.7911.44

Volvo駕駛室內(nèi)噪聲06.567.87

58.839.66

1011.7212.20

F16駕駛艙內(nèi)噪聲

03.594.17

55.696.72

108.8110.12

Babble噪聲03.333.94

55.466.27

108.689.81

表2 算法輸出語音對(duì)數(shù)譜距離(LSD)對(duì)比

噪聲類型輸入SNR /dB文獻(xiàn)[9]算法本文算法

白噪聲

05.665.37

55.004.59

104.413.95

Volvo駕駛室內(nèi)噪聲

02.712.36

52.191.96

101.721.57

F16駕駛艙內(nèi)噪聲06.355.73

55.194.86

104.313.78

Babble噪聲

07.046.40

55.034.56

103.613.35

圖1給出白噪聲背景下幾種語音信號(hào)的語譜圖,帶噪語音信號(hào)的輸入SNR為5 dB。

圖1 白噪聲下語音信號(hào)語譜圖(SNR=5 dB)

圖1(a)~(d)依次表示為:純凈語音、帶噪語音、文獻(xiàn)[9]中算法增強(qiáng)后的語音和本文算法增強(qiáng)后的語音。從仿真結(jié)果中不難看出,兩種算法在保存大部分語音信號(hào)能量的同時(shí)都可以有效地消除背景噪聲,但相對(duì)而言,本文算法輸出的語音信號(hào)與純凈語音信號(hào)要更相近。

4 結(jié) 語

本文提出了一種新的拉普拉斯模型因子估計(jì)算法,其利用語音方差和模型因子的關(guān)系,采用一種新型的語音方差估計(jì)方法,間接地獲得模型因子的估計(jì)。仿真實(shí)驗(yàn)表明,基于該模型因子估計(jì)方案的語音增強(qiáng)算法能夠有效地避免原始算法的不足,在多種噪聲背景下都具有更好的語音增強(qiáng)效果。

參考文獻(xiàn)

[1]BOLL S F. Suppression of acoustic noise in speech usingspectral subtraction [J]. IEEE Trans. Acoust. Speech Signal Processing, 1979, 27(2): 113-120.

[2]EPHRAIM Y, MALAH D. Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator [J]. IEEE Trans. Acoust. Speech Signal Processing, 1984, 32(6): 1109-1121.

[3]SOON I Y, KOH S N. Speech enhancement using 2-D Fourier transform[J]. IEEE Trans. Speech Audio Processing, 2003, 11(6): 717-724.

[4]YOU C H, KOH S N, RAHARDJA S. Beta-order MMSE spectral amplitude estimation for speech enhancement [J]. IEEE Trans. Speech Audio Process., 2005, 13(4): 475-486.

[5]SOON I Y, KOH S N, YEO C K. Noisy speech enhancement using discrete cosine transform [J]. Speech Commun., 1998, 24(3): 249-257.

[6]CHANG J H. Warped discrete cosine transform-based noisy speech enhancement[J]. IEEE Trans. Circuits and Systems-Ⅱ: Express Briefs, 2005, 52(9): 535-539.

[7]GAZOR S, ZHANG W. Speech probability distribution [J]. IEEE Signal Processing Lett., 2003, 10(7): 204-207.

[8]GAZOR S. Employing laplacian-gaussian densities for speech enhancement [C]//Proc. ICASSP’04. Montreal, Canada: IEEE, 2004: 297-230.

[9]歐世峰,趙曉暉,顧海軍.基于間接拉普拉斯模型因子估計(jì)的語音增強(qiáng)算法[J].數(shù)據(jù)采集與處理,2006,21(4):386-391.

[10]PLAPOUS C, MARRO C, SCALART P. Improved signal to noise ratio estimation for speech enhancement [J]. IEEE Trans. Audio, Speech, Language Processing, 2006, 14(6): 2098-2108.

主站蜘蛛池模板: 不卡视频国产| 成人字幕网视频在线观看| 国产一区二区免费播放| 一区二区午夜| 波多野结衣无码中文字幕在线观看一区二区 | 97影院午夜在线观看视频| 午夜国产在线观看| 久久a级片| 丝袜亚洲综合| 亚洲三级视频在线观看| 久996视频精品免费观看| 国产后式a一视频| 69免费在线视频| 国产精品区网红主播在线观看| 18黑白丝水手服自慰喷水网站| 黄色一级视频欧美| 日本www在线视频| 国内自拍久第一页| 国产亚洲精品自在久久不卡| 91无码人妻精品一区二区蜜桃| 国产成人在线无码免费视频| 99久久这里只精品麻豆| 欧美区在线播放| 99re在线视频观看| 亚洲三级色| 2022精品国偷自产免费观看| 九色视频线上播放| 国产成人做受免费视频| 99视频国产精品| 91娇喘视频| 久久99蜜桃精品久久久久小说| 99无码中文字幕视频| 亚洲黄色视频在线观看一区| 亚洲国产午夜精华无码福利| 国产日本欧美在线观看| 亚洲国产日韩在线观看| 麻豆国产精品视频| 在线亚洲精品福利网址导航| 免费人成在线观看视频色| 欧美性猛交一区二区三区| 澳门av无码| 亚洲国产一区在线观看| 波多野结衣一级毛片| 天天摸天天操免费播放小视频| 亚洲最新在线| 亚洲美女一级毛片| 亚洲熟妇AV日韩熟妇在线| 中文字幕第4页| 成人亚洲视频| a毛片基地免费大全| 日韩一二三区视频精品| 亚洲国产成人精品青青草原| 成人伊人色一区二区三区| 在线观看的黄网| 大香网伊人久久综合网2020| jizz在线观看| 91探花国产综合在线精品| 免费看一级毛片波多结衣| 亚洲精品视频免费观看| 手机在线免费不卡一区二| 亚洲成a人在线观看| 亚洲精品制服丝袜二区| 国产美女91视频| 日本久久久久久免费网络| 99re热精品视频国产免费| 久草国产在线观看| 婷婷激情亚洲| 成人毛片在线播放| 日韩不卡高清视频| 久久这里只有精品国产99| 99视频在线免费看| 一级毛片无毒不卡直接观看| 欧美色图久久| 91视频精品| 国产激情无码一区二区免费| 亚洲男人的天堂视频| 成人精品免费视频| 国产精品自在自线免费观看| 992Tv视频国产精品| 国产精品视频导航| 伊人激情久久综合中文字幕| lhav亚洲精品|