999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于壓縮感知和MFCC的語(yǔ)音端點(diǎn)檢測(cè)算法

2019-09-20 00:54:46
測(cè)控技術(shù) 2019年5期
關(guān)鍵詞:信號(hào)檢測(cè)

吳 雷 周 萍

(1.桂林電子科技大學(xué) 認(rèn)知無(wú)線電與信息處理教育部重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004; 2.桂林電子科技大學(xué) 信息與通信學(xué)院,廣西 桂林 541004;3.桂林電子科技大學(xué) 電子工程與自動(dòng)化學(xué)院,廣西 桂林 541004)

在語(yǔ)音識(shí)別系統(tǒng)中,輸入信號(hào)通常由原始語(yǔ)音信號(hào)和各類噪聲信號(hào)混合而成。將各個(gè)語(yǔ)音信號(hào)時(shí)段與非語(yǔ)音信號(hào)時(shí)段區(qū)分開(kāi)并對(duì)語(yǔ)音信號(hào)開(kāi)始位置進(jìn)行精確定位被稱作端點(diǎn)檢測(cè)(Voice Activity Detection,VAD)。端點(diǎn)檢測(cè)是語(yǔ)音信號(hào)處理的一個(gè)基本問(wèn)題,語(yǔ)音端點(diǎn)檢測(cè)的目的是在一段含噪語(yǔ)音中提取出語(yǔ)音段的起點(diǎn)和終點(diǎn)[1]。

在對(duì)連續(xù)語(yǔ)音檢測(cè)和去噪時(shí),可以利用濁音的周期性將語(yǔ)音和噪聲分離,但是將清音和寬帶平穩(wěn)噪聲進(jìn)行區(qū)分時(shí)卻存在一定的困難,語(yǔ)音信號(hào)容易被噪聲淹沒(méi)。文獻(xiàn)[2]中采用基于短時(shí)幅度和短時(shí)過(guò)零特征的端點(diǎn)檢測(cè)方法在同一個(gè)門(mén)限下對(duì)一些清音信號(hào)進(jìn)行檢測(cè)時(shí),可能會(huì)出現(xiàn)虛檢、漏檢現(xiàn)象,從而導(dǎo)致系統(tǒng)發(fā)生錯(cuò)誤識(shí)別。基于奈奎斯特定理的其他端點(diǎn)檢測(cè)算法(譜熵法、自相關(guān)參數(shù)法、獨(dú)立分量分析法、高階統(tǒng)計(jì)量)在解決這一問(wèn)題時(shí)能取得一定的效果,但通常其數(shù)據(jù)處理量大,大多數(shù)情況下不利于語(yǔ)音信號(hào)的實(shí)時(shí)分析與處理[3]。

2006年,Donoho[4]等人提出了壓縮感知CS(Compressed Sensing)理論。該方法能以低于奈奎斯特速率對(duì)信號(hào)進(jìn)行快速采樣,這也使CS理論逐漸成為信號(hào)處理領(lǐng)域的研究熱點(diǎn)[5]。文獻(xiàn)[3]中提出了基于壓縮感知觀測(cè)序列的倒譜距離檢測(cè)方法,利用語(yǔ)音信號(hào)的稀疏性通過(guò)構(gòu)建稀疏基從而得到信號(hào)的稀疏表示。在觀測(cè)序列上采用倒譜距離算法進(jìn)行端點(diǎn)檢測(cè),這種方法大大減少了數(shù)據(jù)運(yùn)算量。但是,由于其未對(duì)原始語(yǔ)音信號(hào)恢復(fù)重構(gòu),此端點(diǎn)檢測(cè)方法不適用于語(yǔ)音識(shí)別系統(tǒng)。文獻(xiàn)[6]開(kāi)始將Mel 頻率倒譜系數(shù)(Mel Frequency Coefficient,MFCC)作為分類特征用于語(yǔ)音/非語(yǔ)音的檢測(cè)。Wang[7]等人采用MFCC倒譜相識(shí)度作為語(yǔ)音/非語(yǔ)音的分類特征。在此基礎(chǔ)上本文提出了基于壓縮感知和MFCC的語(yǔ)音端點(diǎn)檢測(cè)算法,利用噪聲不能在DCT域近似稀疏,在觀測(cè)壓縮過(guò)程中會(huì)部分丟失的原理,對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮感知與重構(gòu),恢復(fù)后的語(yǔ)音信號(hào)信噪比得以提高。在重構(gòu)信號(hào)基礎(chǔ)上,提取MFCC倒譜特征,采用倒譜距離進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)。實(shí)驗(yàn)結(jié)果證明,在連續(xù)語(yǔ)音檢測(cè)中該方法能取得很好的效果。另外,由于MFCC特征參數(shù)能用于后續(xù)的識(shí)別,節(jié)約了系統(tǒng)的運(yùn)行資源,有利于語(yǔ)音識(shí)別系統(tǒng)的集成化。

1 理論介紹

1.1 壓縮感知

壓縮感知(CS)理論通過(guò)極少數(shù)的稀疏表示便能重建該信號(hào)。由此看來(lái),CS不僅是一種信號(hào)采樣方式,也是一種信息提取方法。壓縮感知理論主要分為稀疏表示、壓縮觀測(cè)和恢復(fù)重構(gòu)三部分。其數(shù)學(xué)模型闡述如下。

(1) 稀疏表示。

(1)

式中,y=[y1,y2,…,yM]T,y=〈x,Ψi〉,y中非零元素個(gè)數(shù)記作‖y‖0。若‖y‖0=K,且K≤N,則稱信號(hào)x是K稀疏的。

(2) 壓縮觀測(cè)。

s=Φx

(2)

(3) 恢復(fù)重構(gòu)。

(3)

(4)

(5)

圖1 重構(gòu)算法流程圖

1.2 Mel倒譜特征

于迎霞和史家蒯等將倒譜特征應(yīng)用于帶噪端點(diǎn)檢測(cè)方法并取得了很好的效果。由于Mel倒譜特征參數(shù)其本身能保持一定的特性,因此在語(yǔ)音識(shí)別中得到廣泛的應(yīng)用[11]。通過(guò)大量實(shí)驗(yàn)驗(yàn)證,該種檢測(cè)算法更加適用于高倍噪聲環(huán)境[12]。Mel倒譜特征參數(shù)是基于聽(tīng)覺(jué)模型的特征參數(shù)提取方法,將耳蝸當(dāng)作是一個(gè)濾波器組,當(dāng)頻率小于1 kHz時(shí),耳蝸以線性形式進(jìn)行濾波;而當(dāng)頻率大于1 kHz時(shí),耳蝸以對(duì)數(shù)形式進(jìn)行濾波。根據(jù)人耳耳蝸的這一特性,研究人員設(shè)計(jì)了Mel頻率濾波器組,經(jīng)過(guò)倒譜運(yùn)算后就能得到Mel頻率倒譜系數(shù)。MFCC參數(shù)的計(jì)算以Mel頻率為基準(zhǔn),其與實(shí)際頻率的轉(zhuǎn)換關(guān)系可用式(6)表示:

(6)

而 MFCC的求取過(guò)程是首先把求得的頻率特性通過(guò)式(6)計(jì)算出Mel頻率特性,隨后將其變換到倒譜空間中[13]。MFCC計(jì)算框圖如圖2所示。

圖2 MFCC計(jì)算框圖

MFCC計(jì)算過(guò)程如下:

① 對(duì)輸入語(yǔ)音信號(hào)進(jìn)行預(yù)處理,包括分幀、加窗等步驟,然后將語(yǔ)音幀進(jìn)行DFT變換,依據(jù)式(7)計(jì)算得語(yǔ)音的頻率特性。

(7)

式中,x(n)為輸入語(yǔ)音信號(hào);N為傅里葉變換的長(zhǎng)度。

② 對(duì)Xa(k)求平方,將其作為輸入通過(guò)一組含有M個(gè)三角形濾波器的濾波器組,該濾波器組的中心頻率為f(m),m=0,1,2,…。

③ 設(shè)Hm(k)為三角濾波器的頻率響應(yīng)特性,將濾波器組的輸出進(jìn)行對(duì)數(shù)變換,其計(jì)算公式如下:

(8)

④ 將S(m)進(jìn)行DCT變換,所得C(n)即為 MFCC系數(shù)。

(9)

在對(duì)語(yǔ)音信號(hào)提取MFCC參數(shù)時(shí),一般選取12階倒譜系數(shù),由于第0階的倒譜系數(shù)表現(xiàn)出的是一種能量的特性,通常C(0)被當(dāng)作能量系數(shù),而不作為倒譜系數(shù)。

2 改進(jìn)算法

在實(shí)際環(huán)境下,絕大部分信號(hào)的信噪比比較低,單純的語(yǔ)音端點(diǎn)檢測(cè)技術(shù)準(zhǔn)確率較低且難以達(dá)到預(yù)期的檢測(cè)效果。大量實(shí)驗(yàn)表明,在對(duì)信號(hào)進(jìn)行檢測(cè)時(shí),必須先對(duì)其進(jìn)行去噪處理。本文采用壓縮感知重構(gòu)對(duì)語(yǔ)音信號(hào)去噪,利用倒譜距離對(duì)重構(gòu)信號(hào)進(jìn)行端點(diǎn)檢測(cè),如圖3所示。

圖3 端點(diǎn)檢測(cè)算法框圖

基于壓縮感知和MFCC的語(yǔ)音端點(diǎn)檢測(cè),其算法具體步驟如下:

① 利用語(yǔ)音在離散余弦變換(Discrete Cosine Transform,DCT)域下的稀疏性,采用性能表現(xiàn)最優(yōu)的Hadamard矩陣壓縮測(cè)量帶噪語(yǔ)音,然后通過(guò)改進(jìn)的正交匹配跟蹤算法(Orthogonal Matching Pursuit,OMP)進(jìn)行語(yǔ)音信號(hào)恢復(fù)。

② 利用漢寧窗對(duì)重構(gòu)后的信號(hào)進(jìn)行分幀,假定重構(gòu)的語(yǔ)音信號(hào)的前10幀為噪聲信號(hào),對(duì)前10幀MFCC參數(shù)求平均,得到噪音的Mel倒譜初始值。

(10)

③ 最后利用滑動(dòng)平均求取每幀語(yǔ)音的Ci離Cmn的倒譜距離。設(shè)MFCC系數(shù)的序列為Ci,i=1,2,…,n,則滑動(dòng)平均式[14]為

(11)

式中,C(i)為語(yǔ)音信號(hào)第i幀的MFCC倒譜距離。根據(jù)MFCC系數(shù)距離曲線,取T1=0.22,T2=0.12。當(dāng)C(i)≥T1且C(i+1)≥T1時(shí),就可以認(rèn)為第i幀是一個(gè)語(yǔ)音信號(hào),當(dāng)隨后C(i)≤T2時(shí)即認(rèn)為語(yǔ)音結(jié)束。

④ 為了保證檢測(cè)的實(shí)時(shí)性,噪聲Mel倒譜初始值按式(12)更新:

Cmn=λCmn+(1-λ)Ci

(12)

式中,Cmn為前面10幀噪聲的MFCC均值矢量;Ci為當(dāng)前幀的MFCC矢量;λ為更新速度。

3 仿真實(shí)驗(yàn)與結(jié)果

為了檢驗(yàn)該算法在帶噪連續(xù)語(yǔ)音的檢測(cè)效果,使用錄音筆在實(shí)驗(yàn)室安靜的環(huán)境下錄制純凈的語(yǔ)音信號(hào),其中信號(hào)的采樣率為16 kHz,每幀256個(gè)采樣點(diǎn),幀移為80個(gè)采樣點(diǎn)。圖4給出了純凈語(yǔ)音信號(hào)“我到北京去”的時(shí)域波形圖,使用標(biāo)準(zhǔn)噪音庫(kù)noisex-92里的白噪聲信號(hào)對(duì)其干擾,圖5為疊加高斯白噪聲后的帶噪信號(hào)波形。

圖4 純凈語(yǔ)音信號(hào)

圖5 帶噪語(yǔ)音信號(hào)(信噪比10dB)

首先,采用傳統(tǒng)的雙門(mén)限法進(jìn)行仿真,使用語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)平均過(guò)零率來(lái)進(jìn)行端點(diǎn)檢測(cè),圖6為語(yǔ)音信號(hào)短時(shí)能量檢測(cè)結(jié)果,圖7為語(yǔ)音信號(hào)短時(shí)平均過(guò)零率檢測(cè)結(jié)果。從圖6、圖7可以看出,使用雙門(mén)限法檢測(cè)時(shí),其采用歸一化處理,在同一門(mén)限下進(jìn)行檢測(cè)。由于濁音的短時(shí)能量遠(yuǎn)大于清音的短時(shí)能量,在清音“北”字語(yǔ)音段上信號(hào)幅度突然變小,該方法將一段語(yǔ)音檢測(cè)成為了兩段語(yǔ)音,很顯然發(fā)生了誤檢現(xiàn)象。

然后,采用壓縮感知與MFCC端點(diǎn)檢測(cè)方法對(duì)同一帶噪語(yǔ)音“我到北京去”進(jìn)行檢測(cè)。依據(jù)上述步驟對(duì)原始信號(hào)進(jìn)行壓縮感知與重構(gòu)后,信號(hào)波形如圖8所示,從圖中可以看出,采用壓縮感知和改進(jìn)的OMP算法對(duì)帶噪語(yǔ)音信號(hào)進(jìn)行壓縮觀測(cè)和重構(gòu),重構(gòu)信號(hào)不僅能較好地恢復(fù)原始語(yǔ)音信號(hào)波形,而且取得了良好的降噪效果。

圖6 短時(shí)能量檢測(cè)結(jié)果

圖7 短時(shí)平均過(guò)零率檢測(cè)結(jié)果

圖8 重構(gòu)的語(yǔ)音信號(hào)

圖9為傳統(tǒng)雙門(mén)限端點(diǎn)檢測(cè)算法和CS-MFCC端點(diǎn)檢測(cè)算法在不同信噪比情況下的檢測(cè)結(jié)果。從圖中可以看出,在信噪比大于5 dB時(shí),兩種檢測(cè)算法都可以進(jìn)行有效的端點(diǎn)檢測(cè),但當(dāng)信噪比低于5 dB時(shí),傳統(tǒng)雙門(mén)限檢測(cè)算法性能明顯下降,已無(wú)法有效進(jìn)行端點(diǎn)檢測(cè),特別是測(cè)試樣本中的后3個(gè)字符,幾乎完全被淹沒(méi)在噪聲信號(hào)中,嚴(yán)重影響檢測(cè)準(zhǔn)確率。

在連續(xù)語(yǔ)音檢測(cè)過(guò)程中出現(xiàn)幅值急劇變化時(shí),基于本文改進(jìn)的CS-MFCC端點(diǎn)檢測(cè)算法不但可以在大于5 dB的高信噪比環(huán)境下有效檢測(cè)出語(yǔ)音幀的起始與結(jié)束,而且在信噪比為0 dB的惡劣環(huán)境下仍然可以保持有效的工作,能適用于連續(xù)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行帶噪語(yǔ)音端點(diǎn)檢測(cè),具有良好的魯棒性。

實(shí)驗(yàn)中采用傳統(tǒng)的雙門(mén)限端點(diǎn)檢測(cè)算法和本文改進(jìn)的CS-MFCC端點(diǎn)檢測(cè)算法分別對(duì)語(yǔ)音信號(hào)進(jìn)行端點(diǎn)檢測(cè),并改變信噪比的值,統(tǒng)計(jì)在不同信噪比條件下兩種算法的端點(diǎn)檢測(cè)結(jié)果如表1所示。準(zhǔn)確率定義為:

錯(cuò)誤幀數(shù)=語(yǔ)音誤判為噪聲幀數(shù)+噪聲誤判為語(yǔ)音幀數(shù)

準(zhǔn)確率=(總幀數(shù)-錯(cuò)誤幀數(shù))/總幀數(shù)

當(dāng)準(zhǔn)確率低于70%時(shí),則對(duì)應(yīng)的算法被認(rèn)為無(wú)效。

圖9 CS-MFCC端點(diǎn)檢測(cè)結(jié)果

端點(diǎn)檢測(cè)方法信噪比(SNR)0dB5dB10dB20dB30dB傳統(tǒng)雙門(mén)限算法失效失效94.2595.7396.18本文改進(jìn)算法91.6391.7596.3296.1694.63

通過(guò)統(tǒng)計(jì)實(shí)驗(yàn)結(jié)果可知,在信噪比大于10 dB的情況下,傳統(tǒng)雙門(mén)限算法和本文改進(jìn)算法都能保持94%以上的準(zhǔn)確率,但當(dāng)信噪比低于10 dB時(shí),傳統(tǒng)雙門(mén)限算法性能表現(xiàn)不穩(wěn)定,幾乎無(wú)法有效地工作,而本文改進(jìn)的CS-MFCC端點(diǎn)檢測(cè)算法依然可以保持91%以上的準(zhǔn)確率。由此可見(jiàn),傳統(tǒng)雙門(mén)限檢測(cè)算法雖簡(jiǎn)單易實(shí)現(xiàn),但是抗噪性能太差,特別是在檢測(cè)弱摩擦音和結(jié)尾音符時(shí)存在明顯不足,無(wú)法在低信噪比環(huán)境下有效工作。而本文改進(jìn)算法利用壓縮感知與重構(gòu)進(jìn)行了降噪處理,同時(shí)采用 MFCC倒譜距離進(jìn)行端點(diǎn)檢測(cè),具有較強(qiáng)的抗噪性能和魯棒性,在強(qiáng)噪聲等惡劣環(huán)境下亦可保持有效工作。

文獻(xiàn)[15]提出的改進(jìn)的自適應(yīng)倒譜距離檢測(cè)算法是在傳統(tǒng)倒譜距離端點(diǎn)檢測(cè)算法基礎(chǔ)上引入倒譜距離乘數(shù)和門(mén)限增量系數(shù),進(jìn)一步提高了端點(diǎn)檢測(cè)準(zhǔn)確率,但是在低信噪比環(huán)境下存在漏檢、誤檢現(xiàn)象,特別是針對(duì)強(qiáng)度較弱的信號(hào)或者清音信號(hào),而本文提出的改進(jìn)CS-MFCC端點(diǎn)檢測(cè)算法有效地改善了這一現(xiàn)象。圖10為兩種改進(jìn)算法在SNR=-10 dB環(huán)境下的端點(diǎn)檢測(cè)結(jié)果。

圖10 CS-MFCC和改進(jìn)倒譜距離端點(diǎn)檢測(cè)結(jié)果

由圖10可知,文獻(xiàn)[15]提出的改進(jìn)算法漏檢了測(cè)試樣本的后兩個(gè)字符,特別是最后一個(gè)尾音字符,多次測(cè)試均為漏檢,而本文提出的CS-MFCC算法則依然可以有效檢測(cè)出語(yǔ)音端點(diǎn)。

4 結(jié)束語(yǔ)

本文將壓縮感知理論和MFCC倒譜系數(shù)相結(jié)合的方法應(yīng)用于連續(xù)語(yǔ)音端點(diǎn)檢測(cè)。在端點(diǎn)檢測(cè)之前利用壓縮感知與重構(gòu)進(jìn)行了降噪處理。通過(guò)實(shí)驗(yàn)證明,采用 MFCC倒譜距離對(duì)帶噪語(yǔ)音進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),較好地解決了傳統(tǒng)的雙門(mén)限算法在不同字間由于幅度變化大會(huì)產(chǎn)生誤判的問(wèn)題,解決了傳統(tǒng)雙門(mén)限檢測(cè)方法在連續(xù)帶噪語(yǔ)音情況和低信噪比環(huán)境下端點(diǎn)檢測(cè)的不足。本文算法引入了壓縮感知理論進(jìn)行語(yǔ)音降噪,利用噪聲與語(yǔ)音信號(hào)在DCT域的差異性,去除語(yǔ)音的噪聲干擾,提高端點(diǎn)檢測(cè)算法的噪聲敏感性,很好地解決了文獻(xiàn)[15]在強(qiáng)度較弱的語(yǔ)音信號(hào)或清音信號(hào)下可能出現(xiàn)的丟失或誤檢問(wèn)題,為連續(xù)語(yǔ)音識(shí)別系統(tǒng)提供了可靠的基礎(chǔ)。

猜你喜歡
信號(hào)檢測(cè)
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
信號(hào)
鴨綠江(2021年35期)2021-04-19 12:24:18
“幾何圖形”檢測(cè)題
“角”檢測(cè)題
完形填空二則
孩子停止長(zhǎng)個(gè)的信號(hào)
小波變換在PCB缺陷檢測(cè)中的應(yīng)用
基于LabVIEW的力加載信號(hào)采集與PID控制
主站蜘蛛池模板: 在线a网站| 久久久久久国产精品mv| 亚洲欧美在线综合图区| 全裸无码专区| 波多野结衣二区| 一级爆乳无码av| 亚洲精品无码久久久久苍井空| 亚洲欧美另类色图| 激情无码视频在线看| 伊人久久婷婷五月综合97色| 夜色爽爽影院18禁妓女影院| 欧洲欧美人成免费全部视频| 一本大道无码日韩精品影视| 无码人中文字幕| 亚洲第一黄片大全| 久无码久无码av无码| 国产在线八区| 丁香婷婷综合激情| 青青草原偷拍视频| 97se亚洲| 国产欧美日韩资源在线观看| 亚洲av日韩av制服丝袜| 色婷婷成人| 手机在线看片不卡中文字幕| 91福利在线看| 免费毛片网站在线观看| 国产SUV精品一区二区6| 免费一级α片在线观看| 免费国产在线精品一区| 精品国产成人av免费| 日韩国产无码一区| 色悠久久久久久久综合网伊人| 欧美成人免费一区在线播放| 亚洲欧洲日产国码无码av喷潮| 色综合综合网| 欧美高清国产| 一级香蕉视频在线观看| 国产1区2区在线观看| www.亚洲天堂| 在线观看亚洲天堂| 国产人人干| 国产精品女熟高潮视频| 直接黄91麻豆网站| 日本在线免费网站| 色视频久久| 亚洲aaa视频| 亚洲AV无码久久精品色欲| 国产在线91在线电影| 在线观看欧美精品二区| 国产无套粉嫩白浆| 中文国产成人久久精品小说| 毛片基地美国正在播放亚洲| 午夜国产大片免费观看| 日韩欧美在线观看| 亚洲天堂高清| 91精品最新国内在线播放| 熟妇丰满人妻av无码区| 国产亚洲精品自在久久不卡| 精品無碼一區在線觀看 | 国产综合精品日本亚洲777| 欧美人与牲动交a欧美精品| 无码一区二区波多野结衣播放搜索| 国产电话自拍伊人| av在线手机播放| 久久久久国产精品嫩草影院| 青草午夜精品视频在线观看| 国产精品真实对白精彩久久| 国产最爽的乱婬视频国语对白| 国产丝袜一区二区三区视频免下载| 天天视频在线91频| 免费观看男人免费桶女人视频| 亚洲综合极品香蕉久久网| 最近最新中文字幕在线第一页| 国产青榴视频在线观看网站| 国产一级毛片高清完整视频版| 婷婷色婷婷| 91亚洲影院| 亚洲欧美成aⅴ人在线观看 | 99久久国产综合精品女同| 99精品在线看| 精品一区二区无码av| 毛片手机在线看|