999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于對數能量倒譜特征的端點檢測算法

2014-07-07 03:38:45王民孫廣沈利榮劉利
計算機工程與應用 2014年16期
關鍵詞:特征信號檢測

王民,孫廣,沈利榮,劉利

1.西安建筑科技大學信息與控制工程學院,西安 710055

2.西安石油大學光電油氣測井與檢測教育部重點實驗室,西安 710065

基于對數能量倒譜特征的端點檢測算法

王民1,孫廣1,沈利榮2,劉利1

1.西安建筑科技大學信息與控制工程學院,西安 710055

2.西安石油大學光電油氣測井與檢測教育部重點實驗室,西安 710065

端點檢測技術是語音識別的關鍵技術之一,為了克服傳統倒譜距離語音端點檢測算法在低信噪比下檢測效果的不理想,將對數能量(LE)特征和倒譜(C)特征相結合,提出了一種新的對數能量倒譜特征(LEC),采用模糊C均值聚類和貝葉斯信息準則(BIC)方法估計特征門限,得出了正確的語音端點判斷,在三種典型噪聲下,對信噪比從-5 dB到15 dB的帶噪聲語音進行仿真,結果表明LEC法的檢測錯誤率僅為20.25%,明顯低于倒譜法和對數能量法,能有效地確定語音的端點并改善語音識別效果。

對數能量;倒譜距離;模糊C均值聚類;貝葉斯信息準則(BIC);端點檢測

1 引言

目前語音識別與說話人識別的研究中,語音端點檢測的準確率在很大程度上決定著整個系統的識別率。端點檢測的傳統方法是采用語音信號的時域特征,短時能量和短時過零率作為特征參數[1],該方法在高信噪比時具有很好的檢測效果,而在低信噪比時檢測效果則非常不理想。近年來提出了很多優化改進的方法,如基于倒譜距離[2]、譜熵法[3]、對數能量[4],神經網絡法[5]等,檢測效果上得到了很大的改善,然而上述算法也比較容易受噪聲影響,因此,在實際環境應用中體現不出好的推廣前景。

文獻[4]提出了對數能量法,與傳統的線性能量相比,不會出現對數能量特征中噪聲段特征值過大的問題,能較好地區分語音信號中不同的部分。基于文獻[4]通過倒譜與對數能量相結合,提出對數能量倒譜(LEC)法,門限估計采用模糊C均值聚類和貝葉斯信息準則,該方法有好的魯棒性。實驗證明,在低信噪比噪聲環境中,這種LEC法相比對數能量法和倒譜法,能取得更好的檢測效果。

2 基于對數能量倒譜特征的端點檢測算法

2.1 倒譜距離的定義

假定輸入信號s(n),其倒譜變換是c(n)。其中一種信號倒譜的定義是將信號s(n)的倒譜c(n)看作是lgS(w)的傅里葉級數展開[6],即:

其中,c(n)是倒譜系數,且c(n)=c(-n)是實數。根據帕斯維爾定理,無限階倒譜的系數可以用p階倒譜的系數來近似,可以近似如下[2]:

信號和本身的倒譜是一一對應的變換,倒譜距離能作為在端點檢測中的一個判決參數,屬于相似距離范疇。

2.2 對數能量倒譜特征

在語言端點判定方法中,一種好的能量特征應該對不同幅度的語音信號都具有好的區分性。也就是說,既不能使幅度相對較大的語音表征為靜音或噪聲,也不能使幅度小的噪聲表征成語音。在此,本文應用一種對數能量[4]特征LEi,其計算的表達式為:

式中,E(i)為i幀信號的短時線性能量,a為常數,實驗結果測得當a=5×105時效果最好。首先,對LE和C分別依次進行平移和調整,再做相乘運算,將其結果記為P(i),計算公式為:

其中AveLE和AveC分別為前10幀對應的對數能量和倒譜距離的特征平均值。

然后,可得LEC的計算公式為:

其中a取9.5的經驗值。

倒譜特征和對數能量倒譜特征的比較,可以發現倒譜特征不能準確地使語音和噪聲明顯地區分開來,特別是語音樣本在開始的階段,噪聲也被表征出語音特征。而LE卻具有良好的平滑性和區分性,計算LEC的算法框圖如圖1。

圖1 對數能量倒譜特征框圖

3 門限估計和端點檢測

3.1 模糊聚類C均值[7]

模糊C均值算法如下:

(1)設要聚成C個類,由人決定C的個數。

(2)在第C次迭代中,樣本數據的隸屬度用如下方法計算:

i=1,2,…,n,j=1,2,…,c。ml(l=1,2,…,c)為每個聚類的中心,μj(xi)是第i個樣本對于第j類的隸屬度函數。

(3)用由(2)得到的當前的隸屬度函數更新計算各聚類中心。

(4)當其隸屬度不再變化時,則終止。否則返回到(2)。

3.2 貝葉斯信息準則(BIC)

貝葉斯信息準則(Bayesian Information Criterion,BIC)可以用來判定語音端點檢測過程中的門限值[8]。BIC模型定義如式(9):

其中X={xi|i=1,2,…,N}為數據的特征集;Φ={φj|j=1,2,…,K}為模型參數;lg(X,φ)是數據X和模型參數φ的似然函數;nφ是模型參數φ的個數;N是X中數據的個數;λp是其懲罰因子。

由BIC可知,最大化BIC值即為最優模型個數。假設語音片段和背景噪聲均服從高斯分布N(μi,∑i)模型,其中μi為均值向量,∑i為協方差矩陣,則可以通過式(10)得到聚類數為C時的BIC值:

其中N是總數據個數;Ni為第i個聚類中數據的個數;d為特征空間的維數。

對于黏膜型雞痘,則需要用消毒后的鑷子對病雞咽喉處的假膜進行剝離,之后施用1%高錳酸鉀溶液對患處進行清洗,最后涂抹魚肝油。對于結膜炎的病雞,可以通過雙氧水進行消毒,采用抗生素眼藥水來進行對癥治療。在發現雞群中出現雞痘的情況下,應及時采用雞痘疫苗的五倍劑量進行刺種,并且每天對雞以及雞舍進行消毒。如果發病雞較多,可以通過抗病毒以及抗菌消炎的中西藥進行治療,防治發生感染。

對于端點檢測,可設定初始聚類個數C=2,最優聚類數Cbest可以通過以下進行判決:

3.3 端點檢測

本文利用模糊C均值聚類和BIC算法對LEC的門限值進行估計,并完成語音端點檢測,其算法步驟為:

(1)通過式(6)計算信號每一幀的LEC特征。

(2)利用模糊C聚類算法對LEC特征分別進行聚類數目是C=1和C=2時的模糊聚類。

(3)通過式(11)決定最優聚類數Cbest的值。

(4)若Cbest=1,通過第二步得其聚類中心為m11,則LEC特征門限的計算公式為:

此時,LEC特征門限的計算公式為:

其中γhigh,γlow是經驗常數。

(5)由以上步驟得到LEC特征雙門限值進行端點檢測。雙門限端點檢測法見文獻[1]。

4 實驗結果分析

實驗測試語音采用TIM IT標準語音庫中的30條連續語音,16 kHz采樣頻率,16 bit量化,單聲道wav語音格式,采用白噪聲,分別生成-5 dB,5 dB,15 dB的帶噪語音,最后利用NOISEX 92標準噪聲庫中的babble噪聲和pink噪聲,以及實際環境中的噪聲分別進行了語音檢測分析。

由于語音信號在一定時間內具有短時平穩性,本文取幀長為12 ms(每幀包含256個采樣點),幀移為8 m s(每幀包含128個采樣點),FFT點數為256,門限估計參數為:

實驗比較對象為文獻[4]的對數能量法,首先載入一段干凈的語音信號,如圖2,分別用兩種參數對語音信號進行分析,用對數能量檢測的結果如圖3,用對數能量倒譜特征的檢測結果如圖4。

圖3 語音信號的檢測結果

圖4 語音信號的檢測結果

圖2 原始語音

通常在連續的語音條件差下,不能完全地檢測出端點,因為會有輔音的漏檢和噪音的誤檢造成干擾,因此給出如下式(17)~(19)的評價標準。

其中leak_num,false_num和F_num分別表示語音被誤檢是噪聲的幀數,噪聲被誤檢是語音的幀數和總的語音幀數,圖4給出的是本文方法在SNR=15 dB的端點檢測。

為了進一步檢測本文方法的魯棒性,分別對語音信號進行了pink噪聲分析,如圖5,babble噪聲分析,如圖6。本文為了模擬實際環境中的噪聲,用采集到的一段道路十字路口的噪聲,進行實際噪聲下的魯棒性分析,如圖7。

由圖3中的(b)和(c)圖可以看出,在SNR=15 dB時,LE法也可以檢測出語音的起止點位置,但LE法的漏檢率要比LEC法要高,說明LEC法具有更好的語音特征,能正確地區分語音和噪聲。

圖5和圖6中可以得出,本文方法分別在pink噪聲和babble噪聲的干擾下,也顯示出了較高的準確率。在實際噪聲下,如圖7所示,檢測結果在第一個音的截止點處,有略微的下降,因為道路上會有一定的突然噪聲,但整體的檢測率依然比較準確,因此可以說明,在不同噪聲情況下,LEC法有著很好的魯棒性。

同時由表1可知,LEC法在SNR=-5 dB時的總誤檢率僅為20.25%,在信噪比為0~10 dB時,總的錯誤檢測率要明顯低于LE法,并且在pink、babble噪聲條件下,有著良好的抗噪性。

表1 不同信噪比下不同方法的實驗結果

由上述的分析,可以得出結論,在低信噪比條件,LEC法具有更好的檢測性和穩健性。

5 結論

圖5 語音信號的檢測結果

圖6 語音信號的檢測結果

本文把對數能量和倒譜相結合,提出一種新的對數能量倒譜特征,利用模糊聚類C均值算法和貝葉斯信息判決算法進行門限估計,采用雙門限法進行語音端點檢

圖7 語音信號的檢測結果

測。實驗結果表明,與對數能量法比,在連續語音下,其檢測錯誤率明顯要低,并能夠準確地檢測出語音的端點,在不同噪聲環境中表現出了很好的穩健性,特別在低信噪比下,具有更好的檢測性能。這主要是對數能量倒譜結合了對數能量和倒譜各自的優點,同時克服了一定各自的缺點,從而具有更優的檢測性能。這說明多特征相結合的端點檢測方法是以后研究的熱門方法。

[1]Shin J W,Kwon H J,Jin S H,et al.Voice activity detection based on conditional MAP criterion[J].IEEE Signal Processing Letters,2008,15:257-260.

[2]張志敏,郭英,王博.一種基于倒譜特征的語音端點檢測改進算法[J].電聲技術,2006(4):39-42.

[3]趙歡,王綱金,趙麗霞.一種新的對數能量譜熵語音端點檢測方法[J].湖南大學學報:自然科學版,2010(7):72-77.

[4]肖述才,王作英.端點檢測中的一種新的對數能量特征[J].電聲技術,2004(6):37-41.

[5]江銘虎,袁保宗,林碧琴.神經網絡語音識別的研究及進展[J].電信科學,1997(7):1-5.

[6]Haigh J A.Robust voice activity detection using cepstral features[C]//Computer,Communication,Control and Power Engineering,Proceedings of the IEEE Region 10 Conference TENCON,1993,3(3):321-324.

[7]Tian Y.Fuzzy clustering and bayesian information criterion based threshold estimation for robust voice activity detection[C]//IEEE International Conference on Acoustics,Speech and Signal Processing Proceedings(ICASSP). Hong Kong,China:IEEE,2003(1):444-447.

[8]Chen S S.Clustering via the Bayesian information criterion with applications in voice recognition[C]//IEEE International Conference on Acoustics Speech and Signal Processing Proceedings(ICASSP).Munich,Germany:IEEE,1998(I):645-648.

WANG M in1,SUN Guang1,SHEN Lirong2,LIU Li1

1.School of Information and Control Engineering,Xi’an University of Architecture and Technology,Xi’an 710055,China
2.Key Laboratory of Photoelectric Logging and Detecting of Oil and Gas,Ministry of Education,Xi’an Shiyou University, Xi’an 710065,China

Endpoint detection is one of the key technologies of speech recognition,in order to overcome the undesirable detection results of traditional cepstrum distance in speech endpoint detection algorithm under low signal to noise ratio, combined logarithm ic energy feature(LE)with cepstrum features(C)for endpoint detection,proposes a new logarithmic energy cepstrum features(LEC),uses fuzzy C-means clustering and Bayesian information criterion to estimate features threshold,achieves better endpoint judgment,conducts the SNR simulation from-5 dB to 15 dB with noisy speech under three kinds of typical noise.The results indicate that the LEC method’detection error rates is just 20.25%and significantly lower than cepstrum and logarithmic energy method,it also can effectively determine the speech endpoint and improve voice recognition results.

logarithmic energy;cepstrum distance;Fuzzy C-means clustering;Bayesian Information Criterions(BIC); Endpoint detection

A

TP3

10.3778/j.issn.1002-8331.1209-0255

WANG M in,SUN Guang,SHEN Lirong,et al.Voice activity detection using logarithmic energy and cepstrum Distance.Computer Engineering and Applications,2014,50(16):198-201.

國家自然科學基金(No.61073196)。

王民(1959—),男,副教授,主要從事智能信息處理研究,主研方向為智能信息處理;孫廣(1986—),男,碩士研究生,主研方向為語音信號處理;沈利榮(1987—),女,碩士研究生,主要從事測井信號檢測研究。E-mail:sunguang216@163.com

2012-09-23

2012-11-26

1002-8331(2014)16-0198-04

猜你喜歡
特征信號檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
抓住特征巧觀察
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 刘亦菲一区二区在线观看| 国产精品福利尤物youwu | 免费va国产在线观看| 亚洲无码高清一区二区| 亚洲色欲色欲www在线观看| 久久一色本道亚洲| 一级不卡毛片| 54pao国产成人免费视频| 一级毛片不卡片免费观看| 国产成人av一区二区三区| 国产日本一区二区三区| a毛片免费看| 欧洲熟妇精品视频| 欧美a在线| 国产欧美在线观看一区| 免费不卡在线观看av| 99精品国产高清一区二区| 色网站在线视频| 亚洲第一页在线观看| 毛片在线播放网址| 亚洲无码精彩视频在线观看| 欧美精品v| 一级福利视频| 99爱在线| 日韩一区精品视频一区二区| 国产原创演绎剧情有字幕的| 国产一区在线视频观看| 在线看片中文字幕| 真实国产乱子伦视频| 中文无码伦av中文字幕| 久久精品66| 五月丁香在线视频| 亚洲天堂视频在线播放| 无码专区国产精品一区| 国产99精品久久| 欧美日韩成人| 欧美色伊人| 国产在线专区| a色毛片免费视频| 亚洲成aⅴ人片在线影院八| 永久免费无码成人网站| 国产精品冒白浆免费视频| 色综合中文字幕| 丝袜亚洲综合| 中文字幕欧美日韩高清| 久久久久亚洲精品成人网| 丁香婷婷综合激情| 亚洲中文字幕97久久精品少妇| 久久国产精品电影| 亚洲综合亚洲国产尤物| 亚洲色无码专线精品观看| 亚洲综合中文字幕国产精品欧美| 精品人妻系列无码专区久久| 一区二区三区四区日韩| 露脸一二三区国语对白| 国产免费网址| 中文天堂在线视频| 欧美国产视频| 国产黑丝一区| 日韩小视频在线播放| 91色在线观看| 久久久久国产一级毛片高清板| 一级爆乳无码av| 日本在线欧美在线| 国产青榴视频在线观看网站| 婷婷色中文网| 国产精品丝袜在线| 国产一线在线| 国产微拍精品| 婷婷中文在线| 高潮爽到爆的喷水女主播视频 | 久久久久无码国产精品不卡| 香蕉久久国产超碰青草| 亚洲一级毛片| 久久中文字幕av不卡一区二区| 一本色道久久88综合日韩精品| 美女啪啪无遮挡| 成人永久免费A∨一级在线播放| 亚洲开心婷婷中文字幕| 色婷婷成人| 免费国产不卡午夜福在线观看| 国产性精品|