999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種改進型的MEL濾波器混合特征參數提取方法研究*

2014-02-09 09:02:08陸安江張正平
通信技術 2014年12期

黃 銳,陸安江,張正平

(貴州大學大數據與信息工程學院,貴州貴陽550025)

一種改進型的MEL濾波器混合特征參數提取方法研究*

黃 銳,陸安江,張正平

(貴州大學大數據與信息工程學院,貴州貴陽550025)

由于在說話人識別中梅爾頻率濾波器組結構分布不均勻,在低頻區域分布密集而在中心頻率、高頻率分布稀疏,影響了在中、高頻段的MEL倒譜系數(MFCC)的提取,本文提出適用于說話人識別的改進MEL濾波器與MidMel濾波器相結合得到兩種混合特征參數,用此方式來提高中、高頻率特征參數提取的精度,從而提高系統識別率。實驗結果顯示,在同一環境中,新的混合特征參數識別率與識別性能優于傳統的特征參數,且運算量較少。

說話人識別 梅爾頻率濾波器 MidMel濾波器 MEL倒譜系數

0 引 言

說話人識別是指根據說話人所發出的語言信號來鑒定此人的真實身份或確定他所宣稱的身份與他的真實身份是否符合。怎樣確切的判別某個人的身份,并保護其信息安全已經成為現今社會的一個焦點問題。利用人的生理特征識別身份的技術利用其優點可以在將來代替鑰匙、密碼等傳統技術?,F今,可以通過計算機把語音信號建模,然后與說話人的聲音進行匹配,最后得到識別結果。因此,如何提高其識別率,怎樣提取更好的語音特征參數就成為了一個重要的課題[1]。

當前,常見的特征參數包括線性預測系數(LinearPrediction Cepstral Coefficent,LPCC)、梅爾倒譜系數(MelFrequency Cepstrum Coefficient,MFCC)[2]。最近,有學者提出了將各個說話人特征參數組合來提高識別率的新方法,并有研究表明高頻部分含有大量表征說話人個性的信息。用語音信號4 kHz~10 kHz的特征參數與0~4 kHz頻率范圍的特征參數做說話人識別的結果可以達到一致,并且發現在500 Hz~2 kHz也包括說話人的重要信息[3]。sandipan等[4]人

對MFCC進行了改進,對MFCC沒有側重的高頻部分用IMFCC(對MFCC濾波器進行翻轉濾波)與MFCC結合得到新的混合特征參數,在一定程度上提高了識別率;文獻[5]提出用fisher準則來結合傅里葉分析和小波分析構造出來的混合特征參數;文獻[6]用MFCC于IMFCC結合提取出的混合特征參數再用fisher準則擇優降維,得到新的特征參數提高了識別率,但其并沒有考慮到中心頻率的重要性;文獻[7]采用MFCC、IMFCC、MID-MFCC結合的混合特征參數,但其過程較復雜。

本文首先計算MidMFCC參數,然后再計算改進的MEL濾波器。后者在低、高頻有較好的分辨率,再結合MidMFCC參數,組成一種新的混合特征參數。

1 語音特征參數提取

1.1 Mel倒譜系數的提取

梅爾倒譜系數(MFCC)采用Mel濾波器,它在低頻部分分辨率高而忽略了高頻部分,它把語音信號的線性頻譜轉化為Mel頻標的非線性譜,再將其置換至倒譜域。兩種坐標的變換關系如式(1)。

提取MFCC參數的過程:

1)把語音原始信號預處理加窗后變成短時信號,然后用快速傅里葉變換(Fast Fourier Transform, FFT)把其變換為頻域信號,并算出其短時能量譜。

2)將短時能量譜用Mel濾波器進行濾波,從而得到濾波系數。

3)對得到的濾波系數根據式(2)進行余弦變換,將信號映射到低維空間從而得到特征參數。

式中,(m)表示MFCC第m維特征參S(n)表示濾波器系數,M表示濾波器的階數。

圖1 Mel尺度變換關系Fig.1 Mel scale variation relations

圖2 Mel濾波器組分布Fig.2 Mel-filterbank distribution

由圖2可以看出,濾波器在低頻上較密集,而在中、高頻上較稀疏,這樣就漏掉了很多有用的說話人個性特征參數。因此,提高MEL濾波器在中、高頻的分辨率,從而提高識別率。

1.2 改進的MFCC

在MFCC特征參數中,側重說話人低頻部分,對中、高頻計算精度教低,提取的特征參數不能更好的表征說話人的語音特征。

為了使提取出來的特征參數包含更多的說話人個性特征和降低計算的難度,設計出改進的Mel濾波器組,用以改進其在中、高頻段特征參數計算精度,其模型如圖3所示。

圖3 改進的Mel濾波器組分布Fig.3 Modified Mel-frequency filter

改進的濾波器組在低于0~3 000 Hz的頻率范圍內與Mel濾波器組是相同的;在3 000 Hz~4 000 Hz的頻率范圍,是基于反Mel刻度變換得到的。它是在Mel刻度變換的基礎上改進提出來的,反Mel刻度的物理變換關系式如式(3)所示。

反Mel濾波器的帶寬會根據頻率的增大而逐漸減小,所以在高頻部分分辨率較大,它的結構特點與Mel濾波器剛好相反。

圖4 IMFCC尺度變換曲線Fig.4 IMFCC scale variation curve

因此,反Mel濾波器組提取出的特征參數能夠更好的表征高頻部分說話人個性特征信息。反Mel變換關系如圖4所示。

1.3 MidMFCC的提取

在參數提取過程中,刻度的轉換關系主要體現在濾波器組的分布情況上,而由圖3可以看出,在改進的MFCC參數中,濾波器主要集中在低頻和高頻的部分;而MidMFCC參數,濾波器在中心頻率部分比較密集,而在低頻和高頻部分比較稀疏。MidMFCC的提取過程與MFCC的提取過程一致,MidMel刻度與Hz刻度的轉換關系如式(4)所示。

MidMFcc變換關系如圖5所示。

圖5 MidMel尺度變換曲線Fig.5 MidMel scale variation curve

圖6 MidMel濾波器組分布Fig.6 MidMel-filterbank distribution

用Mel濾波器組與反Mel濾波器組結合得到的特征參數,再與MidMel濾波器組得到的特征參數結合,從而得到新的混合特征參數。它在低頻部分與Mel濾波器組的特點相同,在中頻部分與MidMel濾波器組特點相同,而在高頻部分具有反Mel濾波器組的特點。讓改進的濾波器與Mel濾波器類似,并且符合人耳的聽覺特性,在低、高頻同時具有較高的分辨率,其特征參數的維數不變,并且不會增加特征參數的提取時間。

用改進的Mel濾波器提取新的特征參數的步驟與MFCC特征參數的提取相同,只是把Mel濾波器換成改進的Mel濾波器,然后與MidMel濾波器得到的特征參數結合得到新的特征參數。

2 實驗分析

說話人識別主要分為孤立詞說話人識別、連接詞說話人識別和連續說話人識別。孤立詞說話人識別中是把其中的詞語當成一個整體來識別;連接詞說話人識別一般是針對數字串進行識別;而連續說話人識別比較復雜,它針對說話人日常生活中隨意所說的話來進行模式識別。本文主要從數字串的識別(連接詞語音識別)進行判定,得到系統識別率,然后與傳統MFCC參數的識別率做對比。

2.1 試驗

實驗在MatlabR2010a環境下進行,采用了8 KHz采樣率、16 bits量化,每幀32 ms(約256點),幀移16 ms,并利用漢明窗進行短時分析,創建了從1~9的9個阿拉伯數字串的語音庫,每個數字串用15個不同的人(11男4女),每人對9個數字串發音4遍并錄制,對錄制的樣本信息先采用雙門限端點檢測法,去掉冗余。選取其中360個作為測試樣本,其余的作為語音的訓練樣本。其中一組使用12階Mel濾波器組得到MFCC特征參數;另外一組使用改進的Mel濾波器得到改進的MFCC參數和MidMFCC參數結合的混合參數。這樣得到的混合特征參數就平均包含了整個說話人語音頻域,增加了低、中、高頻段倒譜系數的計算精度。然后分別對測試樣本中的數據提取的MFCC系數序列矩陣和混合特征系數序列矩陣,按照圖7的流程步驟實現說話人識別系統,其中改進的過程只在特征參數提取上有所不同。

圖7 總流程Fig.7 Total flow chart

本文采用基于VQ[8]的說話人識別系統對兩種系數矩陣進行訓練,分析結果。實驗采用5交叉驗證(5 Cross-validation)的方法進行評判得到最后的識別率,即把5次得到的整體結果進行計算得到最后的識別結果,每一次的模型總數為20個,以識別正確或錯誤來表征識別率,其識別率如表1所示。

表1 不同特征參數的識別結果Table1 Identification results of different characteristic parameters

從表2的結果可以看出,對于相同的說話人語音樣本,在相同的環境下改進后的MFCC混合特征參數比傳統的MFCC特征參數最后的識別率得到了提高。

表2 不同特征參數的識別率Table 2 Identification rate of different characteristic parameters

在試驗中還發現,用MFCC提取特征參數識別女性的誤識個數多,這是因為女性的聲音頻率比男性的高,而Mel濾波器則是在低頻部分精度高,忽略了高頻部分的說話人特征參數。而改進后得到的參數卻彌補了這一不足,更好的提高了計算精度。

3 結 語

本文針對MFCC特征參數在說話人語音信號的低頻部分有良好的計算精度,而忽略了中、高頻說話人語音信號的計算精度。提出了采用MidMFCC與改進的Mel濾波器相結合的算法。實驗結果表明,在相同環境下,改進的算法與經典的算法相比較識別率有了一定程度的提高。下一步的工作,將繼續優化改進算法,對提取出的特征參數進行擇優選擇,提高識別的速度和效率。

[1] 張曉俊,陶智,吳迪,肖仲喆,趙鶴鳴.采用多特征組合優化的語音特征參數研究[J].通信技術,2012,45 (12):98-101.

ZHANG Xiao-jun,TAO Zhi,WU Di,XIAO Zhong-zhe, ZHAO He-ming.Study of Speech Chara-cteristic Parameters by Optimized Multifeature Combination[J].Communications Technology,2012,45(12):98-101.

[2] DAVIS S B,MERMELSTEIN P.Comparison ofparametric repre-sentations for monosy-llabic word recognition in continuously spoken sentences[J].IEEE Transactins on Acoustics,Speech and Signal Process-ing,1980,28 (04):357-365.

[3] 項要杰,楊俊安,李晉徽,陸俊.一種適用于說話人識別的改進Mel濾波器[J].計算機工程,2013(11):214 -218.

XIANG Yao-jie,YANG Jun-an,LI Jin-hui,LUJun.An Improved Mel-Frequency Filter fo-r Speaker Recognition [J].Computer Engin-eering,2013(11):214-218.

[4] SANDIPAN C,ANINDYAR,SOURAV M.Captur-ing complementaly information via reve-rsed filter bank and parallel implement-ation with MFCC for improved text-indep-endent speaker identification[C]//Proc-eedings of the 2007 International Confe-rence on Computing:Theory and Applicati-on.Piscataway:IEEE,2007:463-467.

[5] 汪崢,連翰,王建軍.說話人識別中特征參數提取的一種新方法[J].復旦學報(自然科學版),2005,44 (01):197-200.

WANG Zheng,LIAN Han,WANG Jian-jun.App-lication of a New Mixed Feature in Spea-ker Identification [J].Journal of Fudan University(Natural Science), 2005,44(01):197-200.

[6] 胡峰松,張璇.基于梅爾頻率倒譜系數與翻轉梅爾頻率倒譜系數的說話人識別方法[J].計算機應用, 2012,32(09):2542-2545.

HU Feng-song,ZHANG Xuan.Speaker Recognition Method based on Mel-Frequency Cepstrum Coefficient and Inverted Mel-Frequency Cepstrum Coefficient[J].Journal of-Computer Applications,2012,32(9):2542-2544.

[7] 鮮曉東,樊宇星.基于Fisher比的梅爾倒譜系數混合特征提取方法[J].計算機應用,2014,34(02):558-561.

XIAN Xiao-dong,FAN Yu-xing.Parameter Extraction Method for Mel-Frequency Cep-stralCoefficients based on Fisher Criterion[J].Journal of Computer Applications, 2014,34(2):558-561.

[8] YANG Hai-Yan,JING Xin-Xing.Perfor-mance Test of Parameters for Speaker Recognition System based on SVM -VQ[C]//2012 International Conference on Machine Learning and Cybernetic-s(ICMLC),Xian:IEEE,2012: 321-325.

黃 銳(1990—),男,碩士,主要研究方向為語音識別;

HUANG Rui(1990-),male,M.Sci.,majoring in voice recognition.

陸安江(1978—),男,博士研究生,講師,主要研究方向為傳感器技術;

LU An-jiang(1978-),male,doctoral postgraduate,majoring in sensor technology.

張正平(1964—),男,博士生導師,教授,主要研究方向為通信新技術。

ZHANG Zheng-ping(1978-),male,doctoral tutor,majoring in the new technology of communication.

A M odified M ixture Feature Param eter Extraction
M ethod of M el-Frequency Filter

HUANG Rui,LU An-jiang,ZHANG Zheng-ping
(School of Big Data and Information Engineering,Guizhou University,Guiyang Guizhou 550025,China)

The nonuniform distribution ofmel-filterbank structure in speaker recognition,that is,too intensive in low frequency region while too sparse in high frequency andmid-frequency region,would affect the extraction of MFCC in mid-frequency and high frequency.In light of this,the paper proposes amethod to extract the twomixed feature parameters by combining Mel-filterbank and MidMel-filterbank,thismethod applicable to speaker recognition system could improve the accuracy ofmedium and high frequency feature parameters extraction and thus upgrade the system recognition rate.Experimental results indicate that the recognition rate and recognition performance of the novelmixed parameters is superior to that of traditional characteristic parameters,and moreover,with less computational complexity.

speaker recognition;Mel-filterbank;MidMel-filterbank;Mel-frequency Cepstral Coefficient(MFCC)

TN912.34

A

1002-0802(2014)12-1388-04

10.3969/j.issn.1002-0802.2014.12.009

2014-09-22;

2014-10-22 Received date:2014-09-22;Revised date:2014-10-22

貴州省社發攻關項目(黔科合SY字[2013]3105號)

Foundation Item:The Social Development Project in Guizhou Province(Guizhou Province SY[2013]3105)

主站蜘蛛池模板: 国产国语一级毛片| 欧美亚洲香蕉| 99热这里只有精品久久免费| 亚洲无码熟妇人妻AV在线| 一本色道久久88| 中文字幕佐山爱一区二区免费| 久久久91人妻无码精品蜜桃HD| 在线日韩日本国产亚洲| 日韩一区二区三免费高清| 国产免费久久精品44| 国产日韩欧美成人| 97视频在线精品国自产拍| 久久亚洲精少妇毛片午夜无码| 免费看久久精品99| 国产亚洲精| 网友自拍视频精品区| 国产精品吹潮在线观看中文 | 中文字幕无码电影| 欧美a级在线| 国产毛片不卡| 久久精品娱乐亚洲领先| 国产理论一区| av天堂最新版在线| 欧美国产日韩另类| 香蕉久人久人青草青草| 欧美精品一二三区| a色毛片免费视频| 毛片手机在线看| 一区二区午夜| 人人艹人人爽| 久久精品人人做人人爽| 99在线观看视频免费| 欧美亚洲综合免费精品高清在线观看| 色婷婷成人网| 欧美日韩专区| 国产精品高清国产三级囯产AV| 99久久精品免费看国产免费软件| 青草国产在线视频| 麻豆精品视频在线原创| 亚洲成av人无码综合在线观看| 国产成人精品视频一区二区电影| 国产一区二区三区免费观看| 日韩中文精品亚洲第三区| 美女毛片在线| 亚洲视屏在线观看| 免费一级α片在线观看| 国产青青操| 人妖无码第一页| 精品无码视频在线观看| 亚洲永久视频| 亚洲国产精品日韩欧美一区| www.精品国产| 强奷白丝美女在线观看| 欧美日本在线一区二区三区| 一本大道AV人久久综合| 亚洲日本中文综合在线| 韩日无码在线不卡| 97久久免费视频| 免费va国产在线观看| 国产成人AV综合久久| 国产喷水视频| 国产成人精品一区二区免费看京| 国产视频欧美| 麻豆精品在线播放| 国产激爽大片在线播放| 人妻91无码色偷偷色噜噜噜| 欧美在线天堂| 亚洲国产精品一区二区高清无码久久| 国产91导航| 欧美黑人欧美精品刺激| 国产人成在线视频| 亚洲欧洲日韩久久狠狠爱| 国产成人福利在线| 亚洲香蕉久久| 国产成人无码AV在线播放动漫 | 亚洲成人www| 国产在线观看第二页| 国产精品55夜色66夜色| 制服丝袜无码每日更新| 22sihu国产精品视频影视资讯| 香蕉网久久| 91探花国产综合在线精品|