999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GMM的說話人識別系統(tǒng)設(shè)計與實現(xiàn)

2014-08-07 12:08:20滕廣超林嘉宇
微處理機 2014年3期
關(guān)鍵詞:特征實驗模型

劉 冰,滕廣超,林嘉宇

(1.國防科學(xué)技術(shù)大學(xué)電子科學(xué)與工程學(xué)院,長沙410073;2.武警湖南省總隊湘潭市支隊,湘潭411104;3.武警黃金一總隊通信科,哈爾濱150086)

基于GMM的說話人識別系統(tǒng)設(shè)計與實現(xiàn)

劉 冰1,2,滕廣超1,3,林嘉宇1

(1.國防科學(xué)技術(shù)大學(xué)電子科學(xué)與工程學(xué)院,長沙410073;2.武警湖南省總隊湘潭市支隊,湘潭411104;3.武警黃金一總隊通信科,哈爾濱150086)

現(xiàn)代通信中,說話人的身份認證技術(shù)一直是通信行業(yè)研究的重點和熱點。而基于GMM和MFCC的說話人識別技術(shù),是目前為止相對成熟和常用的方法。對說話人識別系統(tǒng)的構(gòu)成做了相關(guān)的研究,并通過MATLAB編程,設(shè)計了一款以MFCC作為特征參數(shù),基于GMM模型的說話人識別系統(tǒng)。經(jīng)過實驗測試,本系統(tǒng)能基本滿足工作及家庭生活環(huán)境下的說話人識別需要。

說話人識別;Mel倒譜系數(shù);混合高斯模型

1 引 言

說話人識別(Speaker Recognition)[1],也稱聲紋識別(Voiceprint Recognition),是一種利用說話人的語音特征與預(yù)先提取的說話人的語音特征相比較,進而確認和鑒別說話人身份的技術(shù)。說話人識別技術(shù)的研究始于二戰(zhàn)時期美國的Bell實驗室,經(jīng)過幾十年的研究和發(fā)展,說話人識別技術(shù)取得了突飛猛進的發(fā)展。特別是1995年,Reynolds[2]對高斯混合模型(Gaussian Mixture Model,GMM)[3-4]進行了詳細介紹和應(yīng)用,其簡單、實用、高效的特點,使之成為說話人識別模式匹配過程中的重要技術(shù)。說話人識別可分為說話人確認(Speaker Verification)和說話人鑒別(Speaker Identification)兩類。

2 說話人識別系統(tǒng)原理

說話人識別系統(tǒng)一般由訓(xùn)練模塊和識別模塊組成。其原理如圖1所示。

圖1 說話人識別系統(tǒng)原理框圖

2.1 說話人識別系統(tǒng)預(yù)處理

說話人識別系統(tǒng)的預(yù)處理過程一般可分為:采樣與量化、預(yù)加重處理、加窗和端點檢測。

語音信號經(jīng)過采樣和量化之后,信號由模擬轉(zhuǎn)為了數(shù)字信號。為便于頻譜分析或聲道參數(shù)分析,需要對信號進行預(yù)加重。預(yù)加重可以用一階數(shù)字濾波器來表示:

其中μ為預(yù)加重系數(shù),取值為0.9375。

根據(jù)語音信號在10ms到20ms內(nèi)近似不變的假設(shè),可以將語音信號分成一些短的段進行處理,即分幀。分幀后進行加窗,采用漢明窗函數(shù)。

端點檢測(VAD)方面,采用的是短時能量與短時過零率相結(jié)合的方法,由此判斷語音信號的起始點位置。短時能量可用來區(qū)分清音段和濁音段,有聲段和無聲段。短時過零率則表示一幀語音中語音信號波形經(jīng)過零電平的次數(shù)。由于短時過零率對噪聲非常敏感,很容易產(chǎn)生虛假過零,故我們對其進行了改進。設(shè)立一個門限T,將過零率的定義改進為越過±T的次數(shù)。即

經(jīng)過改進后,短時過零率有了較強的抗干擾能力,同時在進行說話人識別端點檢測時,可以設(shè)立多個門限,進一步提高檢測精度。

2.2 MFCC特征提取

Mel頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC)[5-6]是一種基于梅爾尺度的頻域倒譜參數(shù)。MFCC運用Mel頻率刻度對實際頻率軸進行彎折來模擬人耳所聽到的聲音高低和聲音頻率之間的非線性關(guān)系,因而在說話人識別中得到了極為廣泛的應(yīng)用。系統(tǒng)中MFCC參數(shù)提取的流程是:

(1)對語音信號進行預(yù)處理,其中語音采集頻率8000Hz、16-bit、Mono,幀長為20ms,幀移為10ms;

(2)快速傅里葉變換(FFT):使用基2的離散傅里葉變換,將時域能量轉(zhuǎn)換為頻域能量;

(3)Mel能量:通過40個Mel濾波器組,得到40維的Mel頻子帶能量;

(4)Mel對數(shù)能量:對每個MEL頻子帶能量取對數(shù),mel(i)=ln[filt(i)];

(5)離散余弦變換:

其中D=13,mfcc(n)即為原始的mfcc特征;

(6)一階二階差分:在原有13維mfcc特征的后面加入13維的一階和二階差分構(gòu)成39維的特征。可通過一個長度為5的窗函數(shù)來求,從而使得這種靜態(tài)特征得到相應(yīng)的動態(tài)特征。通過實驗表明,這種39維的動態(tài)特征能夠很好的提高系統(tǒng)識別性能。

2.3 基于GMM混合高斯模型的模式匹配

混合高斯模型對不同說話人語音的短時譜特征矢量所具有的概率密度函數(shù)進行建模。通過對這些特征矢量進行聚類,并看做是一個多維的高斯分布函數(shù),然后求出每一類的均值、協(xié)方差矩陣和出現(xiàn)的概率,作為每個說話人的模板。最后把觀測序列代入模板,進行模式匹配,找到最大后驗概率,即對應(yīng)識別的人。

M階GMM概率密度函數(shù)如下:

其中s為語音的特征矢量,M為高斯混合模型中分量的個數(shù),αj為混合權(quán)值;P(s|λ)表示s屬于λ模型的概率。其中等j個混合高斯概率密度函數(shù)可表示為P(s):

其中μj為均值向量,Rj為協(xié)方差矩陣。一個完整的混合高斯模型是由參數(shù)混合權(quán)重、均值向量和協(xié)方差矩陣組成,可表示為:

系統(tǒng)中的模式匹配即所有參考說話人構(gòu)成的一個集合,識別判斷目標說話人與集合中的哪一個說話人相匹配。其目的就是找到目標說話人與集合中模型的最大輸出匹配概率,使得待識別語音特征矢量組X具有最大后驗概率P(λi|X)。

由Bayes理論,最大后驗概率可表示為

3 說話人識別系統(tǒng)軟件開發(fā)

3.1 系統(tǒng)設(shè)置與數(shù)據(jù)庫

實驗主要是在PC機平臺上,采用MATLAB 7.0編程語音完成的。系統(tǒng)以有源型麥克風(fēng)作為錄制語音的輸入工具,運用CoolEdit ProV2.1對錄入后的語音進行處理。

實驗數(shù)據(jù)來自實驗室環(huán)境下的采集。語音庫中包含了30個說話人(15男,15女),年齡范圍在10歲至40歲之間,共進行300次說話人識別測試。實驗所用的主要參數(shù)如表1所示。

表1 實驗主要參數(shù)列表

3.2 系統(tǒng)功能設(shè)計

該說話人識別系統(tǒng)具有以下功能:

(1)能較準確的識別待驗證人是否為合法用戶;

(2)可實現(xiàn)語音波形的顯示;

(3)可訓(xùn)練說話人語音,增加訓(xùn)練樣本庫;

(4)可較準確的識別待驗證人的身份信息。

3.3 系統(tǒng)基本結(jié)構(gòu)

說話人識別系統(tǒng)主要分為兩個部分:訓(xùn)練過程和識別過程。

在訓(xùn)練階段,首先讀取訓(xùn)練對象的若干語音文件作為訓(xùn)練語句,然后對這些訓(xùn)練語句進行端點檢測、預(yù)加重、MFCC特征參數(shù)提取,最后為訓(xùn)練對象建立各自的語音特征參數(shù)模型。

在識別階段,首先將事先錄制的語音文件作為測試語句在系統(tǒng)中讀取,然后系統(tǒng)對這些測試語句的特征參數(shù)進行提取,然后將這些參數(shù)與系統(tǒng)內(nèi)部建立的各個語音模型進行特征參數(shù)相似度計算,最終得到識別結(jié)果。

3.4 系統(tǒng)性能評估

一個說話人識別系統(tǒng)的好壞主要由正確識別率、訓(xùn)練時間長短、識別時間長短、語音環(huán)境變化等元素進行反映。一般來說,一個好的說話人識別系統(tǒng),應(yīng)該具備較高的正確識別率,較短的訓(xùn)練時間,較短的識別時間,能適應(yīng)多種語音環(huán)境等特點。

為了測試系統(tǒng)性能,系統(tǒng)使用了39維差分MFCC特征參數(shù)進行了小數(shù)據(jù)庫文本的說話人識別實驗,參與實驗的共有30人(15男,15女)。在錄入訓(xùn)練樣本時,每人錄入4句文字和2句數(shù)字,共錄兩次,累積時長為1分鐘,建模時間約為30s。測試時,每人再錄入1句文字和1句數(shù)字,共錄兩次,累積時長為20s。在測試過程中,將每人的測試語音分別截取成1s、2s、4s、8s、10s的語音段,用來測試不同時長的測試語音對于系統(tǒng)正確識別率的影響。實驗結(jié)果如表2所示。

表2 在不同測試時間長度下識別準確率和識別時間

4 結(jié)束語

通過測試可知,在訓(xùn)練樣本時間相對一致的情況下,測試樣本時間越長,識別的準確度越高,完成識別所用時間越長;其參數(shù)提取采用39維差分MFCC方法能有效提高說話人識別系統(tǒng)性能。實驗結(jié)果表明,設(shè)計的說話人識別系統(tǒng)具有較高的識別率和較短的識別時間,能基本滿足辦公室、家居環(huán)境下較少用戶的說話人識別需要。

[1]吳朝暉,楊瑩春.說話人識別模型與方法[M].北京:清華大學(xué)出版社,2009.

[2]D A Reynolds,Thomas F.Quatier and Robert B.Dram.Speaker verification using adapted Gaussian Mixture Models[J].Digital Singal Processing 10,Academic Press.2000:19-24.

[3]蔣偉,范明鈺.基于高斯混合模型的說話人識別研究[D].成都.電子科技大學(xué),2005.

[4]D A Reynolds,Campbell W,Gleason T T.The 2004 MIT Lincoln laboratory speaker recognition system[A].In Processdings of ICASSP[C],Philadel Phia,USA,2008.

[5]何朝霞,潘平.說話人識別中改進的MFCC參數(shù)提取方法[J].科學(xué)技術(shù)與工程,2011,11(18):4215-4218.

[6]王剛,鄧方.電話信道下應(yīng)用DMFCC進行說話人識別[J].清華大學(xué)學(xué)報,2009,49(10):1597-1600.

Design and Im plementation of Speaker Identification System Based on GMM

LIU Bing1,2,TENG Guang-chao1,3,LIN Jia-yu1
(1.Shool of Electronic Science and Engineering,National Defense Technology University,Changsha 410073,China;2.Xiangtan City Team,The Armed Police Corps of Hunan,Xiangtan 411104,China;3.Communications Department,Gold Corp I,The Armed Police,Harbin 150086,China)

In modern communication,the technology of the speaker's ID authentication is the focus of research and hotspots in communications industry.At present,the speaker identification technology,based on GMM and MFCC,is usable and poplar.In this paper,the composition of speaker identification system is researched and a system which uses Mel frequency cepstral coefficients(MFCC)as feature parameter and GMM for speakermodel is designed by Matlab.The test results show that the system can generallymeet the requirements of identification for work and life.

Speaker Recognition;MFCC;GMM

10.3969/j.issn.1002-2279.2014.03.018

TP391.4

:A

:1002-2279(2014)03-0063-03

劉冰(1985-),男,湖南省湘鄉(xiāng)市人,工程碩士,主研方向:語音信號處理,說話人識別。

2013-10-30

猜你喜歡
特征實驗模型
一半模型
記一次有趣的實驗
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
如何表達“特征”
做個怪怪長實驗
不忠誠的四個特征
抓住特征巧觀察
3D打印中的模型分割與打包
NO與NO2相互轉(zhuǎn)化實驗的改進
主站蜘蛛池模板: 亚洲人成网7777777国产| 尤物在线观看乱码| 亚洲三级电影在线播放 | 精品视频一区二区观看| 99re视频在线| 日韩专区欧美| 亚洲精品成人片在线播放| 成人永久免费A∨一级在线播放| 丁香亚洲综合五月天婷婷| av在线手机播放| 91外围女在线观看| 午夜福利在线观看入口| 亚洲国产成熟视频在线多多| 夜夜爽免费视频| 真人免费一级毛片一区二区| 亚洲天堂网在线观看视频| 国产一级片网址| 福利视频一区| 超碰精品无码一区二区| 狠狠色丁香婷婷| 天天做天天爱夜夜爽毛片毛片| 麻豆国产原创视频在线播放 | 波多野结衣视频网站| 国产精品视频猛进猛出| 亚洲欧美精品一中文字幕| 日韩欧美国产成人| 狠狠做深爱婷婷综合一区| 99色亚洲国产精品11p| 国内精品视频区在线2021| 成人福利在线看| 午夜精品福利影院| 伊人久久大香线蕉成人综合网| 亚洲69视频| 色婷婷成人| 亚洲高清中文字幕| 超清人妻系列无码专区| 久久无码av三级| 亚洲色成人www在线观看| 国产无码精品在线播放| 国产白浆视频| 欧美色视频日本| 欧美一道本| 色国产视频| 久久久久国产精品熟女影院| 国产99视频在线| 亚洲首页在线观看| 情侣午夜国产在线一区无码| 成年av福利永久免费观看| 99re这里只有国产中文精品国产精品| 免费看久久精品99| 人妻出轨无码中文一区二区| 国产女人在线| a欧美在线| 国产青榴视频在线观看网站| 欧美一级色视频| 国产精品成人不卡在线观看| 国内毛片视频| 人妻丰满熟妇αv无码| 国产黄网永久免费| 久久永久视频| 99精品久久精品| a天堂视频| 在线无码av一区二区三区| 亚洲人成网站在线观看播放不卡| 亚洲有无码中文网| 波多野结衣中文字幕一区二区| 亚洲国产一成久久精品国产成人综合| 亚洲欧洲自拍拍偷午夜色| 波多野结衣久久高清免费| 欧美精品v日韩精品v国产精品| 免费观看精品视频999| 亚洲视频四区| 久久99热66这里只有精品一| 国产性生大片免费观看性欧美| 69国产精品视频免费| 九九九精品成人免费视频7| jijzzizz老师出水喷水喷出| 日韩色图区| www精品久久| 国产极品美女在线播放| 久夜色精品国产噜噜| 国产v精品成人免费视频71pao|