999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Mel頻率倒譜系數(shù)的說話人識別研究

2016-06-06 05:37:03朱宇軒
西部皮革 2016年10期
關(guān)鍵詞:特征

朱宇軒

(西華大學(xué),四川 成都 610039)

?

基于Mel頻率倒譜系數(shù)的說話人識別研究

朱宇軒

(西華大學(xué),四川 成都 610039)

摘要:由于人耳對聲音頻率的感知不是線性的,通過短時傅里葉變化得到的語音信號短時譜是按實(shí)際語音頻率分布的,但符合人耳聽覺特性的頻率分布是按照臨界頻帶分布的。因此按實(shí)際頻率分布的頻譜作為語音特征時,由于它不符合人耳的聽覺特性,將會降低說話人識別系統(tǒng)的識別性能。

關(guān)鍵詞:頻率倒譜;語音特征

1Mel頻率倒譜系數(shù)(MFCC)

MFCC是在頻譜上采用濾波器組的方法計算出來的,將語音頻率劃分成一系列的三角形濾波器序列,這組濾波器在頻率的坐標(biāo)上是等寬的。這是因?yàn)槿祟愒趯?000Hz以下的聲音頻率范圍的感知遵循近似線性的關(guān)系;對1000Hz以上的語音頻率范圍的感知不遵循線性關(guān)系,而是遵循在對數(shù)頻率坐標(biāo)上的近似線性關(guān)系。

Mel頻率倒譜系數(shù)(MFCC)是使用傅立葉分析提取的語音特征參數(shù),是類似于指數(shù)的形式,Mel頻率可以用如下公式表示:

Mel(f)=2595lg(1+f/700)

(1)

式中:f是以Hz為單位的實(shí)際頻率。對頻率軸的不均勻劃分是MFCC特征區(qū)別于普通倒譜特征的最重要的特點(diǎn)。語音頻率與Mel頻率的對應(yīng)關(guān)系如圖1所示。

2頻率倒譜系數(shù)計算

根據(jù)Zwicker的工作,Mel頻率的增長是與臨界帶寬的變化保持一致的,以Mel為單位的頻率刻度劃分與臨界帶寬在細(xì)節(jié)上并不精確相等,但這個差別是很小的。

(1)將信號進(jìn)行分幀,預(yù)加重和加漢明窗處理,然后進(jìn)行短時傅里葉變換并得到其頻譜。

(2)求出頻譜平方,即能量譜,并用M個Mel帶通濾波器進(jìn)行濾波;由于每一個頻帶中分量的作用在人耳中是疊加的,因此將每個濾波器頻帶內(nèi)的能量進(jìn)行疊加,這時第k個濾波器的輸出功率譜x′(k)。

(3)將每個濾波器的輸出取對數(shù),得到相應(yīng)頻帶的對數(shù)功率譜;并進(jìn)行反離散余弦變換,得到L個MFCC系數(shù),一般L取12~16個左右。得到MFCC系數(shù)為

(2)

它將頻譜轉(zhuǎn)化為基于頻率的非線性頻譜,然而轉(zhuǎn)換到頻譜域上,由于充分考慮了人耳的聽覺特性,在一定程度上模擬了人耳對語音的處理特點(diǎn),而且沒有任何提前假設(shè),MFCC 參數(shù)具有良好的識別性能和抗噪能力,在信道噪聲和頻譜失真的情況下具有較好的穩(wěn)健性。但是計算量和計算精度要求較高。

3MFCC中的能量信息和動態(tài)參數(shù)

短時能量是說話人識別中一個重要的參數(shù),由于短時能量對系統(tǒng)的識別性別有一定的提升作用,因此可以在說話人語音特征中加入能量參數(shù)作為特征向量的一維分量。

假定語音段中長度為N的一幀{si(n),n=1,2,…,N},計算該幀的短時對數(shù)能量的公式如下:

(3)

為了減小不同語音段不同語音幀的能量差別,使其能夠與前面的倒譜特征系數(shù)一起作為向量計算,需對其進(jìn)行歸一化處理。

(4)

前面計算得到的MFCC倒譜系數(shù)為語音信號的靜態(tài)特征參數(shù),它只表征了語音譜的即時信息。研究發(fā)現(xiàn),語音倒譜的動態(tài)信息包含了與說話人有關(guān)的信息,可以將其用于提高說話人識別系統(tǒng)的識別率。

語音信號的倒譜動態(tài)信息表示了語音特征參數(shù)隨時間變化的規(guī)律。語音倒譜特征隨時間的變化規(guī)律可由下式表示:

(5)

4總結(jié)

在實(shí)際的應(yīng)用中窗函數(shù)h(k)一般采用矩形窗,k為常數(shù),一般取2,這樣的動態(tài)參數(shù)就是當(dāng)前幀的前兩幀和后兩幀的線性結(jié)合。用同樣的方法對一階動態(tài)參數(shù)進(jìn)行計算就得到了二階MFCC參數(shù)。在得到倒譜系數(shù)的動態(tài)信息后,一般的做法是將原始特征與動態(tài)特征參數(shù)結(jié)合,組成高維特征矢量作為訓(xùn)練和識別的一幀語音信號特征參數(shù)。實(shí)驗(yàn)表明,使用MFCC及其一階和二階差分參數(shù)作為特征可顯著提高說話人識別系統(tǒng)的性能,它在一定程度上模擬了人耳對語音的處理特點(diǎn),并具有一定的抗噪性能,進(jìn)一步地表示了說話人語音背后的隱性個性差異。

參考文獻(xiàn):

[1]徐波.語音識別技術(shù)與應(yīng)用的發(fā)展趨勢.中國計算機(jī)學(xué)會,2008,2:54~57.

[2]李霄寒.基于概率統(tǒng)計模型的說話人確認(rèn)的研究[D].中國科學(xué)技術(shù)大學(xué),2003.

[3]韓紀(jì)慶,張磊,鄭鐵然.語音信號處理[M].北京:清華大學(xué)出版社,2004,10~50.

作者簡介:朱宇軒,男,漢族,四川南充,工人,大學(xué)本科,西華大學(xué),研究方向:電子、計算機(jī)。

中圖分類號:TN912

文獻(xiàn)標(biāo)志碼:A

文章編號:1671-1602(2016)10-0014-01

猜你喜歡
特征
抓住特征巧觀察
離散型隨機(jī)變量的分布列與數(shù)字特征
具有兩個P’維非線性不可約特征標(biāo)的非可解群
月震特征及與地震的對比
如何表達(dá)“特征”
被k(2≤k≤16)整除的正整數(shù)的特征
不忠誠的四個特征
詈語的文化蘊(yùn)含與現(xiàn)代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 亚洲男女天堂| 永久免费AⅤ无码网站在线观看| 国产亚洲视频中文字幕视频| 亚洲成人黄色在线| 亚洲欧美激情小说另类| 亚洲中文精品久久久久久不卡| 久久综合丝袜长腿丝袜| 爆乳熟妇一区二区三区| 精品国产香蕉伊思人在线| 国产精品xxx| 毛片最新网址| 精品久久综合1区2区3区激情| 五月综合色婷婷| 中文字幕无码电影| 国产91成人| 亚洲成在人线av品善网好看| 国产91高清视频| 精品福利视频导航| 欧美人在线一区二区三区| 92午夜福利影院一区二区三区| 波多野结衣视频网站| 伊人久久精品无码麻豆精品| 婷婷午夜影院| 国产成人永久免费视频| 热久久综合这里只有精品电影| 一区二区自拍| 国产剧情伊人| 福利在线不卡一区| 亚洲码一区二区三区| 97视频在线观看免费视频| 国产免费黄| 91精品aⅴ无码中文字字幕蜜桃 | 国产91色在线| 伊人久久久久久久| 日本一区二区不卡视频| 亚洲男人天堂2018| 小说区 亚洲 自拍 另类| 91在线一9|永久视频在线| 国产又色又爽又黄| 亚洲免费播放| 久久久久国产精品免费免费不卡| 国产成人综合亚洲欧洲色就色| 91青青在线视频| 成人国产小视频| 毛片久久久| 国产欧美日韩在线在线不卡视频| 999国内精品久久免费视频| 国产精品欧美在线观看| 久久久久久久蜜桃| a级毛片免费看| 欧美一区二区三区国产精品| 国产美女久久久久不卡| 亚洲无码日韩一区| 久久国产高清视频| 91久久性奴调教国产免费| 国产av无码日韩av无码网站| 无码'专区第一页| av性天堂网| 第一区免费在线观看| 97在线公开视频| 亚洲国产一成久久精品国产成人综合| 亚洲欧洲自拍拍偷午夜色| 成人在线不卡视频| 91伊人国产| a毛片在线| 亚洲国产91人成在线| 国产一级无码不卡视频| 香蕉精品在线| 婷婷在线网站| 久久国产亚洲欧美日韩精品| 国产无码性爱一区二区三区| 国产精品专区第1页| 久久窝窝国产精品午夜看片| 日本高清免费不卡视频| 91系列在线观看| 天天综合色网| 小说区 亚洲 自拍 另类| 亚洲一区毛片| 日韩午夜片| 少妇精品在线| 91系列在线观看| 伊人久热这里只有精品视频99|