999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Mel系數的特征參數在模仿語音中的應用研究

2014-10-21 20:04:55韋國剛周萍
電子世界 2014年6期

韋國剛 周萍

【摘要】模仿者蓄意模仿說話人的語音,當相似度較高時,說話人識別系統就有可能被模仿者欺騙。語音特征參數作為說話人識別系統的關鍵組成部分,直接影響系統的性能。Mel系數是語音識別領域最成熟的特征參數之一,但是,MFCC特征參數在語音識別中對中、高頻段的識別精度較低。為了解決上述問題,融合Mid-MFCC和IMFCC,采用增減分量法,提出了MMI-MFCC特征參數。實驗結果表明,新的MMI-MFCC特征參數比傳統的MFCC特征參數更有效的區分模仿語音的相似度。

【關鍵詞】模仿語音;Mel系數;增減分量法;相似度

1.Mel及其相關特征參數

1.1 MFCC特征特征參數

作為一種能夠較好模擬人耳對聲音信號的特殊感知特性的特征,Mel頻率倒譜參數(MFCC)近年來被廣泛應用在語音識別領域,1Mel的意義對應為1000Hz音頻感知程度的1/1000。經研究,Steven B.Davis建立了符合人類聽覺特性Mel頻率,與實際頻率之間的對應關系如下:

(1)

公式(1)中,Mel頻率的單位是Mel,將語音信號頻率劃分成一個三角濾波器組——Mel濾波器組[1]。Mel尺度濾波器組各個濾波器在Hz頻率坐標軸上并非等距的,但在Mel頻率坐標軸上是等距的,各濾波器之間交叉重疊。用式(2)對Mel濾波器進行計算:

(2)

公式(2)中,M為濾波器組中濾波器的個數,一般。

MFCC參數[1][2]的算法流程圖如圖1所示,Mel濾波器組的作用主要在于將語音信號從Hz頻域空間映射到人耳感知的Mel頻域空間,使濾波器的空間尺度與人的聽覺感知尺度更加相近。

圖1 MFCC的提取流程圖

1.2 改進的Mel頻率倒譜系數

Sandipan在MFCC參數的基礎上,通過改變Hz-Mel頻率直接的非線性對應關系,研究設計出一種與Mel濾波器完全相反的I-Mel濾波器,提出了逆Mel頻率倒譜參數(IMFCC)。I-Mel濾波器組的濾波器在低頻段分布較為稀疏,而集中分布在高頻段,從而使得IMFCC在高頻段具有較強的頻譜信息。IMFCC的Hz-Mel頻率的對應關系為:

(3)

IMFCC的Hz-Mel頻率對應關系及I-Mel頻率濾波器的分布如圖2所示:

圖2 IMFCC頻率對數關系及I-Mel濾波器組

圖3 Mid-Mel頻率對數關系及I-Mel濾波器組

MFCC和IMFCC分別解決了低頻段和高頻度段的計算精度問題,可是中頻段的計算精度仍然不夠理想。為了解決上述問題,經研究設計出了一種在中頻段分布密集的Mid-Mel濾波器組。Mid-MFCC頻率倒譜參數[5]參考MFCC和IMFCC的Hz-Mel頻率對應關系,在0~2000Hz頻率段相似于IMFCC的高頻段,在2000~4000Hz頻率段相似于MFCC的低頻段,從而得到了Mid-Mel的Hz-Mel頻率對應關系,Mid-MFCC的Hz-Mel頻率對應關系及Mid-Mel頻率濾波器組分布如圖3所示。可以看出,IMFCC和Mid-MFCC的提取過程與MFCC,基本相同只需要改變濾波器組的響應函數即可。

2.混合特征參數

2.1 增減分量法

增減分量法是一種計算各階倒譜分量平均貢獻(相對重要性)的有效方法,具體計算公式如下:

(4)

公式(5)中,R(i)表示第i階倒譜分類的平均貢獻值,n為倒譜階數,p(i,j)是從第i階到第j階倒譜系數特征的識別率。若求出一個特征的平均貢獻值R(i)為正值,則說明添加該特征會提高識別率,反之,則說明添加該特征會降低識別率。本文中僅順序添加或社區特征分量,所以R(i)僅代表該分類的相對重要性,而不能依次衡量各分量之間的依賴關系。

2.2 MMI-MFCC混合特征參數

為了提高MFCC在中、高頻段的語音識別分辨率,根據增減分量法原理,求出MFCC、Mid-MFCC和IMFCC三種特征參數對識別率貢獻最大的n階倒譜系數后,再在它們組合到一起,便得到了新的混合MFCC,本文定義為MMI-MFCC。其參數的提取過程如圖4所示。

圖4 H-MFCC的提取流程圖

3.實驗結果和分析

模仿語音庫是研究模仿語音說話人識別的關鍵問題之一,它的質量直接影響實驗研究的意義。一些專業配音網站,從事各類題材的配音,他們擁有很多優秀的專業配音員,在配音工作室有他們專業的錄音棚,擁有模仿者和被模仿者的語音材料,采用頻率為8kHz,量化精度為16bit。

提取16階的MFCC參數,并計算其Mid-MFCC和IMFCC特征參數,根據增減分量法原理,選取16階的MMI-MFCC混合特征參數,用歐氏距離計算原語音與模仿語音的MMI-MFCC差異,然后對MMI-MFCC的歐氏距離從小到大進行排序提取16階的MFCC參數,用歐氏距離計算原語音與模仿語音的MFCC差異,然后對MFCC的歐氏距離從小到大進行排序。將16階MFCC和MMI-MFCC的歐氏距離進行及相似度排名對比,見表1所示。

通過表1可以看出,模仿者與被模仿者之間,混合特征參數MMI-MFCC歐氏距離遠大于MFCC的,這說明混合參數MMI-MFCC區分模仿者與被模仿者的性能得到了明顯的提高;歐氏距離排名與模仿相似度排名中,混合特征參數MMI-MFCC最相似,有約85.71%的模仿者的排名是一致,MFCC最差(僅約57.14%排名一致),這說明混合特征參數MMI-MFCC對于描述語言模仿相似程度的能量最好。

4.結束語

MFCC較好地模擬人耳對聲音信號的特殊感知特性的特征,針對MFCC中、高頻段識別精度不高的問題,融合Mid-MFCC和IMFCC,提出了混合特征參數MMI-MFCC,并采用增減分量法很好地控制了它們的計算時間復雜度和空間復雜度。對于辨別模仿語音,新的混合特征參數具有更好的性能。

參考文獻

[1]郭春霞.基于MFCC的說話人識別系統研究[D].西安:西安電子科技大學,2006.

[2]張晶,范明,馮文全等.基于MFCC參數的說話人特征提取算法的改進[J].電聲技術,2009,33(9):61-69.

主站蜘蛛池模板: 亚洲天堂伊人| 亚洲精品片911| 无码视频国产精品一区二区| 国产区免费| 久热这里只有精品6| 鲁鲁鲁爽爽爽在线视频观看| 久久免费视频播放| 久久精品娱乐亚洲领先| 亚洲男人的天堂久久香蕉网| 一级一级特黄女人精品毛片| 一本综合久久| 国产男人的天堂| 国产乱论视频| 国产色偷丝袜婷婷无码麻豆制服| 国产精品美女网站| 孕妇高潮太爽了在线观看免费| 国产精品部在线观看| 高清免费毛片| 男人天堂伊人网| 日韩国产另类| 香蕉久久国产超碰青草| 亚洲第一精品福利| 久久中文字幕2021精品| 国产成人精品一区二区| 亚洲欧美精品一中文字幕| 欧美在线中文字幕| 无码aaa视频| 国产欧美视频在线| 日本黄色不卡视频| 美女内射视频WWW网站午夜 | 老色鬼欧美精品| 亚洲人成在线精品| 亚洲第一极品精品无码| 国产成人精品无码一区二| 国产男女XX00免费观看| 一区二区三区高清视频国产女人| 中文精品久久久久国产网址 | 久久久久人妻一区精品| 久久77777| 亚洲男人天堂久久| 国产精品一区不卡| 丝袜亚洲综合| 国产麻豆精品手机在线观看| 老司国产精品视频91| 激情五月婷婷综合网| 亚洲成人www| 亚洲一区波多野结衣二区三区| 青草国产在线视频| 国产女人喷水视频| 免费无码网站| 欧美亚洲日韩中文| 2020精品极品国产色在线观看| 国内自拍久第一页| 国产亚洲男人的天堂在线观看| 又粗又硬又大又爽免费视频播放| 波多野结衣在线一区二区| 国产成人精品2021欧美日韩| 亚洲视频免费在线| 亚洲欧美成人综合| 欧美福利在线| 亚洲大学生视频在线播放| 国产激爽大片高清在线观看| 国内精品久久久久鸭| 亚洲精品自拍区在线观看| 中国国产高清免费AV片| 国产精品人人做人人爽人人添| 日韩A级毛片一区二区三区| 国产91麻豆免费观看| 伊人国产无码高清视频| 国产精品自在自线免费观看| 91久久国产综合精品| 经典三级久久| 成人年鲁鲁在线观看视频| 91精品视频在线播放| 国产在线精彩视频二区| 正在播放久久| 麻豆精品在线| 91精品啪在线观看国产91九色| 毛片一级在线| 亚洲色偷偷偷鲁综合| 日韩AV无码免费一二三区| 伊人激情综合网|