999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于耳蝸倒譜系數的說話人識別

2020-04-23 01:22:32曾金芳徐文濤黃費貞
電子技術與軟件工程 2020年5期
關鍵詞:特征提取實驗

曾金芳 徐文濤 黃費貞

(湘潭大學物理與光電工程學院 湖南省湘潭市 411105)

說話人識別又叫聲紋識別。說話人識別技術以其獨特的方便性、經濟性、準確性受到 了世人的矚目,被廣泛應用到信息安全領域、通信領域、司法領域和軍事領域[1]。說話人識別就是從說話人的一段語音中提取出說話人的個性特征,通過對這些個性特征的分析和識別,從而達到對說話人進行辨認的目的[2]。這些個性特征就是說話人識別重點研究的內容。

聲學特征主要有:線性預測系數(Lin- ear prediction cepstral coefficient, LPC C)、梅爾倒譜系數( Mel frequency cepstral coefficient, MFCC)[3]以及耳蝸倒譜系數(Cochlear filter cepstral coeffi- cients, CFCC)[4]等。最常用的MFCC 是根據人耳結構設計的三角濾波器組進行特征提取的,但在噪聲情況下的識別效果急劇下降[5]。CFCC特征提取方法并沒有考慮到人耳聽覺的神經元動作電位發放率與聲音強度的飽和關系特性,而這種關系特性推導出非線性冪函數可以近似于聽覺神經元[6]。通過對文獻[6]的算法實驗分析,發現其非線性冪函數參數調整為1/15 時,在說話人識別方面信噪比較高的情況下有較好的效果。為了提高低信噪比情況下說話人的識別率,本文將語音增強算法的維納濾波[7]加入前端處理。雖然增加了步驟,但總體上容易實現。

筆者在前人研究的基礎上,在說話人識別方面采用能夠模擬人耳聽覺特性的非線性冪函數提取新的耳蝸倒譜系(New Cochlear filter cepstral coeffici- ents,NCFCC),驗證NCFCC 特征對于CFCC的優勢和缺點,然后通過維納濾波來改進其缺點。

1 CFCC特征參數提取

CFCC 是由貝爾實驗室的Li Q 在2011年首次提出的并應用于說話人識別的特征參數[4]。CFCC 特征參數提取方法如圖1 所示。

假設f(t)是一個原始的輸入語音信號,則耳蝸濾波器變換的函數可以定義為:

式中:a,b 為實數。

式中:α>0 和β>0,α,β 決定了ψ(t)的頻域形狀和寬度,α 和β的一般取經驗值為α=3、β=0.2。θ 為控制沖激響應的角度,它的取值應該滿足積分表達式:

μ(t)為單位步進函數,b 為隨時間可變的實數,a 為尺度變量,一般情況下可由濾波器的質心頻率fc和最低中心頻率fL決定:

圖1:CFCC 特征提取框圖

圖2:本文特征提取過程

由式(4)可知,a 的取值范圍0

式中:d=max{3.5τi, 20ms}, τi表示第i 個子帶中心頻率的周期,j 為幀數;L 為分幀的幀移。對y(i,j)進行離散余弦變換(DCT)變換從而提取CFCC 特征。

2 非線性冪函數和維納濾波的特征提取

2.1 非線性冪函數的特征提取

CFCC 作為聽覺特征參數,式(7)的提取過程中采用立方根函數來模擬非線性響度變換的過程。雖然立方根可以得到很好的模擬效果,但聽覺特性的非線性不一定就是立方根,可以是非線性冪函數或對數函數等。經過試驗在高信噪比的環境下立方根的效果不是很理想,而非線性冪函數卻有比較好的效果。通過實驗非線性冪函數比對數函數和立方根有更好的效果,因此采用NCFCC 來模擬人耳聽覺特性。多次實驗發現非線性冪函數取1/15 效果最好,其方程可表示為:

2.2 維納濾波

表1:純凈語音下算法識別率對比

表2:三種噪聲情況下算法識別率對比

圖3:白噪聲環境下識別結果對比

維納濾波的基本原理是根據全部過去的和當前的觀察數據來估計信號的當前值,它的解是以均方誤差最小為條件所得到的系統的傳遞函數Н(w)形式給出的。

設帶噪語音信號為:

其中,x(n)表示帶噪信號;s(n)表示純凈語音;v(n)表示噪聲。則經過維納濾波器h(n)的輸出響應y(n)為:

理論上,y(n)應盡量接近于s(n),因此y(n)為s(n)的估計值。h(n)的頻域為Н(w):

其中,Ps(w)為x(n)的功率譜密度;Pv(w)為噪聲的功率譜密度。本文算法提取過程如圖2。

3 實驗設計與分析

試驗環境是在MATLAB R2016a 平臺下完成的。試驗過程通過TIMIT 語音庫說話人79 人(56 男,23 女)進行試驗,每個說話人錄制10 段語句,7 段用于模型訓練,3 段用于測試。分類器采用高斯混合模型。

3.1 試驗一

為了驗證NCFCC 算法的有效性及其在噪聲環境下的識別性能,分別用NCFCC 算法和CFCC 算法以及MFCC 算法進行比較,噪聲采用Noisex- 92 噪聲數據庫中的白噪聲進行噪聲環境的仿真實驗。純凈環境下實驗結果如表1,加噪環境下實驗結果如圖3。

對表1 和圖3 的實驗分析,得出NCFCC 算法在高信噪比情況下比CFCC 的識別率好,但低信噪比的情況下識別率略差。而經典算法MFCC 雖然在純凈語音情況下識別率較高,但其魯棒性相對于CFCC 和NCFCC 來說較差。

3.2 實驗二

由于低信噪比情況下NCFCC 算法比CFCC 算法的識別率略低,因此在前端加入維納濾波器,以提高語音信號的信噪比,從而得到本文算法。本文算法和CFCC 算法以及MFCC 算法在三種噪聲情況下對比。實驗結果如表2。

通過表2 可以發現本文算法相對于CFCC 算法識別率基本都有明顯提高。

4 結語

本文通過改進CFCC 的非線性冪函數,然后在其前端加入維納濾波器的方法整體上提高了說話人識別率。從上面實驗可以發現改進的算法在信噪比高的情況下識別率有所提高,就可以通過語音增強的方式來提高整體的說話人識別率,從而整體上提高算法的抗噪性能。

猜你喜歡
特征提取實驗
記一次有趣的實驗
特征提取和最小二乘支持向量機的水下目標識別
微型實驗里看“燃燒”
做個怪怪長實驗
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
Bagging RCSP腦電特征提取算法
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
基于MED和循環域解調的多故障特征提取
主站蜘蛛池模板: 国产在线精品99一区不卡| 在线亚洲精品福利网址导航| 国产成人无码AV在线播放动漫| 久久99国产综合精品1| 97国产成人无码精品久久久| 欧美日韩在线第一页| 国产成人精品一区二区不卡 | av手机版在线播放| 婷婷在线网站| 国产无码高清视频不卡| 欧美不卡在线视频| 国产精品偷伦视频免费观看国产 | 国产欧美日韩综合在线第一| 在线观看国产网址你懂的| 国产成人综合亚洲欧洲色就色| 亚洲人人视频| 黄色网页在线播放| 爱做久久久久久| 在线a网站| 国产亚洲精品无码专| 国产人碰人摸人爱免费视频| 精品成人一区二区三区电影| 欧美成人看片一区二区三区| 成人在线观看不卡| 中文字幕免费视频| 欧美人在线一区二区三区| 亚洲视频免| 国产人成在线观看| 啊嗯不日本网站| 精品综合久久久久久97超人| 国产亚洲成AⅤ人片在线观看| 亚洲无码精品在线播放| 香蕉99国内自产自拍视频| 亚洲色中色| 2048国产精品原创综合在线| 亚洲精品动漫| 天堂网国产| 亚洲综合色区在线播放2019| 91小视频在线播放| 99热这里只有成人精品国产| 成人伊人色一区二区三区| 日韩A∨精品日韩精品无码| 亚洲无线一二三四区男男| 久久久久亚洲精品成人网| 免费毛片全部不收费的| 成年免费在线观看| 91破解版在线亚洲| 成年看免费观看视频拍拍| 欧美啪啪视频免码| 亚洲无码一区在线观看| 精品撒尿视频一区二区三区| 亚洲人妖在线| 97国产在线视频| 97在线视频免费观看| 欧美激情视频一区| 久久人人妻人人爽人人卡片av| 国产成人精品18| 日韩毛片免费| 一级毛片网| 亚洲人成日本在线观看| 久久久久国产一级毛片高清板| 国产亚洲精品精品精品| 伊大人香蕉久久网欧美| 精品视频福利| 91蜜芽尤物福利在线观看| 一级成人a毛片免费播放| 免费在线看黄网址| 亚洲另类色| 一级毛片在线播放| 久久精品亚洲专区| 伊人激情久久综合中文字幕| 国内精品久久人妻无码大片高| 香蕉久久国产超碰青草| 天天爽免费视频| 麻豆国产在线观看一区二区| 欧美亚洲综合免费精品高清在线观看 | 国内精品视频| 99久久亚洲综合精品TS| 亚洲一区无码在线| 亚洲精品在线观看91| 国产精品hd在线播放| 狠狠色成人综合首页|