999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GFCC與CFC的低信噪比說話人識別

2021-01-15 09:22:08馮月春陳惠娟
網絡安全技術與應用 2021年1期
關鍵詞:特征實驗模型

◆馮月春 陳惠娟

基于GFCC與CFC的低信噪比說話人識別

◆馮月春1陳惠娟2

(1.寧夏理工學院 寧夏 753000;2.西安工程大學 陜西 710048)

在全特征矢量集模型CFC和互信息識別的基礎上,對不同的語音特征參數提取方式及不同特征在不同信噪比下的識別率做了比較,實驗結果表明基于人耳聽覺特性的穩健特征提取方式在高信噪比時識別率最高;本文針對低信噪比情況下說話人識別系統的識別率較低的問題,提出了基于多窗譜估計普減法的能熵比法用于語音的前端降噪處理,結果表明通過改進的端點檢測法在低信噪比下明顯提高說話人識別的識別率。

端點檢測;CFC;識別率

說話人模型是說話人識別系統的核心,目前常見的說話人模型包括:隱馬爾科夫模型、高斯混合模型、矢量量化、人工神經網絡等。這些方法的運用只考慮了語音信號的時變分布特征,并沒有考慮語音信號的統計分布特征,同時計算量比較大。上海大學的俞教授提出了全特征矢量集模型CFC[1],該模型基于互信息理論和語音信號分析,對隨機變量或隨機信號之間所攜帶對方信息進行定量描述,由于該模型同時考慮了語音信號的時變分布特征和統計分布特征,能有效地提高類間耦合度和類內凝聚度,是目前常用的說話人模型匹配方式。該模型對語音參數特征敏感,尤其是低信噪比的情況下。因此,語音特征的提取方式是CFC精度的主要影響因素。本文在全特征矢量集模型CFC和互信息識別的基礎上,對不同的語音特征參數提取方式識別率做了比較,結果表明基于人耳聽覺特性的穩健特征提取方法在高信噪比時識別率最高,在低信噪比下識別率較低,本文采用多窗譜估計普減法[2]和能熵比相結合的端點檢測,對語音信號進行預處理,使說話人識別在低信噪比下識別效果明顯改善。

1 互信息匹配識別模型及原理

1.1 說話人全特征矢量模型

全特征矢量集模型CFC的基本思想是通過對一組包含說話人各種語音發音個性特征的數據進行分析處理,提取相應的代表性特征矢量表示說話人語音模型,其訓練過程如下。

(2)計算各原始特征矢量與CFC中各特征矢量之間的距離,并將原始特征矢量賦予與其距離最小的CFC特征矢量所在子集,即:

(3)對每個CFC特征矢量子集中的原始特征矢量在特征空間計算其均值,并將其作為新的CFC特征矢量,即

1.2 基于互信息評估的說話人識別原理

從理論上分析,由于不可能得到嚴格的語音信號特征矢量的概率分布密度函數以及語音模式的條件概率,語音模式之間的互信息計算只能通過合理的估計進行,即引入了熵的計算。公式如下:

2 語音特征提取實驗對比

2.1 實驗環境

本文涉及的說話人識別實驗中訓練語音數據均在實驗室環境下用進行錄制,采樣率11025Hz,量化精度16 位,每個人錄制了7 段12 秒的語音,其中,前4 段用于訓練,后3 段用于識別。為了比較各種特征提取方式的魯棒性,分別在原語音數據中疊加上固定比例的噪聲。實驗所使用8種噪聲類型,信噪比分別為0dB,10dB,20dB,30dB。實驗結果如圖1(a)、(b)所示。橫軸代表不同的信噪比,縱軸代表說話人的識別率;圖中矩形的線條表示為LPCC特征在不同信噪比下的識別率,圓形的線條為MFCC特征在不同信噪比下的識別率,三角形的線條為GFCC特征在不同信噪比下的識別率,星形為組合特征MFCC+GFCC在不同信噪比下識別率[4]。

圖1(a) 不同信噪比下說話人識別率

圖1(b) 不同信噪比下說話人識別率

2.2 實驗結果與分析

(1)在純凈語音環境下,MFCC,GFCC和MFCC+GFCC的識別率一致,最高可達到90%,而LPCC的識別率相對較低,在70%左右。

(2)在低信噪比下GFCC特征參數和組合特征MFCC+GFCC的識別率優于MFCC和LPCC的識別率,說明GFCC具有一定抗噪性能。

3 改進的語音端點檢測

從實驗結果發現,普通的端點檢測只對有話段檢測和處理,一般用短時平均能量和短時平均過零率就可以檢測出語音的端點,但實際處理中語音往往處于復雜的噪聲環境中,判別語音段的起始點和終止點的問題主要歸結為區別語音和噪聲的問題。因此,采用基于多窗譜估計普減法的能熵比法用于端點檢測,來提高說話人識別的正確性。改進后說話人識別工作原理如圖2所示:

圖2 說話人識別系統

4 實驗結果

實驗結果如圖3(a)、(b)所示。其中,圓形表示普通的端點檢測下特征GFCC的識別率,星形表示改進的端點檢測下特征GFCC的識別率[5]。

從圖3(a)、(b)中可以看出:(1)在8種不同的噪聲環境下,采用兩種端點檢測法說話人識別的識別率均隨著信噪比的增大越來越大。(2)從圖中可以看到,在低信噪比下對含噪的語音法進行預處理后,對多數噪聲識別率都有所提高。(3)八種噪音下在SNR低于5dB時,我們的抗噪聲說話人識別系統的識別率提高明顯。

圖3(a) 不同信噪比下說話人識別率

圖3(b) 不同信噪比下說話人識別率

5 結論

在全特征矢量集模型CFC和互信息識別的基礎上,通過實驗驗證,結果表明低信噪比下的識別率較差;然后,針對此問題,提出了基于多窗譜估計普減法的能熵比法用于語音的前端降噪處理,通過改進的端點檢測法算法使說話人識別在不同程度上得到了提高。

[1]俞一彪.基于互信息理論的說話人識別研究[D].上海:上海大學,2004.

[2]武鵬鵬,趙剛,鄒明.基于多窗譜估計的改進普減法[J].現代電子技術,2008(12):151-152.

[3]杜曉青,于風芹.基于發聲機理與人耳感知特性的說話人識別[J],計算機工程,2013,39(11),197-199.

[4]郭武.復雜信道下的說話人識別[D].合肥:中國科學技術大學,2007.

[5]余建潮,張瑞林.基于MFCC和LPCC的說話人識別[J].計算機工程與設計,2009(5):1189-1191.

寧夏高等學校科學研究項目(編號:NGY2018-166)

猜你喜歡
特征實驗模型
一半模型
記一次有趣的實驗
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
做個怪怪長實驗
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
NO與NO2相互轉化實驗的改進
主站蜘蛛池模板: 男女男免费视频网站国产| 欧美a级在线| 精品国产女同疯狂摩擦2| 国产精品va免费视频| 91福利片| 999福利激情视频| 4虎影视国产在线观看精品| 亚洲最猛黑人xxxx黑人猛交| 国产91丝袜在线播放动漫 | 国产精品不卡片视频免费观看| 亚洲高清中文字幕在线看不卡| 天堂网亚洲综合在线| 欧美成人区| 欧美日本激情| 沈阳少妇高潮在线| 日韩午夜伦| 久久香蕉国产线看精品| 亚洲AⅤ综合在线欧美一区| 国产一级特黄aa级特黄裸毛片| 国产v欧美v日韩v综合精品| 波多野结衣一区二区三区88| 亚洲男女天堂| 亚洲青涩在线| 久综合日韩| 99视频免费观看| 国产一区二区三区日韩精品| 激情综合五月网| 欧美亚洲国产日韩电影在线| 91在线日韩在线播放| 国产精品区视频中文字幕| 亚洲女同欧美在线| 久久久久无码精品国产免费| 欧美另类视频一区二区三区| 日韩在线网址| 国产无套粉嫩白浆| 亚洲第一成年人网站| 在线精品亚洲一区二区古装| 毛片免费高清免费| 国产丝袜第一页| 国产精品欧美亚洲韩国日本不卡| 精品国产美女福到在线不卡f| 国产主播在线一区| 国产成人麻豆精品| 欧美伊人色综合久久天天| 91免费片| 日韩在线欧美在线| 日韩亚洲高清一区二区| 日韩毛片视频| 久久黄色视频影| 大香伊人久久| 日韩在线第三页| 69国产精品视频免费| 四虎成人精品| 国产精品亚洲五月天高清| 91久久青青草原精品国产| 国产日本欧美亚洲精品视| 国产玖玖视频| 国产视频a| 被公侵犯人妻少妇一区二区三区 | 国产日韩欧美一区二区三区在线 | 美女无遮挡免费网站| 国产成人精品在线1区| 99re这里只有国产中文精品国产精品 | 国产男女免费视频| 人人爱天天做夜夜爽| 亚洲中久无码永久在线观看软件 | 欧洲一区二区三区无码| 在线欧美国产| 亚洲无码精品在线播放 | 亚洲男人天堂久久| 伦伦影院精品一区| 99久久成人国产精品免费| 青青草原国产| 亚洲久悠悠色悠在线播放| 色屁屁一区二区三区视频国产| 中文字幕第4页| 特级毛片8级毛片免费观看| 97在线观看视频免费| 国产肉感大码AV无码| 久久免费观看视频| 日韩黄色大片免费看| 亚洲国产成人久久精品软件|