999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

說話人識別綜述

2017-10-20 11:37:28甄倩倩張庭亮
科技資訊 2017年25期
關鍵詞:特征提取

甄倩倩+張庭亮

DOI:10.16661/j.cnki.1672-3791.2017.25.241

摘 要:生物識別,是通過生物信息來識別人身份的技術,說話人識別是一種通過人的聲音來識別人身份的技術。說話人識別是生物識別領域的重要研究課題之一。本文首先介紹說話人識別的背景和研究意義;其次介紹目前在說話人特征提取方面所采用的方法;再次介紹說話人識別方面所采用的方法研究;最后分析說話人識別的研究困難和未來發(fā)展趨勢。

關鍵詞:生物識別 說話人識別 特征提取

中圖分類號:TP391 文獻標識碼:A 文章編號:1672-3791(2017)09(a)-0241-03

Abstract: Speaker recognition is one of the important research topics in the field of biometrics, which is a way of recognizing human identity through the voice of the people. Firstly, it introduces the background and significance of speaker recognition. Secondly, it introduces the present research situation of feature extraction and speaker recognition. Finally, it analyzes the research difficulties and future development trend of speaker recognition.

Key Words: Biological Recognition; Speaker Recognition; Feature Extraction

生物特征識別技術是一種采用人的生理或行為進行識別身份的技術。基于生物特征識別技術的身份認證是社會高度信息化和經(jīng)濟全球化的需求,是政府和商業(yè)領域必不可少的重要技術[1]。目前常見的生物識別技術有虹膜識別、指紋識別、掌紋識別、步態(tài)識別、說話人識別等。說話人識別作為生物識別中的一種,目前也引起了學者的廣泛關注。說話人識別(Speaker Recognition)又稱話者識別或聲紋識別(Voiceprint Recognition),是由計算機利用語音波形中所包含的反映特定說話人生理和行為特征的語音特征參數(shù)來自動確定或鑒別說話人身份的技術[2]。說話人識別的根本依據(jù)是:每個人都有自己獨特的聲道和發(fā)音特征,使得自己的話聲是唯一的。對說話人識別的研究源于20世紀30、40年代,近些年該課題引起了生物識別研究者的廣泛關注。目前,隨著科學的發(fā)展,學者的青睞,已經(jīng)取得了一系列研究成果。在國內(nèi),通過中國知網(wǎng)搜索說話人識別,從2000年至今,相關文獻2553篇。目前說話人識別可以應用在密碼鎖[3]、司法鑒定[4]等中。

1 說話人識別過程

通過對前人工作的總結(jié),說話人識別的過程包含語音信息的預處理、特征提取與現(xiàn)有語音庫進行比對最終識別出說話人,具體流程見圖1所示。

2 說話人識別綜述

本文從預處理、特征提取和說話人模型3個方面對說話人識別算法進行分析。

2.1 預處理

說話人語音預處理是說話人識別系統(tǒng)的重要環(huán)節(jié),預處理包括預加重、端點檢測、分幀加窗處理以及對帶有噪聲的說話人語音的語音增強處理[5]。除了常規(guī)的預處理之外,卷積神經(jīng)網(wǎng)絡可以應用在說話人語音信號的預處理中,例如中,胡青等[6]采用卷積神經(jīng)網(wǎng)絡的卷積和降采樣兩種操作對語音信號進行預處理。

2.2 特征提取

2.2.1 MFCC(Mel頻率倒譜系數(shù),Mel Frequeucy Cepstrum Coefficient)

Mel頻率倒譜系數(shù)是說話人特征提取中最長用的系數(shù)。例如,文獻[7-9]在特征提取方面均采用MFCC提取說話人特征。但MFCC容易受噪聲的影響,噪聲環(huán)境下的識別率較低。

2.2.2 HHT(希爾波特黃變換Hilbert–Huang Transform)倒譜系數(shù)

文獻[10]中采用HHT倒譜系數(shù)來刻畫動態(tài)語音特征,該方法雖然識別精度提高,但是卻以犧牲識別時間為代價。

2.2.3 DNN(深度神經(jīng)網(wǎng)絡,Deep Neural Network)

文獻[11]中為了提取說話人語音信息,提出了一種基于深度神經(jīng)網(wǎng)絡的說話人識別方法,該方法能夠解決語音信號這種弱信息極易受噪聲等的影響的問題。通過在RSR2015數(shù)據(jù)庫數(shù)據(jù)上實驗,實驗結(jié)果表明該方法在特征提取方面,優(yōu)于MFCC等傳統(tǒng)特征提取方法,系統(tǒng)的錯誤率也有所降低。

2.2.4 融合特征提取

除了以上所述的單一的特征提取方法,還有一些融合特征提取方法。例如,文獻[12]在特征提取方面針對噪聲環(huán)境中說話人識別性能較差的不足,結(jié)合小波變換的優(yōu)點,提出了將小波變換技術與傳統(tǒng)的特征參數(shù)提取方式相結(jié)合的方法,利用加權(quán)特征組合,能夠達到抗噪的目的。文獻[13]中為了提高在噪音環(huán)境下說話人識別系統(tǒng)的識別率,通過對MFCC參數(shù)提取過程進行改進,用小波包變換代替快速傅里葉變換和Mel濾波器組,獲得了新參數(shù)new MFCC,然后將信號的頻譜重心與new MFCC結(jié)合成新的特征參數(shù)進行提取。文獻[14]中,將MFCC和LPCC進行結(jié)合作為說話人識別的特征。文獻[15]中提出了一種基于 Fisher準則的梅爾頻率倒譜系數(shù)(MFCC)、線性預測梅爾倒譜系數(shù)(LPMFCC)、Teager能量算子倒譜參數(shù)(TEOCC)相混合的特征參數(shù)提取方法。endprint

2.3 說話人模型

2.3.1 GMM(高斯混合模型,Gaussian Mixture Model)

高斯混合模型是說話人識別中最常使用的一種模型,很多說話人相關的文獻中都采用該方法以及在此基礎上所衍生出來的自適應高斯混合模型以及一些其他的改進算法。例如文獻[5,8,9]在設計說話人識別系統(tǒng)時,均采用高斯混合模型作為識別模型。文獻[16]中提出了一種基于高斯混合模型的自適應說話人識別算法,該算法識別在不降低識別率的情況下,識別速度提高了4倍。文獻[17]提出一種混合數(shù)可變的自適應高斯混合模型并將其應用于說話人識別,識別率有所提高。文獻[18]中提出了一種基于GMM托肯配比相似度校正得分的說話人識別算法,識別性能有了大幅提高。文獻[19]中在傳統(tǒng)GMM的基礎上,對模型參數(shù)初始化進行改動,采用分類法與K-mean聚類進行結(jié)合。

2.3.2 VQ(矢量量化,Vector Quantization)

文獻[20-21]均采用VQ作為說話人識別模型。除了VQ單獨使用外,還有一些文獻中將其與其他的識別模型結(jié)合。例如,文獻[7]將VQ與DTW動態(tài)時間調(diào)整模型結(jié)合。文獻[22]將其與HMM隱馬爾可夫相結(jié)合,進行說話人識別。文獻[23]將其與人工神經(jīng)網(wǎng)絡ANN相結(jié)合。

2.3.3 DTW(動態(tài)時間調(diào)整模型,Dynamic Time Warping)

文獻[24]設計了一種基于DTW的說話人識別系統(tǒng)。文獻[25]中,宋大杰將改進的DTW作為模式匹配的算法。文獻[26]研究了基于動態(tài)時間規(guī)正(DTW)和圖論方法的語音識別和說話人識別的特征子集選擇問題,提出了基于DTW距離的有向圖方法(DTWDAG)。文獻[7]通過動態(tài)時間規(guī)整模型進行偽裝程度鑒定,再利用矢量量化模型進行說話人識別,從而設計了DTW與VQ相結(jié)合的電子偽裝語音說話人識別系統(tǒng)。

2.3.4 SVM(支持向量機,Support Vector Machine)

支持向量機一是在高維空間使用線性函數(shù)假設空間的學習系統(tǒng),它由一個來自最優(yōu)化理論的學習算法訓練,該算法實現(xiàn)了一個由統(tǒng)計學習理論導出的學習偏置[27]。文獻[28]在支持向量機的基礎上,結(jié)合高斯混合模型,提出基于一類SVM-GMM的短語音說話人識別算法,提高了短語音數(shù)據(jù)條件下系統(tǒng)的識別性能;引入多核映射,提出基于多核SVM-GMM的短語音說話人識別算法。文獻[29]針對傳統(tǒng)支持向量機算法時空復雜度較高的不足,提出了一種基于交叉驗證KNN的支持向量預選取算法。文獻[30]中,翟玉杰提出了一種基于GMM和SVM的說話人識別算法。相對于以往的算法,識別率有了大幅提高,但是通過進一步研究發(fā)現(xiàn)其識別率進一步提高受到信道因素影響較為嚴重。為了彌補GMM-SVM說話人識別的這一缺點,在GMM-SVM的說話人識別方法的基礎上應用了因子分析技術模型級信道補償算法,識別效率上超過了傳統(tǒng)的GMM-SVM方法,具有更好的信道魯棒性。將GMM與SVM兩者結(jié)合能夠解決GMM在語音數(shù)據(jù)較小時不能區(qū)分數(shù)據(jù)間的差異性及SVM在處理大量數(shù)據(jù)時識別率下降的問題[31]。

2.3.5 其他

文獻[32]針對BP神經(jīng)網(wǎng)絡收斂速度慢、容易陷入局部極小的缺陷,將遺傳算法全局尋優(yōu)的特點與BP神經(jīng)網(wǎng)絡相結(jié)合,利用遺傳算法對神經(jīng)網(wǎng)絡的權(quán)值和閾值進行優(yōu)化,構(gòu)成一個GABP神經(jīng)網(wǎng)絡,有效地解決了BP神經(jīng)網(wǎng)絡容易陷入局部最優(yōu)的問題。文獻[33]將深度神經(jīng)網(wǎng)絡與隱馬爾可夫模型結(jié)合,提出了一種二者融合的自適應方法。文獻[34]以及文獻[35]均將深度神經(jīng)網(wǎng)絡應用在說話人識別中。

3 結(jié)論

說話人識別是語音識別的范疇,但其不關心說話的內(nèi)容,更關心的是說話人的身份。經(jīng)過幾十年的發(fā)展,說話人識別技術相對來說已比較成熟,但識別時容易受環(huán)境的干擾,造成噪聲環(huán)境中,識別錯誤率高等問題,所以目前說話人識別在環(huán)境影響方面還有一些待解決的技術問題。

參考文獻

[1] 鄭方,艾斯卡爾·肉孜,王仁宇,等.生物特征識別技術綜述[J].信息安全研究,2016,2(1):12-26.

[2] 蔣曄,唐振民.GMM文本無關的說話人識別系統(tǒng)研究[J].計算機工程與應用,2010,46(11):179-182.

[3] 張濤濤.語音聲紋密碼驗證技術研究[D].中國科學技術大學,2016.

[4] 楊陽.聲紋識別技術及其在司法鑒定中的應用[D].廈門大學,2007.

[5] 陳強.基于GMM的說話人識別系統(tǒng)研究與實現(xiàn)[D].武漢理工大學,2010.

[6] 胡青,劉本永.基于卷積神經(jīng)網(wǎng)絡的說話人識別算法[J].計算機應用,2016,36(S1):79-81.

[7] 李燕萍,陶定元,林樂.基于DTW模型補償?shù)膫窝b語音說話人識別研究[J].計算機技術與發(fā)展,2017,27(1):93-96.

[8] 吳慧玲,杜成東,毛鶴.基于GMM的說話人識別算法的研究與應用[J].現(xiàn)代計算機:普及版,2014(14):31-35.

[9] 劉冰,滕廣超,林嘉宇.基于GMM的說話人識別系統(tǒng)設計與實現(xiàn)[J].微處理機,2014(3):63-65.

[10] 杜曉青,于鳳芹.基于HHT倒譜系數(shù)的說話人識別算法[J].計算機工程與應用,2014,50(3):198-202.

[11] 張濤濤,陳麗萍,蔣兵,等.采用深度神經(jīng)網(wǎng)絡的說話人特征提取方法[J].小型微型計算機系統(tǒng),2017,38(1):142-146.

[12] 檀蕊蓮,柏鵬,李哲,等.基于小波變換的說話人識別技術[J].空軍工程大學學報:自然科學版,2013,14(1):85-89.endprint

[13] 胡峰松,王磊.一種基于小波包分析的說話人識別算法[J].小型微型計算機系統(tǒng),2014,35(7):1610-1614.

[14] 于明,袁玉倩,董浩,等.一種基于MFCC和LPCC的文本相關說話人識別方法[J].計算機應用,2006,26(4):883-885.

[15] 謝小娟,曾以成,熊冰峰.說話人識別中基于Fisher比的特征組合方法[J].計算機應用,2016,36(5):1421-1425.

[16] 陳覺之,張貴榮,周宇歡.基于GMM模型的自適應說話人識別研究[J].計算機與現(xiàn)代化,2013(7):91-93.

[17] 王韻琪.自適應高斯混合模型及說話人識別應用[D].蘇州大學,2014.

[18] 楊瑩春,鄧立才.基于GMM托肯配比相似度校正得分的說話人識別[J].清華大學學報:自然科學版,2017(1):28-32.

[19] 蔣曄,唐振民.GMM文本無關的說話人識別系統(tǒng)研究[J].計算機工程與應用,2010,46(11):179-182.

[20] 張玉嬌.基于矢量量化(VQ)的說話人識別的研究[D].南京理工大學,2015.

[21] 涂佩佩.基于矢量量化的說話人識別的研究[D].安徽大學,2016.

[22] 趙峰,于洋.基于VQ和HMM的雙層聲紋識別算法[J].桂林電子科技大學學報,2017(1):83-84.

[23] 楊彥.基于矢量量化(VQ)和人工神經(jīng)網(wǎng)絡(ANN)的說話人識別的研究[D].東南大學,2006.

[24] 張飛云,張鵬,高建生.噪聲環(huán)境中基于DTW的說話人識別[J].許昌學院學報,2011,30(5):68-72.

[25] 宋大杰.基于DTW的說話人識別及其在DSP上的實現(xiàn)[D].東華理工大學,2012.

[26] 劉敬偉,徐美芝,鄭忠國,等.基于DTW的語音識別和說話人識別的特征選擇[J].模式識別與人工智能,2005, 18(1):50-54.

[27] 雷震春.支持向量機在說話人識別中的應用研究[D].浙江大學,2006.

[28] 金煥梅.基于支持向量機的短語音說話人識別[D].吉林大學,2012.

[29] 陳雪芳,楊繼臣.交叉驗證KNN支持向量預選取算法在說話人識別上的應用[J].科學技術與工程, 2013,13(20):5839-5842.

[30] 翟玉杰.基于GMM-SVM說話人識別的信道算法研究[D].吉林大學,2015.

[31] 趙立輝,毛竹,霍春寶,等.基于GMM-SVM的說話人識別系統(tǒng)研究[J].工礦自動化,2014,40(5):49-53.

[32] 蘭勝坤.遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的說話人識別系統(tǒng)[J].自然科學版,2013,27(10):91-95.

[33] 薛少飛.DNN-HMM語音識別聲學模型的說話人自適應[D].中國科學技術大學,2015.

[34] 耿國勝.基于深度學習的說話人識別技術研究[D].大連理工大學,2014.

[35] HAZRAT ALI.基于深度學習模型的說話人識別算法研究[D].北京科技大學,2015.endprint

猜你喜歡
特征提取
特征提取和最小二乘支持向量機的水下目標識別
基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
基于DNN的低資源語音識別特征提取技術
自動化學報(2017年7期)2017-04-18 13:41:09
Bagging RCSP腦電特征提取算法
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于DSP的直線特征提取算法
基于改進WLD的紋理特征提取方法
計算機工程(2015年4期)2015-07-05 08:28:02
淺析零件圖像的特征提取和識別方法
機電信息(2015年3期)2015-02-27 15:54:46
基于CATIA的橡皮囊成形零件的特征提取
主站蜘蛛池模板: 国产欧美日韩综合一区在线播放| 97人妻精品专区久久久久| 久久精品一品道久久精品| 成AV人片一区二区三区久久| 伊人激情综合| 一级全免费视频播放| 2020久久国产综合精品swag| 伊人久久大香线蕉成人综合网| 国产网友愉拍精品| 国产噜噜在线视频观看| 激情六月丁香婷婷四房播| 自偷自拍三级全三级视频| 国产亚洲精品在天天在线麻豆| 欧美精品v| 91网址在线播放| 色妞永久免费视频| 丰满人妻被猛烈进入无码| 成人va亚洲va欧美天堂| 亚洲毛片网站| 91小视频在线观看免费版高清| 尤物精品视频一区二区三区| 毛片视频网| 伊人网址在线| 美女一区二区在线观看| 亚洲成在人线av品善网好看| 激情综合网址| 91精品国产自产在线老师啪l| 无码精品国产dvd在线观看9久| 97超爽成人免费视频在线播放| 91丨九色丨首页在线播放 | 韩国v欧美v亚洲v日本v| 亚洲第一黄色网| 日韩精品一区二区三区免费| 亚洲精品第一在线观看视频| 一区二区午夜| 色哟哟精品无码网站在线播放视频| 国产在线精彩视频论坛| 国产一级在线观看www色| 成AV人片一区二区三区久久| 亚洲中文字幕日产无码2021| 精品久久国产综合精麻豆| 亚洲最黄视频| 国产精品视频猛进猛出| 综合色在线| 97se亚洲| 亚洲天堂日韩在线| 日韩AV无码免费一二三区| 国产精彩视频在线观看| 国产美女在线观看| 毛片在线播放网址| 九色综合伊人久久富二代| 无码电影在线观看| 天天色天天综合网| 永久成人无码激情视频免费| 色天天综合| 青青久视频| 日韩精品一区二区深田咏美| 少妇精品在线| 99久久这里只精品麻豆| 成人va亚洲va欧美天堂| 精品精品国产高清A毛片| 真实国产乱子伦视频| 国产日韩精品一区在线不卡| 九九免费观看全部免费视频| 国产尤物jk自慰制服喷水| 欧美综合区自拍亚洲综合天堂 | 中文字幕亚洲乱码熟女1区2区| 日韩成人在线网站| 欧洲av毛片| 欧美人在线一区二区三区| 欧美一区二区自偷自拍视频| 亚洲天堂777| 欧美性爱精品一区二区三区| 欧美日韩一区二区在线播放| 综合网天天| 色哟哟色院91精品网站| 国产菊爆视频在线观看| 亚洲天堂网站在线| 这里只有精品在线播放| 欧美性猛交一区二区三区| 国产丰满大乳无码免费播放 | 2021天堂在线亚洲精品专区|