999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GMM統(tǒng)計(jì)特性的電子偽裝語音鑒定研究

2017-02-22 07:10:23李燕萍陶定元
關(guān)鍵詞:模型

李燕萍,林 樂,陶定元

(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210000)

基于GMM統(tǒng)計(jì)特性的電子偽裝語音鑒定研究

李燕萍,林 樂,陶定元

(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210000)

數(shù)字多媒體技術(shù)的發(fā)展使多媒體信息得到廣泛使用和傳播,給人類的信息交流帶來極大的便利。隨著語音相關(guān)技術(shù)的發(fā)展與逐漸成熟,對(duì)于語音信號(hào)處理的應(yīng)用也越來越廣泛。數(shù)字多媒體信息易于修改的特點(diǎn),使其面臨著惡意篡改帶來的嚴(yán)重危機(jī)。近年來,手機(jī)應(yīng)用軟件市場(chǎng)上出現(xiàn)了大量的變聲軟件,例如微信變聲器、超級(jí)變聲器等等,類似變聲器的下載量動(dòng)輒上百萬,這些應(yīng)用軟件可使說話人的聲音發(fā)生巨大的改變,致使一般的聽話人無法辨認(rèn)發(fā)音人的身份、年齡乃至性別,即使是對(duì)話者非常熟悉的人也很難識(shí)別出說話者的身份。提出了一種鑒定電子偽裝語音的方法,通過GMM模型建模,將其均值矢量構(gòu)成組合特征,然后基于SVM分類器進(jìn)行訓(xùn)練和鑒別。通過對(duì)比語音偽裝前后的梅爾倒譜特征參數(shù)的統(tǒng)計(jì)特性變化,對(duì)特征參數(shù)的變化規(guī)律進(jìn)行了分析研究。實(shí)驗(yàn)結(jié)果表明,提出的方法對(duì)電子偽裝語音的鑒定正確率達(dá)到90%。

變聲軟件;電子偽裝語音;梅爾倒譜系數(shù);支持向量機(jī);高斯混合模型

0 引 言

近年來,手機(jī)應(yīng)用軟件市場(chǎng)上出現(xiàn)了大量的變聲軟件,例如微信變聲器、超級(jí)變聲器等等,類似變聲器的下載量動(dòng)輒上百萬,這些應(yīng)用軟件可使說話人的聲音發(fā)生巨大的改變,致使一般的聽話人無法辨認(rèn)發(fā)音人的身份、年齡乃至性別,即使是對(duì)話者非常熟悉的人也很難識(shí)別出說話者的身份。犯罪分子利用電子偽裝語音[1-3]實(shí)施電話詐騙嚴(yán)重危害社會(huì)安全,由于偽裝語音具有良好的偽裝特性,給司法鑒定工作帶來很大的困難。鑒于電子偽裝語音的嚴(yán)重危害,亟待尋求一種鑒定電子偽裝語音的方法。

目前,對(duì)于電子偽裝語音相關(guān)的研究,大多集中在電子偽裝語音對(duì)于說話人識(shí)別系統(tǒng)的識(shí)別率的影響。文獻(xiàn)[4-6]表明,電子偽裝語音嚴(yán)重影響說話人識(shí)別系統(tǒng)的識(shí)別率。文中提出了一種用于鑒定電子偽裝語音的方法,在進(jìn)行說話人識(shí)別實(shí)驗(yàn)之前采用該方法進(jìn)行電子偽裝語音鑒定,可有效提高說話人識(shí)別系統(tǒng)的識(shí)別率。該方法采用梅爾倒譜系數(shù)(MFCC)結(jié)合高斯混合模型(GMM)[7-9],以GMM模型均值組合特征向量作為SVM分類器訓(xùn)練和鑒別的特征參數(shù)[10]。經(jīng)實(shí)驗(yàn)結(jié)果證明,這種方法對(duì)于電子偽裝語音的鑒定率達(dá)到90%。

1 電子偽裝語音基本原理

電子偽裝語音的基本原理是通過調(diào)整采樣率即時(shí)域的壓縮或者展寬從而改變基音頻率[11],用這種方法可以非常簡(jiǎn)單地對(duì)改變聲音,但是這樣的偽裝語音往往聽起來不自然,有的變聲軟件采用基音同步疊加相加法對(duì)語音進(jìn)行進(jìn)一步處理,從而使偽裝之后的語音聽起來更加自然。

在語音學(xué)研究中,基音頻率被認(rèn)為是最多降低或升高12個(gè)半音。假設(shè)語音基音頻率為f0,偽裝因子a為提高或降低a個(gè)半音,經(jīng)過偽裝之后的基音頻率為f1,則有:

f1=2(a-1)/12·f0

(1)

其中,偽裝因子a為整數(shù),且-111,說明提高了基音頻率;如果a<1,說明降低了基音頻率;如果a=1,說明未改變基音頻率。

2 鑒別方法原理介紹

2.1 特征參數(shù)提取過程

語音的預(yù)處理包括端點(diǎn)檢測(cè)、預(yù)加重、分幀、加窗。假設(shè)一段語音x(n),經(jīng)過預(yù)處理之后,得到N幀語音,對(duì)這N幀語音提取D維MFCC系數(shù),得到N個(gè)D維向量,用這N幀訓(xùn)練高斯混合模型。

為了準(zhǔn)確地表征說話人的個(gè)性特征,往往需要說話人大量的樣本,而將大量的樣本輸入到支持向量機(jī)進(jìn)行分類時(shí),會(huì)有巨大的計(jì)算量,自然而然地,通過少量的樣本作為支持向量機(jī)的輸入,選取代表性樣本的方法有很多。例如,對(duì)于MFCC或LPCC特征向量序列可以通過隨機(jī)方式、矢量量化等方法選取,但是這些方法具有很明顯的缺點(diǎn)。隨機(jī)選取的樣本由于具有很強(qiáng)的偶然性,難以表示大量樣本的分布情況,而矢量量化方法雖能很好地表示樣本的分布中心,但仍包含很多冗余信息,并且魯棒性較差[12]。

GMM模型作為一種統(tǒng)計(jì)模型,利用若干高斯概率密度函數(shù)的加權(quán)和來表示特征向量在概率空間的分布情況,GMM模型使用較少的參數(shù)很好地描述了說話人的個(gè)性特征,在文本無關(guān)說話人識(shí)別方面得到了廣泛應(yīng)用[13]。GMM模型由EM算法訓(xùn)練得到,其均值向量不但反映了各說話人在特征空間的分布,而且也較好地反映了說話人的個(gè)性信息,因而可考慮采用GMM模型的均值向量作為SVM的訓(xùn)練樣本。一個(gè)具有M個(gè)混合數(shù)D維GMM可表示為:

(2)

(3)

則有均值組合特征向量:

V=(V1,V2,…,VM)

(4)

其中,Vi,i=1,2,…,M為第i個(gè)高斯混合模型均值向量。

2.2 分類算法

文中采用的分類算法是建立在MFCC統(tǒng)計(jì)特性的基礎(chǔ)上,訓(xùn)練和鑒別流程分別見圖1和圖2。

圖1 訓(xùn)練流程圖

圖2 鑒別流程圖

在訓(xùn)練階段,訓(xùn)練數(shù)據(jù)庫由原始語音和偽裝語音數(shù)據(jù)集組成,根據(jù)偽裝因子a可分為24個(gè)子集,將每個(gè)子集中的偽裝語音和原始語音進(jìn)行預(yù)處理及MFCC特征提取,然后訓(xùn)練GMM模型,得到均值組合特征向量V,以該特征參數(shù)作為輸入樣本進(jìn)行SVM訓(xùn)練,從而得到其中一個(gè)子集的分類器。同理,可以訓(xùn)練得到24個(gè)分類器[14]。

在識(shí)別階段,待測(cè)試語音進(jìn)行同樣的預(yù)處理和MFCC特征提取,訓(xùn)練GMM模型,得到均值組合特征向量V,將該特征向量分別輸入到24個(gè)分類器中,如果24個(gè)分類器全部鑒別為原始語音,則判定待測(cè)試語音為原始語音,只要其中一個(gè)鑒別為偽裝語音,則判定為偽裝語音。

3 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)用的變聲軟件是一款非常典型的手機(jī)變聲軟件,軟件名字叫“高保真變聲”,實(shí)驗(yàn)用的手機(jī)系統(tǒng)平臺(tái)是Android4.2,錄音的采樣頻率為8kHz,PCM方式量化精度為16bit,語料人數(shù)是24人,其中訓(xùn)練語音240段,測(cè)試語音240段,語音內(nèi)容包括“你好”、“快把錢給我”、“把錢轉(zhuǎn)到我的銀行卡里”、“你的小孩在我手里,你趕快拿錢來贖”、“南京郵電大學(xué)”等1~10s長(zhǎng)短不一的語音。

3.1 語音的預(yù)處理

首先對(duì)讀取的語音輸入信號(hào)進(jìn)行端點(diǎn)檢測(cè),去除靜音段,對(duì)語音進(jìn)行預(yù)加重,預(yù)加重的目的在于濾除低頻干擾,將更為有用的高頻部分的頻譜進(jìn)行適當(dāng)提升,文中實(shí)驗(yàn)采用的預(yù)加重系數(shù)為0.98。然后進(jìn)行分幀加窗處理,實(shí)驗(yàn)提取MFCC參數(shù)時(shí)選取的幀長(zhǎng)為20 ms,幀移為10 ms,分幀之后加漢明窗進(jìn)行處理。

3.2 語音的特征參數(shù)提取

對(duì)經(jīng)過預(yù)處理的語音提取20維MFCC,圖3列出了部分男聲“Hello”的MFCC統(tǒng)計(jì)特性變化,其中偽裝程度為1(即a=1)時(shí)為原始語音的統(tǒng)計(jì)特性。

圖中對(duì)比了第10、17維MFCC系數(shù)統(tǒng)計(jì)特性的變化,從中可以看出,第10維MFCC系數(shù)均值先遞增而后遞減,方差先遞增而后平穩(wěn)波動(dòng)。第17維MFCC系數(shù)隨著偽裝因子的提高先增加而后降低再增加,方差在偽裝因子為5和7時(shí)取得極大值。

從上面的分析比較可以得出以下結(jié)論:無論偽裝因子為何值,偽裝語音與原始語音的MFCC系數(shù)的統(tǒng)計(jì)均值和方差均有較大差異。這種統(tǒng)計(jì)特性的差異為選取GMM均值組合特征參數(shù)奠定了理論基礎(chǔ)。

在選取高斯混合分量個(gè)數(shù)時(shí),個(gè)數(shù)越多,對(duì)說話人特征矢量空間分布就越逼近,從而提高了系統(tǒng)的魯棒性。但是高斯混合分量個(gè)數(shù)太多,一方面加大了系統(tǒng)的計(jì)算、占用更多的系統(tǒng)資源,另一方面,在有限時(shí)長(zhǎng)的訓(xùn)練數(shù)據(jù)情況下使得模型訓(xùn)練不夠充分,從而降低了系統(tǒng)性能。一般認(rèn)為模型的高斯混合分量個(gè)數(shù)在32以上系統(tǒng)的性能趨于穩(wěn)定。所以在提取得到語音的MFCC系數(shù)后,選取高斯混合模型個(gè)數(shù)為48,進(jìn)行GMM訓(xùn)練,從而得到均值組合特征向量V。文中對(duì)比了不同偽裝因子V2、V4兩個(gè)高斯模型分量均值,如圖4所示。

圖3 MFCC統(tǒng)計(jì)特性變化比較

圖4 GMM模型均值向量比較

由圖4可知,不同的偽裝因子下V2、V4兩個(gè)高斯混合模型均值同樣具有較大差異。

3.3 分類器的訓(xùn)練及偽裝語音的鑒定

文中利用語音高斯混合模型參數(shù)混合均值構(gòu)成的組合向量作為SVM分類器的輸入進(jìn)行訓(xùn)練,訓(xùn)練得到偽裝因子從-11~13的24個(gè)分類器,待測(cè)語音從2~60 s不等,待測(cè)偽裝語音偽裝因子分布從-12~12,每個(gè)偽裝因子取10段語音待測(cè)。實(shí)驗(yàn)結(jié)果見表1。

表1 不同偽裝因子的鑒別率結(jié)果

從表中可以看出,在偽裝程度很小時(shí),偽裝語音鑒定的正確率比偽裝程度較大時(shí)要低,這是因?yàn)閭窝b語音與原始語音差別并不明顯,但盡管這種差異不明顯,鑒定正確率也可達(dá)到80%。綜合上述數(shù)據(jù),對(duì)偽裝語音的總體鑒定正確率為90%。

4 結(jié)束語

電子偽裝語音對(duì)于說話人識(shí)別識(shí)別系統(tǒng)的識(shí)別率有較大影響。為了去除電子偽裝語音的不良影響,提出了一種SVM結(jié)合GMM均值組合特征參數(shù)的電子偽裝語音鑒定方法。并且運(yùn)用這種方法有效地實(shí)現(xiàn)了對(duì)電子偽裝語音的鑒定,在進(jìn)行說話人識(shí)別實(shí)驗(yàn)之前,采用該方法對(duì)語音進(jìn)行電子偽裝語音鑒定,有效提高了說話人識(shí)別系統(tǒng)識(shí)別率。實(shí)驗(yàn)結(jié)果表明,該方法鑒別電子偽裝語音的效果可達(dá)90%。因此該方法可為將來電子偽裝語音的司法鑒定提供理論依據(jù)。鑒于實(shí)驗(yàn)人數(shù)較少,測(cè)試語音說話人來自訓(xùn)練語音說話人集合,在今后的工作中,會(huì)使用不同的語料庫,從而實(shí)現(xiàn)對(duì)不是來自訓(xùn)練語音說話人集合測(cè)試語音的鑒定。

[1] Neustein A,Patil H A.Forensic speaker recognition:law enforcement and counter-terrorism[M].[s.l.]:Springer,2011.

[2] Wu Haojun,Wang Yong,Huang Jiwu.Blind detection of electronic disguised voice[C]//Proceedings of the international conference on acoustic,speech and signal processing.[s.l.]:[s.n.],2013:3013-3017.

[3] 張桂清,金怡珠,劉紅偉,等.電子偽裝語音的變聲規(guī)律研究[J].證據(jù)科學(xué),2010,18(4):503-509.

[4] Zhang C,Tan T J.Voice disguise and automatic speaker recognition[J].Forensic Science International,2008,175(2-3):118-122.

[5] Hermann J K,Joaquin G R,Javier O G.Effect of voice disguise on the performance of a forensic automatic speaker recognition system[C]//Proceedings of the speaker and language recognition workshop.[s.l.]:[s.n.],2014.

[6] Rodman R.Computer recognition of speakers who disguise their voice[C]//Proceedings of the international conference on signal processing applications & technology.Texas:[s.n.],2000:474-476.

[7] Kinnunen T,Li Haizhou.An overview of text-independent speaker recognition:from features to supervectors[J].Speech Communication,2010,52(1):12-40.

[8] 于 明,袁玉倩,董 浩,等.一種基于MFCC和LPCC的文本相關(guān)說話人識(shí)別方法[J].計(jì)算機(jī)應(yīng)用,2006,26(4):883-885.

[9] 蔣 曄,唐振民.GMM文本無關(guān)的說話人識(shí)別系統(tǒng)研究[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(11):179-182.

[10] 冷自強(qiáng),王金明,林大會(huì).一種GMM-SVM混合說話人辨認(rèn)模型[J].軍事通信技術(shù),2009,30(1):86-89.

[11] Trehub S E,Cohen A J,Thorpe L A,et al.Development of the perception of musical relations:semitone and diatonic structure[J].Journal of Experimental Psychology-human Perception and Performance,1986,12(3):295-301.

[12] 林 琳,陳 虹,陳 建,等.基于多核SVM-GMM的短語音說話人識(shí)別[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2012,43(2):504-509.

[13] 賀志陽,張玲華.基于GMM統(tǒng)計(jì)參數(shù)和SVM的說話人辨認(rèn)研究[J].南京郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2006,26(3):78-82.

[14] Wu J H,Wang Yong.Identification of electronic disguised voices[J].IEEE Transactions on Information Forensics and Security,2014,9(3):489-499.

Research on Identification of Electronic Disguised Voice Based on GMM Statistical Parameters

LI Yan-ping,LIN Le,TAO Ding-yuan

(College of Communications and Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210000,China)

With the development of digital multimedia technology,digital information has been widely used and spread,which brings great convenience to human communication.Speech related technology gradually becomes mature,and its application is more and more extensive.This kind of information is easy to be modified,so that it is facing a serious crisis of malicious tampering.In recent years,a large number of software appear in mobile phone application store,such as Wechat Voice Changer,Super Voice Changer and so on,which can change the speaker’s voice a lot.As a result,the listener cannot identify the speaker’s age and sex,even they are familiar.A novel algorithm for identification of electronic disguised voice is put forward based on supervector combined by mean vectors of Gaussian mixture model and SVM classifier for training and identification.By comparing the statistical change of MFCC between nature and disguised voice,the variation of voice parameters is studied.Experimental results show that the identification rate can reach 90%.

voice changer;electronic disguised voice;MFCC;SVM;GMM

2015-10-26

2016-02-25

時(shí)間:2017-01-04

國(guó)家自然科學(xué)基金資助項(xiàng)目(61401227);江蘇省博士后基金(1402067B);智能語音技術(shù)公安部重點(diǎn)實(shí)驗(yàn)室2014年度開放課題(2014ISTKFKT02)

李燕萍(1983-),女,副教授,博士,研究方向?yàn)檎f話人識(shí)別、語音轉(zhuǎn)換;林 樂(1990-),男,碩士研究生,研究方向?yàn)檎f話人識(shí)別。

http://www.cnki.net/kcms/detail/61.1450.TP.20170104.1023.022.html

TP31

A

1673-629X(2017)01-0103-04

10.3969/j.issn.1673-629X.2017.01.023

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 老司国产精品视频| 亚洲综合极品香蕉久久网| 久久动漫精品| 久久综合丝袜日本网| 成人福利在线免费观看| 欧美国产日韩另类| 国产丰满大乳无码免费播放| 视频一区亚洲| 伊人福利视频| 一级毛片免费不卡在线| 欧美日韩一区二区在线播放| 国产精品成人久久| 中文字幕欧美成人免费| 精品综合久久久久久97超人| 欧美第一页在线| 丁香婷婷激情综合激情| 亚洲国产理论片在线播放| 最新国产麻豆aⅴ精品无| 97se亚洲综合不卡| 国产精品成人啪精品视频| 国产午夜一级淫片| 欧美三級片黃色三級片黃色1| 精品国产污污免费网站| 日韩无码真实干出血视频| 日本午夜精品一本在线观看| 国产区免费| 超清人妻系列无码专区| 国产96在线 | 在线观看亚洲精品福利片| 亚洲高清在线天堂精品| 国产一级妓女av网站| 免费观看无遮挡www的小视频| 成人日韩欧美| 91娇喘视频| 国产日韩精品一区在线不卡| 国产午夜看片| 真人免费一级毛片一区二区| 浮力影院国产第一页| 成人国产精品2021| 欧美日本中文| 91精品免费高清在线| 亚洲精品欧美日韩在线| 色综合中文综合网| 欧美精品二区| 播五月综合| 欧洲极品无码一区二区三区| 久久婷婷综合色一区二区| 2021最新国产精品网站| 婷婷丁香色| 日本欧美视频在线观看| 久久午夜夜伦鲁鲁片无码免费| 亚洲成人免费看| 99热这里只有成人精品国产| 久久99热66这里只有精品一| 日韩精品资源| 免费看av在线网站网址| 日韩一二三区视频精品| 99视频只有精品| 在线欧美日韩| 国产亚洲精品自在久久不卡| 亚洲视频三级| 91探花国产综合在线精品| A级全黄试看30分钟小视频| 免费国产在线精品一区| 中文字幕av一区二区三区欲色| 久久黄色小视频| 久久国产精品无码hdav| 99福利视频导航| 亚洲第一区在线| 久久婷婷色综合老司机 | 不卡视频国产| 国产精品第三页在线看| 国产1区2区在线观看| 日韩av手机在线| 亚洲综合18p| 无码AV高清毛片中国一级毛片| 全免费a级毛片免费看不卡| 制服丝袜国产精品| 69视频国产| 精品一区二区无码av| a亚洲天堂| 国产XXXX做受性欧美88|