999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于分類特征映射的SVM話者確認

2010-09-25 05:55:06賀慶瑋許敏強
通信技術 2010年3期
關鍵詞:分類特征模型

賀慶瑋, 李 輝, 許敏強

0 引言

話者確認技術通過提取語音信號中所包含的話者特征信息, 對其所聲明的身份做出判決, 接受或是拒絕。話者確認技術具有終端設備簡單、對用戶配合要求較低等特點,可以應用于金融、商貿、公安司法等諸多領域, 具有廣泛的發展前景。

支持向量機[1]是建立在統計學習理論基礎上的機器學習方法。通過學習算法,SVM 可以自動尋找出那些對分類有較好區分能力的支持向量,由此構造出的分類器可以最大化類與類之間的間隔,因而有較好的適應能力和較高的分類性能。它作為一種區分性模型具有非常好的分類能力,適合于解決話者確認這樣的二分類問題[2]。然而,在與文本無關的話者確認中,大量的話者語音倒譜特征參數使得直接使用它們訓練SVM話者模型變得非常的困難,無論是運算的時間復雜度和空間復雜度都無法滿足實際應用的需要。同時,不同話者的特征參數在特征空間的混疊十分嚴重,使得難以尋找區分性較好的分類界面。

高斯混合模型GMM(Gaussian Mixture Model)是一種概率統計模型,通常使用由全局背景模型 UBM(Universal Background Model)MAP自適應得到的GMM作為語音統計模型來描述語音參數在特征空間中的分布,較傳統的VQ分類描述[3]有著很大精度優勢。通過對描述話者語音的GMM中的均值、方差、權重參數進行合適的組合,便能夠將大量的語音數據映射到一個高維特征空間,作為話者特征矢量。GMM全統計參數超矢量[4]就是利用方差和權重對均值進行修正,并將修正后均值串聯得到的特征超矢量,已經被證明能夠較好地表示話者信息。本文將采用和其性能相似而計算復雜度更低的加權均值超矢量作為話者特征。

在使用SVM作為話者模型的話者確認系統中,模型的訓練著重于尋找目標話者特征和冒認話者特征之間的分類界面。如果待分類樣本數據量較大,將增加尋找分類界面的難度。為了優化分類界面的區分性,本文在系統前端根據基音周期的大小對語音特征參數進行分類。基音周期是語音激勵源的重要參數,能夠對語音倒譜特征參數進行較好的特征子空間劃分。分類之后,每個特征子空間建立獨立的話者確認系統,并在后端進行評分融合,得到系統最終評分。在NIST’06數據庫上的實驗表明,本文提出的方法具有較好的話者確認性能。

1 基于特征映射和SVM話者確認

支持向量機是建立在統計學習理論基礎上的機器學習方法,它可以表示為:

其中 K (x,xi)為核函數,需要滿足 Merce條件。對于線性核函數 K (x,xi) = x?xi。通過學習算法,SVM可以自動尋找出那些對分類有較好區分能力的支持向量,由此構造出的分類器可以最大化類與類之間的間隔,因而有較好的適應能力和較高的分類能力[5]。

在本文無關的話者確認系統中, 由于確認所需的語音數據量較大,直接使用語音特征參數訓練話者SVM模型面臨著模型訓練效率低下和特征混疊嚴重等困難。目前流行的解決方法是對話者的語音參數做合適的特征映射,使大量的語音參數映射到一個高維超矢量,以適合于使用SVM進行分類。

作為概率統計模型,GMM通過高斯概率密度函數的線性加權組合刻畫語音特征參數的統計分布,可以表示為:

其中M為GMM的混合度, N (x;mi; ∑i)表示均值為 mi,協方差矩陣為∑i的高斯分布。三種參數權重、均值、方差以不同的方式組合可以得到不同的GMM統計特征超矢量。本文中采用的加權均值超矢量可以表示為:

由于每條話者語音經過特征映射之后只有一個加權均值超矢量,訓練樣本數較少,且特征空間上的混疊較少,使用簡單的線性核函數即能取得較好的效果,故本文中的SVM話者模型均采用線性核函數訓練。

2 基于基音分類和SVM的話者確認

2.1 基于基音周期的分類

一般而言,語音信號主要由清音和濁音兩部分組成(靜音除外)。清音發音時沒有聲帶振動,是一種偽隨機噪聲;濁音的激勵源為聲帶周期性地振動,其振動周期就是基音周期,它是隨著時間和發音高低而不斷變化的。因此,我們可以很容易地根據清音和濁音將語音倒譜特征參數劃分為兩個特征子空間。另外,語音當中濁音蘊含的說話人特征信息往往相對較多,我們可以將濁音進一步劃分為若干個子空間。基音周期描述了濁音信號的準周期特性,非常適合用于為語音倒譜特征參數分類。本文根據每幀語音的基音周期的大小(令清音的基音周期為0),對語音倒譜特征參數進行特征空間上的分類。在對語音經過分幀、加窗預處理之后,同時提取 MFCC參數和基音周期,根據預先確定的基音周期的范圍,將 MFCC參數分為若干個子類。分類之后,我們將在每個特征子空間上建立GMM-UBM-SVM話者確認子系統,得到測試語音在每個子空間上的評分,最后在后端進行評分融合。

2.2 子類評分融合

分類系統在對各特征子空間描述更加精細的同時,也帶了的子系統評分融合的問題。各子類系統運行在不同的特征空間,故其評分具有一定的互補性。本文的系統評分融合采用算法復雜度低、易于實現的線性加權融合,其表達式如下所示:

其中totals為總系統評分,is為子系統i評分,iω為子系統i評分所占權重。權重的設定較為靈活。可以令各系統權重相同,即等權重融合;也可以考慮UBM語音分類時各子類的特征數目設定權重;還可以根據測試語音在各類中的比重綜合考慮權重取值。本文實驗采用的語音較長,在各類分布較為均勻,加上各類的互補性較好,本文主要采用等權重融合方式。

3 實驗結果及其分析

3.1 實驗數據

實驗數據選自NIST’06 SRE數據庫1side語音數據集中的100個男性話者,共計100條訓練語音,406條測試語音 ,每條語音去除靜音后長度約為2分鐘。對于每條語音,以20 ms幀長,10 ms幀移用Hamming窗分幀提取參數。特征參數采用 32維 MFCC(Mel-Frequency Cepstral Coefficient)參數,其中包含無0階的16維靜態參數和一階動態。為了降低信道的影響,減小數據之間的不匹配,參數經過了 RASTA(Relative Spectra),CMS(Cepstral Mean Subtraction)處理。SVM話者模型訓練中,采用1個話者超矢量做”+1”類,其余 99個話者超矢量做”-1”類,用線性核函數進行訓練。

3.2 評估標準

實驗中用EER和DET(Detection Error Trade-off)曲線來評價話者確認系統性能。DET曲線的橫坐標為對數刻度下的目標話者錯誤拒絕率 FR(False Rejection Rate),縱坐標為對數刻度下的冒認者錯誤接受率 FA (False Acceptance Rate),它反映了取不同確認閾值時,識別系統的FA和FR。曲線越靠近坐標軸說明系統性能越好。EER識FA與FR相等時的錯誤率。EER越小也一定程度上說明話者確認系統的性能越好。

3.3 分類子系統性能實驗

對于相同的實驗數據,本文進行了分類數目N=2 、N=3的實驗,并且根據分類數目的大小,各子類系統進行了采用不同混合度的實驗,分兩類時,根據即基音周期是否為 0,清音和濁音各為一類,份三類時,清音一類,基頻小于 120的為第二類,大于120的為第三類。表1顯示了分類系統中各個子系統的EER。

表1 分類子系統性能比較

根據實驗結果我們可以看出:

① 各分類子系統的確認性能均較差,其EER均在9%以上,而且隨著類數的增加,各子類的性能也有下降的趨勢。這是因為每個子類只蘊含了話者一部分的信息,類數的增加使得子類蘊含的信息減少;

② 在各個子類中蘊含的話者信息有限,如果用來描述子類的GMM混合度過大,使得GMM出現欠訓練情況,即訓練數據不足使得訓練統計模型性能較差。

3.4 評分融合系統實驗

本文對分類數目N=2、N=3、N=4和N=5時的分類系統均進行了后端線性等權重評分融合,得到總系統的評分,各系統的EER如表2所示、相對于各個子系統,評分融合后的總系統性能有了較大的提高,這充分說明了各個子系統蘊含的話者信息不同,具有較強的互補性。例如類數N=3,各類混合度均為128時,三類的平均EER為11.44%,而等權重融合后EER為5.94%,性能明顯提高。

表2 分類子系統融合實驗性能比較

從話者確認性能上看,N=3分類變換系統的EER大大優于GMM-UBM和GMM-UBM-SVM。正是前端的分類變換,使得對話者信息的描述更加精細,才帶來整體性能上的提升。

4 結語

SVM是一種區分性模型,非常適合于話者確認這種二分類問題。直接使用語音特征參數建立SVM話者模型面臨著數據混疊嚴重,計算復雜度高等問題。本文通過分類特征映射的方法,首先將語音根據基音周期的大小在特征空間上分類,再在各特征子空間的系統中,用描述話者子類的GMM的加權均值超矢量作為描述話者特征的超矢量,使用線性核函數建立SVM話者模型,在每個子系統中進行獨立測試評分。經過后端線性加權融合之后的系統,其話者確認性能有了較大的提高。本文的方法在 NIST’06 1side數據庫上得到了驗證。

[1] Vapnik V N. An Overview of Statistical Learning Theory[J].IEEE Transactions on Neural Networks,1999,10(05):988-999.

[2] Campbell W M, Sturim D E, Reynolds D A. Support Vector Machines Using GMM Supervectors for Speaker Verification[J].Signal Processing Letters,IEEE,2006,13(05):308-311.

[3] 趙鴻濱,盧瀟,馬麗華.基于加權VQ的說話人識別中權值產生方法的研究[J].通信技術,2008,41(02):73-75.

[4] 姚亮亮,戴蓓蒨.基于GMM全統計參數和SVM的文本無關話者確認[J].中國科學技術大學學報, 2008, 38(12):1386-1391.

[5] 萬鳴華,劉中華,金忠.一種基于2DPCA和SVM的人臉識別方法[J].通信技術,2009,42(05):100-102.

猜你喜歡
分類特征模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 2048国产精品原创综合在线| 久久精品国产免费观看频道| 97免费在线观看视频| 国产精品男人的天堂| 很黄的网站在线观看| 又大又硬又爽免费视频| 91无码人妻精品一区| 国产一区二区在线视频观看| 中文字幕乱码中文乱码51精品| 国产精品妖精视频| 97在线观看视频免费| 欧美影院久久| 青草精品视频| 国产福利大秀91| 91探花国产综合在线精品| 欧美性久久久久| 国产欧美成人不卡视频| 国产麻豆精品久久一二三| 国产精品久久久久鬼色| 欧美无遮挡国产欧美另类| 欧美人与牲动交a欧美精品 | 久久性视频| 99视频有精品视频免费观看| 欧美日韩国产在线人成app| 国产日韩丝袜一二三区| 精品剧情v国产在线观看| 波多野结衣无码AV在线| 亚洲AV无码久久天堂| 国产99精品久久| 亚洲精品在线影院| 在线国产毛片| 国产视频自拍一区| 日本影院一区| 亚洲中久无码永久在线观看软件 | 亚洲欧美国产五月天综合| 亚洲国产成人无码AV在线影院L| 伊人成人在线视频| 夜夜操天天摸| 亚洲国产91人成在线| 国产区91| 91精品国产一区| 在线五月婷婷| 亚洲一区二区日韩欧美gif| 5555国产在线观看| 色视频国产| 午夜日b视频| 国产玖玖视频| 色婷婷在线影院| 人人91人人澡人人妻人人爽 | 一本大道视频精品人妻 | 国内精品久久久久久久久久影视 | 国产精品v欧美| 免费毛片在线| 久久99国产综合精品女同| 免费女人18毛片a级毛片视频| 久久超级碰| 黄色三级毛片网站| 狠狠色丁香婷婷综合| 国产成人精品一区二区免费看京| 国产精品lululu在线观看 | 午夜人性色福利无码视频在线观看| 在线另类稀缺国产呦| 亚洲精品天堂在线观看| 狠狠久久综合伊人不卡| 国产男女免费完整版视频| 日韩无码黄色网站| 日韩中文字幕免费在线观看| 欧美色亚洲| 91综合色区亚洲熟妇p| 国产精品免费露脸视频| 成年人福利视频| 五月婷婷丁香色| 亚洲中文字幕久久无码精品A| 一级福利视频| 女人av社区男人的天堂| 国内精自视频品线一二区| 99精品免费在线| 国产欧美日韩18| 日本午夜精品一本在线观看 | 亚洲国产亚综合在线区| 成人国产一区二区三区| 91无码人妻精品一区二区蜜桃 |