999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于虛擬化的聲紋識別系統性能研究

2015-01-05 05:54:08潘松松田文洪
成都信息工程大學學報 2015年2期
關鍵詞:模型系統

佘 堃,潘松松,田文洪

(電子科技大學,四川成都611731)

0 引言

在認證技術領域中,使用密碼進行加密和解密是最常見的、最簡單的技術,得到了廣泛的應用。然而這種身份認證方式存在很大的弊端,簡單的容易被破解,復雜的容易被遺忘。隨著互聯網系統的爆發式發展、計算機技術和密碼學的深入研究,密碼的安全性面臨著嚴峻的考驗,傳統的密碼身份認證很難滿足現代安全、便捷的需求[1]。

相對地,生物特征識別成為了一種很好的技術創新突破口。聲紋識別(又稱說話人識別)是一種通過語音數據識別說話人身份的生物識別技術,近年來受到眾多研究機構和企業的追捧,加快了理論研究和實際應用開發的進展[2]。人的聲道結構、說話習慣都是唯一的、長期穩定的,這使得每個人發出來的聲音都具有獨特性。聲紋識別就是從說話人說話語音中提取具有代表性的聲紋特征,以此識別說話人的真實身份。因為聲紋識別具有經濟性、非接觸性、準確性的特點,可以打破局域和時間的限制,得到電話社保身份確認、公安司法案件偵破、銀行或證券身份識別、國防安全等領域的青睞[3]。

但是在實際應用中,聲紋模型訓練和身份識別會涉及到大量的語音數據存儲和聲紋信號處理算法運算。隨著用戶數量的急劇增加,需要處理的語音數據量就越多,它對數據中心和計算資源的要求也越高,依賴性也就越強,相應的應用種類也就會增加,功能變得更多,系統更復雜,管理也就變得更困難,成本更高[4]。

而云計算正是從服務提供者的角度給出的一種解決辦法。通過虛擬化技術把物理資源(CPU、存儲空間、操作系統、應用程序開發環境等)分成多個虛擬化空間,彼此互不影響。用戶無需關心具體物理機的位置或性能,直接通過網絡獲得高效的計算和存儲能力。

文中引入云計算技術,把聲紋識別系統運用于虛擬化環境中,實現一個結合虛擬化技術的聲紋識別系統,評估系統的整體運算性能。

1 相關工作

人依靠聽覺能夠分辨說話人的身份,那么說話人語音中必然包含獨特的身份信息。但是機器是無法直接識別的,需要從聲紋中提取出機器能夠識別的數據和理解的識別公式。在聲紋識別技術的研究中,從聲紋中提取說話人的身份特征信息,稱為聲紋特征向量[5]。

根據文獻[6]的研究顯示,特征提取的根本目標就是降維,用少量的矩陣維數記錄說話人的語音特征。線性預測倒譜系數(LPCC)、線譜對(LSP)、線性預測殘差等線性預測分析出來的特征參數無法準確地表達出聽覺特征,人耳對于不同頻率的感知能力與聲紋頻率不是呈現線性關系。對此提出了Mel頻率的特性,更能符合并表達出實際聽覺特征,在與文本無關的聲紋識別應用領域中,MFCC(Mel-Frequency Cepstrum Coefficients)的特征提取方法比線性預測方法在識別方面更占優勢。

聲紋特征提取后,就需要模型進行描述聲紋特性,模型的選擇和建立都至關重要,直接影響聲紋識別的性能。根據文獻[7]和文獻[8]的研究表明,混合模型(Gaussian Mixture Model,GMM)具有卓越的性能優勢,在多種領域中被廣泛使用。高斯混合模型是一種多組高斯分布(亦稱正態分布)的線性迭代模型。由于多組正態概率密度函數的線性加權和可以模擬任意分布,所以一個人的聲紋特征也可以由GMM來描述。每個人的聲紋特征都是不一樣的,即其統計出來的聲紋特征分布也是有區別的、唯一的,所以可以通過GMM建立生成的聲紋特征模型對比說話人的身份。但是隨著GMM的訓練階數的增加,就會造成系統花更多的計算資源和計算時間,這將對聲紋識別系統帶來很大的性能挑戰。

文獻[9]研究了在云計算環境中,虛擬機粒度對工作負載性能的影響。采用HPL作為代表緊密耦合的計算工作量,性能評估的結果顯示了虛擬機粒度對計算工作量的性能有顯著的影響。在配置有8個CPU的服務器,處理問題大小為4096的HPL,采用8個虛擬機的性能效果比4或16個虛擬機的性能高出4倍,是最為出色的。而12個CPU的服務器處理問題大小為256到1024的HPL,采用24個虛擬機達到了性能最佳狀態。文獻[9]還表明VM粒度對Web系統的性能的影響并不重要,VM粒度只是動態改變了VM延展性策略,可用于提高緊密耦合的計算工作負荷的性能。

而把聲紋識別系統運用于虛擬化環境中,實現一個結合虛擬化技術的聲紋識別系統,此過程會變得更加復雜,涉及到聲紋識別算法的大量計算、與前臺進行信息交互、虛擬機的調用等,會是一個緊密耦合的綜合性云系統[10]。

2 結合虛擬機技術的聲紋識別系統設計

研究如何把虛擬機技術結合到聲紋識別系統之中,最常見的設計想法就是在物理機上運行多臺虛擬機,同時把物理機上原來的運行環境系統重新部署到虛擬機里,形成虛擬機集群,那么一臺物理機就可以并發運行聲紋識別系統,提高系統的效率。但上述理論模型在實際應用過程中可能會出現如下的情況:如果有些識別任務被分配到正在運行識別任務的虛擬機(忙狀態的虛擬機)上,這些識別任務就會等待,呼叫中心(前臺)的請求就會延遲,甚至請求超時,得不到響應,這樣反而降低了系統的性能和使用效果。這就相應地引出一個致命的問題——如何合理調度虛擬機資源,結合整個系統的基本架構,對此制定了兩套調度方案:方案一是在虛擬機服務器上做修改,每個虛擬機上添加一個監視器,監視虛擬機的運行狀況(忙狀態還是閑狀態);在物理機上添加虛擬機調度模塊,根據虛擬機的狀況,調度一臺空閑狀態的虛擬機給呼叫中心使用,運行識別算法。具體執行方案如圖1所示。

圖1 基于監視器的調度方法

步驟1:呼叫中心需要獲取虛擬機資源時,向虛擬機服務器的調度模塊發送調用虛擬機的請求。

步驟2::調度模塊接收到呼叫中心的請求后,會向所有開啟的虛擬機發送檢測虛擬機運行狀況的請求。

步驟3:如果虛擬機接收到調度模塊發送過來的服務請求,虛擬機的監視器會監測到本臺虛擬機的CPU使用率、內存消耗情況、運行時間、調度的次數,根據這些反饋的參數得到虛擬機的狀態(忙狀態還是閑狀態),然后響應調度模塊的請求。

步驟4:調度模塊接收到所有虛擬機的響應后,選擇出一個空閑狀態的虛擬機,把這臺虛擬機的ip地址發送給呼叫中心,作為步驟1的響應數據。

步驟5:呼叫中心獲得虛擬機的ip地址后,就可以調用這臺虛擬機的Web服務,向其發送聲紋識別的運算請求。

步驟6:虛擬機將識別結果反饋給呼叫中心,完成整個識別任務。

6個步驟全部完成才能實現整個后臺調用運算,只要其中任何一步出現問題,就會造成識別任務的失敗。監視器監測虛擬機的運行情況,時時刻刻在后臺運行,反饋虛擬機的健康情況。再由調度模塊根據具體參數設計合理地調度算法,分配空閑的虛擬機資源,這個過程會一直搶占服務器和虛擬機的資源。從開發和系統結構角度考慮,基于監視器和虛擬機調度模塊的系統架構設計加重了系統的任務模塊和復雜度,增加了耦合性和開發周期,系統崩潰的風險也隨之提高[11]。

另一套方案是根據語音卡本身的調度機制,拓展并實現調度虛擬機的功能。語音卡支持的分路線數是有限的,是跟網絡接口所擁有的網絡物理線數一一對應的[12]。一般情況下模擬語信號音卡支持的語音通道線數大多為8條或16條;而數字信號語音卡的語音通道線數依據E1接口的數量決定的,每個E1接口支持30個語音通道線數。多塊語音卡也可以一起使用來共同完成語音處理功能,語音卡之間不需要經過計算機總線,可以直接通過語音卡內部語音總線相互連接通信,實現數據的交換和通信。語音卡本身就有自動調用語音通道的機制,提供調用空閑語音通道、釋放語音通道、等待語音通道等功能。就可以利用語音卡的語音通道調度機制,結合一個閑狀態的虛擬機ip池,實現一種高效的、精簡的虛擬機調度模塊。具體執行方案如圖2所示。

圖2 基于語音通道調度機制的虛擬機調度方法

這種虛擬機調度方法明顯比上一個方案的方法要簡單很多,虛擬機調度模塊的實現直接在呼叫中心實現,不需要在虛擬機或虛擬機服務器物理機上添加其他系統模塊,降低了系統的耦合性,減輕了虛擬機服務的運行負擔。當一個空閑的語音通道被啟用時,系統會從閑狀態的虛擬機ip池中分配給此語音通道一個有效的、空閑狀態的虛擬機ip地址,提供虛擬機資源。當語音通道資源被釋放時,系統就隨之把虛擬機ip資源還原到閑狀態的虛擬機ip池中,釋放虛擬機資源。

3 結果與分析

系統所采用的語音樣本庫是由20位測試者錄制而成的,其中男女各有10人,年齡跨度從20多歲到50多歲,語言限制為普通話。每個測試人員錄制了一組包含8段短語音的訓練語音樣本,以及3組(每組包括3段短語音)以上的識別語音。錄制的內容都是根據制定的問題回答的,應答時間設置為10秒,完全能夠保證用戶淡定自然、語速緩和、吐字清晰地應答問題。每個測試人員在進行語音注冊和識別階段用的是同一部手機,手機的品牌和型號選擇也加以限制,確保語音樣本的質量。所有的語音采集過程都是在安靜的測試環境中完成的,經過呼叫中心生成unsigned 8 bit、A-Law編碼方式、采樣率8000 Hz、位速64 kbps、單聲道的WAV格式語音樣本。

系統采用Pentium Dual-Core CPU E5300@2.60 GHz(1 個 CPU)、4 GB(海力士 DDR3 1333 MHz)、Microsoft Windows Server 2008(64 bit)操作系統的2臺服務器。其中一臺直接部署聲紋識別系統,用于順序執行識別任務的計算性能。另一臺開啟了4臺Oracle VM VirtualBox虛擬機,每臺虛擬機都搭建聲紋識別系統,用于并發執行識別任務的計算性能。通過獲取樣本語音庫中的所有訓練模型語音和一組識別語音,在兩臺服務器中都執行4次模型訓練和身份識別任務,并統計相應的運行時間。

3.1 模型訓練的性能比較

按照測試執行方案,統計出建模訓練在物理機上順序執行所耗時間,如表1所示。

表1 建模訓練在物理機上順序執行所耗時間/s

由于本次系統是對20位測試者的模型進行順序執行的訓練,所以表1中的合計時間是20位測試者進行模型訓練所耗時間的總和,最終的測試所耗平均時間是825.623125秒。

建模訓練在虛擬機群上并發執行所耗的時間,如表2所示。

表2 建模訓練在虛擬機群上并發執行所耗時間/s

由于虛擬機服務器系統的最大并發執行能力是同時運行4臺虛擬機,所以共同執行20位測試者的模型訓練任務,所耗時間如表2所示的所用總時間,所耗的平均時間是544.66075秒。在聲紋建模階段,順序執行和并發執行的時間比對,如圖3所示。

圖3 順序和并發執行模型訓練所耗平均時間

根據圖3,虛擬機并發在執行建模訓練的性能比順序執行提高了34.03%。

3.2 聲紋確認的性能比較

聲紋確認的性能測試,跟模型訓練的測試一樣。統計出聲紋確認在物理機上順序執行所耗時間,如表3所示。

表3 聲紋確認在物理機上順序執行所耗時間/s

由于系統是順序執行20位測試者的聲紋確認,所以表3中的合計時間是20位測試者聲紋確認所耗時間的總和,最終的測試平均時間是22.35125秒。聲紋確認在虛擬機群上并發執行所耗時間,如表4所示。

由于虛擬機服務器系統的最大并發執行能力是同時運行4臺虛擬機,所以共同執行20位測試者的身份識別任務,所耗時間如表4所示的所用總時間,所耗的平均時間是7.06125秒。在聲紋確認階段,順序執行和并發執行的時間比對,如圖4所示。

根據圖4所示,虛擬機并發在執行聲紋確認的性能比順序執行提高了68.41%。

表4 聲紋確認在虛擬機群上并發計算所耗時間/s

圖4 順序和并發執行聲紋確認所耗平均時間

4 結束語

論文主要是將聲紋識別系統與虛擬化技術相結合,解決聲紋模型訓練和身份識別的大量數據分析運算,提高整體系統的執行效率。在單CPU服務器的環境中,比對了部署4臺虛擬機與單獨物理機的執行性能。虛擬機并發在執行建模訓練的性能比物理機執行提高了34.03%,執行聲紋確認的性能比物理機執行提高了68.41%。

[1] 李建華.探究網絡信息安全管理中多因素身份認證的使用[J].電子技術與軟件工程,2015,(4):231-232.

[2] 白燕燕,胡曉霞,鄭三婷.基于聽覺特性的聲紋識別系統的研究[J].電子設計工程,2015,(4):85-87.

[3] 龐景旭.關于音頻司法鑒定技術的研究[J].法制博覽,2014,(19).

[4] 孫熙領,陳超,丁治明,等.云計算環境中基于訪問量和依賴性評價的數據分配算法[J].計算機科學,2012,39(5):141-146.

[5] 尹許梅.基于MFCC和矢量量化的說話人識別算法研究[D].長沙:湖南大學,2011.

[6] 胡政權,曾毓敏,宗原,等.說話人識別中MFCC參數提取的改進[J].計算機工程與應用,2014,(7):217-220.

[7] 于嫻,賀松,彭亞雄,等.基于GMM模型的聲紋識別模式匹配研究[J].通信技術,2015,(1).

[8] 許東星.基于GMM和高層信息特征的文本無關說話人識別研究[D].合肥:中國科學技術大學,2009.

[9] Ping W,Wei H,Varela C A.Impact of Virtual Machine Granularity on Cloud Computing Workloads Performance[C].Grid Computing(GRID),2010 11th IEEE/ACM International Conference on.2010:393-400.

[10] 謝霞.基于數字語音卡的智能語音外呼系統[J]. 電子技術與軟件工程,2015,(5).

[11] 陳任之,黃立波,陳頊顥,等.單節點多GPU集群下HPL動態負載均衡優化[J].計算機科學,2013,40(3):107-110.

[12] Kochut A.On Impact of Dynamic Virtual Machine Reallocation on Data Center Efficiency[C]//Modeling,Analysis and Simulation of Computers and Telecommunication Systems,2008.MASCOTS 2008.IEEE International Symposium on.IEEE,2008:1-8.

[13] Desell T,Maghraoui K E,Varela C A.Malleable applications for scalable high performance computing[J].Cluster Computing,2007,10(3):323-337.

猜你喜歡
模型系統
一半模型
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
3D打印中的模型分割與打包
主站蜘蛛池模板: 影音先锋亚洲无码| 伊人久久大香线蕉影院| 在线免费看片a| 丁香六月激情综合| 亚洲欧美一区在线| 欧美日韩第三页| 久久窝窝国产精品午夜看片| 免费人成网站在线高清| 日韩高清一区 | 久久综合国产乱子免费| 青草精品视频| 成年免费在线观看| 91探花国产综合在线精品| 国产另类乱子伦精品免费女| 一本久道热中字伊人| 亚洲国内精品自在自线官| www.精品国产| 亚洲人妖在线| 欧美日本视频在线观看| 国产精品亚洲综合久久小说| 五月天综合网亚洲综合天堂网| 国产在线观看高清不卡| 国产一区二区三区视频| 日韩不卡高清视频| 狠狠躁天天躁夜夜躁婷婷| 国产农村妇女精品一二区| 亚洲天堂福利视频| 国产自产视频一区二区三区| 亚洲男人的天堂在线观看| www.99在线观看| 亚洲天堂日韩av电影| 麻豆AV网站免费进入| 成人在线观看不卡| 久久青草视频| 国产福利一区二区在线观看| 国产一区二区三区精品欧美日韩| 精品综合久久久久久97超人| 日韩黄色精品| 美女黄网十八禁免费看| 波多野结衣久久高清免费| 国产亚洲精品97在线观看| 色亚洲成人| 久久狠狠色噜噜狠狠狠狠97视色| 2020极品精品国产| 波多野结衣中文字幕一区二区| 国产白浆在线| 国产精品视频观看裸模| 国产迷奸在线看| 精品国产免费观看一区| 91精品国产一区| 亚洲中文字幕久久无码精品A| 内射人妻无套中出无码| 国产精品午夜福利麻豆| 亚洲一区黄色| 国产日本欧美亚洲精品视| 国产玖玖视频| 老司机精品久久| 亚洲无码高清免费视频亚洲| 九色视频在线免费观看| 91精品网站| 国产日韩欧美在线视频免费观看 | 在线观看欧美国产| 国产微拍一区二区三区四区| 国产精品第一区在线观看| 久久婷婷五月综合色一区二区| 国产自产视频一区二区三区| 2020国产精品视频| 亚洲综合第一区| 日本欧美一二三区色视频| 五月婷婷欧美| 一级毛片不卡片免费观看| www欧美在线观看| 欧洲极品无码一区二区三区| 亚洲精品中文字幕午夜| 国产在线视频导航| 天堂网亚洲综合在线| 九九久久99精品| 一本大道东京热无码av| 九九久久99精品| 波多野结衣第一页| 国产视频入口| 亚洲码一区二区三区|