曹 慧,潘 琦,呂明珠,張騰達,年伏寶
(安徽新聞出版職業技術學院,合肥230601)
基于虛擬儀器手持式回放語音識別裝置設計
曹 慧,潘 琦,呂明珠,張騰達,年伏寶
(安徽新聞出版職業技術學院,合肥230601)
針對高保真錄音回放攻擊問題,開展了高保真錄音回放識別技術的論述。以信道語音特征為模型,借助虛擬儀器設計一種手持式高保真錄音回放識別裝置,通過仿真實驗表明:基于虛擬儀器設計回放語音識別裝置能夠識別原始語音和高保真回放語音的差異。
回放語音;信道噪聲;虛擬儀器;識別裝置
隨著語音識別技術的發展,語音識別系統在司法取證、電子金融等領域得到廣泛應用。語音識別系統所面臨的問題主要來自于假冒真人說話和錄制真人說話兩方面的攻擊。近年來,由于一些低價格高性能的錄音設備相繼出現,通過這些錄音設備錄制的高保真語音使人耳難以分辨,犯罪嫌疑人開始利用這些高保真錄音回放進行電信詐騙。高保真錄音回放攻擊成為信息時代所面臨的嚴重的安全問題之一,已給國家和個人金融安全帶來了威脅[1-2]。
錄音回放攻擊是指用高性能錄音設備偷錄某一特定人的語音,然后通過回放偷錄的語音實施攻擊。針對錄音回放攻擊問題,國內外許多學者提出了很多識別方法,如Luck J.、EAtal B.S、Steven B.D等人分別將倒譜技術、線性倒譜系數、美爾頻率倒譜系數(MFCC)用于語音識別當中,取得了較好的語音識別效果,提高了語音識別的精度。瑞典大學Elisabeth等人通過語音中的語調模式和時長,提出通過計算語音周期、時長和共振峰頻率來對模仿者語音進行識別。近年來語音識別方法和技術取得了很大進展,語音識別技術從原來的單一模型發展到當前的混合模型,如隱馬爾可夫模型、高斯混合模型、神經網絡模型等[2-3]。
近年來,中國學者在語音識別領域的研究也取得了驕人的成績,提出了許多新的語音識別方法,如華南理工大學王志鋒等人提出了用語音中信道噪聲的方法來識別是否是回放語音。王志鋒等人提出的信道噪聲研究思路是回放語音在回放之前經歷至少一次錄音和回放過程,像麥克風、信號放大器、揚聲器、濾波器、A∕D轉換器等設備都會引入相應的設備信道噪聲,如圖1所示。錄音和回放設備類型不同引入的信道噪聲特征也不同,使得回放語音和原始語音在信道噪聲特征參數上存在很大的差異。采用現代統計學和模式識別的方法來提取錄音與回放設備中引入的信道噪聲,獲取設備相應的信道模式。原始語音中僅含系統錄音設備的信道噪聲,而回放語音不僅含有系統的信道噪聲,還包括偷錄設備、回放等設備引入的信道噪聲,因此提取出原始語音和回放語音中的信道模式噪聲,并把相關信號導入到相應的語音識別裝置進行回放語音識別是一種可行的方法[2-4]。

圖1 音頻語音錄制過程
虛擬儀器是美國虛擬儀器公司(NI)開發的一種將計算機、LabVIEW軟件和信號采集硬件相結合的新型儀器。虛擬儀器用戶可以設計個性化的圖形操作界面來操作這臺儀器。虛擬儀器具有很強的私人定制性,用戶完全可以按照自己的意愿去設計一個滿足自己研究方向的儀器,從而實現對所測信號的采集、處理、分析、顯示、存儲等功能,大大簡化了項目研究程序,大幅度降低了研究成本。虛擬儀器的實質是充分利用現有計算機技術來實現并擴展一些傳統儀器的功能。LabVIEW軟件是虛擬儀器的關鍵,該軟件采用圖形化編程,軟件中設置信號采集分析多個功能模塊,當與信號采集硬件連接后,就可以通過LabVIEW軟件編程來實現不同的功能,如圖2是虛擬儀器平臺結構圖[5]。

圖2 虛擬儀器平臺結構圖
研究以提取信道噪聲特征為方法,采用Lab-VIEW軟件編程開發虛擬仿真驗證平臺并植入語音識別裝置中(手機版)。仿真識別裝置采用模塊化設計,包含回放語音導入模塊、回放語音分析模塊、原聲數據庫模塊、回放語音識別模塊和語音信息存儲模塊。識別語音從導入模塊進入語音識別裝置,語音識別裝置對語音信號進行預處理后,通過語音分析模塊提取疑似回放語音中信道噪聲特征進行頻譜分析,最后與原聲數據庫模塊中說話人原聲進行比對識別,最終判斷是否為回放攻擊語音,識別過程中所有的數據都可以通過語音信息存儲模塊實時存儲,方便以后的查閱取證[6-7],如圖3所示。

圖3 回放語音識別裝置設計流程圖

圖4 仿真平臺主程序
仿真識別裝置的軟硬件采用美國NI公司開發的產品,程序開發軟件為LabVIEW 2013,利用軟件中LabVIEW Sound and Vibration Tookits強大功能進行圖形化編程。硬件為MyDAQ,筆者設計的仿真識別裝置以美國NI公司設計的MYDAQ采集卡為基礎,可以對回放語音信號進行實時采集,也可以從本地硬盤或網絡中調取原聲數據庫中說話人的語音信號。如圖4、圖5是回放語音虛擬仿真識別平臺圖形化主程序和操作界面[8]。

圖5 仿真平臺操作界面
手持式錄音回放識別裝置外觀設計如圖6。該裝置以虛擬儀器軟硬件為基礎,裝置主要用于承載語音識別硬件,也可作為普通手機盒使用。該設計包括整機外形、語音識別波形顯示屏、語音擴音出口、語音識別觸動按鈕、音量調節按鈕、待機按鈕、USB接口、電池散熱口8個部分。

圖6 手持式錄音回放識別裝置
識別裝置前面有語音識別顯示屏用于語音檢測波形圖顯示,擴音出口用于聲音向外傳播,按下語音識別觸動按鈕語音檢測識別開始,再次按下識別程序結束;裝置底部有USB接口和電池散熱口,USB接口與電腦相連,用于語音信號的導入和導出,如圖7;裝置右側有音量調節按鈕和待機按鈕,可以隨時調節語音信號的強弱和使裝置處理待測待機狀態如圖8;裝置左側有語音信號鎖定按鈕,點擊此按鈕可以將所測信號鎖定,系統將自動保存數據,如圖9。

圖7 識別裝置底部結構

圖8 識別裝置右側結構

圖9 識別裝置左側結構
采用筆者設計的識別裝置對疑似回放攻擊語音進行仿真識別實驗??紤]到詐騙分子年齡一般在25-30歲之間,并且男性居多,本實驗任意選擇一名25-30歲之間的男性采集其說話原聲,并利用高保真錄用設備錄制說話人原聲。說話人說話字段設計為“我是王小明大學輔導員,小明現在在醫院急救急需用錢”。將采集到的說話人字段原聲和錄制的回放語音同時導入仿真識別裝置進行識別。通過識別裝置仿真實驗分別得出說話人的原始語音和回放語音的頻譜圖,如圖10和圖11所示。從圖10和圖11所顯示的頻譜圖可以看出,原始語音和回放語音的頻譜圖非常相似。生活中這種高保真回放語音通過接聽手機是無法識別出來的。通過筆者設計的手持式回放語音識別裝置,將虛擬儀器技術應用到手機當中,可以檢測和計算出原始語音和回放語音信道噪聲特征差。如果將原始語音和回放語音同時導入到手持式回放語音識別裝置中,可以得出如圖12所示信道噪聲特征頻譜圖。通過圖12頻譜圖可以看出原始語音和回放語音信道噪聲頻譜相減后,還明顯出現了一段信道噪聲特征頻譜,在圖12所顯示的頻譜圖中伴有多個共振峰出現,因此我們可以斷定識別的語音為高保真回放攻擊語音[8]。

圖10 原始語音頻譜圖

圖11 回放語音頻譜圖

圖12 回放語音信道噪聲頻譜圖
[1]王志鋒,賀前華.基于信道模式噪聲的錄音回放攻擊檢測[J].華南理工大學學報(自然科學版),2011,39(10):7-8.
[2]王志鋒.基于信道信息的數字音頻盲取證關鍵問題研究[D].廣州:華南理工大學,2013.
[3]王茂蓉,周萍.基于信道信息的錄音假冒者檢測系統研究[J].計算機仿真,2016,33(2):461.
[4]展領.蓄意模仿說話人語音中特征參數的研究[D].桂林:桂林電子科技大學,2010.
[5]張振.李香飛,甘淑敏,等.基于labview的聲音信號采集分析系統開發[J].北方工業大學學報,2012,24(3):42-43.
[6]羅海宇.具有防錄音回放功能的說話人識別系統的設計與實現[D].廣州:華南理工大學,2012.
[7]張利鵬,曹犟,徐明星,等.防止假冒者闖入說話人識別系統[J].清華大學學報(自然科學版),2008(s1):699-703.
[8]曹慧.高保真錄音回放攻擊取證算法與仿真驗證[J].安陽工學院學報,2015,14(4):47-49.
TP391.9
A
1673-2928(2018)02-0069-04
D01:10.19329/j.cnki.1673-2928.2018.02.020
2017-12-20
安徽省高等學校自然科學重點研究項目(項目編號:KJ2017A871)。
曹慧(1979-),男,安徽省望江縣人,碩士,安徽新聞出版職業技術學院教師,主要研究領域為信號處理和系統仿真。
王彥永)