999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進壓縮感知的說話人識別抗噪算法

2016-07-19 02:13:23茅正沖
計算機應用與軟件 2016年6期
關鍵詞:信號

茅正沖 龔 熙

(江南大學輕工過程先進控制教育部重點實驗室 江蘇 無錫 214122)

?

基于改進壓縮感知的說話人識別抗噪算法

茅正沖龔熙

(江南大學輕工過程先進控制教育部重點實驗室江蘇 無錫 214122)

摘要壓縮感知CS(compressive sensing)是一種基于信號稀疏性,有效提取信號中有用信息的方法。根據語音信號和干擾噪聲在離散余弦變換域DCT(discrete cosine transform)稀疏性的不同,提出一種基于改進壓縮感知的說話人識別抗噪算法。在用正交匹配追蹤OMP(orthogonal matching pursuit)算法重構語音信號時設定相關度閾值和語音恢復閾值,不僅有效恢復了語音信號,而且實現了語音增強。然后通過Gammatone濾波器組,對恢復語音信號進行處理,提取特征參數GFCC。仿真實驗在高斯混合模型識別系統中進行,實驗結果表明,將這種方法應用于說話人識別抗噪系統,系統的識別率及魯棒性都有明顯提高。

關鍵詞壓縮感知正交匹配追蹤GFCC抗噪算法識別率

0引言

壓縮感知(CS)作為近些年新興的信號處理技術,是一種在采樣過程中利用較少數據就能有效提取信號信息,然后通過重構算法從采樣信息中恢復原信號的方法[1]。語音增強是指對帶噪語音信號進行處理,降低噪聲的干擾,恢復出較純凈的語音。所以,壓縮感知與語音增強的本質是類似的。CS理論由于其邊采樣邊壓縮的特性使其具有了巨大的吸引力和應用前景,研究領域已經涉及到了雷達、無線傳感、醫學等領域。文獻[2]將壓縮感知理論運用到了隨機調制雷達信號處理中,為隨機調制雷達的低旁瓣信號處理提供了全新思路。文獻[3]將合成聚焦于CS理論結合,解決了B超成像過程中數據量大的問題。

信號的稀疏性是壓縮感知的前提和基礎,但是正如語音和圖像等信號,它們本身并不是稀疏的,但可以通過某種變換在其變換域中得到一個稀疏的信號以此來適用壓縮感知。對于語音信號通常可以轉換到DCT域、小波域等變換域來獲得稀疏信號。文獻[4]對語音信號在DCT域能顯示出的近似稀疏性提出語音信號DCT域壓縮感知。文獻[5]利用語音信號自身構造了一種自相關觀測矩陣,在同等重構性能下壓縮率比其他隨機矩陣更低。文獻[6]在壓縮感知的重構階段設定相似度閾值來進行語音增強,該算法對非人聲噪聲有一定抗干擾作用。文獻[7]提出了離散余弦小波包變換的語音信號壓縮感知,構造出了更加稀疏的變換基,提高了重構的性能。

本文根據語音信號和干擾噪聲在DCT域稀疏性的不同,在通過OMP算法重構帶噪語音信號中的有用信息時,設置相關度閾值來限制迭代的次數,讓盡可能少的噪聲分量恢復出來。而當背景噪聲類型于說話人信號時,僅設置相關度閾值不能有效恢復純凈語音信號,因為這時背景噪聲和純語音信號擁有相似的稀疏性。所以本文提出設置第二個門限閾值:語音恢復迭代閾值,以此來抑制人聲背景噪聲的回復。在重構過程中,如果低于此閾值,則迭代停止。這種雙門限閾值的正交匹配追蹤算法能夠很好地應對不同的噪聲環境場合,有效地實現語音增強。

1改進壓縮感知說話人識別抗噪算法

1.1壓縮感知基本原理

1.2DCT域稀疏性

對信號作壓縮感知處理時,信號自身或者在變換域的稀疏性是對其進一步分析的重要前提。由于語音信號具有類余弦信號的周期特性,因此可以在DCT域來對其進行表示:

(1)

此時,Ψ為離散余弦基矩陣。經過DCT變換后的稀疏系數為Θ=(θ1,θ2,…,θN)T,θi=X(i-1),i=1,2,…,N,本文對一段語音“發布”截取一幀(512點)作DCT變換,并對DCT系數的絕對值進行降序排列,結果如圖1所示。可以發現,在200~512之間的DCT系數都近似為0,說明信號在DCT域是稀疏的,可以采用壓縮感知方法處理。

圖1 DCT域系數分布及其降序排列

另外,本文對語音信號“發布”、高斯噪聲以及babble噪聲各取一幀作稀疏性對比,結果如圖2所示。通過DCT系數絕對值的直方圖發現,語音信號小幅度系數占了絕大部分,具有良好的稀疏性;高斯DCT系數比較均勻,舍棄小系數后作重構恢復,失真會很大,因而高斯噪聲不具有稀疏性;babble噪聲為一段嘈雜的人聲背景噪音,觀察圖2(f)發現,babble噪聲也具有較好的稀疏性。

圖2 語音信號和噪聲在DCT域稀疏性對比

根據CS理論,對帶噪語音信號進行低維投影,當觀測矩陣維數足夠包含語音信息時,投影后將丟失部分不具有稀疏性的噪聲信息,重建時無法恢復。因此利用稀疏性不同的特性可以對語音信號進行去噪。然而,當采集的語音信號被類似于babble這樣的人聲噪聲干擾時,僅根據稀疏性不同不能很好去噪,因為背景噪聲同樣具有較好的稀疏性。

1.3觀測矩陣

觀測矩陣Φ的選取對信號重構的性能有著很大影響,合適的觀測矩陣應該在盡可能低的觀測維數下,由一種重構算法,恢復出盡可能純凈的語音信息,同時又能去掉了大量噪聲。即要在觀測值M盡可能小的情況下達到對原始信號x較好的去噪效果,以此來提高最后的識別率。

觀測矩陣Φ分為隨機觀測矩陣和確定性觀測矩陣。隨機觀測矩陣與大多數變換基矩陣不相關,很大概率滿足RIP條件,比較容易構造。但在實際應用中,存在不確定性。確定性矩陣雖然不存在上述問題,但構造比較困難。目前在壓縮感知中普遍采用隨機觀測矩陣對信號進行低維投影,常用的有Gauss分布隨機矩陣,Bernoulli分布隨機矩陣,Fourier矩陣,Toeplitz矩陣和Hadamard矩陣,文獻[9]討論了這些隨機矩陣的性能,如圖3所示,從圖中可以看Hadamard矩陣性能最優。

圖3 五種隨機矩陣性能比較

1.4改進OMP重構算法

(2)

式中ζ為重構信號與帶噪語音信號x之間的殘差。當重構信號越接近x中的純語音信號時重構性能越好,而不是讓重構信號逼近x。

OMP算法依據殘余信號r與原子庫D=ΦΨ中原子內積由大到小恢復信號的,其實也是根據信號分量的重要性程度來決定迭代恢復的次序。可以把帶噪語音信號分為三個部分:純凈部分、帶噪部分和噪聲部分,那么,語音信號的重構就可以劃分為以下三個階段:(1) 純語音信息的迭代恢復;(2) 帶噪語音信息的迭代恢復;(3) 噪聲信息的迭代恢復。要實現語音增強,需要控制迭代的次數。

圖4 改進OMP算法流程圖

2Gammatone特征提取

Gammatone濾波器能很好地模擬人耳基底膜的分頻特性,本文通過該濾波器組提取特征參數GFCC。先對帶噪信號作預處理(預加重、分幀和加窗)和壓縮重構,然后將恢復的信號通過一組64通道的Gammatone濾波器組,其中心頻率在50~8000Hz之間[11],時域表達形式如式(3):

g(f,t)=kta-1e-2πbtcos(2πft+φ)t≥0

(3)

式中,k為濾波器增益,a為濾波器階數,f為中心頻率,φ為相位,b為衰減因子,該因子決定相應的濾波器的帶寬,它與中心頻率f的關系為:

b=24.7(4.37f/1000+1)

(4)

由于Gammatone濾波器的時域表達式為沖擊響應函數,所以將其進行傅里葉變換就可以得到其頻率響應特性。不同中心頻率的Gammatone濾波器幅頻響應曲線如圖5所示。

圖5 一組不同中心頻率下Gammatone濾波器的幅頻響應曲線

當語音信號通過該濾波器時,輸出信號Gm(i)的響應表達式為:

(5)

式中,N=64是濾波器的通道數,M是采樣之后的幀數。

這樣Gm(i)就構成了一個矩陣,它的每一列稱為Gammatone特征系(GF)[12],一個GF特征矢量由64個頻率成分組成。由于相鄰的濾波器通道有重疊的部分,GF特征矢量相互之間存在相關性。為了減小GF特征矢量的維度及相關性,這里對每一個GF特征矢量進行離散余弦變換(DCT),具體表示為:

(6)

將系數Ci(j)稱為GFCC系數。圖6為語音段“發布”的GFCC特征系數,其主要特征體現在低維(前30維)上。在實際的說話人識別系統中,由于計算量大,并非取全部維數的GFCC系數。文獻[13]證明,主成分分析PCA(principalcomponentsanalysis)技術可以把64維GFCC系數,按累積貢獻率不小于85%的準則,降到26維。降維后的GFCC特征參數表示為:

(7)

圖6 語音段“發布”的GFCC特征系數

3實驗結果與分析

實驗所用的語音庫是用麥克風錄制的,語音采用的是單聲道,8KHz的采樣頻率,16bit量化。該語音庫由20人錄制,每個人錄制10段語音,時長分2~5s不等,將每個人的4段語音作為訓練樣本集,用高斯混合模型對其訓練,另外6段語音作為測試樣本集。混入噪聲選自NOISEX-92標準噪聲庫中的white噪聲和babble噪聲,信噪比分別為-10、-5、0、5和10dB。采用的識別方法是高斯混合模型(GMM),GMM的混合數是16。仿真結果如圖7所示。

圖7 仿真實驗結果

為了獲得經本文算法處理后語音的主觀聽覺感受,采用MOS評分法,接受10位聽眾的聽覺感受測試,聽眾根據處理后語音的清晰度、可懂度和噪聲情況綜合給出評分,然后記錄不同算法處理后的MOS均分,如表1所示。

表1 主觀MOS評分比較

從圖7和表1中可以看出,本文算法的識別率和MOS評分要高于文獻[6]的壓縮感知方法以及一般的語音去噪增強算法,尤其在人聲背景噪聲環境下,本文算法抗噪能力并未下降,凸顯出本文算法的優越性。

4結語

語音信號作為一種典型的非平穩性信號,容易受到噪聲的干擾。本文給出了一種基于改進壓縮感知的說話人識別抗噪算法,先對帶噪語音信號作預處理,然后壓縮重構,將重構恢復的語音信號通過Gammatone濾波器組提取特征參數GFCC,最后在GMM模型中識別。實驗結果表明,本文算法的識別率、魯棒性及主觀感受都優于傳統的語音增強識別算法。GFCC特征參數能很好地模擬人耳基底膜特性,降低加性噪聲的影響;改進的壓縮感知能降低人聲背景噪聲的干擾,增加了該算法在更多背景噪聲環境下的適應性。然而,OMP重構時每次迭代都要用最小二乘法估計殘差,隨著迭代次數的增加,原子集合矩陣不斷擴大,矩陣求逆的運算量和重建所需的時間也相應增加。在短時間內進行說話人識別時,識別算法還需進一步改進。因此,如何優化本文算法,減少計算量,實現短時識別將是下一步研究的重點。

參考文獻

[1]MarcoFDuarte,YoninaCEldar.StructuredCompressedSensing:FromTheorytoApplications[J].Transactiononsignalprocessing,2011, 59(9):4053-4085.

[2] 劉振.基于壓縮感知的隨機調制雷達信號處理方法與應用研究[D].湖南:國防科技大學研究生院,2013.

[3] 杜衍震,孫豐榮,李凱一,等.一種合成聚焦的便攜式B型超聲成像方法[J].計算機工程,2014,40(1):246-249.

[4]MorenoRG,MauricioMG.DCT-Compressivesamplingappliedtospeechsignals[C]//21stInternationalConferenceonElectricalCommunicationsandComputers.SanAndresCholula,Puebla,Mexico,2011:55-59.

[5] 季云云,楊震.基于自相關觀測的語音信號壓縮感知[J].信號處理,2011,27(2):207-214.

[6] 周小星,王安娜,孫紅英,等.基于壓縮感知過程的語音增強[J].清華大學學報,2011,51(9):1234-1238.

[7] 張長青,陳硯圃.離散余弦小波包變換及語音信號壓縮感知[J].聲學技術,2014,33(1):35-40.

[8]ThongTDo,LuGan,NamHNguyen,etal.FastandEfficientCompressiveSensingUsingStructurallyRandomMatrices[J].IEEETransactionsonSignalProcessing,2012,60(1):139-154.

[9] 李小波.基于壓縮感知的測量矩陣研究[D].北京:北京交通大學,2010.

[10]LinghuaChang,JwoyuhWu.AnImprovedRIP-BasedPerformanceGuaranteeforSparseSignalRecoveryviaOrthogonalMatchingPursuit[J].IEEETransactionsonInformationTheory,2014,60(9):5702-5715.

[11] 王玥,錢志鴻,王雪,等.基于伽馬通濾波器組的聽覺特征提取算法研究[J].電子學報,2010,38(3):525-528.

[12]XavierValero,FrancescAlias.GammatoneCepstralCoefficients:BiologicallyinspiredFeaturesforNon-SpeechAudioClassification[J].IEEETransactionsonMultimedia,2012,14(6):1684-1689.

[13]HarunUguz.Atwo-stagefeatureselectionmethodfortextcategorizationbyusinginformationgain,principalcomponentanalysisandgeneticalgorithm[J].Knowledge-BasedSystems,2011,24(7):1024-1032.

[14] 茅正沖,王正創,龔熙.一種低信噪比下的說話人識別算法研究[J].計算機應用與軟件,2014,31(12):218-220,252.

A SPEAKER RECOGNITION ANTI-NOISE ALGORITHM BASEDONIMPROVEDCOMPRESSIVESENSING

Mao ZhengchongGong Xi

(Key Laboratory of Advanced Process Control for Light Industry,Ministry of Education,Jiangnan University,Wuxi 214122,Jiangsu,China)

AbstractCompressive sensing (CS) is a method based on signal sparseness, and can efficiently extract useful information from signals. In this paper we present a speaker recognition anti-noise algorithm, which is based on improved compressive sensing, according to the different sparseness between speech signal and interfering noises in discrete cosine transform (DCT) area. We set correlation threshold and speech recovery threshold when reconstructing speech signals with orthogonal matching pursuit algorithm, this can not only restore speech signal effectively, but also realises the speech enhancement. Then through Gammatone filter bank we process the restored speech signal and extract feature parameter GFCC. Simulation experiment is conducted in Gaussian mixture model recognition system, experimental result shows that this algorithm obviously improves the recognition rate and robustness when being applied to speaker recognition and anti-noise system.

KeywordsCompressive sensingOMPGFCCAnti-noise algorithmRecognition rate

收稿日期:2015-01-05。國家自然科學基金項目(60973095);江蘇省自然科學基金項目(BK20131107)。茅正沖,副教授,主研領域:機器人視聽覺識別。龔熙,碩士生。

中圖分類號TP391.4

文獻標識碼A

DOI:10.3969/j.issn.1000-386x.2016.06.038

猜你喜歡
信號
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
7個信號,警惕寶寶要感冒
媽媽寶寶(2019年10期)2019-10-26 02:45:34
孩子停止長個的信號
《鐵道通信信號》訂閱單
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
基于Arduino的聯鎖信號控制接口研究
《鐵道通信信號》訂閱單
基于LabVIEW的力加載信號采集與PID控制
Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
主站蜘蛛池模板: 国产后式a一视频| 亚洲久悠悠色悠在线播放| 国产丰满成熟女性性满足视频| 亚洲第一成网站| 久久一日本道色综合久久| 无码精品福利一区二区三区| 亚洲日韩精品无码专区| 天天色综网| 亚洲中文精品人人永久免费| 玖玖免费视频在线观看 | 99精品视频播放| 巨熟乳波霸若妻中文观看免费| 伊人狠狠丁香婷婷综合色| 久久性视频| 欧美激情视频二区三区| 欧美伦理一区| 亚洲人成影院在线观看| 国产精品天干天干在线观看| 久久婷婷五月综合色一区二区| 国产色偷丝袜婷婷无码麻豆制服| 国产丝袜丝视频在线观看| 国产精品乱偷免费视频| 一边摸一边做爽的视频17国产| 中日韩一区二区三区中文免费视频 | 欧美性精品| 国产精品三级av及在线观看| 五月天久久综合国产一区二区| 中文字幕色站| 国产乱子伦手机在线| 色成人亚洲| 国产99在线观看| 第一区免费在线观看| 亚洲成人精品久久| 性欧美久久| 国产精品永久在线| 黄色网址手机国内免费在线观看| 亚洲日本一本dvd高清| 国产乱人伦AV在线A| 91九色国产在线| 一级毛片在线播放免费| 国内自拍久第一页| 97成人在线视频| 女人毛片a级大学毛片免费| 国产99热| 欧美亚洲网| 日韩小视频在线观看| 国产午夜福利亚洲第一| 亚州AV秘 一区二区三区| 免费又爽又刺激高潮网址 | 日韩欧美国产区| 欧美一级色视频| 亚洲妓女综合网995久久 | 伊人精品视频免费在线| 久久99精品久久久久久不卡| 天天色综合4| 无码中文字幕精品推荐| 久草视频精品| 亚洲久悠悠色悠在线播放| 免费人成又黄又爽的视频网站| 亚洲福利视频网址| 国产精品永久在线| 又爽又黄又无遮挡网站| 欧美不卡视频在线观看| 日韩久久精品无码aV| 永久免费AⅤ无码网站在线观看| 91亚洲国产视频| 亚洲成肉网| 欧美97欧美综合色伦图| 动漫精品啪啪一区二区三区| 四虎国产永久在线观看| 亚洲精品手机在线| 欧美一级高清片久久99| 伊人网址在线| 亚洲欧美综合精品久久成人网| 国产精品亚洲精品爽爽| 久久青青草原亚洲av无码| 国产亚洲精品无码专| 国产毛片基地| www亚洲精品| 色综合天天视频在线观看| 午夜丁香婷婷| 国产九九精品视频|