?
一種改進閾值函數的EMD-CIIT語音去噪算法
引文格式: 鐘金良,景新幸,楊海燕.一種改進閾值函數的EMD-CIIT語音去噪算法[J].桂林電子科技大學學報,2016,36(1):9-13.
鐘金良,景新幸,楊海燕
(桂林電子科技大學 信息與通信學院,廣西 桂林541004)
摘要:為了克服基于傳統經驗模態分解語音去噪算法在閾值去噪時閾值函數處理不平滑的缺點,對EMD-CIIT(EMD重復間隔閾值)語音去噪方法的閾值函數進行改進,并在Matlab平臺搭建的語音識別系統進行仿真實驗。實驗結果表明,改進閾值函數的EMD-CIIT去噪算法具有較高的識別率及良好的魯棒性。
關鍵詞:語音去噪;EMD;改進閾值
語音信號是一種非線性、非平穩的信號。歷年來,學者們一直致力于研究語音去噪的算法。基于譜減法的語音去噪方法假設語音信號短時平穩,其在實際應用中有一定的局限性[1]。1995年,Donoho在小波變換的基礎上提出閾值去噪的方法[2],但基函數一經選定,整個分解和重構過程都已確定,無法再更改。文獻[3-4]提出經驗模態分解(empirical mode decomposition,簡稱EMD)算法。傳統EMD算法將信號分解為一系列固有模態函數(intrinsic mode function,簡稱IMF)分量和一個殘余分量,分解的各個IMF分量突出了數據的局部特征,殘余分量則體現了信號變化趨勢。受小波閾值去噪方法的啟發,文獻[5]提出了EMD重復間隔閾值(EMD clear iterative interval thresholding,簡稱EMD-CIIT)語音去噪算法,但其在間隔閾值上未考慮閾值選取的問題。為此,本研究對閾值函數進行改進,提出一種改進的EMD-CIIT語音去噪算法。
1經驗模態分解原理
EMD算法是一種先進的信號處理方法,能有效處理非平穩、非線性的信號。分解的固有模態分量必須滿足2個條件:1)零點數和極點數必須相等或至多相差1個;2)極大值和極小值組成的上下包絡線關于時間軸局部對稱,即上下包絡均值為0。具體步驟為:假設原始信號為s(t),找出s(t)的所有極大值和極小值;依據極大值和極小值構造上下包絡線;計算均值m11(t),求差值h11(t)=s(t)-m11(t);用h11(t)替換原始s(t);若h1,k-1與h1,k之間的差值小于設定值,則認為h1,k是一個IMF分量,記c1(t)=h1,k,r1(t)=s(t)-c1(t);再令s(t)=rn(t),直到rn(t)為常量或一個單調函數時,EMD分解結束,即得到原信號s(t)的分解式為
(1)
(2)
認為滿足零均值的條件。其中ε為篩分門限,取值為0.2~0.3。
2基于EMD的去噪方法
對實測信號進行EMD分解,得到一系列IMF分量。對分解的IMF分量進行EMD直接閾值去噪(EMD direct-thresholding,簡稱EMD-DT),此方法的去噪思想類似于小波閾值去噪。EMD-DT方法的硬閾值函數為:
(3)
軟閾值函數為:
(4)
其中Ti為i層IMF所用的閾值。為克服EMD-DT去噪不佳的缺點,利用Kopsinis等[5]提出的間隔閾值(EMD-IT)方法去噪。EMD-IT方法的硬閾值函數為:
(5)
軟閾值函數為:
(6)

2專用式建筑學專業教室是通過一個單獨的空間作為主要個體的教學空間類型,具有安靜、封閉的空間特點,為學生進行獨立的學習和思考提供了很好的空間。
(7)

3改進的閾值函數
由式(5)、(6)可知,當閾值大于極值點值,相當于在原來子波上與加權系數相乘[6]。用式(6)處理,發現其有間斷現象,為使處理平滑,受文獻[7]啟發,提出一種改進的閾值函數。設計閾值函數為:
(8)

(9)
3.1改進閾值函數的奇偶性


(11)

(12)
可見,改進的閾值函數為奇函數,函數關于原點對稱,因此,只需分析閾值函數為正數的部分,另一部分可根據奇偶對稱性得出。
3.2改進閾值函數的單調性
對函數F進行一階求導,得
(13)
其中,α的取值范圍為(0,1],又因j恒大于1,則1-j<0,可得一階導數在整個區間上恒為正數,故改進后的閾值函數在區間上單調遞增。
3.3改進閾值函數的連續性

(14)

(15)

(16)
可見,改進的函數在閾值Ti處是連續的。

(17)

(18)

(19)
可見,改進的閾值函數在Ti/2同樣也是連續不間斷的。
分解得到的EMD分量為7層(j=7)時,調節系數α=0.88,改進的加權函數和軟、硬閾值加權函數的函數圖形如圖1所示。

圖1 不同閾值對比Fig.1 The comparison of different thresholds
改進的閾值函數克服了硬閾值函數在間斷點處不連續性及軟閾值函數存在的恒定偏差問題。當子波極值大于閾值時,改進的閾值函數逐漸逼近硬閾值函數,而不像硬閾值函數不作改變。通過引入IMF分解層數j來減小加權子波與原始子波之間的偏差,使重構后得到的信號更加逼近原始信號。引入調節系數α目的是為了保證連續性,在實際應用中可根據具體情況,在(0,1]選取合適的α來提高硬閾值函數的逼近速度。
4改進閾值函數的EMD-CIIT語音去噪
當噪聲較嚴重時,直接對第一個IMF分量進行多次隨機改變,然后進行EMD-IT語音去噪,這種方法叫做重復間隔閾值語音去噪(EMD-IIT)。但當噪聲較小時,直接對第一個IMF分量進行隨機改變,會導致有用信號也包含在第一個IMF分量中,有用信號被一起濾除[9],改進閾值函數的EMD-CIIT語音去噪算法則可克服這一缺陷。算法步驟為:
1)對帶噪語音進行EMD分解,獲得IMF分量ci(t),i=1,2,…,L;對ci(t)進行傳統的直接閾值去噪(EMD-DT),得到去噪后的IMF分量ci(t)。

步驟1)是利用小波閾值去噪的方法來處理帶噪信號[10],然而,小波閾值去噪時,需要準確選取小波基函數。為此,利用EMD-DT進行噪聲估計,由于IMF分量的第一個分量大部分由噪聲構成[11],對其進行EMD-DT后可得到較好的噪聲估計。
5仿真及結果分析
為了驗證改進的EMD-CIIT算法的有效性和優越性,利用改進的EMD-CIIT算法處理不同信噪比的帶噪語音信號。分別對未改進的EMD分解進行EMD-IIT語音去噪、改進算法的EMD-IT語音去噪、傳統的EMD語音去噪和所提出的方法進行實驗仿真。實驗所用的語音信號來自NOIZEUS語料庫,其采樣頻率為8 kHz,量化為16 bit。通過采集實際車載環境中的噪聲,根據不同的信噪比(5、0、-5 dB)進行仿真實驗,改進的EMD-CIIT算法去噪效果對比如圖2所示。

圖2 去噪效果對比Fig.2 The comparison of denoising effect
由圖2可知,在不同信噪比下,特別是在信噪比為-5 dB時,改進的EMD-CIIT算法也有較強的語音還原能力。為了驗證處理后的語音信號在語音識別系統的識別率,對“開窗”、“關窗”、“開燈”、“關燈”進行訓練,分別設為[R0,R1,R2,R3],并對這些語音信號進行加噪,然后進行降噪處理,作為測試模板,最終識別結果為[T0,T1,T2,T3],其在Matlab界面顯示如圖3所示。
在不同信噪比下,分別對含噪聲語音信號采用不處理、傳統EMD多尺度法語音去噪、EMD-IT語音去噪、EMD-CIIT語音去噪、改進EMD-CIIT語音去噪進行處理,并分別計算出系統在不同情況下的識別率。計算識別率的公式為:

圖3 識別過程Fig.3 Recognition process
其中:C為語音識別系統的識別率;N為語音庫總的詞匯數;H為正確識別的次數。不同算法的識別率對比如表1所示。從表1可看出,不同算法都可在語音識別系統上進行識別,但不同信噪比下識別率差距很大。經語音去噪處理后的語音識別率都有不同程度的提升,在信噪比較低的情況下,未處理的語音識別系統的識別率很低,傳統的降噪算法對系統的識別率有所提高,但不很明顯,改進的算法在提高語音識別系統的識別率上效果顯著,即使在信噪比較低的情況下也有較大提高。

表1 不同算法的識別率
6結束語
為了克服傳統基于經驗模態分解語音去噪算法在閾值去噪時閾值函數處理不平滑的缺點,提出了一種改進閾值函數的EMD-CIIT算法,該算法可應用于語音識別系統中。較于其他傳統算法,改進閾值函數的EMD-CIIT算法大大提高了語音識別系統的識別率。但本算法未考慮EMD在分解過程中產生的端點效應以及模態混迭的問題,這會使EMD分解過程中產生虛假分量,有待今后研究中加以改進。
參考文獻:
[1]劉志坤,唐小明,朱洪偉.基于改進譜減法的語音增強研究[J].計算機仿真,2009.26(6):363-366.
[2]DONOHO D L.De-noising by soft-thresholding[J].IEEE Transactions on Information Theory,1995,41(3):613-627.
[3]HUANG N E,SHEN Z.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-tationary time series analysis[J].Proceedings of the Royal Society of London A,1998,454(1971):903-995.
[4]WU Z,HUANG N E.A study of the characteristics of white using the empirical mode decomposition method[J].Proceedings of the Royal Society of London A,2004,460:1597-1611.
[5]KOPSINIS Y,MCLAUGHLIN S.Development of EMD-based denoising methods inspired by wavelet thresholding[J].IEEE Transactions on Signal Processing,2009,57(4):1351-1362.
[6]李洋,景新幸,楊海燕.基于改進小波閾值和EMD的語音去噪方法[J].計算機工程與設計,2014,35(7):2462-2466.
[7]戴亮.非平穩噪聲環境下的語音增強算法研究[D].長沙:中南大學,2012:31-36
[8]張雄偉,陳亮,楊吉斌. 現代語音處理技術及應用[M].北京:機械工業出版社,2003:111-124
[9]MANUEL B V,WENG B W,BARNER k E.ECG signal denoising and baseline wander correction based on the empirical mode decomposition[J].Computers in Biology and Medicine,2008,38(1):1-13.
[10]BOUDRAA A O,CEXUS J C.EMD-based signal filtering[J].IEEE Transactions on Instrumentation and Measurement,2007,56(6):2196-2202.
[11]曲從善,路廷鎮,譚營.一種改進型經驗模態分解及其在信號消噪中的應用[J].自動化學報,2010,36(1):67-73.
編輯:黎仁惠
An improved threshold function EMD-CIIT speech denoising algorithm
ZHONG Jinliang, JING Xinxing, YANG Haiyan
(School of Information and Communication Engineering, Guilin University of Electronic Technology, Guilin 541004, China)
Abstract:The threshold process of speech denoising method based on empirical mode decomposition is not smooth, so the threshold function of EMD-CIIT (EMD clear iterative interval thresholding) speech denoising algorithm is improved. A speech recognition system is built by Matlab simulation platform. The experimental results show that compared with other algorithms, there are higher recognition rate and good robustness in the improved threshold EMD-CIIT algorithm.
Key words:speech denoising; EMD; improved threshold
中圖分類號:TN929.5
文獻標志碼:A
文章編號:1673-808X(2016)01-0009-05
通信作者:景新幸(1960-),男,湖北武漢人,教授,博士,研究方向為語音信號處理、非線性電路、集成電路設計。E-mail:jingxinxing@guet.edu.cn
基金項目:廣西自然科學基金(2012GXNSFAA053221)
收稿日期:2015-03-23