沐 城,張玲華
(南京郵電大學 通信與信息工程學院,江蘇 南京 210003)
數字助聽器中多通道響度補償算法的研究
沐 城,張玲華
(南京郵電大學 通信與信息工程學院,江蘇 南京 210003)
目前數字助聽器中用的較多的響度補償方法,通常是對語音的高頻部分進行高增益,但由于聽損患者在高頻段的聽覺范圍比較小,直接對高頻部分進行高增益容易超出聽損患者的聽覺范圍。文中引進了寬動態壓縮技術,首先將整個語音的動態范圍按一定比例均勻壓縮到患者的殘余聽力中,然后將頻帶非等寬劃分,再在不同頻段進行響度補償和增益控制,最后對信號進行重構,并利用小波閾值去噪技術去除部分噪聲。實驗結果表明,該方法能夠使補償后語音的響度完全映射到聽損患者的聽覺范圍內,從而有效提高患者的聽力水平,特別對高頻部分語音的辨識,具有較好的效果。
響度補償;寬動態壓縮;正交鏡像濾波器組;增益控制
在聽力損失的情況下,聽閾普遍下移,從而造成聽覺動態范圍減小、分辨語言的能力下降等問題。響度補償是數字助聽器的關鍵算法之一,也是其核心任務之一。為了對聲音進行壓縮放大,將正常聽力范圍內的聲音映射到聽損患者的聽力范圍內[1],就需要用到響度補償。目前,大多數數字助聽器都已實現多通道響度補償功能[2],但多數響度補償方法主要用于處理等寬頻率間隔。其實人耳對聲音頻率的感受與實際的頻率高低不是線性關系,而是接近對數關系,所以等寬頻率間隔的補償方法不能滿足人耳的聽覺特性。雖然不同患者的聽力損失是不一樣的,但基本上具有低頻聽力損失較小、高頻聽力損失較大的特點。有研究表明,大腦通過相對比率[3-4]來感受頻率,而不是絕對頻率。由于語素的頻譜間存在一定位置關系[5],通過按比例壓縮可以保持這種關系。
考慮到上述情況,文中將寬動態壓縮技術[6]應用于響度補償。首先將整個語音信號的動態范圍按一定比例均勻壓縮到患者的殘余聽力中,再讓信號順次通過寬動態壓縮模塊、響度補償模塊以及增益控制模塊,經過這一系列處理后,語音信號處于聽損患者聽閾范圍內,再利用小波閾值去噪技術去除部分噪聲。實驗結果表明,該方法具有較好的效果。
1.1 多頻段語音信號響度補償原理
一般來說,人耳能感覺到頻率在16~20 000 Hz間的聲音。在這個范圍內,可引起人的聽覺的最小聲音強度被稱為聽閾。如果振動強度繼續增加,當達到一定限度時,將會引起鼓膜疼痛,這個限度稱為痛閾。對于不同頻率,人耳的感覺是不同的,對正常聽力者和聽損患者進行聲強測試,可以分別得到正常人和聽損患者的聽力檢查曲線圖。聽損患者的聽力測試曲線與正常人相比是不同的,他們對聲強的敏感度更低,所以他們的聽閾要比一般人高,而痛閾卻比一般人低,因此聽力范圍比普通人小。一般通過多次測試特殊頻點的閾值,求各頻點閾值的平均值作為聽損程度,連接各閾值所得曲線圖作為聽損患者的聽力檢查圖。圖1是一個聽損患者的聽力檢查曲線圖。

圖1 聽損患者的聽力檢查曲線
從圖1中可以看到,聽損患者在不同頻率損傷情況是不一樣的,一般來說,在低頻區域損傷較小,聽閾值也較小,在高頻區域的聽力損失更為嚴重,使得在高頻區域閾值較大,導致高頻區域聽力范圍較小。就算是同一患者,在不同頻段上也會有不同程度的聽力損傷,因此使用單通道響度補償方式是不合適的。
對聽損患者進行響度補償,不僅要考慮不同頻率信號的聽力敏感,還要考慮患者可以承受的信號強度。因此,在對聲音進行響度補償的同時,還要根據聲音的強度進行控制,以確保小信號能被病人聽清楚,同時保護病人的耳朵在強信號下不受傷害[7]。
圖2是增益控制曲線。其中,UCLn和UCLu分別為正常人和患者的痛閾值,THRn和THRu分別為正常人與患者的聽閾值,MCLn和MCLu分別為正常人和患者的最適閾值。這些參數的值并不是固定的,不同患者在不同頻率上的值都是不同的,因此需要根據各患者的具體情況來測定聽力測試曲線(見圖1)。根據圖2的增益控制曲線對響度補償后的語音進行增益調節,正常聽力范圍內的聲音被映射到聽障者的聽力范圍上。

圖2 增益控制曲線
1.2 寬動態壓縮方法
所謂寬動態壓縮,意思是將整個聲音按照一定的比例進行均勻壓縮,最終壓縮到患者的殘余聽力中。由于聲音具有特殊性質,語素之間存在一定關系,語素之間的聯系可以通過按比例壓縮來保持。將語音按比例壓縮到患者較好的聽力范圍內,可以使患者更好地聽到聲音的高頻部分,有助于改善患者的語音識別率[8]。
首先根據患者的聽力情況,選擇要進行壓縮的頻段和目標頻段,然后計算出高頻部分的壓縮比[9]。設壓縮比為γ,則:
(1)
其中:ftmax和ftmin分別為目標頻段的最高頻率和最低頻率;fomax和fomin分別為原頻段的最高頻率和最低頻率。
壓縮后信號頻譜表達式為:
(2)
圖3為從實驗語音中截取的一幀語音,采用了寬動態壓縮方法,選擇壓縮比γ=2,獲得壓縮前后的頻譜比較圖。其中,壓縮前原始語音的頻段為0~8 000Hz,壓縮后的目標頻段取0~4 000Hz。實線表示原始語音的頻譜,虛線表示壓縮后語音的頻譜。
1.3 基于QMFB的多通道子帶濾波器組設計
從圖1可以看出,不同頻段上的聽損程度是不同的,因此需要將語音劃分為多個頻段,不同頻段使用不同的補償因子。還可以看出,聽損患者在4 000~8 000 Hz頻段上的聽力范圍較小,而在0~4 000 Hz頻段上的聽力范圍較大。因此先將信號整體壓縮到0~4 000 Hz頻段上,這樣使得4 000~8 000 Hz頻段上的信號對應到2 000~4 000 Hz頻段上,這時的信號處于患者的殘余聽力中,最后再使用正交鏡像濾波器組(QMFB)對信號進行非等帶寬劃分[10-12]。

圖3 原頻譜及壓縮后頻譜
信號經過QMFB的分析,濾波器組被分成若干子帶信號,各子帶信號經過處理后,再經過合成濾波器組輸出合成信號。假設分析濾波器組的低通濾波器為H0(ω),高通濾波器為H1(ω);合成濾波器組的低通濾波器為G0(ω),高通濾波器為G1(ω)[13]。若H0(ω)=H(ω),由于H0(ω)和H1(ω)關于ω=π/2對稱,兩者頻響關系滿足:
H1(ω)=H(ω-π)
(3)
(4)
合成濾波器組跟分析濾波器組的差別只是因子不同,兩者結構基本相同。因此合成濾波器組的低通濾波器G0(ω)=2H(ω),高通濾波器G1(ω)=-2H(ω-π)。
對于濾波器而言,一般來說,階數提高了,可以使過渡帶變窄,阻帶波動變小,當然濾波效果更接近理想情況,缺點是成本較高。經過綜合考慮,文中選取階數N=99,歸一化截止頻率fp=0.45π的濾波器。由于QMFB是線性相位的,可以消除混疊失真,能夠完美重構信號[14]。
1.4 系統結構框圖
首先對原始語音進行響度衰減,模擬患者聽到的語音,然后對該語音進行寬動態壓縮,將語音按一定比例均勻地壓縮到目標頻段,再使用分析濾波器組對語音進行非等帶寬劃分,并對各子帶信號進行響度補償和增益調節,最后使用合成濾波器組將子帶信號合成為最終補償后的語音。
系統框圖如圖4所示。

圖4 系統框圖
具體步驟如下:
第1步:根據圖1聽力檢查曲線圖模擬患者聽到的聲音。聽力曲線圖是分段曲線,先計算各分段點的聲壓級,相鄰分段頻率點之間是線性關系,可以計算各頻段聲壓級的衰減曲線,然后在各頻段內依據得到的衰減曲線進行幅度衰減,從而得到患者聽到的聲音。聲壓級計算公式為:
(5)
其中:x是采樣信號;N是信號長度;P0是基準聲壓級,一般取20μPa。
第2步:對語音進行分幀。幀長取20ms,幀移為10ms,加窗為漢明窗。
第3步:對分幀后的語音進行壓縮。從圖1聽力檢查圖可以看到,患者在4 000~8 000Hz上的聽覺范圍較小,而在0~4 000Hz上的聽覺范圍較大,可以取壓縮比γ=2。根據式(1)將語音進行壓縮,壓縮到目標頻段0~4 000Hz,這樣原始語音在4 000~8 000Hz的頻段就映射到了2 000~4 000Hz頻段上。要根據不同患者的具體情況來選取原頻段與目標頻段。
第4步:對語音進行分頻處理。使用四通道QMFB分析濾波器組將壓縮后的語音幀分頻,語音被分成0~500Hz,500~1 000Hz,1 000~2 000Hz以及2 000~4 000Hz這四個頻段。
第5步:對子帶信號進行響度補償和增益控制。子帶補償的方法跟第一步的過程相反。語音經過補償后,再對其強度進行增益調節。先根據式(5)計算輸入信號的聲壓級,再確定各子帶的增益調節因子,也就是a與b兩段直線的斜率,如圖2所示。假設a,b兩段直線的斜率分別為CRa=和CRb,則:
(6)
(7)
由圖2可知,當THRn≤SPLin (8) 當MCLn≤SPLin (9) 第6步:將子帶信號進行合成。先用QMFB的合成濾波器組將子帶信號合成為一幀完整的信號,再將各幀信號疊加得到響度補償后的語音,并利用小波閾值去噪技術去除部分噪聲。 錄制一段語音作為實驗使用語音。先對語音進行分幀,幀長取20ms,幀移取10ms。再根據圖1的聽力曲線對語音進行衰減,獲得患者聽到的聲音。然后根據圖4的系統框圖,將衰減語音依次通過寬動態壓縮模塊、QMFB分析濾波器組、補償控制模塊以及QMFB合成濾波器組,最終獲得符合聽損患者聽覺特性的語音,并利用小波閾值去噪方法去除部分噪聲。 圖5為其中一幀語音經過衰減以及響度補償后的波形圖。 從圖5可以看出,衰減后的語音在大多數頻段內的響度值都遠低于聽損患者的聽閾值。信號處于低頻段時衰減相對較小,處于中高頻段時的衰減較大。經過響度補償后,原先衰減的語音大部分都處于患者的聽覺范圍,雖然有少部分處于聽閾以下,但是經過增益控制后,所有頻段的語音都被調節到患者的聽覺范圍內,有效實現響度補償。 如圖6所示,這是原始語音、經過衰減后語音、經過增益控制后語音的時域波形圖。 從圖6可以看出,衰減后的語音幅度非常小,并且波形發生變化,甚至無法分辨出原始語音。而由增益控制后語音波形圖可以看出,經過響度補償和增益控制后的語音與原始語音的波形基本相同,不僅如此,語音的幅度也有了明顯的增強,從而實現了對語音進行響度補償的目的。 圖6 原語音、衰減語音、增益后語音時域波形圖 上述實驗表明,使用寬動態壓縮,可將患者聽覺范圍較小的高頻區域信號移動到患者聽覺范圍較大的低頻區域,同時對該低頻區域的語音進行響度補償,這樣可使患者獲得較好的聽覺效果。補償后,語音信號基本上與原來的信號相同,而且聲音的強度明顯增強。再經過增益調整,將處于患者聽閾以下的信號調整到患者聽閾以上,同時將幅度過大的信號進行適當削弱,這樣既可以使聲音映射到聽損患者的聽力范圍內,又能防止聲音過大對患者造成二次傷害。實驗結果表明,該方法能有效實現響度補償,改善聽覺效果,有效提高患者的聽力水平。 [1] 趙 力,張昕然,梁瑞宇,等.數字助聽器若干關鍵算法研究現狀綜述[J].數據采集與處理,2015,30(2):252-265. [2]ChongKS,GweeBH,ChangJS.A16-channellow-powernonuniformspacedfilterbankcorefordigitalhearingaids[J].IEEETransactionsonCircuitsandSystemsII:ExpressBriefs,2006,53(9):853-857. [3]Miller-HansenDR,NelsonPB,WidenJE,etal.Evaluatingthebenefitofspeechrecodinghearingaidsinchildren[J].AmericanJournalofAudiology,2003,12(2):106-113. [4]StelmachowiczPG,PittmanAL,HooverBM,etal.Theimportanceofhigh-frequencyaudibilityinthespeechandlanguagedevelopmentofchildrenwithhearingloss[J].ArchOtolaryngolHeadNeckSurg,2004,130:556-562. [5]GoldbaumSM,HalpinC.Exploringthedamagedear:theNIDCDnationaltemporalboneregistry[J].ASHA,1999,41(1):29-33. [6] 陳廣飛,應 俊.數字助聽器寬動態壓縮算法研究[J].北京生物醫學工程,2006,25(5):454-456. [7] 雍雅琴.數字助聽器中主要語音信號處理方法研究[D].北京:北京協和醫學院,2013. [8] 王青云,趙 力,趙立業,等.一種數字助聽器多通道響度補償方法[J].電子與信息學報,2009,31(4):832-835. [9] 張寶琳,張玲華.數字助聽器中多通道響度補償方法的研究[J].信號處理,2013,29(5):656-661. [10]RothweilerJH.Polyphasequadraturefilters-anewsubbandcodingtechnique[C]//ProcofIEEEICASSP.[s.l.]:IEEE,1983. [11] 張 晨,李雙田.設計QMF組的一種新算法及基于GA的優化[J].信號處理,2005,21(2):120-125. [12] 孟 君.基于DSP的數字助聽器多通道響度補償方案[J].南京信息工程大學學報:自然科學版,2010,2(5):420-425. [13] 李 麗.非均勻濾波器組的研究[D].西安:西安電子科技大學,2009. [14]HuangJ,GuGX.AdirectapproachtothedesignofQMFbanksviafrequencydomainoptimization[J].IEEETransactiononSignalProcessing,1998,46(8):2131-2138. Research on Multi-channel Loudness Compensation in Digital Hearing Aids MU Cheng,ZHANG Ling-hua (College of Telecommunications & Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China) Loudness compensation algorithm is a key technique in digital hearing aid.At present,digital hearing aid in multi-channel loudness compensation method,is usually high gain for the high frequency part of speech.However,because of the relatively small range of hearing loss in the high frequency range,the high gain of the high frequency part is easy to exceed the range of hearing loss.Wide dynamic compression technique is introduced in this paper.First the dynamic range of the speech according to a certain proportion is uniformly compressed to patients with residual hearing,then the band is partitioned with non equal width,and loudness compensation and gain control is carried out in different frequency band.Finally,the signal is reconstructed,removing partial noise by wavelet threshold denoising technology.Experiment shows that the method makes the loudness of speech after compensation completely mapped to range of hearing loss in patients,effectively improving the patient’s hearing level,especially on speech identification of high frequency part with good effect. loudness compensation;wide dynamic compression;quadrature mirror filter bank;gain control 2015-08-26 2015-11-27 時間:2016-05-05 江蘇省高校自然科學研究重大項目(13KJA510003);江蘇高校優勢學科建設工程資助項目(PAPD) 沐 城(1990-),男,碩士研究生,研究方向為現代語音處理與通信技術;張玲華,教授,博士,博士生導師,研究方向為傳感器和語音。 http://www.cnki.net/kcms/detail/61.1450.TP.20160505.0831.102.html TP301.6 A 1673-629X(2016)06-0123-04 10.3969/j.issn.1673-629X.2016.06.0272 實驗與仿真

3 結束語