姚旺 張鳳翔 駱天宇 西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院軟件學(xué)院 重慶北碚 400715
?
基于人聽(tīng)覺(jué)機(jī)理的寬動(dòng)態(tài)壓縮算法的仿真實(shí)驗(yàn)
姚旺張鳳翔駱天宇西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院軟件學(xué)院重慶北碚400715
【文章摘要】
通過(guò)人的聽(tīng)覺(jué)機(jī)理方式獲取共振峰的位置,利用寬動(dòng)態(tài)壓縮算法方式,分別對(duì)共振峰的頻率范圍和其他頻率范圍計(jì)算并應(yīng)用相應(yīng)增益,最后利用自動(dòng)增益控制將最大的輸出進(jìn)行限制,防止聲音音量過(guò)大而使聽(tīng)障患者的聽(tīng)力造成二次損傷。實(shí)驗(yàn)結(jié)果表明,該算法在保護(hù)共振峰的基礎(chǔ)上,實(shí)現(xiàn)了響度補(bǔ)償技術(shù),提高了語(yǔ)言的辨識(shí)度和聽(tīng)覺(jué)的舒適度,同時(shí)具有一定的抗噪性能。
【關(guān)鍵詞】
共振峰;寬動(dòng)態(tài)壓縮;響度補(bǔ)償;數(shù)字信號(hào)處理
由于當(dāng)今社會(huì)壓力的增大,老齡化問(wèn)題的凸顯,造成聽(tīng)障患者與日俱增,助聽(tīng)器的發(fā)展刻不容緩。助聽(tīng)器是一種供聽(tīng)力殘疾者改善聽(tīng)覺(jué)障礙,補(bǔ)償聽(tīng)力損失,進(jìn)而提高與他人會(huì)話能力的小型擴(kuò)音設(shè)備i。助聽(tīng)器主要分為模擬助聽(tīng)器和數(shù)字助聽(tīng)器倆種。其中數(shù)字助聽(tīng)器以數(shù)字信號(hào)處理器為核心,具有低噪聲,可控性強(qiáng),可編程等特點(diǎn),被聽(tīng)障患者所歡迎。數(shù)字助聽(tīng)器的核心算法包含響度補(bǔ)償,噪聲抑制,消除反饋等,目的是使患者在聽(tīng)覺(jué)舒適的同時(shí)增強(qiáng)語(yǔ)音的可懂度ii。
響度補(bǔ)償算法是數(shù)字助聽(tīng)器的核心算法之一,其主要目標(biāo)是將聲音進(jìn)行增益控制,使其聲壓級(jí)映射在患者的聽(tīng)力范圍內(nèi),避免高音刺耳低音過(guò)小等問(wèn)題,以有效利用并保護(hù)患者的殘余聽(tīng)力。響度補(bǔ)償算法主要有寬動(dòng)態(tài)壓縮算法,多通道響度補(bǔ)償算法。多通道響度補(bǔ)償算法iii是現(xiàn)在大多助聽(tīng)器已應(yīng)用的響度補(bǔ)償算法,通過(guò)重構(gòu)濾波器組,分別對(duì)不同通道施加增益。寬動(dòng)態(tài)壓縮算法是一種將語(yǔ)音按比例動(dòng)態(tài)壓縮至患者殘余聽(tīng)力范圍的一種方法iv。然而由于傳統(tǒng)的響度補(bǔ)償算法都未考慮共振峰結(jié)構(gòu)v,如果一個(gè)共振峰被施加了不同增益就會(huì)導(dǎo)致其移動(dòng),變形,甚至可能會(huì)消失,就會(huì)導(dǎo)致語(yǔ)音共振峰的失真,降低語(yǔ)音的舒適度。
本文以寬動(dòng)態(tài)壓縮算法為基礎(chǔ),結(jié)合共振峰提取算法與自動(dòng)增益控制算法,將輸入的語(yǔ)音進(jìn)行預(yù)處理,根據(jù)Mel倒譜系數(shù)提取語(yǔ)音信號(hào)的共振峰,在頻域分析基礎(chǔ)上,分別對(duì)共振峰及其他特征點(diǎn)進(jìn)行增益補(bǔ)償,最后對(duì)過(guò)大的輸出進(jìn)行限制,使音頻信號(hào)控制在理想的范圍內(nèi)。

圖1 動(dòng)態(tài)壓縮補(bǔ)償策略的輸入輸出曲線
臨床表明聽(tīng)障患者與正常人對(duì)不同頻率的聲強(qiáng)感受不同,聽(tīng)障患者的聽(tīng)閾高于正常人,而痛閾卻低于正常人,因此他們的聽(tīng)覺(jué)范圍小于正常人。寬動(dòng)態(tài)壓縮算法的目的是使聽(tīng)障患者可以動(dòng)態(tài)范圍的接收到語(yǔ)音信號(hào)。
寬動(dòng)態(tài)壓縮算法的輸入輸出曲線如下圖1:
其中THRn,THRu為正常人,患者的聽(tīng)閾值,MCLn,MCLu為正常人,患者的最適閾值,UCLn,UCLu為正常人,患者的痛閾值。橫坐標(biāo)SPLin表示輸入的聲壓級(jí),縱坐標(biāo)SPLout表示輸出的聲壓級(jí)。
定義Ca為a段增益比,Cb為b段增益比,結(jié)合已知的最佳范圍與聽(tīng)障患者的臨床測(cè)試。
1.當(dāng)SPLin < THRu時(shí), SPLout = 0。此時(shí),輸入語(yǔ)音的聲強(qiáng)微小到即使聽(tīng)力正常人也無(wú)法感知,算法不啟用;
2.當(dāng)THRu < SPLin < MCLu時(shí),SPLout = THRn + (SPLin -THRu)* Ca。此時(shí),輸入語(yǔ)音的聲強(qiáng)介于正常人的聽(tīng)閾與舒適閾之間,所以算法采用的是 a 段增益補(bǔ)償,人耳可以感覺(jué)到較低的聲音,即將處理好的聲音按比例減小;
3.當(dāng)SPLin = MCLu時(shí),SPLout = MCLu。此時(shí),算法處于正常人聽(tīng)覺(jué)最適宜的“拐點(diǎn)”處,人耳接受最舒適的響度,算法不啟用;
4.當(dāng)MCLu < SPLin < UCLu時(shí), SPLout = MCLu +( SPLin — MCLu) * Cb。此時(shí),輸入語(yǔ)音的聲強(qiáng)介于正常人的舒適閾與痛閾之間,算法采用 b 段增益補(bǔ)償,人耳可以感覺(jué)到較大的聲音,而且感知響度適當(dāng)壓縮到小于患者的痛閾范圍,即將處理好的聲音按比例減小;
5.當(dāng)SPLin > UCLu時(shí),SPLout = UCLu。此時(shí),輸入語(yǔ)音的聲強(qiáng)超過(guò)正常人的不舒適痛閾,算法將輸出聲強(qiáng)設(shè)置為患者能接受的最適合聲音最高響度,此舉既最大限度減少了對(duì)原有語(yǔ)音譜比例。
經(jīng)過(guò)增益控制后,正常人的聽(tīng)力范圍完全被映射到患者的聽(tīng)力范圍。所以,可以通過(guò)實(shí)時(shí)采集每幀的語(yǔ)音信號(hào)數(shù)字序列乘以該幀信號(hào)的動(dòng)態(tài)響度補(bǔ)償增益序列,實(shí)現(xiàn)對(duì)語(yǔ)音的個(gè)性化響度補(bǔ)償。

圖3 “語(yǔ)音波形測(cè)試”的預(yù)處理

圖4 共振峰提取

圖2 算法流程圖
2.1聲音的預(yù)處理
通過(guò)窗函數(shù)的高通濾波器,進(jìn)行濾波,消除語(yǔ)音信號(hào)的趨勢(shì)項(xiàng)和直流分量。
2.2共振峰的檢測(cè)
共振峰是指當(dāng)準(zhǔn)周期脈沖激勵(lì)進(jìn)入聲道時(shí)引起共振特性,產(chǎn)生一組共振頻率,這組共振頻率稱為共振峰vi。常用的共振峰估算方法有倒譜法vii和LPC法viii,本文采用的是基于人的聽(tīng)覺(jué)機(jī)理,即依據(jù)人的聽(tīng)覺(jué)實(shí)驗(yàn)結(jié)果來(lái)分析語(yǔ)音頻譜基礎(chǔ)上進(jìn)行改進(jìn)的共振峰提取算法ix。
該算法的流程為先將語(yǔ)音進(jìn)行預(yù)處理,對(duì)加權(quán)Mel倒譜系數(shù)提取,DCT變換最終確定共振峰的估計(jì)值。具體過(guò)程如下:
1)對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)加重,分幀與加窗。
2)通過(guò)公式(1)感知權(quán)重函數(shù)x,計(jì)算公式(2)估計(jì)誤差函數(shù),求出加權(quán)Mel倒譜的系數(shù)。


3)利用公式(3)提取WMCEP譜包絡(luò)并對(duì)其進(jìn)行平滑處理。

4)確定共振峰的最終估計(jì)值
2.3增益補(bǔ)償與最大增益限制
為了防止過(guò)大的輸出使聽(tīng)障患者的聽(tīng)力造成進(jìn)一步損傷,本文最后要對(duì)輸出值進(jìn)行最大輸出限制,利用AGCO算法xi,將過(guò)大輸出進(jìn)行增益計(jì)算,最后將所有信號(hào)通過(guò)關(guān)IFFT轉(zhuǎn)換成時(shí)域進(jìn)行輸出。
本文設(shè)計(jì)的算法流程圖如圖2所示,
根據(jù)本文的算法流程,利用matlab進(jìn)行仿真實(shí)驗(yàn),輸入“語(yǔ)音波形測(cè)試”的語(yǔ)音,進(jìn)行輸入測(cè)試測(cè)試。首先對(duì)輸入的語(yǔ)音進(jìn)行窗函數(shù)的預(yù)處理,其結(jié)果如下圖3所示。
對(duì)預(yù)處理后的語(yǔ)音利用本文所提到的基于人的聽(tīng)覺(jué)機(jī)理的方法進(jìn)行共振峰檢測(cè),檢測(cè)結(jié)果如下圖4所示,可見(jiàn)其基本能良好的識(shí)別共振峰。
對(duì)其進(jìn)行增益控制后,可見(jiàn)其輸出較好的在其增益范圍內(nèi)(如圖5所示),驗(yàn)證了該算法較好的保證了低失真的輸出,說(shuō)明該算法良好。

圖5 增益控制
本文通過(guò)結(jié)合Mel倒譜系數(shù)與共振峰檢測(cè),提出一種基于人的聽(tīng)覺(jué)機(jī)理的寬動(dòng)態(tài)壓縮算法,通過(guò)結(jié)合加權(quán)Mel對(duì)共振峰進(jìn)行檢測(cè)進(jìn)行增益補(bǔ)償。仿真結(jié)果證明,該算法可以實(shí)現(xiàn)較滿意的補(bǔ)償效果,比傳統(tǒng)的多通道響度補(bǔ)償和寬動(dòng)態(tài)壓縮能較好的保護(hù)共振峰的完整性,同時(shí)具有一定的抗噪能力,雖然算法用時(shí)增多,但預(yù)計(jì)在硬件實(shí)現(xiàn)過(guò)程中該運(yùn)算時(shí)間會(huì)適當(dāng)減少。
【參考文獻(xiàn)】
[1]馬小玲,劉訓(xùn)等。國(guó)內(nèi)助聽(tīng)器的現(xiàn)狀調(diào)研與發(fā)展分析。中央民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,23(1):39-43
[2]肖憲波,王寧宇,胡廣書。數(shù)字助聽(tīng)器中若干主要算法的發(fā)展和現(xiàn)狀[J]。生物醫(yī)學(xué)工程學(xué)雜志,2004,21(4):694-698
[3]張寶琳,張玲華。數(shù)字助聽(tīng)器中多通道響度補(bǔ)償方法的研究。信號(hào)處理,2013,29(5):656-661
[4]陳廣飛,應(yīng)俊。數(shù)字助聽(tīng)器寬動(dòng)態(tài)壓縮算法研究。北京生物醫(yī)學(xué)工程,2006,25 (5):454-456,481
[5]趙毅,伊雪飛,陳克安。一種基于共振峰提取的多通道響度補(bǔ)償算法。信號(hào)處理,2012,28(3):352-360
[6]宋知用.MATLAB在語(yǔ)音信號(hào)分析與合成中的應(yīng)用.北京航空航天大學(xué)出版社。2013:259-283.
[7]王曉亞.倒譜在語(yǔ)音基音和共振峰提取中的應(yīng)用【J】.無(wú)線電工程,2004,34(1):57—61
[8]郁伯康,郁梅.LPC方法提取語(yǔ)音信號(hào)共振峰的分析[J】.電聲技術(shù),2000,3(1):3-8
[9]楊鴻武,趙濤濤。一種基于加權(quán)Mel倒譜的語(yǔ)音信號(hào)共振峰提取算法。西北師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,50(1):53-57
[10]黃德智,楊鴻武,蔡蓮紅.語(yǔ)音信號(hào)的加權(quán)Mel倒譜分析CJ].信號(hào)處理。2006,22(6):840—843.
[11]楊博,劉潤(rùn)生,張國(guó)防。基于WDRC的聽(tīng)力損傷補(bǔ)償算法研究,電聲技術(shù)。2013,37(11):45-49
基金項(xiàng)目:國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)計(jì)劃(項(xiàng)目號(hào):201410635032)
【作者簡(jiǎn)介】
姚旺(1994-),女,漢,遼寧,本科,學(xué)生,西南大學(xué),研究方向:嵌入式
張鳳翔,男,漢,重慶,副教授,西南大學(xué),研究方向:實(shí)時(shí)和嵌入式