摘 要:整個系統以DSP為核心,結合TI公司高性能立體音頻Codec芯片TLV320AIC23構建硬件環境,并在此基礎上實現音頻雙通道方向性選擇,多通道壓縮算法,噪聲消除以及反饋消除等助聽器關鍵算法。該系統功耗低,使用中參數可調節,滿足聽障患者對聽力進行補償的要求,也為進一步研究助聽器高級算法搭建了較好的實驗平臺。
關鍵詞:助聽器; 濾波; 補償; 自適應
中圖分類號:TP3681文獻標識碼:B
文章編號:1004-373X(2010)08-0169-04
Design of Audiphone Based on TMS320VC5416DSP
WANG Lei, GUAN Ke
(Information Engineering College, Chang’an University, Xi’an 710064, China)
Abstract: The entire system takes DSP as a core, constructs hardware environment in combination with high performance stereo audio codec chip TLV320AIC23 produced by TI Company, and realizes dual-channel audio directional options, multi-channel compression algorithm, and the elimination of noise and feedback on the basis of the hardware environment, The system has low power consumption, adjustable parameters in use to meet the needs of hearing-impaired patients for compensating their hearing, a better experimectal platform is prvided for a further study of high-level algorithm of hearing aids.
Keywords: audiphone; filtering; compensation; self-adaptation
0 引 言
隨著社會的發展以及人們對聽障患者的日益關注,助聽器的發展逐漸受到人們的重視。但由于聽力障礙患者病因各異,其聽力損失情況存在著較大差異,使得每位患者對于助聽器的補償有著不同的要求。目前,現代助聽器技術進入到全數字助聽器時代。同時,各種有效提高數字助聽器效能的數字信號處理算法也得到更多的重視。在此提出基于TMS320VC5416的數字助聽器設計,能滿足聽障患者對聽力的需求。
1 系統構成和工作原理
1.1 系統組成
基于助聽器的技術要求,選用TI公司的C54X系列產品TMS320C5416(以下簡稱C5416)和數字編碼器TLV320AIC23(以下簡稱AIC23)。
數字編碼器AIC23是TI公司推出的一款高性能的立體聲音頻Codec芯片,A/D轉換和D/A轉換部件集成在芯片內部,采用先進的∑-Δ過采樣技術,內置耳機輸出放大器。AIC23 DSP Codec工作電壓與C5416的核心和I/O電壓兼容,可實現與C54x串行口的無縫連接,功耗很低,使得AIC23是一款非常理想的音頻模擬器件,可以很好地應用于數字助聽器的設計當中。
系統結構如圖1所示,主要包括DSP模塊、音頻處理模塊、JTAG接口、存儲模塊及電源模塊等。模擬語音信號通過MIC或LINE IN輸入AIC23, 經過模/數轉換后通過MCBSP串口輸入C5416,經過實際所需的算法進行處理和補償后,得到聽障患者所需要的語音信號,再通過AIC23數/模轉換,通過揚聲器或耳機輸出聲音信號。
圖1 系統設計原理框圖
1.2 C5416與AIC23的接口設計
圖2是C5416與AIC23的接口原理圖。由于AIC23采樣輸出的是串行數據,因此需要協調好與之相配的DSP的串行傳輸協議,MCBSP是最適合做語音信號傳輸的。將AIC23的第22腳MODE接高電平,接收來自DSP的SPI格式串口數據。數字控制接口(SCLK,SDIN,CS)與MCBSP1連接,控制字共16位,由高位開始傳輸。數字音頻口LRCOUT,LRCIN,DOUT,DIN,BCLK與MCBSP0相連。在工作方式上,DSP為主模式,AIC23為從模式,即BCLK的時鐘信號由DSP產生。
串口時鐘由BCLKX0,BCLKR0并聯到AIC23的BCLK時鐘,這樣在發送和接收數據時都可產生串口時鐘信號。輸入/輸出同步信號LRCIN與LRCOUT,用來啟動串口數據傳輸,接收DSP的幀同步信號。
BFSX0和BFSR0,BDR0和BDX0分別與AIC23的DIN和DOUT連接來實現DSP與AIC23之間的數字通信。
圖2 C5416與AIC23的接口圖
2 系統實現
2.1 語音的基本特性
聲音是一種波,能被人耳聽到聲音的振動頻率為20 Hz~20 kHz。語音是聲音的一種,他是由人的發音器官發出的,具有一定語法和意義的聲音。語音的振動頻率最高可達15 kHz。
語音按其激勵形式的不同分為:濁音、清音、爆破音。而人的聲音特性基本是由基因周期和共振峰等因素決定的。當發濁音時,氣流通過聲門使聲帶發生振動,產生準周期激勵脈沖串。這個脈沖串的周期就稱為“基因周期”,其倒數即為“基因頻率”。
人類的聲道和鼻道都可以看做是非均勻界面的聲道管,聲道管的諧振頻率稱為共振峰。改變聲道的形狀就產生不同的聲音。共振峰用依次增加的多個頻率表示,如F1,F2,F3,等,稱之為第一共振峰,第二共振峰等。為了提高語音接收質量,必須采用盡可能多的共振峰。實際中,頭三個共振峰是最重要的,具體情況因人而有差異。
2.2 語音增強
在實際的應用環境中,語音會不同程度的受到環境噪聲的干擾。語音增強就是對帶噪語音進行處理,降低噪聲的影響,改善聽覺環境。
實際語音遇到的干擾可能包括以下幾類:
(1) 周期性噪聲:如電器干擾,發動機旋轉引起的干擾等,這類干擾在頻域表現為一些離散的窄峰。特別是50 Hz或60 Hz交流聲會引起周期噪聲。
(2) 沖擊噪聲:如電火花,放電產生的噪聲干擾,這類干擾在時域表現為突然出現的窄脈沖。消除這種噪聲可以在時域中進行,即根據帶噪語音信號幅度的平均值確定閾值。
(3) 寬帶噪聲:通常指高斯噪聲或白噪聲,其特點是頻帶寬,幾乎覆蓋整個語音頻段。它的來源很多,包括風、呼吸噪聲和一般的隨機噪聲源。
2.3 算法分析
噪聲影響使得患者語言識別率大幅下降,去噪和補償是助聽器的重要環節。人耳對于25~22 000 Hz的聲音有反應。語音的大部分可用信息只存在于200~3 500 Hz之間。根據人耳感知特性及實驗確定,對語音感知,語音識別較為重要的第二共振峰大部分位于1 kHz之上。
2.3.1 周期噪音消除
周期噪聲一般是許多離散的譜峰,來源于發動機的周期性運轉。電器干擾,特別是50~60 Hz交流聲也會引起周期噪聲。所以使用帶通濾波器可以有效地消除周期噪音以及3 500 Hz以上的高頻聲音。
IIR數字濾波器在設計上可以借助成熟的模擬濾波器的成果,如巴特沃斯、契比雪夫和橢圓濾波器等,IIR數字濾波器線性差分方程:
Matlab環境下可視化得到濾波器對動態輸入數據的實時濾波效果如圖3所示。
圖3 IIR切比雪夫濾波Matlab仿真圖
2.3.2 基于短時譜估計的寬帶噪音去除
由于語音信號的短時譜具有較強相關性,而噪聲的前后相關性很弱,因此采用基于短時譜估計的方法從帶噪語音中估計原始語音。而且人耳對于語音相位感受不敏感,可將估計得對象放在短時譜的幅度上。
2.3.3 譜相減法
譜相減法在無參考信號源的單話筒錄音系統中是一個有效的方法。因為噪聲是局部平穩的,可認為發語音強的噪聲與發語音期間的噪聲功率譜相同,因此利用語音前后的“寂靜幀”來估計噪聲。
譜相減法的原理框圖及仿真結果如圖4,圖5所示,對語音信號加窗處理后,利用已知的噪聲功率譜信息對信號進行除噪處理。
圖4 譜相減法原理圖
圖5 譜相減法的Matlab仿真實現
2.4 噪聲對消法
噪聲對消法是最基本的減譜算法,它的基本原理是從帶噪語音中直接減去噪聲。由于寬帶噪聲與語音信號在時域和頻域上完全重疊,是比較難去除的。所以需要用到非線性處理,自適應濾波器不斷地調節。
圖6中一個聲道采集帶噪語音,另一個聲道采集噪聲。帶噪語音序列S(n)與噪聲序列d(n)經傅里葉變換得到頻譜分量Sk(w)和Dk(w),噪聲分量Dk(w)經過濾波后與帶噪語音相減,再加上帶噪語音的相位,經傅里葉反變換恢復為時域信號。在強噪音背景時,這種方法可以得到很好的消除噪音效果。
圖6 雙聲道采集系統的噪聲對消
在實際中兩個采集聲道要保證一定隔離,以防止兩個聲道都采到帶噪語音。為了使采集到的噪聲更接近于帶噪語音中的噪聲,自適應濾波器可以很好地實現這一功能。
圖7是運用噪聲對消法得到的左聲道的增強語音示例。
2.4.1 多通道壓縮算法
在聽力損失的情況下,聽閾普遍下移,從而造成聽覺動態范圍減小。這種動態范圍的減小程度與頻率有關,一般高頻部分損失較大。在數字助聽器信號處理算法中,聽力補償算法是其中最核心的一種算法。聽力補償算法的目的是對聲音進行壓縮放大,將正常人聽閾范圍內的聲音映射至聾人聽域內,并盡可能的保持聽覺舒適和提高聲音的清晰度和辨識度。
圖7 自適應濾波左聲道Matlab仿真圖
利用濾波器將信號分頻段處理后再綜合,聲音信號被分為數個獨立的頻率區域,這些頻率區域被稱之為通道。該算法主要致力于在時域對信號進行處理。在各個通道中,根據患者聽力損傷的情況,對于不同頻段加以不同的放大處理,對不同頻率成分使用不同的壓縮算法,最后將合成的聲音再發送到患者的耳道里。這里應用該方法對信號做了一定的處理,該系統中將中頻信號做了適當的放大,收音效果良好。圖8為三通道分頻合成圖。
2.5 系統實現
系統在實現時,通過USB接口將目標板和PC機連接起來。通過CCS對目標工程進行在線調試。
目標工程的主要任務是TMS320C5416初始化、管理板上的資源和完成音頻的處理算法。要正確編寫采樣和輸出音頻信號的程序,必須對TMS320C5416的McBSP的每個通道包括27個相關的寄存器進行正確的設置,以滿足TMS320C5416和其他硬件電路芯片的各種時序要求(位同步、幀同步、時鐘信號等)。圖9為原始的語音信號在系統中的回放圖形,圖10為在CCS與DSP硬件連接的原始語音與處理后語音的對比圖形。
圖8 三通道分頻合成Matlab仿真圖
圖9 語音雙聲道未處理
圖10 語音雙聲道處理對比圖
3 結 語
該課題設計的助聽器實現了小型化、集成化、便捷化。系統還可以根據患者的具體需求進行參數的更改和設計,以滿足不同患者的需求。隨著社會的發展,在某些特定的場合不僅聽力有障礙的人,就是聽力正常的人也要借助助聽器。人類對于助聽器的需求會不斷更新,對于問題的探索和研究也將與時俱進,使用助聽器更好地為人類服務,實現人與自然和諧相處,從而促進社會和諧發展。
參考文獻
[1]金亮, 廉小親. 基于TMS320C5409的語音處理系統\\. 北京工商大學學報: 自然科學版, 2005, 23(2): 40-42, 45.
[2]肖憲波, 胡廣書, 劉春紅. 基于形態學的數字助聽器單頻段壓縮算法\\. 清華大學學報:自然科學版, 2005, 45(12): 1680-1683.
[3]宋仲康, 胡智華. 基于TMS320VC5416的音頻接口設計\\. 電子工程師, 2005(7): 24-26.
[4]賈克明, 陶洪久. 基于DSP的嵌入式語音識別系統的研究與實現\\. 武漢理工大學學報:信息與管理工作版, 2006(7): 156-159.
[5]李夕紅, 祝忠明. 基于DSP5402的音頻處理設計與實現\\. 電聲技術, 2006(12): 113-116.
[6]肖憲波, 谷子, 胡廣書, 等. 數字助聽器算法開發平臺pDHA的構建和測試\\. 北京生物醫學工程, 2006, 25(1): 57-60.
[7]陳廣飛, 應俊. 數字助聽器寬動態壓縮算法研究\\. 北京生物醫學工程, 2006, 25(5): 454-456, 481.
[8]孫紅, 張濤. 基于TMS320C5509DSP的無線語音傳輸采集傳輸系統\\. 微計算機信息, 2007, 23(23): 184-186.
[9]成城, 韓贊東. 基于DSP和ARM的音頻處理系統設計\\. 微計算機信息, 2007, 23(8): 147-149.
[10]付榮國, 周慶敏. 基于TLV320AIC23和TMS320VC5416的語音系統設計\\. 微計算機信息, 2007, 23(35): 192-193.
[11]蘇凌旭, 徐智敏.基于TMS320C6713的多路CVSD語音編解碼\\. 現代電子技術, 2009, 32(19): 76-77.