沈陽理工大學信息科學與工程學院 孫 博 梅鐵民
復倒譜去混響研究
沈陽理工大學信息科學與工程學院 孫 博 梅鐵民
語音信號去混響在通信、語音識別和聲源定位方面具有重要意義。首先介紹了混響產生的機理,其次闡述了復倒譜法去混響的基本原理。該方法利用在復倒譜域純凈語音信號和房間沖擊響應的復倒譜分布不同的特點去除混響。通過仿真實驗,證明該算法在去混響中取得了較好的效果。本文采用的是逆濾波方法中經典的復倒譜域濾波方法。聲源信號和房間沖擊響應的復倒譜所在位置不同,前者主要集中在中間點較近的位置而后者集中在首尾兩端[1]。因此,利用這一差別,在給語音信號分段后去掉信號中的混響部分,之后進行逆操作,完成去混響。
去混響;復倒譜;房間沖擊響應;語音信號
理論上,延時50ms以上的反射波產生的效應稱為混響,混響不同于噪聲等毫不相干的外來干擾信號,混響信號來源于聲源信號,是一種有規律的干擾信號。
設s(n)聲源發出的語音信號,x(n)為麥克風收到聲源直接發射來的語音信號和經過反射后的語音信號:


其中,δ(n)為單位沖激函數,忽略x(n)中的噪聲信號u(n),則x(n)可以表示為:

其中,*表示卷積計算,房間沖擊響應h(n)是計算室內混響的重要參數。
同態處理[2]是將非線性運算變換為線性運算,將卷積運算轉化為加法運算的技術,對于一個線性系統來說,其輸入輸出關系服從疊加原理,設語音信號x(n)由聲源激勵信號s(n)和房間沖擊響應h(n)的卷積構成,則有:

卷積信號經過同態系統后變換成一個處理過的卷積信號,如圖1所示。

圖1 同態系統模型

圖2 沖激響應函數
實驗所用的語音是一段英文錄音,采樣頻率為44100Hz,圖2是采用鏡像法模擬的房間沖擊響應函數。用語音與沖激響應函數做卷積得到混響語音,然后給混響語音分幀,加漢明窗,幀長1024,幀移為256。設計一種倒譜域上的低通濾波器(見圖3),經過研究比對,當最高截止點為幀長的1/256,過渡帶帶寬為幀長的1/16時,得到的去混響效果最好。

圖3 低通濾波器
分幀后,對每一幀語音信號的倒譜進行濾波。圖4以第10幀信號的倒譜為例,引入混響后的語音信號的倒譜圖較之前有了變化,濾波后的倒譜圖的中部變平了。圖5中的波形由上至下依次為原始語音、加混響后語音和去混響后語音的時域波形,從中可以看出,加混響后的語音波形較原始語音發生了變化,而去混響后的語音波形還原了原始語音的一些細節。

圖4 加混響前后及濾波前后的語音信號倒譜圖

圖5 去混響前后語音時域波形對比圖

表1 去混響性能改善評測表
本文采用主觀和客觀兩類評測方法,客觀評價方法包含時域和頻域兩類評測指標,分別是信混噪比改善△SRNR,這是一種時域的評測標準,還有線性預測倒譜系數距離改善△LPCC和MEL頻率倒譜系數距離改善△MFCC[3],這是兩種頻域評測指標。其中,△SRNR反映信號在時域波形上的失真度,能夠很直觀的反映問題。△LPCC和△MFCC是從頻域方面模擬人耳的聽覺特性。
表1是采用復倒譜法去混響實驗中應用兩類評測方法所得出的結果,客觀評測指標數值越高表明去混響效果越好,主觀評測指標則是按照優、良、中、差、劣五個等級來說明,可以看出語音去混響有一定效果。
研究了混響是如何產生的以及混響的特性,論述同態信號處理的原理,說明了復倒譜法去混響的原理和運算方法,依據在復倒譜域上混響信號與語音信號所在位置不同的特征,設計出了適用的低通濾波器來減弱房間沖擊響應對聲音信號的干擾。分析了評價去混響效果的主觀和客觀的評測指標,并給出了評測結果,證明復倒譜去混響的方法起到了一定效果。
[1]張德會,陳光治.復倒譜域語音信號去混響研究[J].聲學技術,2009,28(1).
[2]張雪英.數字語音處理及MATLAB仿真[M].北京:電子工業出版社,2016.
[3]宋知用.MATLAB在語音信號分析與合成中的應用[M].北京:北京航空航天大學出版社,2013.