冀常鵬,姬紅紅,郭偉平
1.遼寧工程技術(shù)大學(xué)研究生院,遼寧葫蘆島 125105
2.遼寧工程技術(shù)大學(xué)電子與信息工程學(xué)院,遼寧葫蘆島 125105
一種信號(hào)適度失真的寬線性SAEC模型
冀常鵬1,2,姬紅紅1,郭偉平1
1.遼寧工程技術(shù)大學(xué)研究生院,遼寧葫蘆島 125105
2.遼寧工程技術(shù)大學(xué)電子與信息工程學(xué)院,遼寧葫蘆島 125105
由于人類的雙聲道聽覺系統(tǒng),在電話會(huì)議系統(tǒng)中,立體聲傳播能夠提供語音的遠(yuǎn)程呈現(xiàn)和單聲道系統(tǒng)所不能提供的音頻真實(shí)再現(xiàn)[1-2]。立體聲聲學(xué)回聲是由兩個(gè)麥克風(fēng)和兩個(gè)揚(yáng)聲器之間的耦合產(chǎn)生的[3]。它為數(shù)字網(wǎng)絡(luò)通信系統(tǒng)引入更多的時(shí)延,使回聲現(xiàn)象猶為突出。系統(tǒng)中回聲抵消器的好壞,直接影響通話質(zhì)量的優(yōu)劣。現(xiàn)有的立體聲回聲抵消器(SAEC)均采用高質(zhì)量的全雙工通信,而且是一個(gè)實(shí)變量雙輸入雙輸出的裝置。對(duì)于每個(gè)SAEC接收端的麥克風(fēng)來說它是由一個(gè)未知的雙輸入識(shí)別系統(tǒng)組成,即形成了兩個(gè)聲學(xué)回聲路徑的并聯(lián)組合[4]。因此,為了確定從兩個(gè)揚(yáng)聲器到兩個(gè)麥克風(fēng)的回聲路徑,一個(gè)SAEC系統(tǒng)會(huì)由四個(gè)自適應(yīng)濾波器組成,其結(jié)構(gòu)復(fù)雜且不易實(shí)現(xiàn)。
近年來,寬線性模型的思想逐漸受到重視并被廣泛應(yīng)用[5]。可將寬線性模型引入到SAEC中,則一種復(fù)變量單輸入單輸出新系統(tǒng)將代替經(jīng)典的實(shí)變量雙輸入雙輸出設(shè)計(jì)方案。此時(shí),四個(gè)實(shí)數(shù)聲學(xué)脈沖響應(yīng)轉(zhuǎn)化成一個(gè)復(fù)數(shù)脈沖響應(yīng),其優(yōu)點(diǎn)是只需處理一個(gè)復(fù)變量的輸出信號(hào)。
摒除其內(nèi)在的相似性,SAEC從根本上有別于單信道回聲抵消而且處理難度更大[6]。SAEC所面臨的主要問題是兩個(gè)信道傳輸?shù)木€性相關(guān)信號(hào)會(huì)使自適應(yīng)算法要求解的方程出現(xiàn)異常[7]。這就意味著,在單信道情況下方程沒有唯一解,而是有無限的解[8]。對(duì)于這種解不確定問題的唯一解決途徑是使輸入信號(hào)間的相關(guān)性降低,在保證沒有影響到立體感和音質(zhì)的前提下,使輸入信號(hào)適度失真。
2.1 經(jīng)典立體聲回聲抵消
經(jīng)典的立體聲聲學(xué)回聲抵消器通常是一個(gè)實(shí)變量雙輸入雙輸出系統(tǒng),即有兩個(gè)輸入或揚(yáng)聲器信號(hào)xL(n)和xR(n),兩個(gè)輸出或麥克風(fēng)信號(hào)dL(n)和dR(n),n表示時(shí)間變量。接收端的麥克風(fēng)信號(hào)可以表示為:

其中,yL(n)和yR(n)是聲學(xué)回聲信號(hào),νL(n)和νR(n)是近端信號(hào)。回聲信號(hào)為:

其中,wt,LL、wt,LR、wt,RL、wt,RR是揚(yáng)聲器到麥克風(fēng)的L維聲學(xué)脈沖響應(yīng)的矢量形式,上標(biāo)(·)T是矢量或矩陣的轉(zhuǎn)置。XL(n)和XR(n)是揚(yáng)聲器信號(hào)的L個(gè)抽樣值。這種方法的主要目的是估計(jì)這四個(gè)濾波器的聲學(xué)脈沖響應(yīng),而且揚(yáng)聲器信號(hào)和麥克風(fēng)信號(hào)都是實(shí)變量。因此,現(xiàn)有的聲學(xué)回聲抵消器物理結(jié)構(gòu)比較復(fù)雜。
2.2 寬線性立體聲回聲抵消新模型
文獻(xiàn)[9]和[10]介紹了寬線性模型的基本理論及其復(fù)變量的表達(dá)形式,文獻(xiàn)[11]證明了寬線性模型理論與對(duì)偶原理的一致性。在此,通過復(fù)變量的形式把寬線性模型應(yīng)用到立體聲回聲抵消技術(shù)中,并推導(dǎo)寬線性立體聲回聲抵消模型。
為了引入本文所要介紹的模型,先介紹公式的復(fù)數(shù)表達(dá)式,首先輸出信號(hào)的復(fù)數(shù)形式為:


從式(4)~(6)可以看出通過復(fù)變量引入的寬線性模型。在這種情況下,要做的是從復(fù)數(shù)麥克風(fēng)信號(hào)d(n)和復(fù)數(shù)揚(yáng)聲器信號(hào)x(n)估計(jì)出長(zhǎng)度為2L復(fù)數(shù)聲學(xué)脈沖響應(yīng)Wt。而此時(shí),經(jīng)典實(shí)變量雙輸入雙輸出系統(tǒng)已轉(zhuǎn)換成一個(gè)復(fù)變量單輸入單輸出系統(tǒng)。因此,回聲抵消的物理模型是復(fù)數(shù)域的單輸入單輸出寬線性的。
在SAEC中兩個(gè)輸入信號(hào)是通過對(duì)同一信源進(jìn)行濾波得到的,即兩輸入信號(hào)線性相關(guān),因此預(yù)期的非唯一性問題就出現(xiàn)了。而對(duì)遠(yuǎn)端揚(yáng)聲器信號(hào)的預(yù)處理是獲得解決方案的有效方式。也就是說,為了減小兩個(gè)輸入信號(hào)xL(n)和xR(n)之間的相關(guān)性需要使輸入信號(hào)適度失真,這樣就可以得到非常逼近的聲學(xué)脈沖響應(yīng)估計(jì)值。然而這種失真的實(shí)現(xiàn)要以不降低信號(hào)的質(zhì)量和立體聲效果為前提。
由文獻(xiàn)[12]可知,分別對(duì)每個(gè)信道用正負(fù)半波整流器進(jìn)行整流是能夠降低信號(hào)的相關(guān)性。具體對(duì)輸入信號(hào)的處理公式如下:

其中,αr是用來控制非線性數(shù)量的參數(shù),即使αr增大到0.5也不會(huì)影響到聲音的立體感。
在寬線性模型背景下,復(fù)數(shù)形式的輸入信號(hào)表示為:

式中的相位是由半波整流房發(fā)展改進(jìn)而來的,而幅值與原信號(hào)的幅值保持一致。
因此,讓輸入信號(hào)適度失真的預(yù)處理降低了輸入信號(hào)間的相關(guān)性,避免了因相關(guān)性而出現(xiàn)的解不唯一問題,可以根據(jù)其幅值相位的表達(dá)形式按需要調(diào)控音質(zhì)和立體感。
仿射投影算法(APA)是回聲抵消效果較好的算法之一,其收斂和跟蹤速度比歸一化最小均方誤差(NLMS)快。此外,從算術(shù)運(yùn)算的復(fù)雜度方面看,APA要比遞歸最小二乘(RLS)系列衍生的算法更小。設(shè)W(n)=[w0(n),w1(n),…,w2L-1(n)]T是長(zhǎng)度為2L的自適應(yīng)濾波器系數(shù),且是Wt的估計(jì)值,y′(n)=WH(n-1)X′(n)是自適應(yīng)濾波器在n時(shí)刻的輸出信號(hào),誤差信號(hào)為e(n)=d(n)-y′(n)。
為了導(dǎo)出在本文背景下的APA算法的表達(dá)式,先設(shè)2L×P維的輸入矩陣A(n)=[X′(n),X′(n-1),…,X′(n-P+1)],P是投影階數(shù)。定義P×1維的先驗(yàn)誤差的矢量形式為e(n)=d(n)-AT(n)W*(n-1)。根據(jù)這種表達(dá)方式,APA的更新公式如下:

式中,IP是P×P維的單位矩陣,α是歸一化步長(zhǎng)參數(shù),δ是正則化因子。由此可知,當(dāng)P=1時(shí),式(11)轉(zhuǎn)化成NLMS。因?yàn)锳PA算法簡(jiǎn)單易實(shí)現(xiàn),所以它在實(shí)踐中非常實(shí)用。但是由于濾波器長(zhǎng)度較長(zhǎng),輸入信號(hào)相關(guān)性較高,使得它的收斂速度不是很理想。
利用回聲路徑的稀疏特性,即算法的“成比例”思想[13],來改善算法的收斂速率,調(diào)節(jié)與待估計(jì)濾波器系數(shù)的幅值成比例的自適應(yīng)步長(zhǎng)更新濾波器的每個(gè)系數(shù)。因此,在所有的濾波器系數(shù)中自適應(yīng)增益是按比例重新分配的,在系數(shù)較大時(shí)能加快收斂速度,算法的整體收斂速率也將得到提高。在眾多改進(jìn)的成比例算法中[14],改進(jìn)的成比例APA(IPAPA)算法是最具吸引力的選擇之一,其優(yōu)勢(shì)表現(xiàn)在它的簡(jiǎn)單性和它對(duì)回聲路徑稀疏程度的魯棒性。在本文所提出SAEC的寬線性模型背景下,IPAPA算法的更新公式可以寫成:

其中,k(-1≤k≤1)是用來控制比例數(shù)量的參數(shù)。
在收斂速度和跟蹤速度有所提高的前提下,希望算法的失調(diào)誤差盡量減小。在濾波系數(shù)的估計(jì)過程中,為了減少噪聲的影響,提出正則化APA(R-APA)優(yōu)化表達(dá)式為:

在本文提出的SAEC模型背景下,可以根據(jù)已有的算法推導(dǎo)出更多新算法。其中,APA、IPAPA和R-APA三種基本算法在APA衍生的算法中具有重要的地位,在此先以這三種算法為例分析改進(jìn)方法的可行性。
本文所有的仿真結(jié)果是在提出的SAEC模型背景下進(jìn)行的。設(shè)遠(yuǎn)端聲學(xué)脈沖響應(yīng)有1 024個(gè)參數(shù),近端脈沖響應(yīng)(即wt,LL、wt,LR、wt,RL、wt,RR)的長(zhǎng)度L為512。自適應(yīng)濾波器的長(zhǎng)度1 024,抽樣率為8 000 Hz。遠(yuǎn)端原信號(hào)是IEEE-AP語音庫(kù)的語音序列。
選擇三種算法進(jìn)行對(duì)比,即APA、IPAPA和R-APA算法。所有算法的步長(zhǎng)α=0.5,正則化因子是x(n)的方差。在成比例類型的算法(IPAPA)中取k=0。對(duì)于算法性能采用如下的三項(xiàng)指標(biāo)進(jìn)行估計(jì)與分析:(1)收斂快慢的比較,從仿真結(jié)果中可直觀的看出。(2)均方誤差(MSE),為得到平滑的仿真曲線選擇的平均點(diǎn)數(shù)均超過256點(diǎn)。(3)歸一化失調(diào)函數(shù)(即MIS,單位是dB),其表達(dá)式為為二階范數(shù))。
仿真是在單向通話的情景下進(jìn)行的,由于此時(shí)近端語音信號(hào)不存在,近端信號(hào)v(n)中只包含背景噪聲。因此,可以定義聲學(xué)回聲與噪聲之比(SENR),分別為y(n)和v(n)的方差。仿真中,近端的背景噪聲是獨(dú)立的高斯白噪聲信號(hào),且SENR=30 dB。
首先,在無失真的輸入信號(hào)的情況,輸入信號(hào)經(jīng)過正負(fù)半波整流器后的情況以及本文中提出的輸入信號(hào)適度失真方法的三種情況下,比較APA算法的性能優(yōu)劣。其中也將無失真的情況作為一個(gè)參照展示,失真參數(shù)αr=0.4。其次,分別比較IPAPA和R-APA算法在無失真輸入信號(hào)和適度失真的輸入信號(hào)情況下的收斂性能。最后,比較APA、IPAPA和R-APA算法在使輸入信號(hào)適度失真的方法條件下的性能表現(xiàn)。
由圖1可知,在P=8情況下算法的收斂速度和復(fù)雜度能達(dá)到一個(gè)折中狀態(tài)。由圖1(a)可以看出,在失真狀態(tài)下的APA收斂速度要比整流后的輸入信號(hào)和無處理的參照輸入信號(hào)更快且更易達(dá)到平穩(wěn)狀態(tài),這就意味著,新SAEC模型的物理結(jié)構(gòu)更簡(jiǎn)單,處理速度較快。圖1(b)和1(c)分別是均方誤差和均方誤差的局部細(xì)節(jié)曲線。特別地,從1(c)圖的局部細(xì)節(jié)可知,與正負(fù)半波整流器相比較失真方法具有更小的MES,對(duì)于歸一化失調(diào)函數(shù)而言,經(jīng)過半波整流的輸入信號(hào)的情況失調(diào)量略小,但并無很大差別,即對(duì)回聲信號(hào)的抵消效果更好,能夠有效地抑制回聲的產(chǎn)生,而且抵消情況比較穩(wěn)定,能夠有效且真實(shí)地還原語音信號(hào)。
圖2分別比較IPAPA和R-APA算法在無失真輸入信號(hào)和適度失真的輸入信號(hào)情況下的收斂性能。由圖可知,對(duì)不同算法但相同處理方式時(shí),即R-APA和IPAPA算法分別用這兩種方法處理時(shí),前者的收斂速度比后者略快,誤差較小;對(duì)相同算法但不同處理方式時(shí),即適度失真信號(hào)情況下的IPAPA和R-APA算法要比無失真純粹是輸入信號(hào)情況下算法的收斂速度快,對(duì)輸入信號(hào)無處理時(shí)R-APA算法的誤差最大,而對(duì)信號(hào)進(jìn)行失真處理時(shí)R-APA算法的誤差最小,即為不同的結(jié)構(gòu)與處理方法對(duì)回聲抵消的效果以及效果的穩(wěn)定性。

圖1 在輸入信號(hào)無失真,半波整流和輸入信號(hào)失真狀態(tài)下的函數(shù)曲線圖

圖2 IPAPA和R-APA算法分別在輸入信號(hào)無失真和適度失真條件下的函數(shù)曲線圖

圖3 在失真方法下的APA、IPAPA和R-APA算法的曲線圖
圖3顯示這三種算法在輸入信號(hào)失真情況下的性能曲線。圖3(a)驗(yàn)證了IPAPA和R-APA算法的整體收斂速度要優(yōu)于APA算法,R-APA要比IPAPA算法略快且基本同時(shí)趨于穩(wěn)定。因此,在寬線性SAEC模型的條件下,R-APA算法的回聲抵消效果更好,得到的語音更接近真實(shí)的語音而且立體感增強(qiáng)。圖3(b)和圖3(c)分別顯示了誤差曲線和其局部曲線圖,相比較可知R-APA算法的誤差最小,而且在失真方法下的誤差的幅度也減小了。同時(shí),從圖3(c)可以看出,在本文的方法下,R-APA算法的失調(diào)量最小,即聲學(xué)系統(tǒng)對(duì)聲音的處理效果很穩(wěn)定。
基于現(xiàn)有的實(shí)變量雙輸入雙輸出的SAEC模型,提出了一種復(fù)變量單輸入單輸出的新模型。介紹了適用于SAEC模型的使輸入信號(hào)失真的新方法。在文中,利用仿射投影算法驗(yàn)證寬線性SAEC的性能。仿真結(jié)果表明輸入信號(hào)適度失真的寬線性模型與算法結(jié)合后,提高了算法的收斂速度,降低了失調(diào)量和均方誤差,從而使SAEC新模型物理結(jié)構(gòu)的復(fù)雜度有所減少。而且在外界環(huán)境變化很大,即揚(yáng)聲器和麥克風(fēng)的聲耦合更嚴(yán)重時(shí),本文方法的回聲抵消效果比較理想,而且可以抑制回聲產(chǎn)生,聲音的處理效果較穩(wěn)定,更能滿足人們的要求。
[1]成利香,張桂新.基于DSP生回聲抵消系統(tǒng)的研究[D].長(zhǎng)沙:中南大學(xué),2010.
[2]袁佳能,于鳳芹.一種無雙端會(huì)話檢測(cè)的回聲抵消算法[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(15):33-35.
[3]Chen Qiuying,Wang Xiaomin,Li Mingxuan,et al.Sound field of an electromagnetic acoustic transducer[J].Chinese Journal of Acoustics,2011,30(1):44-54.
[4]Benesty J,Gaensler T,Morgan D R,et al.Advances in network and acoustic echo cancellation[M].Berlin:Springer-Verlag,2001. [5]Benesty J,Paleologu C,G?nsler T,et al.A perspective on stereophonic acoustic echo cancellation[M].Berlin:Springer-Verlag,2011.
[6]Sondhi M M,Morgan D R,Hall J L.Stereophonic acoustic echo cancellation-an overview of the fundamental problem[J].IEEE Signal Processing Letters,1995,2(8):148-151.
[7]Benesty J,Morgan D R,Sondhi M M.A better understanding and an improved solution to the specific problems of stereophonicacousticechocancellation[J].IEEETransactionson Speech and Audio Processing,1998,6(2):156-165.
[8]李躍明,侯楚林.變步長(zhǎng)比例放射投影算法及在回聲消除中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(35):126-129.
[9]Picinbono B,Chevalier P.Widely linear estimation with complex data[J].IEEE Transaction on Signal Processing,1995,43(8):2030-2033.
[10]趙愉,李峰.仿射投影算法中的步長(zhǎng)控制[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(11):112-113.
[11]Mandic D P,Still S,Douglas S C.Duality between widely linear and dual channel adaptive filtering[C]//Proceedings of the IEEE International Conference on Acoustics,Speech,and Signal Processing,2009:1729-1732.
[12]Paleologu C,Benesty J,Ciochinǎ S.Sparse adaptive filters for echo cancellation[C]//Proceedings of the Synthesis Lectures on Speech and Audio Processing,2010.
[13]Duttweiler D L.Proportionate normalized least-mean-squares adaptation in echo cancellers[J].IEEE Transactions on Speech and Audio Processing,2000,8(5):508-518.
[14]Benesty J,Gay S L.An improved PNLMS algorithm[C]// Proceedings of the IEEE International Conference on Acoustics,Speech,and Signal Processing,2002,2:1881-1884.
JI Changpeng1,2,JI Honghong1,GUO Weiping1
1.Institute of Graduate,Liaoning Technical University,Huludao,Liaoning 125105,China
2.School of Electronic and Information Engineering,Liaoning Technical University,Huludao,Liaoning 125105,China
The existing approach of stereophonic acoustic echo cancellation is designed by a two-input/two-output system with real random variables.Its structure appears to be complex and it is difficult to realize.This scheme will be recast as a singleinput/single-output system with complex random variables by approved the widely linear model.The advantage of this method is that instead of handling two real output signals separately,it only handles one complex output signal.Moreover,the perception and quality of the stereo will be modified by the phase and module of the complex input signal,respectively.The coherence can be declined by making the input signal reasonably distorted in order to solve the nonuniqueness problem.The widely linear model and distorted signal are applied in affine projection algorithm to verify the misalignment and convergence.Experimental results indicate that the proposed method has good numerical features of less misalignment and fast convergence,so the SAEC with widely linear model has more advantage.
Stereophonic Acoustic Echo Cancellation(SAEC);widely linear model;nonlinear distortion;Affine Projection Algorithm(APA)
現(xiàn)有的立體聲回聲抵消器是一個(gè)實(shí)變量雙輸入雙輸出的裝置,其結(jié)構(gòu)復(fù)雜不易實(shí)現(xiàn)。寬線性模型的引入,提供了一種復(fù)變量單輸入單輸出的裝置來替代實(shí)變量雙輸入雙輸出裝置,其優(yōu)點(diǎn)是只需處理一個(gè)復(fù)變量的輸出信號(hào)而不是兩個(gè)實(shí)變量輸出信號(hào),而且能通過復(fù)變量輸入信號(hào)的相位和幅值分別調(diào)控聲音的立體感和音質(zhì)。利用輸入信號(hào)適度失真的方法降低兩個(gè)信號(hào)之間的相關(guān)性以解決因?yàn)V波而產(chǎn)生的非唯一性問題。把寬線性模型和失真信號(hào)應(yīng)用到仿射投影算法中,通過仿真驗(yàn)證改進(jìn)方法的誤差性能和收斂速度。結(jié)果表明改進(jìn)的方法具有誤差小和收斂快的特點(diǎn),因此寬線性SAEC模型更有優(yōu)勢(shì)。
立體聲聲學(xué)回聲抵消;寬線性模型;非線性失真;仿射投影算法
A
TN912
10.3778/j.issn.1002-8331.1303-0022
JI Changpeng,JI Honghong,GUO Weiping.Reasonably distorted signal for stereophonic acoustic echo cancellation with widely linear model.Computer Engineering and Applications,2013,49(19):200-203.
國(guó)家自然科學(xué)基金(No.50490275)。
冀常鵬(1970—),男,教授,研究方向?yàn)橥ㄐ排c網(wǎng)絡(luò),信號(hào)檢測(cè)與處理;姬紅紅(1988—),女,研究生,研究方向?yàn)樾盘?hào)檢測(cè)與處理;郭偉平(1987—),女,研究生,研究方向?yàn)樾盘?hào)檢測(cè)與處理。E-mail:hongji19880610@163.com
2013-03-04
2013-05-17
1002-8331(2013)19-0200-04
CNKI出版日期:2013-06-08http://www.cnki.net/kcms/detail/11.2127.TP.20130608.1001.027.html