鄧 軍 楊銀堂
①(西安電子科技大學微電子學院 西安 710071)
②(西安電子科技大學電子工程學院 西安 710071)
在全數字接收機中,插值濾波器通過內插得到最佳采樣值以實現碼元同步的功能。插值濾波器性能的好壞直接影響到全數字接收機的誤碼率,設計性能良好的插值濾波器是設計全數字接收機的關鍵[1]。
插值濾波算法是一種數字信號處理方法,目前其實現大體有兩種方法:軟件方法和硬件方法。軟件方法靈活性和移植性好,但是處理速度較慢、不夠穩定。而硬件方法雖然在靈活性和移植性方面不及軟件方法,但是硬件方法的處理速度快、穩定、效率高、集成度高。
當前國內外就全數字接收機中插值濾波算法實現的研究而言,普遍采用的是DSP軟件實現,雖然Farrow提出了一種典型的易于硬件實現的Farrow結構[2],但由于其運行速度較慢和功耗較高,對于64QAM,256QAM等高效調制信號未達到令人滿意的效果。
本文把插值濾波算法映射到VLSI結構中,用以取代以前的DSP實現方法。在已有的拉格朗日立方插值濾波器Farrow結構基礎上,首先,融入了流水線與并行處理技術來提高其運算速度、并降低功耗,但耗用資源較多。接下來,又在已得到的并行流水線Farrow結構的基礎上,引入了快速FIR算法(FFAs)來生成復雜度降低的并行濾波結構。
通過仿真并在FPGA上實現,得到基于FFAs的結構在頻率響應、脈沖響應及誤碼率性能上接近原結構,且與原結構相比,有著更快的運行速度和更低的功耗。

新的采樣點就是最佳的插值點。只要將模擬濾波器hI(t)換成數字濾波器,就可以用數字的方法實現插值。定義基本指針mk=INT(kTi/ Ts),分數間隔μk=kTi/ Ts?mk,濾波器指針i=INT(kTi/ Ts)?m=mk?m 則式(1)可改寫為

式(2)就是數字插值濾波器的基本方程。
常用的插值濾波器有線性插值濾波器、拉格朗日插值濾波器以及由最佳低通濾波器構成的性能優良的插值器。在本文中,主要研究的是拉格朗日立方插值濾波器。
下面給出了4抽頭的拉格朗日立方插值濾波器的脈沖響應[1]

由于理想的sinc函數是不能物理實現的,于是就需要有一個能滿足需要,并且易于硬件實現的內插函數。拉格朗日內插器較適合硬件實現[3]。Farrow提出了一種典型的易于硬件實現的完全計算式嵌套結構——Farrow結構。用Farrow結構設計拉格朗日多項式插值濾波器的原理如下:
插值濾波器是一種時變線性濾波器,沖激響應函數hI(i,μ)是內插估值點μ的函數,而μ是隨時間變化的,所以沖激響應也是隨時間變化的。對于這種帶有可變因子的濾波器來說,可使用Farrow結構進行設計。下面用Farrow結構設計拉格朗日立方插值濾波器。
由式(1)可知沖激響應的系數分別為

于是可得到插值濾波器的Farrow結構,圖1給出了該濾波器的Farrow結構實現框圖。可見,其關鍵路徑為4TM+6TA。

圖1 拉格朗日立方插值濾波器的Farrow結構實現框圖
Merlino提到流水線是一種在程序執行時可以有多條指令重疊進行操作的并行處理實現技術,其導致了關鍵路徑的縮短[4],從而可以提高時鐘速度或采樣速度,或者可以在同樣速度下降低功耗。關鍵路徑的運算時間就是處理一個新樣點所需要的最小時間。
筆者在文獻[5]中提出的插入延遲單元后構成M級流水線系統,其關鍵路徑縮短為原始路徑長度的1/M,且電源電壓可以降低到βV0(V0為原始電壓),其中β是一個小于1的常數。基于流水線技術的Farrow結構如圖2。
從圖2可以看見,這是一個3級流水線結構,關鍵路徑由4TM+6TA減小到2TM+TA,速度相當于提高了1倍,當處理數據很多時,就節省了很多時間。功耗降低為原來的2β倍[5]。

圖2 流水線技術的插值濾波器Farrow結構實現框圖
并行處理涉及體系結構、算法映射、程序設計等多項技術,在VLSI數字信號的處理中,一直是個研究熱點。在并行處理中,多個輸出在一個時鐘周期內并行地計算。這樣,有效采樣速度提高到與并行級數相當的倍數。并行處理和流水線一樣,也能用來降低功耗[6,7]。
并行處理的功耗降低原理與流水線一樣,通過降低電源電壓來降低功耗。一個L路并行系統的功耗可降低為原來的β2倍[8]。即, β可通過下列二次方程求出:L(βV0?Vt)2=β(V0?Vt)2。
下面將并行處理加入到拉格朗日立方插值濾波器的Farrow結構中,如圖3所示。
將流水線和并行處理技術加入到拉格朗日立方插值濾波器的Farrow結構(以2級并行流水線為例)如圖4所示。

圖3 并行拉格朗日立方插值濾波器的Farrow結構

圖4 2級并行流水線的拉格朗日立方插值濾波器Farrow結構圖
2級并行流水線插值濾波器的Farrow結構與原始Farrow結構的比較見表1。

表1 2級并行流水線插值濾波器的Farrow結構與原始Farrow結構對比
由表可知道,相對于原始濾波器,2級并行流水線插值濾波器雖然使用的資源多了,但是速度提高成原來的(4TM+6TA)/(3TM+3TA)倍,功耗變成原來的β2倍[5]。
由Winograd的著作[9]可知,2個L-1階多項式相乘,可僅用2L-1個乘積項來實現。這種乘法數量的縮減是以加法數量的增加為代價來實現的。
一個被稱為快速FIR算法(FFAs)的相對比較新型的算法就是依賴于這種方法生成復雜度降低的并行濾波結構[10]。采用這種方法,L并行濾波器可以近似用2L-1個長度為N/L的濾波運算來實現[11]。獲得的并行濾波結構將需要2N-N/L次乘法。例如,如果設N=4,L=2,傳統的2并行方法將需要8次乘法,而2并行快速濾波方法僅僅需要6次乘法。當N值很大時,FFAs可以大大縮減乘法的數量。
在時域,一個N抽頭的FIR濾波器可表示為

其中{x(n)}是一個無限長的輸入序列,序列{h(n)}包含了長度為N的FIR濾波器的系數,或者可以在z域中可以表示為

輸入序列{x(0),x(1),x(2),…}可以被分解為偶數部分和奇數部分,如式(4)所示。

其中X0(z2)和X1(z2)分別為x(2k)和x(2k+1)(0≤k≤∞)的z變換。在式(4)中,X(z)被分解為兩個多相式。同樣,N長度的濾波器系數H(z)可以被分解為:H(z)=H0(z2)+z?1H1(z2), 其中H0(z2)和H1(z2)長度分別為N/2,對應于偶數子濾波器和奇數子濾波器。偶數部分的輸出序列y(2k)和奇數部分的輸出序列y(2k+1) (0≤k≤∞)的計算如下式所示:

其中

Y0(z2)和Y1(z2)分別對應時域里的y(2k)和y(2k+1)。式(5)和式(6)中的濾波運算在每次迭代中,處理兩個輸入x(2k)和x(2k+1),并產生兩個輸出y(2k)和y(2k+1),所以被稱為2并行FIR濾波器。這個2并行FIR濾波器可用矩陣形式表示如下:

式(5)和式(6)所展示的2并行FIR濾波器需要2N次乘法和加法運算。可將它們看寫成下面的形式:

這個2并行快速濾波器包括5個子濾波器;然而其中的H0X0和H1X1是公共項,在計算Y0和Y1時可以共用。
根據式(7)和式(8)可得到基于快速FIR算法的拉格朗日立方插值濾波器Farrow結構,如圖5所示。
通過這種方法可得到許多等價的并行FIR濾波器結構,這些結構都是等價的。但是,這些濾波器在硬件VLSI實現中,它們的性能卻有很大的差別。例如,在一個窄帶低通濾波器中,子濾波器H0+H1可能需要比H0?H1更多的非零比特[9]。值得注意的是系數的和或者差也可以用于縮減序列濾波器的強度。另外,不同結構也將導致不同的舍入噪聲特性。選擇合適的濾波器結構也可以減小舍入噪聲。
Farrow結構插值濾波器的快速FIR算法與圖5所示的2級并行處理立方插值濾波器的Farrow結構的比較見表2。
由表可知,使用快速FIR算法比2級并行流線使用更少的資源。

圖5 基于快速FIR算法的拉格朗日立方插值濾波器Farrow結構圖

表2 快速FIR算法與2級并行流水線的比較
以2倍符號速率對接收到的4QAM調制信號進行采樣,求出時鐘誤差后分別用原始Farrow結構立方插值法和基于FFAs的Farrow結構插值法對采樣序列進行的插值濾波繪出插值濾波器輸出信號星座如圖6。顯然圖6(a)中所示原始Farrow結構得到的星座信號點與圖6(b)中基于FFAs的Farrow結構得到的星座信號點基本一致。
另外,我們還通過誤碼率性能考查了原始Farrow結構立方插值濾波器和基于FFAs的Farrow結構插值濾波器的濾波性能。以16QAM信號為例,采樣速率為4倍的符號速率,系統脈沖響應取滾降因子為0.5的升余弦脈沖函數。上述兩種濾波器插值濾波后的誤碼率對比圖如圖7所示。可以看出,基于FFAs的Farrow結構插值濾波器與了原始Farrow結構的插值濾波器的誤碼率基本一致。
最后,我們對基于FFAs的Farrow結構的插值濾波器進行了Verlog HDL編程,并在Actel的FPGA(A3P030)上下載成功。圖8為仿真波形,仿真中只研究編程的正確性,故假設μ=1。由圖中可以看出,輸出的結果符合希望所得到的結果。
本文對拉格朗日立方插值濾波器的Farrow結構進行研究,在Farrow結構的基礎上,加進流水線、并行處理等技術,并利用FFAs算法對該結構進行改進。對改進的結構進行仿真并與原始結構進行比較。對原始的Farrow結構加入流水線與并行處理技術后,關鍵路徑減少,運行速度提高,功耗降低,且星座信號點的收斂性和誤碼性能與原結構基本一致;但耗用的資源卻增加,將加大專用集成芯片的面積。而基于快速FIR算法的改進比并行流水線結構要節省一些資源,同時也提高了運行速度,降低了功耗。

圖6 原始Farrow結構和基于FFAs的Farrow結構得到的星座信號點對比圖

圖7 16QAM的兩種結構的 插值濾波器誤碼性能對比圖

圖8 FFAs的Farrow結構的仿真波形圖
[1] 張公禮. 全數字接收機理論與技術[M]. 北京:科學出版社,2005年1月: 61-85.Zhang Gong-Li. Theory and Technology of All Digital Receiver[M]. Beijing: Science Press, 2005: 61-85.
[2] Gardner F M. Interpolation in digital modems part I:fundamentals[J]. IEEE Transactions on Communications,1993, 41(3): 501-507.
[3] Erup L, Gardner F M, and Harris R A. Interpolation in digital modems part II: implementation and performance[J].IEEE Transactions on Communications, 1993, 41(6):1135-1141.
[4] Merlino P and Abramo A. A fully pipelined architecture for the LOCO-I compression algorithm[J]. IEEE Transactions on Very Large Scale Integration Systems, 2009, 17(7): 967-971.
[5] 鄧軍, 楊銀堂. 全數字接收機中一種低功耗插值濾波器結構及其VLSI實現[J]. 西安電子科技大學學報, 2010, 37(2):320-325.Deng Jun and Yang Yin-tang. A structure of low-power interpolation filter and its VLSI implementation for all digital receiver[J]. Journal of Xidian University, 2010, 37(2):320-325.
[6] Tawfik S A and Ursun V K. Low power and high speed multi threshold voltage interface circuits[J]. IEEE Transactions on Very Large Scale Integration Systems, 2009, 17(5): 638-645.
[7] Tam W P, Lok T M, and Wong T F. Flow optimization in parallel relay netwoks with cooperative relaying[J]. IEEE Transactions on Wireless Communications, 2009, 8(1):278-287.
[8] Polpo A and Pereira C A B. Reliability nonparametric Bayesian estimation in parallel system[J]. IEEE Transactions on Reliability, 2009, 58(2): 364-373.
[9] Winograd S. Arithmetic complexity of computations.CBMS-NSF Regional Conference Series in Applied Mathematics, SIAM Publications, 1980, 33: 21-33.
[10] Parker D A and Parhi K K. Low-area/power parallel FIR digital filter implementations[J]. Journal of VLSI Signal Processing, 1997, 2(1): 75-92.
[11] Jain V and Blair W D. Filter design for steady-state tracking of maneuvering targets with LFM waveforms[J]. IEEE Transactions on Aerospace and Electronic Systems, 2009,45(2): 765-772.