999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于FPGA的級聯結構FFT處理器的優化設計

2010-06-22 03:41:08張竺君錢建平
現代電子技術 2009年22期
關鍵詞:結構

張竺君 錢建平

摘 要:為了減少級聯結構FFT處理器對緩沖存儲器需求量,提出一種基于FPGA用基[CD*2]16和基[CD*2]2、基[CD*2]4、基[CD*2]8組合的混合基算法實現FFT處理器的設計方案。在1 024點FFT處理器的實現過程中,用優化的基[CD*2]4蝶形運算核搭建了級聯結構的基[CD*2]16蝶形運算核,并將對同一個地址進行讀和寫的雙端口RAM和乒乓結構的單端口RAM結合使用,從而在不增加邏輯單元使用和保證運算速度的情況下,大大減少了存儲單元的使用量。

關鍵詞:快速傅里葉變換;FPGA;基[CD*2]16算法;混合基算法;級聯結構

中圖分類號:TP274

0 引 言

數字信號處理主要研究采用數字序列或符號序列表示信號,并用數字計算方法對這些序列進行處理,以便把信號變換成符合某種需要的形式。在現代數字信號處理中,最常用的變換方法就是離散傅里葉變換(DFT),然而,它的計算量較大,運算時間長,在某種程度上限制了它的使用范圍??焖俑道锶~變換(FFT)的提出使DFT的實現變得接近實時,DFT的應用領域也得以迅速拓展。它在圖像處理、語音分析、雷達、聲納、地震、通信系統、遙感遙測、地質勘探、航空航天、生物醫學等眾多領域都獲得極其廣泛的應用。隨著〧PGA技術的高速發展以及EDA技術的成熟,采用〧PGA芯片實現FFT已經顯示出巨大的潛力。

目前用FPGA實現的FFT處理器結構大致分為四種:遞歸結構、級聯結構、并行結構和陣列結構[2[CD*2]6]。遞歸結構只利用一個碟形運算單元對數據進行規律的循環計算,使用硬件資源較少,但運算時間較長。級聯結構每一級均采用一個獨立的碟形運算單元來處理,相對遞歸結構速度上有所提高,不足之處是增加了延時用的緩沖存儲器使用量。并行結構對一級中的蝶形單元并行實現,陣列結構是將每一級的蝶形運算單元全部并行實現,這兩種結構有很高的運算速度,但消耗的資源過大,一般不采用。為了提高運算速度,特別是為了適應多批數據處理,一般采用級聯結構實現FFT處理器。

1 FFT整體結構設計

在FFT算法中,目前大多使用基[CD*2]2和基[CD*2]4算法實現級聯結構的FFT處理器,除此之外,也可采用┗鵞CD*2]8和基[CD*2]16算法來實現。隨著基數的增大,對于相同點數的離散數列,處理器所分的級數越少,對緩沖存儲器的需求也越小,因此考慮采用基[CD*2]16算法來實現FFT處理器,但基[CD*2]16算法只能實現離散數列點數是16的玴次冪的FFT[7]。從而,引入混合基思想來改進基[CD*2]16算法。

設玿(n)為N點有限長序列,其DFT為

設r1=16琾,r2=N/16琾=2,4,8,式(2)先將原非16的p次冪的N點獸FT分解為16琾點的獸FT;再分解為N/16琾點的獸FT。首先對輸入信號進行16琾點的獸FT運算,然后將結果乘以一個旋轉因子W﹏0k0璑,最后將計算出的數據進行一次N/16琾У鉌FT運算,得到的結果即為所需要的玁點FFT運算結果。這樣處理,既能減少分解的級數,又能使計算離散數列點數只需是2的整數次冪即可。以1 024點為例,只需分解成兩級┗鵞CD*2]16運算模塊和一級基[CD*2]4運算模塊即可實現,其FFT處理器結構圖如圖1所示。在此結構圖的前端增加/減少┗鵞CD*2]16運算模塊或將最后一級基[CD*2]4運算模塊改為基[CD*2]2或基[CD*2]8運算模塊,就可以實現其他離散數列的點數只需是2的整數次冪的FFT運算。

2 蝶形運算核的實現

2.1 基[CD*2]16蝶形運算核

如果直接將基[CD*2]16蝶形運算公式轉換到硬件中實現基[CD*2]16運算核,其結構將十分復雜的‐[9,10]。因此,采用易實現的頻域抽選基[CD*2]4算法來實現頻域抽選基[CD*2]16蝶形運算核。由基[CD*2]4蝶行運算單元實現的基[CD*2]16蝶行運算單元如圖2所示。

采用并行流水結構實現的基[CD*2]16運算核,一個數據時鐘可處理16個數據。而每次蝶形運算在一個數據時鐘內只需要計算出一個結果,這將造成資源浪費。因此,采用級聯結構實現的基[CD*2]16蝶形運算核,用兩個┗鵞CD*2]4蝶形運算核分別復用4次來實現每一級中的四個蝶行運算,中間用┮桓霆串行出入/輸出的寄存器進行連接,其結構框圖如圖3所示。

2.2 基[CD*2]4蝶形運算核

基[CD*2]4蝶形運算核的結構如圖4所示,其中加減模塊為兩級流水結構,一次可以計算4個數據。蝶形運算的四個串行輸入數據經串/并轉換器轉換為四路并行數據,進入加減運算單元。計算出的4個并行結果進入并/串轉換器后,串行輸入復數乘法器和旋轉因子相乘然后輸出結果。因為圖1中最后一級的數據只需要進行加減運算不需要再乘以旋轉因子,所以圖1中的┗鵞CD*2]4蝶形運算核是沒有復數乘法器的,數據從并/串轉換器中直接輸出給緩沖存儲器。

2.3 復數乘法器

雖然現在的高端產中已經集成了可以完成乘法的DSP資源,但也是有限的。因此高效復數乘法器的設計對該設計來講仍然非常的重要。復數乘法的標準式如下:

式中:A,B分別為輸入數據的實部和虛部,C和D分別為旋轉因子的實部和虛部。按照這種標準表達式,執行一次復數乘法需要進行4次實數乘法,2次實數加法和2次實數減法。將上述公式重新整理為:R=(C-D)?〣+狢(A-B),I=(C-D)A-C(A-B)в嘔后的復數乘法器需要進行3次實數乘法,2次實數加法和3次實數減法,相比傳統結構多了一個減法器,少了一個乘法器。在FPGA中,加減法模塊所占用的相對裸片面積要小于相同位數的乘法器模塊。這樣的優化還是很有價值的,在FFT吞吐量不變的情況下,可減少25%的乘法器使用量,在乘法器數量一定的情況下可高FFT吞吐量。

3 存儲器單元

傳統的級聯結構的FFT處理器的緩沖存儲器都是采用乒乓結構,基本思想就是用兩塊相同的RAM交替讀出或寫入數據。即其中一塊RAM在寫入數據時,另一塊RAM用于讀出數據。當用于寫入數據的RAM寫滿時交換讀寫功能。將乒乓結構中RAM的內部存儲單元地址用二進制數a9a8a7a6a5a4a3a2a1a0表示。以寫滿其中以塊玆AM為一個周期,用一個二進制計數器玬9m8m7m6m5m4m3m2m1m0生成的順序寫入,混序讀取的乒乓結構玆AM的操作地址如表1所示。[HJ1]第一塊緩こ宕媧⑵韉詼塊緩こ宕媧⑵韉諶塊緩こ宕媧⑵韉謁目榛邯こ宕媧⑵

表1中第一,二,四塊存儲器的寫操作地址和讀操作地址是可以互換的,也就是將數據混序寫入,順序讀取。因此,根據這個規律采用一塊可同時讀寫的雙端口RAM來實現第一,二,四塊存儲器。其基本思想就是對同一個地址進行讀和寫。以用一塊雙端口RAM實現第一塊存儲器的為例,在第一個周期內雙端口RAM按照地址m9m8m7m6m5m4m3m2m1m0進行寫操作,即數據是按照自然順序儲存的。在第二個周期按照地址m0m1m2m3m4m5m6m7m8m9同時進行讀寫操作,讀出的數據按照倒位序排列,寫入的數據按照倒位序儲┐嫻摹*在第三個周期按照地址m9m8m7m6m5m4m3m2m1m0同時進行讀寫操作,讀出的數據按照倒位序排列,寫入的數據是按照自然順序儲存的。依次類推下去,讀出的數據都是按照倒位序排列。同樣第二塊和第四塊存儲器的存儲地址也具有這樣類似的循環規律。因此只有第三塊存儲器需要用乒乓結構的RAM實現,與傳統所有存儲器都用乒乓結構RAM實現相比,節省了3/8的存儲單元。

設計中用Matlab軟件直接生成旋轉因子,并將其轉化為16位有符號定點數寫入MIF文件。然后用ROM直接調用MIF文件,將旋轉因子預置在ROM中。

4 仿真結果

選用Altera公司生產的Cyclone Ⅱ的EP2C35F484C7芯片上進行驗證,在Quartyus Ⅱ7.2軟件中進行編譯和仿真。通過對高基核的優化處理,該[LL]設計對邏輯單元消耗量和傳統用基[CD*2]4算法實現相近,僅為4 399,但由于本文采用了高基低基組合的混合基算法,在處理1 024點的離散數列時,處理器所分的級數僅為3級,相對傳統的低基數算法,其實現減少了對緩沖存儲器塊數的需求;并通過對緩沖存儲器的優化設計,又比全部用乒乓結構RAM實現的傳統方法節省了3/8的存儲單元,因此占用的存儲資源僅為154 048 b。仿真波形如圖5所示,該仿真結果和Matlab計算結果基本一致,存在一定的誤差是由于有限字長效應引起的。

5 結 語

在100 MHz的時鐘下工作,完成一次1 024點的FFT從輸入初始數據到運算結果完全輸出僅需要54.48 μs,且連續運算時,處理一組1 024點FFT的時間僅為10.24 μs,達到了高速信號處理的要求。

參 考 文 獻

[1]蔡可紅.基于FPGA的FFT設計與實現[D].南京:南京理工大學,2006.

[2]韓穎.高速專用FFT處理器的設計與實現[D].北京:北京理工大學,2003.

[3]陸旦前,陳建平,陳曉勇.FFT算法的一種FPGA設計[J].微電子技術,2007(6):178[CD*2]180.

[4]鮑慶龍,劉平.基于FPGA的高速FFT算法實現[J].微處理機,2007(2):16[CD*2]19.

[5]樊光輝,許茹,王德清.基于FPGA的高速流水線FFT算法實現[J].電子工程師,2008,34(3):38[CD*2]40.

[6]賀衛東,段哲民,龔誠.基于FPGA的大點數FFT算法研究[J].電子測量技術,2007,30(11):14[CD*2]16.

[7]謝彥林.可變點流水線結構FFT處理器的設計及其 FPGA 實現[D].西安:西安電子科技大學,2007.

[8]程佩青.數字信號處理教程[M].2版.北京:清華大學出版社,2004.

[9]劉小明.超高速快速傅里葉變換的實現[D].合肥:合肥工業大學,2006.

[10]蘇彥鵬.張漢富.韓磊.基于FPGA的4K點基[CD*2]16 FFT模塊的實現[J].電子與封裝,2007,7(9):8[CD*2]11.

猜你喜歡
結構
DNA結構的發現
《形而上學》△卷的結構和位置
哲學評論(2021年2期)2021-08-22 01:53:34
論結構
中華詩詞(2019年7期)2019-11-25 01:43:04
新型平衡塊結構的應用
模具制造(2019年3期)2019-06-06 02:10:54
循環結構謹防“死循環”
論《日出》的結構
縱向結構
縱向結構
我國社會結構的重建
人間(2015年21期)2015-03-11 15:23:21
創新治理結構促進中小企業持續成長
現代企業(2015年9期)2015-02-28 18:56:50
主站蜘蛛池模板: 又黄又湿又爽的视频| 色婷婷丁香| 91精品国产自产在线老师啪l| 亚洲国产成熟视频在线多多| 97超爽成人免费视频在线播放| 中日韩一区二区三区中文免费视频| 国产色偷丝袜婷婷无码麻豆制服| 亚洲精品无码抽插日韩| 亚洲无码高清一区二区| 超薄丝袜足j国产在线视频| 国产精品永久免费嫩草研究院| 日韩人妻精品一区| 精品视频第一页| 国产91九色在线播放| 影音先锋亚洲无码| 久久无码免费束人妻| 日本午夜影院| 狂欢视频在线观看不卡| 无码一区18禁| 极品av一区二区| 91人妻日韩人妻无码专区精品| 91在线激情在线观看| 日韩视频免费| 亚洲69视频| 国产精品理论片| 亚洲系列无码专区偷窥无码| 国产欧美日韩va| 国产精品美女免费视频大全 | 亚洲第一成网站| 欧美成人免费一区在线播放| 被公侵犯人妻少妇一区二区三区| 女人18毛片一级毛片在线| 亚洲无码视频图片| 少妇精品在线| 成人综合在线观看| 欧美区在线播放| 亚洲高清资源| 狠狠综合久久久久综| 18禁影院亚洲专区| 久久精品亚洲中文字幕乱码| 亚洲国产成人综合精品2020 | 亚洲天堂日韩av电影| 国产精品私拍在线爆乳| 欧美不卡视频一区发布| 国产精品丝袜在线| 欧美五月婷婷| 无码在线激情片| 婷婷伊人五月| 久久77777| 精品天海翼一区二区| 永久免费精品视频| 国产成人精品综合| 天天干伊人| 激情六月丁香婷婷| 婷婷激情五月网| 久久精品一卡日本电影| 免费一级毛片不卡在线播放| 亚洲婷婷六月| 亚洲an第二区国产精品| 亚洲精品不卡午夜精品| 国产一区二区网站| 国产成人精品免费av| 成年人福利视频| 在线日韩日本国产亚洲| 最新国产午夜精品视频成人| 青青草原国产一区二区| 无码有码中文字幕| 免费在线成人网| a级毛片毛片免费观看久潮| 国产成人在线无码免费视频| 男女性色大片免费网站| 欧美综合激情| 亚洲乱码精品久久久久..| 欧美成人看片一区二区三区| 青青草国产在线视频| 日韩精品亚洲一区中文字幕| 人人爱天天做夜夜爽| 超碰精品无码一区二区| 成人免费一级片| 亚洲成人黄色在线观看| 色综合国产| 亚洲第一成年人网站|