999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于FPGA的24×24位低功耗乘法器的設計

2010-04-12 00:00:00邢金朋,李哲英
現代電子技術 2010年22期

摘 要:通過對現有編碼算法的改進,提出一種新的編碼算法,它降低功耗的方法是通過減少部分積的數量來實現的。因為乘法器的運算主要是部分積的相加,因此,減少部分積的數量可以降低乘法器中加法器的數量,從而實現功耗的減低。在部分積的累加過程中,又對用到的傳統全加器和半加器進行了必要的改進,避免了CMOS輸入信號不必要的翻轉,從而降低了乘法器的動態功耗。通過在Altera公司的FPGA芯片EP2C70F896C中進行功耗測試,給出了測試結果,并與現有的兩種編碼算法進行了比較,功耗分別降低3.5%和8.4%。 關鍵詞:乘法器; 動態功耗; FPGA; ASIC

中圖分類號:TN492-34文獻標識碼:A

文章編號:1004-373X(2010)22-0015-04

Design of 24×24 bit Low-power Multiplier Based on FPGA

XING Jin-peng1, LI Zhe-ying2

(1. School of Electronic and Information Engineering, Beijing Jiaotong University, Beijing 100044, China;

2. Institute of Microelectronic Application Technology, Beijing Union University, Beijing 100101, China)

Abstract:A new coding algorithm is introduced through improving the existed coding algorithms. The algorithm can decrease the power dissipation of multiplier with the method of reducing the number of partial production. The main operation of multiplier is the sum of partial productions, so this method can decrease the number of adder in multiplier and decrease the power dissipation of multiplier. During the sum of partial productions, it improves the basic structure of the traditional full-adder and half-adder, and reduces the activity rate of the input signal of CMOS, so decreases the dynamic power dissipation. Through comparison with multipliers which are designed with existed coding algorithms, the power dissipation of the improved coding algorithm is decreased by 3.5% and 8.4%.Keywords: multiplier; low-power dissipation; FPGA; ASIC

收稿日期:2010-05-29

0 引 言

乘法器被廣泛應用于各種數字電路系統中,如DSP、數字圖像處理等系統。隨著便攜電子設備的普及,系統的集成度越來越高,這也對產品的功耗及芯片的散熱提出了更高的要求。本文提出了一種新的編碼算法,通過這種算法實現的乘法器可以進一步降低功耗,從而降低整個電子系統的功耗。

1 乘法器結構

本文介紹的24×24位乘法器的基本結構如圖1所示。其中,“降低乘數中‘1’的數量”實現對乘數y的編碼,以降低乘數y中“1”的數量,這可以在“部分積產生電路”中降低部分積的數量,“部分積產生電路”產生的部分積在“改進后的陣列加法器”和“超前進位加法器”中相加,最后得到乘積z。

圖1 乘法器結構圖

2 降低部分積數量的編碼算法

設x,y是被乘數和乘數,它們分別用24位二進制數表示,最高位是符號位,z是乘積,用47位二進制表示,最高位是符號位,“1”表示負數,“0”表示正數。則它們的關系可以用下式表示:

x=x23∑22i=0xi×2i(1)

y=y23∑22j=0yj×2j (2)

z=x×y=(x23⊕y23)∑22j=0(∑22i=0xi×2i)×yj×2j(3)

式中:xi,yj分別是x,y的權位。如果按式(3)進行乘法計算,需要將∑22i=0xi×2i與所有的yi相乘,產生23行部分積,然后再將其相加,即使yi=0,也要進行上述運算,這樣就勢必增加乘法器的功耗和延時,因此,在下面將會對全加器和半加器進行改進,使∑22i=0xi×2i僅與yi=1相乘,從而避免與yi=0相乘。首先介紹降低乘數y中“1”的數量的編碼算法。用一個事例說明本文介紹的算法的優越性。設m1,m2分別是乘數和被乘數,且令m1=01110111,如果用m2與m1中的每一位相乘,則會產生6個m2和2個“0”列,如果按照Sanjiv Kumar Mangal 和 R.M.Patrikar[1]所建議的方法,則:

01110111(m1)=10001000(n1)-

00010001(n2) (4)

將m2分別與n1和n2相乘,再將它們的乘積相減即得乘積結果。但是,在這一過程中,一共產生4個m2。如果按照本文所建議的方法,會進一步降低m2的數量,即:

01110111(m1)=10000000(n1)-00001001(n2) (5)

由式(5)可以看出,n1和n2中共有3個“1”,因此,可以進一步降低部分積的數量。當乘數的位數較大時,本文提出的算法優越性更大。具體編碼流程如圖2所示。

3 部分積的產生及相加

在數字電路中,功耗主要由3部分構成,即[2]:

Pavg=Pdynamic+Pshort+Pleakage (6)

式中:Pdynamic是動態功耗;Pshort是短路功耗;Pleakage是漏電流功耗。當CMOS的輸入信號發生翻轉時,會形成一條從電源到地的電流Id對負載電容進行充電,從而產生Pdynamic。一般情況下,Pdynamic占系統功耗的70%~90%。因此,有效地降低Pdynamic也就降低了電路功耗。

為了降低CMOS輸入信號的翻轉活動率,本文對部分積相加過程中用到的全加器和半加器[3]進行了必要的改進,從而避免當乘數y的某一位是“0”時輸入信號的翻轉,本文的全加器和半加器的結構如圖3所示。

圖2 降低y中“1”的數量的編碼算法流程圖

圖3 改進后的全加器和半加器電路圖

圖3中,xi+1,xi分別是被乘數的某一位,yj是乘數的某一位,ci,ci+1,co是加法器的進位輸出信號,si是加法器的和。

從圖1中可以看到,y經過編碼以后得到兩個數b和c,其中,b是24位二進制數,c是21位二進制數。由式(5)可得到下式:

z=x×b-x×c(7)

為了降低乘法器的延遲,將b和c分別分成三部分(即b[23:16], b[15:8], b[7:0], c[20:16], c[15:8]和c[7:0]),x分別與這6個數相乘可以得到6組部分積,每一組部分積分別采用圖4所示的陣列加法器相加,即得到6個部分積和(sb2,sb1,sb0,sc2,sc1,sc0)。圖4[4]中的HA,FA0,FA1分別對應圖3中的HA,FA0,FA1;ADD是FA0改進前的全加器。則sb2,sb1和sb0錯位相加可以得到x×b的積sb,sc2,sc1和sc0錯位相加可以得到x×c的積sc,所有這些錯位相加以及得到最后的乘積z都是通過超前進位加法器來實現的。

在由sb,sc得到z的兩個47位二進制數相加過程中,用到了3個如圖5所示[5-6]的16位二進制加法器,它包括4個4位超前進位加法器和1個超前進位單元(其中,Pi為進位傳播函數,Gi為進位產生函數)。錯位相加過程中用到的超前進位加法器與圖5中16位超前進位加法器結構類似,在此不再闡述。

圖4 23×8陣列加法器結構圖

圖5 16位超前進位加法器

4 仿真與功耗測試[7]結果

圖6所示是乘法器的功能仿真波形圖,可以看到,本文所介紹的乘法器的功能是正確的。

圖6 乘法器功能仿真結果

本文所介紹的乘法器是由VerilogHDL[8]編程實現的,因此,在Altera的FPGA芯片EP2C70F896C中進行功耗測試,功耗測試過程中環境變量設置如表1所示。

表1 功耗測試環境變量設置

期間電壓特性核電壓/VI/O電壓/V自動設定交叉點溫度/℃板級建模

正常1.21.526.0無

對功耗的測試時間是1 μs。在測試時間內,給乘法器加入不同的測試激勵,觀察功耗變化情況,為了說明本文提出的算法的優越性,同時也測試了由現有的兩種編碼算法所實現的乘法器,測試結果分別如表2~表4所示(其中,whole表示表格前部的測試激勵在測試時間內依次輸入)。

表2 采用圖2編碼設計的乘法器功耗

x×y總功耗/mW核動態功耗/mW核靜態功耗/mWI/O功耗/mW

0×0163.50.00154.848.66

8 388 607×8 388 607163.960.00154.859.11

4 489 630×4 489 630163.740.00154.858.89

2 489 635×2 489 635163.750.00154.858.90-2 489 635×2 489 635163.740.00154.858.89-4 489 630×4 489 630163.760.00154.858.91-8 388 607×8 388 607163.710.00154.858.86-1 897 593×1 897 593163.760.00154.858.91

whole220.3933.70155.0431.65

表3 文獻[1]中介紹的乘法器功耗

x×y總功耗/mW核動態功耗/mW核靜態功耗/mWI/O功耗/mW

0×0163.760.00154.858.91

8 388 607×8 388 607164.080.00154.859.23

4 489 630×4 489 630163.880.00154.859.03

2 489 635×2 489 635163.930.00154.859.08-2 489 635×2 489 635163.950.00154.859.10-4 489 630×4 489 630163.860.00154.859.01-8 388 607×8 388 607163.970.00154.859.12-1 897 593×1 897 593163.940.00154.859.09

whole228.3524.42155.0748.86

從圖6中可以看出,在測試時間內,當測試激勵保持不變時,FPGA芯片的核動態功耗0.00 mW,總功耗比較小,用三種編碼算法實現的乘法器功耗差別不大,說明在只進行一次乘法運算時,COMS的輸入信號基本沒有翻轉;當輸入激勵在測試時間內變化,即在whole狀態時,三個乘法器都有動態功耗,說明CMOS的輸入信號隨著電路輸入信號的變化而翻轉。本文介紹的乘法器的總功耗比文獻[1]介紹的算法降低了3.5%,比基于Booth-Wallace Tree[9-10]的乘法器的功耗降低了8.4%。

表4 采用Booth-Wallace-Tree 設計的乘法器功耗

x×y總功耗/mW核動態功耗/mW核靜態功耗/mWI/O功耗/mW

0×0163.750.00154.858.9

8 388 607×8 388 607164.080.00154.859.23

4 489 630×4 489 630163.880.00154.859.03

2 489 635×2 489 635163.940.00154.859.09-2 489 635×2 489 635163.910.00154.859.06-4 489 630×4 489 630163.910.00154.859.06-8 388 607×8 388 607163.950.00154.859.10-1 897 593×1 897 593163.950.00154.859.10

whole240.8544.20155.1141.54

5 結 語

本文介紹了一種新的編碼方法,它相對于文獻[1]中的編碼可以進一步降低乘數中“1”的數量,從而進一步降低了乘法器的功耗;另外,還對傳統的全加器和半加器進行了改進,從而降低CMOS輸入信號的翻轉率,從而降低了功耗。并且,通過在Altera公司的FPGA芯片EP2C70F896C中進行功耗測試,可以看出本文介紹的乘法器的功耗比文獻[1]中介紹的乘法器的功耗降低了3.5%,比基于Booth-Wallace Tree[9-10]的乘法器的功耗降低了8.4%。

參考文獻

[1]MANGAL Sanjiv K, BADGHARE R M, DESHMUKH Raghavedra B, et al. FPGA implementation of low power parallel multiplier[C]//IEEE 20th International Conference on VLSI Design. Nagpur: VNIT,2007: 115-120.

[2]CHONG K S, GWEE B , CHANG J S. Low energy 16-bit Booth leapfrog array multiplier using dynamic adders [J]. IET Circuits Devices Syst., 2007,1(2): 170-174.

[3]李哲英,駱麗,鈕文良.電子技術及其應用基礎(數字部分)[M].2版.北京:高等教育出版社,2009.

[4]ECONOMAKOS George, ANAGNOSTOPOULOS Kostas. Bit level architectural explorationi technique for the design of low power multipliers [C]//Proceedings 2006 IEEE International Symposium on Circuits and systems. Greece: Nalional Tech. Univ. of Athens, 2006: 1483-1486.

[5]PRABAKAR TN, AKSHMINARAYANAN G, ANILKUMAR K. FPGA based asynchronous pipelined multiplier with intelligent delay controller[C]//2008 International SoC Design Conference. Tiruchirappalli: Saranathan Cou. of Engineering, 2008,1: 304-309.

[6]Katz, R H.現代邏輯設計[M].北京:電子工業出版社,2005.

[7]王誠,吳繼華,范麗珍,等.Altera FPDA/CPLD 設計(基礎篇)[M].北京:人民郵電出版社,2005.

[8]夏宇聞.Verilog 數字系統設計教程[M].北京:北京航空航天大學出版社,2003.

[9]MAHANT-SHETTI Shivaling S, BALSARA P T, LEMONDS C. High performance low power array multiplier using temporal tiling [J]. IEEE Transactions on Very Large Scale Integration(VLSI)Sysytems, 1999, 7(1): 121-124.

[10]HUANG Zhi-jun, ERCEGOVACMilos D. High-performace low-power left-to-right arrary multiplier design [J]. IEEE Transaction on Computers, 2005,54(3):272-283.

主站蜘蛛池模板: 久久大香伊蕉在人线观看热2| 乱人伦视频中文字幕在线| 国产在线精品美女观看| 综合亚洲色图| 毛片最新网址| 噜噜噜久久| 精品国产电影久久九九| 国产日韩欧美精品区性色| 国产精品自拍露脸视频| 日韩在线网址| 色视频久久| 亚洲无码日韩一区| 青草视频久久| 国产乱子伦手机在线| 亚洲欧美成人在线视频| 国产二级毛片| 99偷拍视频精品一区二区| 日本尹人综合香蕉在线观看| 99视频在线观看免费| 2020久久国产综合精品swag| 青青草原国产| 日本一区高清| 天天躁狠狠躁| 欧美亚洲一区二区三区导航| 暴力调教一区二区三区| 欧美日韩国产系列在线观看| 欧美午夜在线观看| 欧美a在线视频| 91精品国产综合久久香蕉922 | 国产性精品| 国产又爽又黄无遮挡免费观看| 视频在线观看一区二区| 亚洲天堂在线免费| aⅴ免费在线观看| 午夜福利视频一区| 亚洲中文字幕无码mv| 久久综合伊人77777| 精品久久高清| 色婷婷电影网| 午夜a级毛片| 中文无码毛片又爽又刺激| 亚洲妓女综合网995久久| 自拍偷拍欧美日韩| 国产91av在线| 国产精品视频导航| 午夜精品久久久久久久无码软件| 99热这里只有精品2| 制服丝袜亚洲| 激情综合激情| 免费无码AV片在线观看中文| 亚洲 欧美 日韩综合一区| 中文字幕乱妇无码AV在线| 波多野结衣第一页| 亚洲欧洲AV一区二区三区| 中文字幕日韩久久综合影院| 欧美性久久久久| 2022精品国偷自产免费观看| 毛片免费在线视频| 呦视频在线一区二区三区| 欧美激情第一欧美在线| 国产一区二区色淫影院| 91小视频在线观看| 免费国产好深啊好涨好硬视频| 亚洲午夜综合网| 亚洲精品视频免费| 成人午夜视频在线| 亚洲午夜福利精品无码| 精品久久香蕉国产线看观看gif| 啊嗯不日本网站| 亚洲中文无码av永久伊人| a欧美在线| 国产va欧美va在线观看| 亚洲va欧美va国产综合下载| 久青草免费视频| 国产无套粉嫩白浆| 国产XXXX做受性欧美88| 国产精品爆乳99久久| 国产在线98福利播放视频免费| 精品亚洲麻豆1区2区3区 | 99热线精品大全在线观看| 国产伦片中文免费观看| 国产黄色视频综合|