999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

32 位RISC-V 處理器中乘法器的優化設計

2022-04-13 11:44:42唐俊龍湯孟媛吳圳羲盧英龍鄒望輝
電子設計工程 2022年6期
關鍵詞:指令

唐俊龍,湯孟媛,吳圳羲,盧英龍,鄒望輝

(1.長沙理工大學物理與電子科學學院,湖南長沙 410114;2.柔性電子材料基因工程湖南省重點實驗室,湖南 長沙 410114)

乘法器作為處理器的重要組成部分,一般由部分積產生、部分積壓縮和最終結果相加3 部分組成,乘法器的性能制約著處理器算術運算的整體性能[1]?!胺澍BE203”是國內研發團隊開發的面向嵌入式或物聯網領域的低功耗開源RISC-V 處理器,它的乘法器采用基4 Booth 編碼產生部分積,每個周期使用迭代加法器的方法壓縮部分積,經過多個周期的迭代得到最終的乘積。部分積壓縮使用迭代加法器的方法消耗的硬件資源少,但完成一次乘法操作的迭代周期數多,使得乘法器運算速度慢,處理器無法滿足在物聯網應用領域中高速運算的需求[2]。因此,需要設計高速的乘法器來提高低功耗“蜂鳥E203”處理器的運算性能,而高速乘法器設計的關鍵是加快部分積壓縮的速度,目前主要通過優化部分積壓縮中4-2、5-2、6-3和7-3等壓縮器或者設計合適的Wallace 樹壓縮結構達到提升乘法器運算速度的目的,而6-3 與7-3 等高階壓縮器消耗的硬件資源多、功耗高且面積大,在對硬件資源和功耗有要求的嵌入式或物聯網領域中,Wallace 樹壓縮結構通常采用4-2和5-2 壓縮器[3]-7]。為了提高“蜂鳥E203”處理器中乘法器的運算能力,該文提出一種新型的5-2 壓縮器,根據基4 Booth 編碼算法生成部分積的個數將4-2 壓縮器與新型5-2 壓縮器合理排列,組成新型的Wallace 樹壓縮結構代替原乘法器中的加法器。采用Synopsys的Design Compile 工具在SMIC180 nm 工藝下對改進的乘法器綜合,結果表明,乘法器的運算能力得到了顯著提升。

1 RISC-V處理器中乘法器的優化

該文主要針對RISC-V 處理器中乘法器部分積壓縮延時高,執行整數乘法指令周期過長的問題,結合RISC-V 架構的整數乘法指令集的特點,對乘法器進行優化設計。

1.1 RISC-V架構的乘法指令分析

“蜂鳥E203”處理器支持RISC-V 架構的整數乘法指令,共有MUL、MULH、MULHU、MULHSU 4 條乘法指令[8-10],乘法指令分析如表1 所示,其中rd 表示目的寄存器,rs1和rs2 表示源寄存器。4 條乘法指令分別按符號擴展操作和結果高低位選取操作生成相應的控制信號,MULHU 指令乘法的兩個操作數(被乘數和乘數)的符號擴展位都為0;MULHSU 指令被乘數的符號擴展位為被乘數的最高位,乘數的符號擴展位為0,MUL和MULH 指令的兩個操作數的符號擴展位分別為被乘數和乘數的最高位。MUL 指令選取Wallace 樹形結構壓縮結果的低32 位,其余乘法指令選取Wallace 樹形結構壓縮結果的高32 位。控制信號控制部分積產生和部分積壓縮對操作數和部分積的處理,從而完成乘法器的乘法運算。

表1 RISC-V乘法指令分析

1.2 改進型乘法器的結構設計

“蜂鳥E203”處理器中的乘法器如圖1 所示。該文提出一種改進的乘法器結構如圖2 所示,該乘法器支持32 位有/無符號數的乘法運算,主要包括部分積產生(基4 Booth 編碼)、部分積壓縮(Wallace 樹形結構)和選擇器MUX 3 個部分,部分積壓縮采用新型的Wallace 樹形結構代替圖1 中加法器對部分積進行壓縮,增加選擇器并通過控制信號選取4 種乘法指令需要的Wallace 樹形結構的壓縮結果。圖2 中,譯碼模塊對乘法指令進行譯碼,基4 Booth 編碼接收控制信號對被乘數和乘數進行符號擴展并產生18個規整的部分積,經Wallace 樹形結構壓縮,得到求和Sum與進位Carry兩個部分積,選擇器MUX 通過控制信號選取Carry和Sum兩個部分積的高32 位或低32 位,傳輸到“蜂鳥E203”處理器中的ALU 運算模塊進行運算,得到最終結果。

圖1 “蜂鳥E203”處理器中的乘法器整體框圖

圖2 改進型乘法器整體框圖

2 新型的Wallace樹形結構設計

圖2 改進型乘法器結構中新型的Wallace 樹形壓縮結構的核心是壓縮器,在乘法器運算中,壓縮器對部分積快速壓縮時產生大量延時,降低處理器的運算性能[11-12]。對壓縮器的優化和對壓縮器的合理排列能有效提高Wallace 樹形壓縮結構的壓縮速度。

2.1 新型壓縮器的設計

2.1.1 傳統5-2壓縮器

圖3 與圖4 分別是5-2 壓縮器的示意圖和傳統5-2 壓縮器的結構圖[13],其中,X1~X5表示部分積輸入,Cin1和Cin2表示上一級部分積壓縮的進位輸入(即低位的進位),Cout1和Cout2表示本級部分積壓縮產生的橫向進位輸出,求和Sum與進位Carry表示部分積壓縮的縱向輸出,圖3 中輸入輸出的關系式如式(1)所示[5],圖4的邏輯表達式如式(2)~(5)所示。

圖3 5-2壓縮器示意圖

圖4 傳統5-2壓縮器結構圖

2.1.2 新型5-2壓縮器

圖4 傳統5-2 壓縮器結構中,橫向輸出Cout2在邏輯上與低位進位Cin1相關,Cout2需等待Cin1的輸入,這種邏輯依附關系會產生額外的延時;縱向輸出Carry由X1和X2異或門開始經過4 級XOR 與1 級MUX 運算產生結果,Sum由X1和X2異或門開始經過5 級異或門XOR 運算產生結果。Sum處于壓縮器最長路徑的末端,以一個XOR 延時為單位,傳統5-2 壓縮器的關鍵路徑延時為5 個XOR 延時,延時較大影響乘法器的性能[13]。該文基于式(1),對式(2)~(5)進行優化,提出一種新型的5-2 壓縮器,邏輯表達式為式(6)~(9),對應的結構如圖5 所示,相比于圖4 傳統5-2 壓縮器結構,橫向輸出Cout2與X1、X2、X4和X5信號有關,而與Cin1無關,沒有額外延時;縱向輸出Sum和Carry的產生路徑上減少了1 級XOR,新型的5-2 壓縮器關鍵路徑延時減少到4 個XOR 延時,有效降低了縱向輸出的延時?;赟IMC 180 nm的工藝庫,通過H-spice 工具,該文對圖5 新型5-2 壓縮器進行電路仿真,溫度為27 ℃,電源電壓為1.8 V,X1~X5、Cin1和Cin2均為200 MHz的脈沖信號,關鍵路徑延時和功耗仿真結果分別為0.12 ns和0.12 mW。

圖5 新型的5-2壓縮器結構

2.2 新型的樹形壓縮結構

圖2 中,Wallace 樹形結構主要功能是壓縮部分積,由基4 Booth 編碼產生的18 個部分積僅用新型5-2 壓縮器不能將其完全壓縮,而僅用4-2 壓縮器能夠完全壓縮[14-15],但需要4 級4-2 壓縮器,增加了關鍵路徑的延時,且組成的Wallace 樹形結構不對稱,不利于后端版圖的設計。該文對改進型5-2 壓縮器與4-2 壓縮器進行合理排列,提出了一種改進的Wallace 樹形壓縮結構,如圖6 所示,通過1 級5-2 壓縮器和2 級4-2 壓縮器將18 個部分積完全壓縮,該壓縮結構對稱,關鍵路徑延時少。

圖6 新型的Wallace樹形壓縮結構

3 仿真結果

3.1 乘法器功能驗證與分析

該文采用Verilog HDL 語言對優化設計的乘法器進行描述,并嵌入到“蜂鳥E203”處理器中,使用Modelsim 工具對MUL、MULH、MULHU和MULHSU[16]4 種乘法指令進行功能仿真,通過與Modelsim 工具自帶乘法符號的運算結果的對比驗證乘法器功能的正確性。圖7 是執行4 種乘法指令的仿真結果和自帶乘法符號運算結果的對比圖,信號result_op1與result_op2 分別為乘法指令執行結果的低32 位和高32 位,信號final_result 是乘法指令的完整運算結果,信號result 是Modelsim 自帶乘法符號的運算結果,將信號final_result和result的數據對比,兩個結果完全一致。因數據量較多,圖7 截選了仿真結果的一部分。

圖7 乘法運算結果對比圖

3.2 乘法器性能仿真與分析

該設計基于SIMC 180 nm的工藝庫,使用Synopsys公司的Design Compile 工具對改進型乘法器進行綜合,電路面積為0.012 mm2,總單元數目為6 844,延時和周期數與“蜂鳥E203”處理器的原乘法器[17-18]對比如表2。該文設計的乘法器速度性能提升了88.2%,電路最大延時降低了39%。

表2 乘法器性能對比

4 結束語

該文根據RISC-V 指令集中整數乘法指令的特點,優化“蜂鳥E203”處理器中的乘法器,提出了一種新型的5-2 壓縮器,并應用新型的5-2 壓縮器構建了Wallace 樹形結構,設計了改進型乘法器。利用Modelsim 工具驗證了乘法器功能仿真的正確性,并采用SIMC 180 nm 工藝,使用Synopsys 公司的Design Compile 工具對乘法器進行綜合,結果表明,該文設計的乘法器單次乘法指令執行周期數為2,關鍵路徑延時為2.43 ns,相比于“蜂鳥E203”處理器原乘法器在速度上提升了88.2%,電路最大延時降低了39%,大大提高了乘法器的運算速度,適用于嵌入式或物聯網領域中對高速運算有需求的應用。

猜你喜歡
指令
聽我指令:大催眠術
ARINC661顯控指令快速驗證方法
測控技術(2018年5期)2018-12-09 09:04:26
LED照明產品歐盟ErP指令要求解讀
電子測試(2018年18期)2018-11-14 02:30:34
殺毒軟件中指令虛擬機的脆弱性分析
電信科學(2016年10期)2016-11-23 05:11:56
巧用G10指令實現橢圓輪廓零件倒圓角
時代農機(2015年3期)2015-11-14 01:14:29
中斷與跳轉操作對指令串的影響
科技傳播(2015年20期)2015-03-25 08:20:30
基于匯編指令分布的惡意代碼檢測算法研究
一種基于滑窗的余度指令判別算法
歐盟修訂電氣及電子設備等產品安全規定
家電科技(2014年5期)2014-04-16 03:11:28
MAC指令推動制冷劑行業發展
汽車零部件(2014年2期)2014-03-11 17:46:27
主站蜘蛛池模板: 亚洲最大福利视频网| 亚洲综合第一区| 亚洲欧美天堂网| 成人另类稀缺在线观看| 最新日韩AV网址在线观看| AV在线天堂进入| 无码在线激情片| 永久免费无码成人网站| 亚洲天堂网视频| 国产大全韩国亚洲一区二区三区| 久久99久久无码毛片一区二区| 欧美亚洲综合免费精品高清在线观看 | 26uuu国产精品视频| 国产免费久久精品99re不卡| 毛片网站观看| 欧美人与牲动交a欧美精品| 一级做a爰片久久免费| 四虎成人在线视频| 亚洲人成高清| 国产麻豆va精品视频| 国产精品亚洲一区二区在线观看| 在线a网站| 欧美一区二区福利视频| 亚洲成人77777| 国产亚洲第一页| 99re在线观看视频| 国产成人凹凸视频在线| 国产91av在线| 亚洲AⅤ无码日韩AV无码网站| 精品久久久久久中文字幕女| 妇女自拍偷自拍亚洲精品| 性做久久久久久久免费看| 粗大猛烈进出高潮视频无码| 国产欧美一区二区三区视频在线观看| 国产成人亚洲无码淙合青草| 中文字幕精品一区二区三区视频| 欧美日韩亚洲综合在线观看| 精品一区二区三区水蜜桃| 欧美视频二区| 亚洲Aⅴ无码专区在线观看q| 免费一级无码在线网站| 久久五月视频| 26uuu国产精品视频| 亚洲大尺度在线| 国产屁屁影院| 欧美a√在线| 国产91小视频在线观看| 国产视频a| 91www在线观看| 国产成人精品第一区二区| 真实国产乱子伦视频| 99精品高清在线播放 | 国产哺乳奶水91在线播放| 青青青国产视频手机| 国产小视频a在线观看| 国产一区二区三区精品欧美日韩| 国产亚洲欧美在线中文bt天堂| 国产在线精彩视频二区| 国产福利一区在线| 国禁国产you女视频网站| 免费a级毛片视频| 精品自窥自偷在线看| 国产又大又粗又猛又爽的视频| lhav亚洲精品| 久久中文字幕2021精品| 日韩欧美国产成人| 午夜日b视频| 中文字幕人妻av一区二区| 26uuu国产精品视频| 国产精品白浆无码流出在线看| 午夜精品国产自在| 女人一级毛片| 波多野结衣爽到高潮漏水大喷| 国产精品99久久久久久董美香| 第一页亚洲| 无码免费视频| 五月天福利视频| 亚洲第一中文字幕| 一本久道热中字伊人| 欧美不卡视频在线观看| 亚洲精品大秀视频| 国产成人综合亚洲欧洲色就色|