999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于FPGA的感知量化卷積神經(jīng)網(wǎng)絡(luò)加速系統(tǒng)設(shè)計(jì)

2021-06-30 01:43:52電子科技大學(xué)電子科學(xué)與工程學(xué)院賀雅娟
電子世界 2021年11期
關(guān)鍵詞:模型系統(tǒng)設(shè)計(jì)

電子科技大學(xué)電子科學(xué)與工程學(xué)院 周 航 賀雅娟

近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)(CNN)在機(jī)器視覺(jué)等方面取得了巨大成功。為提升嵌入式設(shè)備上運(yùn)行CNN的速度和能效,本文針對(duì)LeNet-5網(wǎng)絡(luò)模型,先對(duì)該網(wǎng)絡(luò)模型進(jìn)行感知量化訓(xùn)練,特征圖和權(quán)重量化為8位整型數(shù)據(jù)。然后設(shè)計(jì)一種卷積神經(jīng)網(wǎng)絡(luò)加速器系統(tǒng),該片上系統(tǒng)(SoC)采用Cortex-M3為處理器,所提出的系統(tǒng)處理一張MNIST圖像所需時(shí)間5.3ms,精度達(dá)到98.2%。

CNN已成功應(yīng)用于圖像識(shí)別等應(yīng)用,隨著CNN解決更復(fù)雜的問(wèn)題,計(jì)算和存儲(chǔ)的需求急劇增加。然而,在一些低功耗的邊緣計(jì)算設(shè)備中,功耗是重要指標(biāo)。目前的研究主要針對(duì)CNN推理階段模型的壓縮和量化。大多數(shù)設(shè)計(jì)都用定點(diǎn)計(jì)算單元代替浮點(diǎn)單元。ESE采用12位定點(diǎn)權(quán)重和16位定點(diǎn)神經(jīng)元設(shè)計(jì),Guo等在嵌入式FPGA上使用8位單元進(jìn)行設(shè)計(jì)。但之前的設(shè)計(jì)主要采用Zynq或者HLS開(kāi)發(fā),功耗較大。

本文設(shè)計(jì)了一種基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)加速系統(tǒng)。首先,通過(guò)感知量化訓(xùn)練的方法,實(shí)現(xiàn)了將浮點(diǎn)CNN模型的各層權(quán)重和特征圖量化成8比特整型;其次,通過(guò)采用單層時(shí)分復(fù)用的方式,設(shè)計(jì)流水線架構(gòu)提高數(shù)據(jù)吞吐率;再次,設(shè)計(jì)基于Cortex-M3的SoC;最后,采用MNIST手寫(xiě)數(shù)字進(jìn)行方案和功能驗(yàn)證。

1 卷積神經(jīng)網(wǎng)絡(luò)

1.1 基本概念

LeNet-5是一個(gè)典型的卷積神經(jīng)網(wǎng)絡(luò)模型,不包含輸入一共有7層。分別為3層卷積層,2層池化層,以及2層全連接層。

1.2 量化原理

針對(duì)目前CNN模型較大,參數(shù)多且不適合在移動(dòng)設(shè)備上使用,Google團(tuán)隊(duì)提出了一種量化方案。該方案在推理過(guò)程中使用純整。量化方案是量化整數(shù)q到實(shí)數(shù)r的映射,如公式(1)所示:

其中常數(shù)S和Z是量化參數(shù)。S表示比例系數(shù),是一個(gè)任意的正實(shí)數(shù)。Z表示零點(diǎn)。CNN中主要的操作,比如卷積層的卷積,以及全連接層的乘累加,都可以看成是矩陣乘法。考慮實(shí)數(shù)兩個(gè)N×N的矩陣r1和r2的乘積r3=r1r2。將每個(gè)矩陣ra的項(xiàng)表示為ra(r,j),其中1≤i,j≤N,用qa(r,j)表示量化項(xiàng),根據(jù)矩陣乘法的定義,得到:

乘以浮點(diǎn)數(shù)M,可以轉(zhuǎn)化成先乘以定點(diǎn)數(shù)M1,再進(jìn)行右移n+31。

將公式(2)中所有零點(diǎn)Z1,Z2,Z3都設(shè)為0,可以大大簡(jiǎn)化推理階段的運(yùn)算。另外將偏置加法和激活函數(shù)合并到其中。比例系數(shù)Sbias=S1S2,零點(diǎn)Zbias=0。由于選用的激活函數(shù)是ReLU,所以只需要將結(jié)果鉗位到[0,255]。

2 加速系統(tǒng)硬件設(shè)計(jì)

2.1 整體結(jié)構(gòu)

本系統(tǒng)采用CPU+FPGA的架構(gòu),包括AHB互聯(lián)矩陣、Cortex-M3處理器、DMA、緊耦合存儲(chǔ)器、雙端口緩存、AHB2APB橋和CNN加速器,如圖1所示。

圖1 系統(tǒng)框圖

存儲(chǔ)器部分包含ITCM,DTCM和雙端口RAM。ITCM存放程序鏡像文件;DTCM作為堆棧區(qū);Dual RAM作為權(quán)重?cái)?shù)據(jù),輸入特征圖,以及中間、最終結(jié)果緩存區(qū),一端連接L1級(jí)總線,CPU和DMA均可以訪問(wèn),另一端連接CNN加速器。

2.2 CNN加速器設(shè)計(jì)

CNN加速器設(shè)計(jì)的整體結(jié)構(gòu)如圖2所示,并行方案采用輸出通道和權(quán)重卷積核內(nèi)部并行,同時(shí)計(jì)算6個(gè)輸出通道,以及卷積核25個(gè)乘法器同時(shí)計(jì)算。

圖2 CNN加速器整體結(jié)構(gòu)

特征圖行緩沖的窗口尺寸為5x5,可以通過(guò)數(shù)據(jù)選擇器選擇輸入特征圖的寬度。權(quán)重特征圖的行緩沖設(shè)計(jì)同理,由于卷積核均為5x5,所以不需要數(shù)據(jù)選擇器。

乘累加陣列輸入為25個(gè)8位特征圖和25個(gè)8位權(quán)重,對(duì)應(yīng)相乘后采用加法樹(shù)方式累加,最后得到1個(gè)位寬為21的有符號(hào)數(shù)。

偏置加法器用于累加偏置或者中間結(jié)果。選擇哪一個(gè)是由數(shù)據(jù)選擇器控制,輸出一個(gè)32位結(jié)果。

量化激活模塊包含一個(gè)32x32位的乘法器,用于將累加結(jié)果和乘法系數(shù)相乘,再經(jīng)過(guò)右移,鉗位到[0,255],經(jīng)過(guò)四舍五入得到量化的結(jié)果。

池化模塊設(shè)計(jì)思路同卷積模塊,采用最大池化。包含3個(gè)比較器和一個(gè)行緩沖,針對(duì)不同層可以選擇不同長(zhǎng)度的特征圖,窗口尺寸為2x2。

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)環(huán)境

本文采用的FPGA是Xilinx公司的Artix-7XC7A200T芯片,開(kāi)發(fā)環(huán)境為Vivado 2018.3。卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理采用Pytorch 1.7.1。實(shí)驗(yàn)的數(shù)據(jù)集是MNIST數(shù),CNN模型采用LeNet-5。

3.2 實(shí)驗(yàn)結(jié)果

本文的SoC工作的頻率為100MHz,識(shí)別一張MNIST圖片的時(shí)間為5.3ms,F(xiàn)PGA的功耗由Vivado的Report Power工具獲得,僅為0.448W。本文處理單幀的時(shí)間比較長(zhǎng),但是功耗是其他文獻(xiàn)的四分之一。由于采用感知量化,識(shí)別正確率FPGA實(shí)現(xiàn)和軟件實(shí)現(xiàn)一致,達(dá)到98.2%。實(shí)驗(yàn)結(jié)果對(duì)比如表1所示。

表1 實(shí)驗(yàn)結(jié)果對(duì)比

結(jié)論:為了解決嵌入式設(shè)備上實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)速度慢和功耗大的問(wèn)題,本文提出了一種卷積神經(jīng)網(wǎng)絡(luò)加速系統(tǒng)。首先對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行感知量化,得到8比特的權(quán)重、特征值和量化參數(shù)。采用Cortex-M3作為處理器設(shè)計(jì)片上系統(tǒng),大大降低了功耗。本設(shè)計(jì)在Artix-7 Xc7a200T上實(shí)現(xiàn)了LeNet-5。通過(guò)MNIST數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果表明本設(shè)計(jì)保持了準(zhǔn)確性,降低了功耗。

猜你喜歡
模型系統(tǒng)設(shè)計(jì)
一半模型
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無(wú)人機(jī)系統(tǒng)
ZC系列無(wú)人機(jī)遙感系統(tǒng)
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
瞞天過(guò)海——仿生設(shè)計(jì)萌到家
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
設(shè)計(jì)秀
海峽姐妹(2017年7期)2017-07-31 19:08:17
有種設(shè)計(jì)叫而專
Coco薇(2017年5期)2017-06-05 08:53:16
主站蜘蛛池模板: 最新午夜男女福利片视频| 六月婷婷综合| 国产激情在线视频| 日本高清有码人妻| 免费看美女毛片| 亚洲品质国产精品无码| 在线观看免费AV网| 夜色爽爽影院18禁妓女影院| 亚洲av无码片一区二区三区| av尤物免费在线观看| 国产传媒一区二区三区四区五区| 国产高清无码麻豆精品| 国产91熟女高潮一区二区| 看你懂的巨臀中文字幕一区二区| 伊人色天堂| 国产精品成人啪精品视频| 日韩福利视频导航| 国产视频久久久久| 国产亚洲精久久久久久久91| 亚洲精品亚洲人成在线| 一级成人欧美一区在线观看| 日韩专区欧美| 制服丝袜在线视频香蕉| 日韩久久精品无码aV| 91无码国产视频| 亚洲中文在线看视频一区| 免费A∨中文乱码专区| 一区二区三区在线不卡免费| 小说区 亚洲 自拍 另类| 香蕉综合在线视频91| 亚洲日韩每日更新| 久久91精品牛牛| 亚洲国产成人综合精品2020| 乱人伦视频中文字幕在线| 精品国产成人高清在线| 国产一级视频在线观看网站| 免费xxxxx在线观看网站| 99热国产这里只有精品无卡顿"| 国产一区成人| 九色在线观看视频| 免费A级毛片无码无遮挡| 亚洲欧洲美色一区二区三区| 欧美中文字幕在线播放| 国产日韩AV高潮在线| 中文字幕在线看| 三级欧美在线| 日韩精品无码免费专网站| 狂欢视频在线观看不卡| 澳门av无码| 亚洲免费三区| 精品国产一区91在线| 99久久精彩视频| 九九九精品成人免费视频7| 青青草综合网| 伊在人亚洲香蕉精品播放| 青青热久免费精品视频6| 国产精品妖精视频| 亚洲综合久久成人AV| 88国产经典欧美一区二区三区| 久久免费观看视频| 第一页亚洲| 久久黄色一级视频| 亚洲,国产,日韩,综合一区| 91久久国产热精品免费| 中文字幕亚洲综久久2021| 亚洲日本在线免费观看| 欧美另类第一页| 免费国产无遮挡又黄又爽| 国产精品亚洲精品爽爽| 欧美性猛交xxxx乱大交极品| 高潮毛片免费观看| 精品国产美女福到在线直播| 亚洲a级毛片| 亚洲色欲色欲www网| 日韩毛片免费| 中文字幕无码电影| 亚洲欧美综合精品久久成人网| 亚洲国产精品一区二区第一页免| 婷婷色婷婷| 最新亚洲人成网站在线观看| 欧美一级高清免费a| 在线无码av一区二区三区|