999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

FPGA在人工智能深度學習中的應用

2022-10-26 08:52:52武漢工程大學郵電與信息工程學院周瑩
數字技術與應用 2022年10期
關鍵詞:模型

武漢工程大學郵電與信息工程學院 周瑩

近年來,FPGA應用的呼聲之高,發展之快令人振奮,從AI到VR,從語音識別,人臉識別到各種各樣的加速器。在人工智能興起和發展的時代,深度學習起到了中流砥柱的作用,然而深度學習仍然面臨著超大計算量的問題,GPU、ASIC、FPGA都是解決龐大計算量的有效方案。本文將以Lenet卷積神經網絡模型為例,基于CNN網絡模型和硬件架構實現,對CNN網絡的后向訓練過程進行Matlab定點仿真和FPGA實現以及Modelsim仿真驗證,最終綜合對比FPGA、GPU、CPU的性能。

人工智能是研究用于模擬和擴展人類行為的一門新型技術學科。對于人工智能,特別是基于深度學習的應用來說,很多應用場所都對實時性有著很高的要求[1]。面對這個新時代提出的新要求,FPGA利用其特點,發揮著它重要的作用[2]。下文以CNN網絡的后向訓練過程為例說明FPGA的性能優勢。

DNN(深層神經網絡)包含兩類核心算法:CNN(卷積神經網絡)和LSTM(長短期記憶網絡),都能在很大程度上受益于低精度的乘加運算[3]。CNN算法目前是最重要的深度學習方法之一,這種算法在圖像識別以及語音識別應用中取得了突破性的成就,下面就以CNN算法的后向訓練過程模型架構及結果仿真為例,說明FPGA在深度學習算法加速上的優勢。

1 CNN的網絡模型

下面以一種具體的Lenet卷積神經網絡模型為例,給該CNN一個輸入,輸入名為MINST的一個數據集,也就是一張灰度圖像,其像素是(1,28,28),如圖1所示。

其conv1作為第一個卷積層,卷積核的大小是(4,1,5,5),其中的4代表有4個(1,5,5)的卷積;利用非全零的方法進行填充,步長取1,Relu作為其激活函數,再依據(式1)和(式2)可得,輸出(4,24,24);第1個池化層是Pooling1,經過這個池化層之后,再采用最大池化策略的方式,利用非全零的方法進行填充,步長取2,這時的輸出是(4,12,12);conv2作為第二個卷積層,它的conv2卷積核大小是(4,4,5,5,),其中的4是指有4個(4,5,5)卷積,利用非全零填充的方法進行填充,步長取1,Relu作為其激活函數,根據(式1)和(式2)可得,經過卷積后的輸出是(4,8,8);接著進入到第二個池化層pooling2,采用Max Pooling的方式且池化值為(2,2),最終的輸出為(4,4,4);經過2層全連接層FC1和FC2,FC1的大小是(12,64),激活函數是Relu,FC2的大小是(10,12),激活函數是Softmax。

通過該模型的訓練之后,可以得到如圖2所示的系統損失函數的變化曲線,隨著迭代次數的疊加,損失函數將會逐漸變小,在開始的四千次迭代中損失函數的變化是迅速變小,而之后的四千到八千次時,曲線已經變得非常緩慢,直到最后趨于平穩。

可以通過曲線圖發現:隨著迭代次數的增加,損失函數逐漸減小,最終會趨向一個穩定值;而準確率的曲線圖是會不斷增大,最終也趨向于一個穩定值,準確率曲線圖此處略[4]。總之,這種模型的損失函數變化曲線和準確率變化曲線都符合要求,性能良好。下文以該模型為例,介紹硬件加速的實現。

2 CNN的硬件結構

對于CNN的后向訓練過程,包含全連接層、池化層傳遞過程以及卷積層誤差;同時也包括了權值的更新。CNN硬件框架是以后向訓練過程的誤差傳遞過程為主,前向預測過程的輸出結果長度為10,作為結構的輸入,通過和Label(正確標簽)相減取得差值之后,便得到了全連接層FullConnected2的誤差項,再經過全連接層隱層的誤差傳遞,會得到全連接層FullConnected1的誤差項,最終得到有效長度是8的4路卷積層,最后經過池化層的誤差項傳遞和卷積層誤差項傳遞,就會得到有效長度為24的4路卷積層[5]。參數更新模塊被進入的誤差項進行更新之后,權值和偏置項也會被更新。下面介紹利用FPGA實現全連接層后向過程的仿真驗證。

3 FPGA實現全連接層后向過程仿真驗證

3.1 Matlab定點仿真

(1)根據卷積神經網絡訓練的算法理論,對上述Lenet卷積神經網絡的后向訓練過程進行Matlab的定點仿真。在Matlab中進行仿真,首先將數據集中的“mnist.train.images.txt”文件輸入,把“mnist.train.labels.txt”當做正確標志。均值設為0.1,初始化權值使用0,初始化方式采用標準差。

(2)向訓練過程的定點方式采用1位符號位、5位整數位、12位小數位,即FI(1,18,12),采用這種方式后的輸出數據是卷積層為1的偏置b_conv1和權值w_conv1,卷積層為2的偏置b_conv2和權值w_conv2,全連接層為1的偏置b_full_connected1和權值w_full_connected1,全連接層為2的偏置b_full_connected2和權值w_full_connected2[6]。如圖3所示,訓練的迭代次數是橫坐標,數據的最大相對誤差值是縱坐標,經過分析訓練過程中的相對誤差絕對值,可以得到相對誤差的最大值是10∧-2,顯然這個誤差結果是在期望值中的。

3.2 FPGA實現和結果驗證

Lenet卷積神經網絡中全連接層隱層的誤差傳遞過程的Modelsim仿真結果如圖4所示,模塊是以10個連續誤差數據作為輸入,輸出是12路并行誤差數據,該數據是由有效控制模塊和12個乘累加器得到的,利用Matlab仿真的結果與這個結果一樣,意味著模塊正確。

其中,全連接層隱層誤差傳遞模塊的端口信號定義如表1所示。

表1 模塊的端口信號說明-誤差傳遞Tab.1 Module's port signal description - error propagation

Lenet卷積神經網絡中全連接層隱層的權值更新過程由第三方仿真工具Modelsim得出的時序結果如圖5所示,該模塊的輸入是單個的誤差數據,輸出是64位的1路數據,即64個權值。一個誤差更新64個權值,因此12個誤差更新了所有的768個權值[7]。Matlab仿真結果和FPGA經過第三方仿真工具Modelsim的結果一樣,意味著模塊功能正確。

其中,全連接層隱層權值更新過程的端口信號定義如表2所示。

表2 端口信號說明-權值更新Tab.2 Port signal description - weight update

實現卷積神經網絡后向訓練過程之后,經過Modelsim仿真的波形圖如圖6所示。由時序圖可得,在FPGA中只要實現了一次后向訓練,就需要821個時鐘信號,由于最大CLK頻率設定為200MHz,即5NS[8]。

通過分析后向訓練在FPGA、GPU、CPU的性能,如表3所示。FPGA實現的后向訓練過程對比CPU來說,處理速度提高了1.8倍,由于該結果受到訓練過程中一系列外在因素的影響,例如權重相對正向過程需要轉置,就會浪費一定的處理時間[9]。雖然FPGA相對于GPU,處理速度稍有差距。但是FPGA功耗比GPU和CPU要小很多。

表3 后向訓練過程FPGA、GPU、CPU性能對比Tab.3 Backward training process FPGA, GPU, CPU performance comparison

4 結語

目前深度學習的流行,其實仍然是得益于大數據和計算性能的提升。但是卻也遭受著計算能力和數據量限制的瓶頸。針對數據量的需求,還能夠利用調整或者變更模型來緩解,但面對計算力的挑戰,卻沒有捷徑。FPGA解決了傳統PLD資源有限的劣勢,又克服了全定制的電路較死板的缺點[10]。隨著FPGA器件和云端部署等技術的發展,內存帶寬已經逐漸不再是DNN的算力瓶頸,取而代之的是單周期可以完成的乘加操作數量,這些都使得FPGA在未來的AI領域中,能夠發揮它最大的優勢,推動科技的進步。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 无码免费视频| 亚洲国产日韩一区| 国产精品白浆在线播放| 免费在线观看av| 精品无码日韩国产不卡av| 久久国产精品麻豆系列| 蜜芽国产尤物av尤物在线看| 无码久看视频| 亚洲女同一区二区| 国产性爱网站| 亚洲婷婷丁香| 日韩欧美国产另类| 免费一级毛片完整版在线看| 国产小视频在线高清播放| 亚洲毛片在线看| 亚洲AV无码不卡无码 | 亚洲床戏一区| 九色在线观看视频| 日本成人不卡视频| 国产欧美日韩精品第二区| 狼友视频国产精品首页| 国产91av在线| 欧美黑人欧美精品刺激| 色综合热无码热国产| 丁香六月综合网| 久久久久免费精品国产| av在线无码浏览| 国产国语一级毛片| 成年人免费国产视频| 亚洲日本中文字幕天堂网| 国产91在线|日本| 亚洲欧洲一区二区三区| 国产精品999在线| 国产电话自拍伊人| 天天躁夜夜躁狠狠躁图片| 91视频免费观看网站| 国产乱人免费视频| 国产一区二区精品福利| 国产精品嫩草影院视频| 91精品啪在线观看国产| 国产福利在线免费观看| 日本黄色不卡视频| 99视频在线精品免费观看6| 国产拍揄自揄精品视频网站| 亚洲综合婷婷激情| 真实国产乱子伦视频| 无码精品国产VA在线观看DVD| 国产农村妇女精品一二区| 激情乱人伦| 日本黄色a视频| 九色91在线视频| 亚洲美女视频一区| 欧美色视频网站| 久久免费看片| 永久免费av网站可以直接看的| 四虎亚洲国产成人久久精品| 亚洲综合在线最大成人| 亚洲午夜久久久精品电影院| 欧美一级大片在线观看| 青草视频免费在线观看| 第一区免费在线观看| 日本日韩欧美| 嫩草国产在线| 2020极品精品国产| 91成人在线观看视频| www.youjizz.com久久| …亚洲 欧洲 另类 春色| 高清无码不卡视频| 欧美.成人.综合在线| 国内精品91| 国产av一码二码三码无码| 久久天天躁狠狠躁夜夜躁| 制服丝袜无码每日更新| 中文字幕自拍偷拍| 日韩无码精品人妻| 色妞永久免费视频| 欧美日在线观看| 午夜性刺激在线观看免费| 日韩av在线直播| 在线免费看黄的网站| 午夜无码一区二区三区在线app| 免费国产高清精品一区在线|