999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種支持卷積神經網絡稀疏計算的方法

2021-04-11 14:56:50中興通訊股份有限公司余金清賀小龍
電子世界 2021年6期
關鍵詞:分類

中興通訊股份有限公司 余金清 章 偉 賀小龍

本文提出一種對神經網絡權重進行編排方法,根據量化的權重值的稀疏特性,通過只編排權重非0值,從而減少權重帶寬;同時,提出一種硬件實現架構,結合編排好的權重,能夠有效減少卷積網絡的乘法運算,特別是在網絡權重稀疏情況下,可以進一步減少卷積計算,從而提升神經網絡處理能力。

1 背景分析

近些年來,人工智能技術在在全世界范圍內得到了迅猛的發展,與此同時神經網絡的規模不斷增長,典型的神經網絡動輒幾十層甚至上百層,計算量不斷的增加造成推理需要的時間也需來越長。

但實際應用中,在如此高的運算量中并不是所有的計算都是有效計算,特別是對于算法經過定點化或是稀疏化后,出現的權重為零的點,實際運行中,是不需要計算的。因此,神經網絡的硬件加速器利用權重的稀疏特性減少計算量,且在此基礎上進一步降低處理時間,提高效能,目前業界都在關注的重點技術問題。

2 設計思路

本設計采用兩種方法來提升神經網絡設計:

(1)權重編排:通過離線方式,對提前訓練好的權重( weights)進行特別編排,去掉值為0的權重,完成對非0權重的編排。

(2)計算加速:卷積網絡加速器,完成神經網絡稀疏計算(只計算非0權重)提升網絡處理能力。

2.1 權重編排

權重編排,通過編譯器對每個積核中點化后的權重值重新編排,編排后的權重變為指示符表+映射表的形式。如圖1所示,通過代運算將一個R*S*CH大小的卷積核切分成多個R*S*CH的卷積核(其中R為卷積核的列寬,S為卷積核的行寬,CH為子卷積核的通道數,假設層的卷積核通道數尾C,存在C<=CH),并對每個子卷積核中定點化后的權重值重新編排,編排后的權重變為指示符表+映射表的形式。

權重編排的實施方式,把相同規律的權重編排(即分類,對于8bit定點處理,如將1,2,4,8分為一類,3,6,12,24分為一類)在一起,先排正數權重,之后排負數權重。使用本文的方式,可以使原來需要R*S*C次乘加作,而編排后最多只需要R*S*C+256次加法操作和256次乘法操作同時,當卷積計算的累加和小于偏置時,可以提前停止卷積運算。

圖1 權重編排流程

根據激活函數 ReLU(Rectified Linear Unit)特性,設置提前停止功能,正數權重和負數權重分開組合,正數權重類型排在向量前面,負數排在后面。

將離線編排好的權重數據,提前存儲在存儲單元中。

(1)對于權重為0的數據,由于其運算結果也為0,則不需要存儲,包括對應索引信;后續運算直接跳過。

(2)對于特征數據,順序存儲在存儲單元中。

權重0由于完成卷積運算結果還是0,在權重編排時就被丟棄,不參與計算,節省了存儲資源與數據讀寫帶寬,并提高了計算效率。

2.2 計算加速

圖2為本文所述稀疏卷積神經網絡實現的方法架構,其處理流程包括:

CPU根據當前處理的網絡模型下發對應的指令給硬件加速器;同時,CPU會給DMA下發指令,讓DMA去對應的存儲單元中讀出相應的權重以及特性數據。硬件解析指令,分別送給對應的控制以及輸入輸出緩存單元。

根據配置信息,需要將當前處理進度的權數據以及特征數據提前存放在緩存單元中。先從緩存單元中獲取權重信息以及位置索引信息(權重位置信息),并根據權重對應的索引信息,去從數據緩存單元中素引對應的數據。

計算單元中的控制器,先將第一個指示符讀到控制器中,之后按照順序讀取權重編排后的映射表內容,以映射表內容為地址選擇條件,數據緩存中讀取數據。

圖2 稀疏的神經網絡處理架構

圖3 卷積計算結構

卷積計算,如圖3所示,指示符內的映射表項讀取時,在沒有達到結束條件,在計算單元的分類累加單元進行計算預處理和加減操作。在計算單元的分類累加單元進行計算預處理(即移位操作,移位量取決于指示符表中的配置)和加減操作(加減取決于指示符表中的配置)。

分類累加過程,當同個指示符內的映表項讀取完時即達到同一權重的結束條件時,查看分類結束標志,如果分類結束標志為未結束,則讀取下一個指示符表項,繼續完成累加操作。

分類切換控制,當分類結束標志為結束,則將累加后的結果,對應的權重值和分類累加計算單元編號送到分類乘加計算單元;同時,讀取下一個指示符表項,并將分類累加處理器中的累加值清零,重新累加減操作,直到指示符表項中的分類結束標志指示為整個卷積操作完成。

分類乘法,分類乘加計算單元完成輸入的權重和數據的乘法操作,并將乘的結果累加到部分和中。

根據該方案,配置分類乘法單元是否能提前停止運算,如果激活函數為ReLU,則使能提前停止功能,即判斷當前卷積的部分和的值與偏置值的差值是否小于0,如果小于零,則反饋給計算單元的控制器,該計算完成處理。

該方法可以達到提前終卷積運算的結果目的,從而減少運算量,減少運算功耗,進而提高能效比。

總結:采用本文所述方法,與現有技術相比,通過權重轉換和新計算單元相結合,提前離線對權重進行了零數據壓縮,使得卷積操作的時間只非零權重的個數有關,較好的利用了權重卷積核的稀疏特性,節省了推理運行時間。與此同時,新的計算單元結構擴展性更好,可以支持計算提前中功能,即可以利用數據的稀疏特性,進一步降低運算量。

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
學生天地(2019年32期)2019-08-25 08:55:22
分類討論求坐標
數據分析中的分類討論
按需分類
教你一招:數的分類
主站蜘蛛池模板: 欧美精品另类| 久久一级电影| 久久婷婷五月综合97色| 成·人免费午夜无码视频在线观看| 国产福利小视频高清在线观看| 色哟哟精品无码网站在线播放视频| 国产欧美视频在线观看| 精品欧美一区二区三区久久久| 欧美a网站| 国产美女精品一区二区| 婷婷亚洲天堂| 亚洲精品麻豆| 亚洲日本在线免费观看| 在线一级毛片| 国产福利在线观看精品| 国产精品成人AⅤ在线一二三四| 亚洲精品国产成人7777| 青草娱乐极品免费视频| 尤物精品视频一区二区三区| av大片在线无码免费| 天天躁夜夜躁狠狠躁躁88| 免费毛片a| 亚洲无码A视频在线| 亚洲区第一页| 无码精油按摩潮喷在线播放| 亚洲综合精品香蕉久久网| h视频在线播放| 国产91熟女高潮一区二区| 在线看片免费人成视久网下载| 日本高清视频在线www色| 免费高清a毛片| 国产免费人成视频网| 九色视频最新网址 | 欧美日韩国产成人高清视频 | 九九视频免费看| 久久先锋资源| 久久无码av三级| 久久亚洲精少妇毛片午夜无码| 婷婷六月综合| 91精品啪在线观看国产| 欧美高清国产| 国产99热| 无码久看视频| 91免费精品国偷自产在线在线| 毛片在线播放a| 国产午夜精品鲁丝片| 中国一级特黄视频| 不卡无码h在线观看| 亚洲第七页| 伊大人香蕉久久网欧美| 毛片a级毛片免费观看免下载| 精品国产Ⅴ无码大片在线观看81| 欧美成人怡春院在线激情| 色噜噜狠狠色综合网图区| 久一在线视频| 性网站在线观看| 97国内精品久久久久不卡| jizz国产视频| 国产日韩精品欧美一区喷| 一区二区三区四区精品视频| 国产丰满成熟女性性满足视频| 国产精品丝袜视频| 久久无码av三级| 国产精品妖精视频| 欧美午夜理伦三级在线观看| 亚洲av无码专区久久蜜芽| 青青草a国产免费观看| 国产高颜值露脸在线观看| 国产第八页| 亚洲乱伦视频| 大学生久久香蕉国产线观看| 国产午夜不卡| 视频在线观看一区二区| 亚洲资源站av无码网址| 国产高清在线观看| 午夜不卡福利| 国产在线观看一区精品| 天天躁夜夜躁狠狠躁躁88| 国产综合另类小说色区色噜噜| 欧美 亚洲 日韩 国产| 精品久久人人爽人人玩人人妻| 国产大片黄在线观看|