999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GhostNet 殘差結(jié)構(gòu)的輕量化飲料識別網(wǎng)絡(luò)

2022-03-12 05:56:46曹遠(yuǎn)杰高瑜翔
計算機工程 2022年3期
關(guān)鍵詞:特征結(jié)構(gòu)

曹遠(yuǎn)杰,高瑜翔

(1.成都信息工程大學(xué) 通信工程學(xué)院,成都 610225;2.氣象信息與信號處理四川省高校重點實驗室,成都 610225)

0 概述

卷積神經(jīng)網(wǎng)絡(luò)自提出以來在計算機視覺領(lǐng)域被廣泛應(yīng)用。在生活中運用智能機器可以節(jié)省人力資源,例如自動售水機、無人超市等。但是當(dāng)售水機部署在學(xué)校等人流量較多的地方時,售水機暴露出效率低、耗時長等缺點。假設(shè)給機器安裝上飲料自動識別,飲料選擇和刷臉支付一體化會使售水機效率更高。因此,飲料等商品的識別對于無人售賣機、智能化超市等是非常必要的。

深度學(xué)習(xí)在目標(biāo)識別與檢測上有著較強的魯棒性,深層神經(jīng)網(wǎng)絡(luò)能夠在復(fù)雜環(huán)境下對目標(biāo)具有較好的識別性能。隨著對目標(biāo)檢測性能要求的提高,研究人員提出了許多深層神經(jīng)網(wǎng)絡(luò)。例如,2014 年ILSVRC 競賽提出的VGGNet[1]和 GoogleNet[2],2015 年提出 的ResNet 以及后來提出的DenseNet[3]等。但是隨著性能的提高卷積層數(shù)也隨之增加,從而出現(xiàn)權(quán)重參數(shù)較大和設(shè)備推理速度慢的問題。因此,上述方法在實際應(yīng)用中常因為參數(shù)量高和效率低而不能部署在資源有限的設(shè)備上。

為解決效率和存儲問題,研究人員采取剪枝[4]、量化[5]、知識蒸餾[6]以及設(shè)計輕量化網(wǎng)絡(luò)的方法來提高推理的速度。例如針對參數(shù)和推理速度推出的YOLOv3-Tiny[7]網(wǎng)絡(luò)是YOLOv3[8]網(wǎng)絡(luò)的一個簡化版;邵偉平等[9]提出采用MobileNet 作為YOLOv3 主干的網(wǎng)絡(luò),在基本沒有精度損失的情況下模型尺寸減小到26 MB,相對于YOLOv3 減少了90%;劉萬軍等[10]提出采用深度可分離卷積[11]構(gòu)建反殘差模塊來替換YOLOv3-Tiny 的主干網(wǎng)絡(luò),在精度無損失的情況下模型尺寸減小到18.2 MB,相對于YOLOv3-Tiny減少了47.7%。但是以上這些網(wǎng)絡(luò)相對于內(nèi)存較低的處理器還是過于龐大。

近年來研究人員設(shè)計一些高效的網(wǎng)絡(luò)模型,例如IANDOLA 等[12]提出SqueezeNet,主要是將3×3 的卷積替換為1×1 的卷積,通過減少3×3 卷積的通道數(shù)等來減小計算量和參數(shù)量;HOWARD 等[13-14]提出了MobileNets,采用大量的深度可分離卷積設(shè)計的神經(jīng)網(wǎng)絡(luò),該結(jié)構(gòu)可以很大程度地減少參數(shù)量和計算量。但是使用深度可分離卷積也存在缺陷,例如EfficientNet網(wǎng)絡(luò)[15]使用了大量低計算量(FLOPs)和高數(shù)據(jù)讀寫量的操作。由于GPU 訪存帶寬的限制,網(wǎng)絡(luò)浪費大量的時間在顯存中讀寫數(shù)據(jù)。當(dāng)顯存較低時,即使計算量較低推理速度也很慢。例如EfficientNet-B3 的計算量不到ResNet50[16]的1/2,推理速度卻比ResNet50 慢了1 倍。本文針對目標(biāo)檢測網(wǎng)絡(luò)計算量、參數(shù)量大以及設(shè)備推理速度慢等問題,設(shè)計一種基于GhostNet[17]殘差結(jié)構(gòu)網(wǎng)絡(luò)架構(gòu)作為YOLOv4-Tiny 的主干來降低計算量和參數(shù)量,以提高運算效率。

1 YOLOv4-Tiny 網(wǎng)絡(luò)

YOLO 算法[18-19]是近年來較受歡迎的神經(jīng)網(wǎng)絡(luò)算法,該算法使用回歸的方法進(jìn)行目標(biāo)檢測。YOLO 用一個神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可以同時預(yù)測出預(yù)測框和類別概率,具有執(zhí)行速度快、檢測效率高的特點。YOLOv4[20]是2020 年提出的神經(jīng)網(wǎng)絡(luò)算法,YOLOv4-Tiny 是縮小版的YOLOv4,YOLOv4-Tiny 結(jié)構(gòu)如圖1 所示。

圖1 YOLOv4-Tiny 網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 YOLOv4-Tiny network structure

YOLOv4-Tiny 模型尺寸僅為23 MB,有21 層卷積層、3 層Maxpool 層和2 層步長為2 的卷積。當(dāng)輸入為416 尺寸時輸出為13×13 和26×26 兩種大小的輸出層[21]。圖1 中虛線部分為Resblock_body[22],該結(jié)構(gòu)經(jīng)過第一個卷積層后將特征圖分組后進(jìn)行后續(xù)的操作。YOLOv4-Tiny 采用了兩層兩步長的普通卷積和3 個Resblock_body 結(jié)構(gòu)作為主干。采用Resblock_body 結(jié)構(gòu)提高了特征的復(fù)用,相較于YOLOv3-Tiny,采用傳統(tǒng)卷積作為主干網(wǎng)絡(luò)有著更好的特征提取,在加快推理速度的同時使得參數(shù)更少。

2 YOLO-GhostNet 算法

2.1 GhostNet 殘差結(jié)構(gòu)

在經(jīng)過卷積后的特征圖是比較相似的,GhostNet的思想是將傳統(tǒng)的卷積分兩步進(jìn)行:第1 步使用較少的卷積核生成一部分特征圖;第2 步對第1 步生成的特征圖使用比較簡單的計算獲得另一部分特征圖,最后將兩組特征圖拼接在一起。第2 個部分的計算可以采用3×3或5×5的通道卷積來替代。標(biāo)準(zhǔn)卷積與GhostNet卷積過程如圖2 所示。

圖2 標(biāo)準(zhǔn)卷積與GhostNet 卷積Fig.2 Standard convolution and GhostNet convolution

假設(shè)輸入特征圖為Di×Di×M,標(biāo)準(zhǔn)卷積核的寬和高為K,GhostNet 卷積的第1 部分卷積核的寬和高為K′,第2 部分為K′′,輸出特征圖為Do×Do×N。

標(biāo)準(zhǔn)卷積的計算量為:

GhostNet 卷積的計算量為:

標(biāo)準(zhǔn)卷積的參數(shù)量為:

GhostNet 卷積的參數(shù)量為:

針對Resblock_body 計算量大、參數(shù)量大、推理速度慢等問題,本文提出采用GhostNet 殘差結(jié)構(gòu)。該結(jié)構(gòu)使用標(biāo)準(zhǔn)卷積與點卷積進(jìn)行降通道,這里第2層卷積層通道為第1 層卷積層的1/2,然后使用5×5 的通道卷積獲得另一半特征圖,通過一個Concat 層拼接起來后與第一層特征圖相加。GhostNet 殘差結(jié)構(gòu)如圖3 所示。

圖3 GhostNet 殘差結(jié)構(gòu)Fig.3 GhostNet residual structure

假設(shè)經(jīng)過卷積過后沒有改變特征圖大小,GhostNet 殘差結(jié)構(gòu)與Resblock_body 結(jié)構(gòu)的輸入特征圖大小都為F×F×P,第1 個卷積層大小都為C×C×P×Q,則GhostNet 殘差結(jié)構(gòu)與Resblock_body 結(jié)構(gòu)計算量之比為:

在步長為1 的卷積時,計算量之比等于參數(shù)量之比。P、Q為輸入輸出通道數(shù),一般遠(yuǎn)大于C,根據(jù)式(5)可以明顯看出,當(dāng)輸入特征圖相同時,GhostNet殘差結(jié)構(gòu)在參數(shù)量和計算量上都比YOLOv4-Tiny 的Resblock_body 結(jié)構(gòu)更低,理論上推理速度也更快。

2.2 YOLO-GhostNet 網(wǎng)絡(luò)

YOLO-GhostNet 網(wǎng)絡(luò)各層參數(shù)如表1 所示。

表1 YOLO-GhosNet 網(wǎng)絡(luò)參數(shù)Table 1 YOLO-GhosNet network parameters

YOLOv4-Tiny 網(wǎng)絡(luò)相對于YOLOv3-Tiny 網(wǎng)絡(luò),無論是在識別精度還是模型尺寸上都有不少的改進(jìn)。但是網(wǎng)絡(luò)在類似于CPU 這樣的處理器上,還是顯得有些龐大。因此,本文將GhostNet 殘差結(jié)構(gòu)代替YOLOv4-Tiny 的Resblock_bod 結(jié)構(gòu),將網(wǎng)絡(luò)大部分3×3 標(biāo)準(zhǔn)卷積采用由一個點卷積和一個5×5 的通道卷積所組成的GhostNet 卷積替代。由式(1)和式(2)可知,使用GhostNet卷積替代標(biāo)準(zhǔn)卷積會隨著輸入通道的變化減少計算量和參數(shù)量,當(dāng)輸入通道越大時,計算量減小越多。YOLO-GhostNet 相比于YOLOv4-Tiny 網(wǎng)絡(luò)計算量減小為原來的31%,參數(shù)量減小為原來的10%。

3 實驗結(jié)果與分析

3.1 實驗數(shù)據(jù)和平臺

本文實驗采用10 097張飲料數(shù)據(jù)集,分別包括雪碧、可樂、綠茶和王老吉4種飲料,每個種類大約2 500張。測試集908張,訓(xùn)練集8 281張,驗證集908張。本次實驗在Windows10操作系統(tǒng)下進(jìn)行,軟件平臺為PyCharm,訓(xùn)練與驗證框架為Keras Tensorflow1.13-GPU 以及CPU 版本。硬件為AMD Ryzen5 3500X型號CPU,GTX1060 6G型號GPU,Batchsize設(shè)置為4,學(xué)習(xí)率采用0.001與0.000 1訓(xùn)練100個epoch,直到Loss不再變化自動終止訓(xùn)練。

3.2 結(jié)果分析

4 種飲料在2 個算法檢測精度如圖4 所示。由圖4 可知,YOLO-GhostNet 在可樂和綠茶2 個種類的精度比YOLOv4-Tiny 算法高,在另外2 種種類略微低一點。平均精確度均值(mAP)為79.43%,相較于YOLOv4-Tiny 基本沒有損失。YOLO-GhostNet 網(wǎng)絡(luò)有12 個BN 層,BN 層在訓(xùn)練時對算法有用,但是在推理時會增加算法訪存量和復(fù)雜度。由于BN 層在做線性運算,因此可以將BN 層融入到卷積層。由于深度學(xué)習(xí)網(wǎng)絡(luò)有較好的魯棒性,進(jìn)行BN 層的融合基本不會影響精度,還可以加快推理速度。BN 層優(yōu)化前后部分參數(shù)如表2 所示。

圖4 YOLO-GhostNet 與YOLOv4-Tiny 算法檢測精度對比Fig.4 Comparison of detection accuracy between YOLO-GhostNet and YOLOv4-Tiny algorithm

表2 YOLO-GhostNet 網(wǎng)絡(luò)BN 層優(yōu)化前后部分參數(shù)Table 2 Some parameters before and after BN layer optimization YOLO-GhostNet network

由表2 可知,經(jīng)過BN 層優(yōu)化后YOLO-GhostNet網(wǎng)絡(luò)在各種類的精度并沒有損失,反而在參數(shù)個數(shù)上減少了4 632 個參數(shù),對于參數(shù)影響雖然不大,但是在一定程度上減少了網(wǎng)絡(luò)訪存量,使得在CPU 上的推理速度快了22%,GPU 上的推理速度快了10%。

YOLO-GhostNet 與YOLOv4-Tiny 以及經(jīng)過BN 層優(yōu)化后的YOLO-GhostNet算法各項參數(shù)如表3 所示。

表3 YOLO-GhostNet 與YOLOv4-Tiny 各參數(shù)對比Table 3 Comparison of parameters between YOLO-GhostNet and Yolov4-Tiny

由表3可知,YOLO-GhostNet相較于YOLOv4-Tiny算法在輸入為416×416×3 大小時,平均精確度基本無損失,模型尺寸和計算量卻下降較多,大幅減少了設(shè)備的資源消耗,提高了模型的性價比,在推理時間上由于GPU 對卷積加速支持程度的區(qū)別,推理時間并沒有快很多,而在CPU 處理器上運行時,優(yōu)勢可以明顯體現(xiàn)出來,對CPU 和計算資源不足的處理器是非常合適的。

4 結(jié)束語

本文設(shè)計一種YOLO-GhostNet 輕量級網(wǎng)絡(luò)模型。該模型采用GhostNet 殘差結(jié)構(gòu)代替原網(wǎng)絡(luò)的Resblock_body,能夠解決計算量和參數(shù)量大以及推理速度慢而難以部署到計算資源少的設(shè)備的問題。此外,將YOLO-GhostNet 算法運用NCNN 框架經(jīng)過半精度量化和BN 層優(yōu)化后,在AMD Ryzen5 3500X 型號CPU 上推理時處理一張圖片只需要45 ms,相對YOLOv4-Tiny 算法速度提高58%,量化后的模型大小為1.1 MB,可在CPU 上達(dá)到實時檢測的效果。

猜你喜歡
特征結(jié)構(gòu)
抓住特征巧觀察
《形而上學(xué)》△卷的結(jié)構(gòu)和位置
新型冠狀病毒及其流行病學(xué)特征認(rèn)識
如何表達(dá)“特征”
論結(jié)構(gòu)
中華詩詞(2019年7期)2019-11-25 01:43:04
新型平衡塊結(jié)構(gòu)的應(yīng)用
模具制造(2019年3期)2019-06-06 02:10:54
不忠誠的四個特征
抓住特征巧觀察
論《日出》的結(jié)構(gòu)
創(chuàng)新治理結(jié)構(gòu)促進(jìn)中小企業(yè)持續(xù)成長
主站蜘蛛池模板: 国产性生交xxxxx免费| 国产精品自在线天天看片| 日韩精品一区二区三区免费| 亚洲精品在线影院| 亚洲欧美另类日本| 波多野结衣中文字幕一区二区| 国产欧美日韩综合一区在线播放| 免费国产一级 片内射老| 乱人伦99久久| www.亚洲一区二区三区| 99久久精品国产麻豆婷婷| 日本午夜影院| 九九久久精品国产av片囯产区| 毛片免费网址| 国产成人精品免费av| 久久午夜夜伦鲁鲁片不卡| 久久国产精品波多野结衣| 亚洲免费人成影院| 538精品在线观看| 午夜小视频在线| 国产成人AV男人的天堂| 日韩精品亚洲精品第一页| 欧美日一级片| 亚洲综合二区| 欧美福利在线观看| 亚洲av无码牛牛影视在线二区| 国产地址二永久伊甸园| 99福利视频导航| 亚洲色欲色欲www网| 亚洲大学生视频在线播放| 无码久看视频| 日本午夜在线视频| 特级aaaaaaaaa毛片免费视频 | 中文国产成人精品久久| 任我操在线视频| 亚洲午夜天堂| 97久久精品人人做人人爽| 无码综合天天久久综合网| 国产精品污视频| 精品国产黑色丝袜高跟鞋 | 综合社区亚洲熟妇p| 国产一级毛片yw| 青草视频免费在线观看| 又爽又大又黄a级毛片在线视频| 特级毛片8级毛片免费观看| 亚洲一区国色天香| 日韩一二三区视频精品| 日韩人妻无码制服丝袜视频| 成年人福利视频| 精品国产一二三区| 一级毛片免费播放视频| 亚洲第一页在线观看| 国产精品第页| 国产精品护士| www精品久久| 91破解版在线亚洲| www中文字幕在线观看| 综合天天色| 国产97公开成人免费视频| 蜜桃视频一区二区| 色天堂无毒不卡| 亚洲香蕉在线| 不卡国产视频第一页| 久久中文无码精品| 久久精品无码中文字幕| 欧美天天干| 青青草国产在线视频| 久操中文在线| 国产精品免费久久久久影院无码| 尤物精品视频一区二区三区| 亚洲国产在一区二区三区| 亚洲国产清纯| 中文字幕永久视频| 国产精品9| 日韩在线1| 日韩在线网址| 久久久久九九精品影院| 国产91麻豆免费观看| 国产a网站| 国产浮力第一页永久地址 | 97人妻精品专区久久久久| 亚洲欧美精品日韩欧美|