梅國(guó)新,姚慶華,陳 瑤,劉 華
(1.云南省交通投資建設(shè)集團(tuán)有限公司,云南 昆明 650228;2.云南省交通科學(xué)研究院有限公司,云南 昆明 650011)
目前,檢測(cè)方法由于監(jiān)控?cái)z像機(jī)的位置距離監(jiān)控場(chǎng)景較遠(yuǎn),視頻內(nèi)工作人員圖像像素尺寸?。ㄒ话?0像素左右),同時(shí)背景較為復(fù)雜,這對(duì)于檢測(cè)安全帽佩戴構(gòu)成了重大挑戰(zhàn).針對(duì)以上問題,本項(xiàng)目提出了一種邊緣環(huán)境下面向大監(jiān)控視頻背景的安全帽檢測(cè)方法。針對(duì)邊緣環(huán)境下面向復(fù)雜背景遠(yuǎn)距離監(jiān)控視頻中安全帽檢測(cè)問題,本文討論了jetson tx2環(huán)境下基于EfficientDet的檢測(cè)方法的性能。
EfficientDet包含兩部分:特征提取網(wǎng)絡(luò)EfficientNet和面向多目標(biāo)檢測(cè)的加權(quán)雙向特征金字塔網(wǎng)絡(luò)。該架構(gòu)解決了深度網(wǎng)絡(luò)的深度、寬度和分辨率之間的平衡問題,可以提高生成模型的泛化能力。如圖1所示,單一提高某個(gè)參數(shù),模型對(duì)圖像的分類準(zhǔn)確率很快會(huì)達(dá)到上限。

圖1 單獨(dú)提升模型寬度、深度、以及圖像分辨率的效果
為了有效調(diào)整深度、寬度和分辨率參數(shù),EfficientNet使用了“復(fù)合系數(shù)”來(lái)動(dòng)態(tài)調(diào)整這3個(gè)參數(shù)。(α,β,γ)分別代表網(wǎng)絡(luò)的深度、寬度和輸入分辨率。根據(jù)前期研究可知網(wǎng)絡(luò)寬度和分辨率每增加一倍,計(jì)算代價(jià)會(huì)多四倍,因此EfficientNet對(duì)目標(biāo)函數(shù)的約束相進(jìn)行了調(diào)整,分別考慮了網(wǎng)絡(luò)深度、網(wǎng)絡(luò)寬度和分辨率三個(gè)維度:網(wǎng)絡(luò)深度約束網(wǎng)絡(luò)深度約束分辨率約束其中圖2給出了達(dá)到同樣檢測(cè)準(zhǔn)確率,使用增加網(wǎng)絡(luò)寬度、網(wǎng)絡(luò)深度、分辨率的策略和使用EfficientNet策略的不同結(jié)果。

圖2 (a)baseline model,(b)-(d)單一提參數(shù)策略,(e)EfficientNet策略
同時(shí),谷歌大腦團(tuán)隊(duì)對(duì)EfficientNet網(wǎng)絡(luò)進(jìn)行了優(yōu)化,使之適應(yīng)多種目標(biāo)檢測(cè),提出加權(quán)雙向特征金字塔網(wǎng)絡(luò),從而快速地實(shí)現(xiàn)多尺度特征融合,對(duì)小目標(biāo)的檢測(cè)起到了顯著的作用。其次采用了EfficientNet作為特征提取網(wǎng)絡(luò),大大減少了參數(shù)量,為我們將模型部署到移動(dòng)邊緣計(jì)算設(shè)備上提供了可能性。
實(shí)驗(yàn)數(shù)據(jù)集來(lái)自于(https://github.com/njvisionpower/Safety-Helmet-Wearing-Dataset),該數(shù)據(jù)集總共有7581張圖像,包含9044個(gè)佩戴安全帽圖像(正類圖像),以及111514個(gè)未佩戴安全帽的圖像(負(fù)類圖像),所有的圖像都標(biāo)注出了目標(biāo)區(qū)域及類別。
本文采用mAP(Mean Average Precision)作為算法的性能評(píng)價(jià)指標(biāo),平均精度均值(mAP)是預(yù)測(cè)目標(biāo)位置以及類別的這一類算法的性能度量標(biāo)準(zhǔn)。mAP指標(biāo)能較好地評(píng)估目標(biāo)定位模型、目標(biāo)檢測(cè)模型以及實(shí)例分割模型性能。
mAP指標(biāo)定義如下,其中C為檢測(cè)類別數(shù)目,AP為每一個(gè)檢測(cè)類的平均檢測(cè)精度。

AP值刻畫了檢測(cè)準(zhǔn)確率和召回率(precision-recall)曲線面積

準(zhǔn)確率和召回率計(jì)算公式如下:

式 中,TP表 示 真 正 例(True Positives);TF表示 假 正 例(False Positives);TN表 示 真 負(fù) 例(True Negatives);FN表示假負(fù)例(False Negatives)。
本文將CascadeRCNN、YOLO V3作為基線算法,對(duì)比了不同參數(shù)設(shè)置的EfficientDet(即EfficientDet-D0、EfficientDet-D3,EfficientDet-D4)在jetson tx2邊緣環(huán)境下的性能。其與基線方法模型大小及性能對(duì)比情況分別如圖3、圖4所示:

圖3 模型大小對(duì)比

圖4 模型性能對(duì)比
如下表1所示,EfficientDet在同等精度的前提下,模型只使用了52M參數(shù),僅為主流模型的十幾分之一,計(jì)算量為326B FLOPS的EfficientDet-D7在COCO數(shù)據(jù)集上實(shí)現(xiàn)了當(dāng)前最優(yōu)的51.0 mAP,準(zhǔn)確率超越之前最優(yōu)檢測(cè)器(+0.3% mAP),其規(guī)模僅為之前最優(yōu)檢測(cè)器的1/4,而后者的計(jì)算量FLOPS更是EfficientDet-D7的9.3倍。從實(shí)際檢測(cè)效果來(lái)看,EfficientDet模型克服了檢測(cè)目標(biāo)間存在著明顯遮擋、重疊率高、圖像分辨率低等問題,取得了比較好的效果,達(dá)到了推理速度更快,模型占用空間較小的要求,也為部署在邊緣計(jì)算環(huán)境上提供了可能。

表1 同等精度下EfficientDet差數(shù)對(duì)比表