王 賀,樊 星
(山西大學(xué) 物理電子工程學(xué)院,山西 太原 030006)
目標(biāo)檢測是計(jì)算機(jī)視覺和數(shù)字圖像處理的一個(gè)熱門方向,廣泛應(yīng)用于機(jī)器人導(dǎo)航、無人自動(dòng)駕駛、智能視頻監(jiān)控、航空航天等諸多領(lǐng)域。多年來,許多深度學(xué)習(xí)模型被提出用來替代傳統(tǒng)的手工特征來解釋圖像,卷積神經(jīng)網(wǎng)絡(luò)[1-2]就是其中之一,并且已經(jīng)取得了一定的成果。相較于傳統(tǒng)方法,卷積神經(jīng)網(wǎng)絡(luò)能自動(dòng)學(xué)習(xí)更深層的特征信息,擁有更高的檢測精度和更快的檢測速度,具有重要的現(xiàn)實(shí)意義。
目前主流的基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測大概分為兩大類:(1)兩階段目標(biāo)檢測算法,這類目標(biāo)檢測算法分為兩個(gè)階段:首先產(chǎn)生候選區(qū)域(Region Proposals),其中包括目標(biāo)的位置信息;其次,對(duì)候選區(qū)域進(jìn)行分類和位置修正。這一類的經(jīng)典目標(biāo)檢測算法有R-CNN[3],F(xiàn)ast R-CNN[4]等。這些算法檢測精度雖高,但模型尺寸大,難以達(dá)到實(shí)時(shí)性。(2)一階段目標(biāo)檢測算法,這類目標(biāo)檢測算法檢測不需要預(yù)先產(chǎn)生候選區(qū)域,而是在圖像上直接產(chǎn)生類別概率和位置信息,比較經(jīng)典的算法有SSD[5-6],YOLO[7-8]等,這類算法雖然損失了部分檢測精度,但模型靈活性高,便于和其他模型結(jié)合,因此,備受人們青睞。SSD算法吸取了YOLO速度快和RPN定位準(zhǔn)確的優(yōu)點(diǎn),使其在運(yùn)行速度和檢測精度上有了較好的平衡。
針對(duì)目前目標(biāo)檢測算法模型大,對(duì)設(shè)備要求高,難以應(yīng)用到移動(dòng)端和嵌入式設(shè)備[9]等問題,本文采用MobileNetV3輕量級(jí)神經(jīng)網(wǎng)絡(luò)[10-11]與SSD檢測器相結(jié)合,以此來滿足能夠移植到嵌入式設(shè)備的要求。……