朱家輝,蘇維均*,于重重,黃俊卿
(1.北京工商大學(xué),北京 100048;2.中國(guó)輕工業(yè)工業(yè)互聯(lián)網(wǎng)與大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室,北京 100048;3.陸軍裝甲兵學(xué)院,北京 100072)
隨著社會(huì)的發(fā)展和科技的進(jìn)步,目標(biāo)檢測(cè)技術(shù)在軍事領(lǐng)域有著重要的應(yīng)用價(jià)值與研究意義。軍事目標(biāo)的檢測(cè)識(shí)別對(duì)于戰(zhàn)場(chǎng)監(jiān)視、偵查和損傷狀態(tài)評(píng)估具有重要作用,是現(xiàn)代高科技戰(zhàn)爭(zhēng)中贏得戰(zhàn)爭(zhēng)勝利的關(guān)鍵因素。然而,在目標(biāo)檢測(cè)任務(wù)中,由于二維目標(biāo)檢測(cè)只能回歸出目標(biāo)的像素坐標(biāo),缺乏深度、尺寸等參數(shù)信息,在實(shí)際應(yīng)用中存在著一定的局限性。近年來(lái),利用深度學(xué)習(xí)網(wǎng)絡(luò)解決復(fù)雜戰(zhàn)場(chǎng)環(huán)境下的三維目標(biāo)檢測(cè)取得了較好效果。
三維目標(biāo)檢測(cè)的研究早期主要是對(duì)單目圖像的三維信息進(jìn)行粗略地快速估計(jì),隨著深度神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,三維目標(biāo)檢測(cè)的應(yīng)用范圍和精度都得到了提高。2014 年,GUPTAS 等提出基于RGB 圖像和深度圖來(lái)檢測(cè)圖像中的輪廓,利用CNN 進(jìn)行特征提取,但網(wǎng)絡(luò)架構(gòu)無(wú)法高效利用反向傳播算法,難以進(jìn)一步優(yōu)化結(jié)構(gòu)。2017 年,WADIM K 等提出SSD-6D 算法,基于RGB 數(shù)據(jù)擴(kuò)展了流行的SSD 目標(biāo)檢測(cè)模型,使其覆蓋整個(gè)三維空間,并在synthetic model 數(shù)據(jù)集上進(jìn)行訓(xùn)練。通過(guò)實(shí)驗(yàn)證明,在多個(gè)挑戰(zhàn)性的數(shù)據(jù)集上,該方法精度超過(guò)同時(shí)期其他算法。2018 年,TRUNG P 等提出了一個(gè)端到端的深度學(xué)習(xí)框架Deep-6DPose,將Mask R-CNN 擴(kuò)展為一個(gè)新的三維目標(biāo)檢測(cè)分支,可以直接回歸出目標(biāo)的三維框,不需要進(jìn)行任何細(xì)化,簡(jiǎn)化訓(xùn)練過(guò)程。隨后,SIMON M 等提出Complex- YOLO 算法以及用于實(shí)時(shí)三維目標(biāo)檢測(cè)的歐拉區(qū)域建議網(wǎng)絡(luò)(ERPN),其中,Complex-YOLO 采用了YOLOV2 網(wǎng)絡(luò)架構(gòu),可直接針對(duì)RGB 圖像進(jìn)行操作,實(shí)現(xiàn)三維目標(biāo)多類邊界框的精確定位?!?br>