師 君 闕鈺佳 周澤南 周遠(yuǎn)遠(yuǎn) 張曉玲 孫銘芳
(電子科技大學(xué)信息與通信學(xué)院 成都 611731)
近年來,對(duì)于人口流動(dòng)性大以及人員密集區(qū)域,如車站,機(jī)場(chǎng),海關(guān)等,如何有效地預(yù)防恐怖襲擊事件顯得尤其重要。穿透衣物、包裹發(fā)現(xiàn)隱藏的危險(xiǎn)物品是安檢成像中的關(guān)鍵因素和難點(diǎn),包括成像時(shí)間、清晰度、識(shí)別違規(guī)物品的準(zhǔn)確率等都是安檢系統(tǒng)中的重要指標(biāo)。傳統(tǒng)安檢安防手段,如X射線,存在電離輻射的風(fēng)險(xiǎn),長(zhǎng)期暴露在X射線下對(duì)于人體有相當(dāng)大的危害[1]。而手持掃描探測(cè)器、安檢門則存在穿透性、準(zhǔn)確性的問題。相比之下,高頻微波,如毫米波、太赫茲具備良好的安全性和穿透性,能夠?qū)﹄[匿的可疑危險(xiǎn)物品進(jìn)行較為清晰地成像且對(duì)人體健康性危害較小,已經(jīng)逐漸成為最主流的人體安檢成像方式[2]。毫米波成像安檢系統(tǒng)由于具備分辨率適中、成像清晰度和對(duì)比度合適、對(duì)人體影響較小等特點(diǎn),成為具有極大潛力的新一代人體安檢系統(tǒng),近些年以近場(chǎng)毫米波3維成像為代表的主動(dòng)式毫米波安檢成像技術(shù)得到了高速發(fā)展[3–5]。
根據(jù)系統(tǒng)工作模式以及原理上的區(qū)別,毫米波成像又分為主動(dòng)式毫米波成像和被動(dòng)式毫米波成像系統(tǒng)。主動(dòng)式毫米波成像系統(tǒng)通過布置收發(fā)陣元,發(fā)射電磁波信號(hào)到目標(biāo)場(chǎng)景,并接收目標(biāo)反射的回波信號(hào),最后結(jié)合成像算法對(duì)目標(biāo)場(chǎng)景進(jìn)行3維重建,進(jìn)而獲取較高精度的成像場(chǎng)景。主動(dòng)式成像系統(tǒng)具備受環(huán)境因素影響小、能獲取豐富的3維場(chǎng)景成像信息、成像分辨率高等特點(diǎn)[6],成為安檢成像技術(shù)研究的重要方向。主動(dòng)式毫米波安檢成像算法主要包括后向投影(Back Projection,BP)算法以及距離多普勒(Range Doppler,RD)算法等。
在刀、槍等異物檢測(cè)方面,由于毫米波安檢成像質(zhì)量受到系統(tǒng)指標(biāo)、隱私等方面的約束,無法或不宜獲得過于高清晰度的圖像,如何從安檢圖像中檢測(cè)敏感目標(biāo)成為毫米波安檢系統(tǒng)的關(guān)鍵問題。傳統(tǒng)檢測(cè)方法通過在圖像中提取特征(如,方向梯度直方圖(Histogram of Oriented Gradient,HOG)[7]、局部二值模式(Local Binary Patterns,LBP)[8]、Harr特征[9]等)并結(jié)合Adaboost、支持向量機(jī)(Support Vector Machine,SVM)等分類器進(jìn)行異物檢測(cè)[10]。這些技術(shù)需要對(duì)毫米波圖像特點(diǎn)有較深的分析,且算法的通用性較差,當(dāng)成像質(zhì)量較差時(shí)尤其明顯。深度卷積神經(jīng)網(wǎng)絡(luò)是目前圖像識(shí)別和檢測(cè)技術(shù)中的熱點(diǎn)技術(shù),該技術(shù)通過大量樣本訓(xùn)練,自動(dòng)尋找圖像中的特征,并進(jìn)行識(shí)別,具有算法通用性好、開發(fā)靈活等優(yōu)點(diǎn)。
自從AlexNet[11],VGG[12]等深度卷積神經(jīng)網(wǎng)絡(luò)在圖片識(shí)別任務(wù)取得優(yōu)異成績(jī)之后,卷積神經(jīng)網(wǎng)絡(luò)開始廣泛應(yīng)用在目標(biāo)檢測(cè)算法中[13–17]。Girshick等人[15]提出了區(qū)域卷積網(wǎng)絡(luò)(Regional Convolutional Neural Network,RCNN)算法,先用選擇性搜索方法(selective search)提取候選區(qū)域,然后使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)候選區(qū)域進(jìn)行特征提取,提取的特征由分類器進(jìn)行分類,并通過邊框回歸(box regression)得到目標(biāo)位置。文獻(xiàn)[14]在快速區(qū)域卷積網(wǎng)絡(luò)(Fast RCNN)[13]的基礎(chǔ)上提出了區(qū)域生成網(wǎng)絡(luò)(Region Proposal Network,RPN),通過交替訓(xùn)練的方式,該網(wǎng)絡(luò)可以與Fast RCNN共享網(wǎng)絡(luò)參數(shù),提高了訓(xùn)練效率,節(jié)省了訓(xùn)練成本,檢測(cè)準(zhǔn)確率也得到了進(jìn)一步的提升。為了進(jìn)一步減少提取候選框時(shí)間損耗,提高檢測(cè)速度,YOLO(You Only Look Once)算法[16]直接對(duì)待檢測(cè)(大)圖的特征圖進(jìn)行邊框回歸,用單個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)同時(shí)實(shí)現(xiàn)對(duì)輸入圖像中目標(biāo)的位置和分類的預(yù)測(cè)。
針對(duì)近場(chǎng)毫米波3維成像與異物檢測(cè)中存在的問題,本文主要討論了基于BP算法的近場(chǎng)毫米波3維成像系統(tǒng)以及基于深度卷積網(wǎng)絡(luò)的異物檢測(cè)技術(shù)。第2節(jié)主要介紹了近場(chǎng)毫米波3維成像系統(tǒng)結(jié)構(gòu)和信號(hào)模型,第3節(jié)討論了基于熱圖和YOLO算法的異物檢測(cè)方法,最后在第4節(jié)通過實(shí)測(cè)數(shù)據(jù)處理對(duì)本文所使用的方法進(jìn)行驗(yàn)證和性能分析。
原理上,近場(chǎng)毫米波安檢系統(tǒng)通過控制線陣運(yùn)動(dòng)合成大尺寸天線獲得微波圖像。但在實(shí)現(xiàn)過程中,受到成本等方面的制約,具體的系統(tǒng)結(jié)構(gòu)有所不同,主要分為垂直掃描模式和圓周掃描模式如圖1所示。
垂直掃描模式中,其線性陣元沿水平方向布設(shè)并以一定的速度往下掃描,分別經(jīng)歷勻加速,勻速以及勻減速運(yùn)動(dòng)的過程,同時(shí)發(fā)射陣元通過一定的脈沖重復(fù)頻率發(fā)射線性調(diào)頻信號(hào)并由接收陣元負(fù)責(zé)接收?qǐng)鼍爸械娜梭w反射回波信號(hào),經(jīng)過一個(gè)完整的合成孔徑時(shí)間,也即完成了一次對(duì)目標(biāo)場(chǎng)景回波的采集工作,進(jìn)而對(duì)目標(biāo)回波信號(hào)實(shí)現(xiàn)基于3維BP成像算法便可對(duì)目標(biāo)人體進(jìn)行3維成像。通過在安檢儀的兩面各分別安置帶有線性陣列的掃描架,這樣便可以在一次掃描的過程中分別實(shí)現(xiàn)人體前、后兩面的成像圖。
圓柱掃描模式下,線性陣元沿垂直方向布設(shè),通過控制該天線圍繞圓心做水平旋轉(zhuǎn),合成圓柱形的陣列天線面[18]。與垂直掃描模式相比,該模式能夠?qū)崿F(xiàn)對(duì)人體水平面內(nèi)360°范圍內(nèi)的等分辨率成像,且不存在人體側(cè)面無法照射的情況,整體性能優(yōu)于垂直掃描模式。但垂直陣列尺寸一般遠(yuǎn)長(zhǎng)于水平陣列,因此該系統(tǒng)成本也相對(duì)較高。為了降低成本,在天線陣列設(shè)計(jì)時(shí),可采用多入多出(Multiple-Input Multiple-Output,MIMO)技術(shù),通過MIMO、單發(fā)多收(Single-Input Multiple-Output,SIMO)等設(shè)計(jì)降低系統(tǒng)成本。
無論其具體工作模式,近場(chǎng)毫米波3維成像安檢系統(tǒng)信號(hào)模型相同,下面以垂直掃描模式為例進(jìn)行推導(dǎo)。此時(shí),水平布置天線陣列的掃描架平臺(tái)沿著x方向分別經(jīng)歷勻加速、勻速以及勻減速運(yùn)動(dòng)的方式向下運(yùn)動(dòng)并對(duì)人體全身進(jìn)行掃描,天線陣列水平安置在掃描架上且平行于y軸,其中,x為方位向即掃描架運(yùn)動(dòng)方向,y為陣列方向即天線布置的水平方向,z為距離向即檢測(cè)人體到掃描面陣的垂直距離。


對(duì)于近場(chǎng)毫米波3維成像系統(tǒng),一般需要較大的信號(hào)帶寬,如3 GHz,采用匹配濾波技術(shù)難以實(shí)現(xiàn),一般采用去斜率處理進(jìn)行距離壓縮。假設(shè)近場(chǎng)毫米波3維成像系統(tǒng)發(fā)射陣元發(fā)射的線性調(diào)頻信號(hào)(Linear Frequency Modulation,LFM)為



其中,第1項(xiàng)對(duì)應(yīng)運(yùn)動(dòng)合成的陣列天線,第2項(xiàng)為距離延遲對(duì)應(yīng)的單頻信號(hào),第3項(xiàng)為殘留相位,由于近場(chǎng)成像中距離的數(shù)值遠(yuǎn)小于光速的數(shù)值,此項(xiàng)可以忽略(假設(shè)系統(tǒng)工作在Ka波段,最遠(yuǎn)作用距離R=0.5 m,調(diào)頻斜率為殘留項(xiàng)產(chǎn)生的最大相位偏差為,遠(yuǎn)小于Ka波段波長(zhǎng)的1/8,故可忽略)。

從近場(chǎng)毫米波3維成像模型可以看出,與傳統(tǒng)SAR成像相比,近場(chǎng)3維成像系統(tǒng)等效陣列結(jié)構(gòu)更為復(fù)雜,可能為2維平面陣列、圓柱陣列等,增加了信號(hào)處理難度。成像過程中,當(dāng)聚焦深度大于一定值后會(huì)導(dǎo)致較嚴(yán)重的散焦現(xiàn)象,而安檢成像中人體的厚度較寬,這些因素都會(huì)導(dǎo)致回波處理和較高精度成像的困難。從系統(tǒng)角度考慮,還可能存在不同陣元接收回波串?dāng)_問題,且回波信號(hào)需要補(bǔ)償通道誤差,進(jìn)一步增加了成像處理難度。
對(duì)于近場(chǎng)3維成像而言,成像算法主要分為頻域成像算法和時(shí)域成像算法。兩類成像算法都在2維成像基礎(chǔ)上擴(kuò)展到3維空間,其中典型近場(chǎng)3維成像算法有3維距離-多普勒算法以及3維后向投影算法。
后向投影算法是典型時(shí)域成像算法,通過對(duì)同一目標(biāo)場(chǎng)景像素點(diǎn)距離壓縮后的回波進(jìn)行多普勒相位補(bǔ)償以及相干累加得到該像素點(diǎn)后向散射系數(shù),進(jìn)而實(shí)現(xiàn)聚焦成像,詳細(xì)流程可參閱文獻(xiàn)[19]。
對(duì)于近場(chǎng)安檢成像應(yīng)用,采用BP算法遍歷3維成像場(chǎng)景,即可得到目標(biāo)區(qū)域的3維圖像。為了更好地呈現(xiàn)結(jié)果,需要將該3維圖像沿距離方向進(jìn)行投影,得到符合人眼視覺的2維圖像。最典型的方法為“最大值投影法”。該方法遍歷方位向和陣列向,選擇距離向所有目標(biāo)像素值中最大的點(diǎn)作為2維投影圖像對(duì)應(yīng)點(diǎn)的像素值。如圖2所示為最大值投影后經(jīng)過質(zhì)量?jī)?yōu)化的成像圖,其中成像的垂直和水平方向分別對(duì)應(yīng)方位向和陣列方向,且后續(xù)章節(jié)中所有成像結(jié)果橫縱坐標(biāo)軸含義與該圖相同,所以不再贅述。假設(shè)3維空間每個(gè)場(chǎng)景點(diǎn)對(duì)應(yīng)像素值函數(shù)為,則最大值投影至2維圖像的公式為

其中,g(x,y)為2維投影圖像,z表示距離向。

圖2 2維成像結(jié)果Fig.2 The 2D imaging result
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)屬于前饋神經(jīng)網(wǎng)絡(luò),通過權(quán)值共享和局部感受野的概念,將卷積運(yùn)算引入到網(wǎng)絡(luò)結(jié)構(gòu)中,在顯著擴(kuò)展網(wǎng)絡(luò)結(jié)構(gòu)的條件下,很好地控制了網(wǎng)絡(luò)參數(shù)維度,在圖像分類識(shí)別、自然語言處理等研究領(lǐng)域獲得了良好效果。
卷積神經(jīng)網(wǎng)絡(luò)一般由交替出現(xiàn)的卷積層、池化層以及最后的全連接層組成,基本結(jié)構(gòu)如圖3所示。

圖3 CNN結(jié)構(gòu)Fig.3 The CNN structure
卷積層由多個(gè)特征圖組成,它的每個(gè)神經(jīng)元通過卷積核(權(quán)值矩陣)與上一層特征面的局部區(qū)域相連接。卷積層通過卷積操作對(duì)輸入進(jìn)行特征提取。第1層卷積層的輸入即為輸入圖像,提取如邊緣、線條等低級(jí)特征。更高層的輸入則為上一層的特征面,從中提取更高級(jí)的特征。
池化層緊隨在卷積層之后,是一種非線性的下采樣。它的每個(gè)神經(jīng)元對(duì)局部接受區(qū)域進(jìn)行池化操作,具有二次特征提取作用。最大池化(max pooling)、均值池化(mean pooling)以及隨機(jī)池化(stochastic pooling)等是常用的池化方法。其中最大池化取局部接受域中最大的點(diǎn),均值池化取接受域中所有值的平均。
在經(jīng)過多個(gè)卷積層和池化層后,連接著一個(gè)或者一個(gè)以上的全連接層。全連接層中的每個(gè)神經(jīng)元與其前一層的所有神經(jīng)元相連接,故而稱為全連接層。該層可以整合卷積層或池化層中具有類別區(qū)分性的局部信息。最后1個(gè)全連接層起到分類器作用,根據(jù)前層提取的特征信息對(duì)輸入進(jìn)行分類處理,輸出目標(biāo)的類別。
卷積網(wǎng)絡(luò)的標(biāo)準(zhǔn)模型主要用于分類任務(wù),其輸入為標(biāo)準(zhǔn)尺寸圖像,輸出為該圖像的類屬編號(hào)。但是,在異物檢測(cè)任務(wù)中,異物圖像嵌于整幅圖像中,在做出類屬判斷前,還需要從圖像中框選出異物可能出現(xiàn)的區(qū)域。下面介紹基于熱圖的異物檢測(cè)方法和基于YOLO網(wǎng)絡(luò)模型的異物檢測(cè)方法。
基于熱圖的目標(biāo)檢測(cè)方法的基本策略類似于圖像濾波過程。首先,利用目標(biāo)圖像(小圖)訓(xùn)練出一個(gè)分類卷積網(wǎng)絡(luò),其輸入為小圖,輸出為該圖像的類屬。然后,將該網(wǎng)絡(luò)在待檢測(cè)圖像中滑動(dòng),每個(gè)位置得到一個(gè)目標(biāo)類屬的輸出構(gòu)成了一張類屬/概率的圖像,稱之為熱圖。

圖4 基于熱圖的目標(biāo)檢測(cè)結(jié)構(gòu)Fig.4 The target detection structure based on heat map
基于熱圖的異物檢測(cè)過程如圖4所示。標(biāo)準(zhǔn)分類網(wǎng)絡(luò)按照一定的步長(zhǎng)在待檢測(cè)大圖中滑動(dòng),每個(gè)位置網(wǎng)絡(luò)運(yùn)行1次,得到1個(gè)概率輸出,遍歷整幅圖像后得到初始熱圖,如圖4(b)所示。
對(duì)于最后層以softmax為激活函數(shù)的分類網(wǎng)絡(luò),其輸出在0~1之間。當(dāng)相鄰小圖中均包含部分異物時(shí),鄰近區(qū)域具有相似大小的概率輸出,所以通過尋找初始熱圖中能量最大值定位異物位置時(shí)會(huì)引入較大誤差。例如,熱圖4(b)橙色區(qū)域能量大小基本一致,每個(gè)點(diǎn)均可能判定為目標(biāo)中心。為此,本文對(duì)原始輸出熱圖進(jìn)行了后處理。使用值為1,尺寸大小為3×3的模板與熱圖做卷積運(yùn)算,使能量進(jìn)一步聚集在異物中心位置,得到一張?zhí)幚砗蟮臒釄D,如圖4(c)。可以看出,只有一個(gè)能量最強(qiáng)點(diǎn),即為待檢測(cè)異物中心。
熱圖檢測(cè)法原理簡(jiǎn)單,但是,由于其需要遍歷整幅待檢測(cè)圖像,運(yùn)算量龐大,且生成的檢測(cè)框尺寸固定,無法適應(yīng)異物尺寸變化。為此,需要對(duì)熱圖法進(jìn)行替換,引入更靈活、高效的異物檢測(cè)算法。
傳統(tǒng)的目標(biāo)檢測(cè)方法通常分為3個(gè)階段。首先通過不同尺寸的滑動(dòng)窗口在圖像上選擇候選區(qū)域,其次對(duì)候選區(qū)域特征進(jìn)行提取,最后通過分類器進(jìn)行識(shí)別。傳統(tǒng)目標(biāo)檢測(cè)基于滑窗進(jìn)行區(qū)域選擇,由于缺乏針對(duì)性,窗口冗余多,時(shí)間復(fù)雜度高,手工選擇的候選框缺乏泛化能力,因此不適用于對(duì)實(shí)時(shí)性、準(zhǔn)確率要求高的安檢應(yīng)用。
隨著深度學(xué)習(xí)的高速發(fā)展,目標(biāo)檢測(cè)算法不斷朝著高效率、高性能的方向發(fā)展。當(dāng)前比較流行的算法主要可以分為兩大類,一類是基于候選區(qū)域(region proposal)的RCNN系算法,主要有RCNN,Fast RCNN和Faster RCNN。RCNN系算法是兩階段(two stage)檢測(cè)算法,需要先使用選擇性檢索(selective search)或RPN網(wǎng)絡(luò)產(chǎn)生候選區(qū)域,然后在候選區(qū)域上做分類與回歸。該類算法在生成候選區(qū)域時(shí)消耗較多時(shí)間,由輸入到檢測(cè)需要3 s左右。雖然RCNN系算法對(duì)于目標(biāo)檢測(cè)耗時(shí)較多,但是在檢測(cè)精度上保持領(lǐng)先水平。另一類是YOLO和SSD這類單階段(one stage)算法,即本文使用的檢測(cè)算法。YOLO算法是一種端到端的目標(biāo)檢測(cè)算法,每次檢測(cè)時(shí)將整張圖像輸入網(wǎng)絡(luò),不同于RCNN系算法生成候選區(qū)域的方法,YOLO算法將圖像劃分為的網(wǎng)格,將目標(biāo)檢測(cè)問題作為回歸問題解決,直接對(duì)網(wǎng)格中的目標(biāo)中心點(diǎn)位置及邊框的高寬進(jìn)行預(yù)測(cè)。因此YOLO算法僅僅使用一個(gè)CNN網(wǎng)絡(luò)就能直接預(yù)測(cè)不同目標(biāo)的類別與位置。相比于傳統(tǒng)檢測(cè)網(wǎng)絡(luò),YOLO算法在檢測(cè)精度得到了很大的提升;相對(duì)于RCNN系列的檢測(cè)網(wǎng)絡(luò),YOLO算法檢測(cè)時(shí)間更短,效率得到了優(yōu)化。這些特點(diǎn)說明了YOLO算法更適用于人流量多的實(shí)時(shí)安檢應(yīng)用。
YOLO算法使用單個(gè)卷積網(wǎng)絡(luò)即可實(shí)現(xiàn)端到端(end to end)的目標(biāo)檢測(cè),其訓(xùn)練流程如圖5所示。YOLO網(wǎng)絡(luò)使用過程簡(jiǎn)單,首先將待檢測(cè)圖片(大圖)尺寸插值到合適的大小,然后送入訓(xùn)練好的YOLO網(wǎng)絡(luò),即可得到目標(biāo)檢測(cè)結(jié)果。相比RCNN等常用檢測(cè)算法,YOLO速度更快,而且訓(xùn)練過程也直接在包含標(biāo)簽(ground truth)的待檢測(cè)(大)圖像中操作,過程更為簡(jiǎn)單。
YOLO網(wǎng)絡(luò)設(shè)計(jì)主要包括特征提取、邊框回歸和非極大值抑制3個(gè)部分。
特征提取主要靠標(biāo)準(zhǔn)卷積網(wǎng)絡(luò)的卷積層實(shí)現(xiàn),一般選擇GooLeNet模型,共包含24個(gè)卷積層和全連接神經(jīng)網(wǎng)絡(luò),且輸出為類屬數(shù)目。損失函數(shù)采用最小二乘準(zhǔn)則,其公式為

圖5 YOLO的訓(xùn)練流程Fig.5 The training process of YOLO

邊框回歸主要任務(wù)是從特征圖中預(yù)測(cè)出目標(biāo)框的位置和尺寸。為了實(shí)現(xiàn)該任務(wù),其在特征圖后串聯(lián)了一個(gè)5輸出網(wǎng)絡(luò)(分別為位置坐標(biāo)、尺寸高寬和置信度),并采用最小二乘準(zhǔn)則對(duì)該神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行訓(xùn)練,代價(jià)函數(shù)為

分類和邊框預(yù)測(cè)使得該網(wǎng)絡(luò)訓(xùn)練變?yōu)橐粋€(gè)多目標(biāo)最優(yōu)化問題,為了簡(jiǎn)化處理,將兩個(gè)損失函數(shù)合并寫為

非極大值抑制(Non Maximum Suppression,NMS)[20]主要用于解決同一個(gè)目標(biāo)中出現(xiàn)多個(gè)候選框的問題。其基本策略是選擇所有候選框中,目標(biāo)出現(xiàn)概率最大的一個(gè)作為目標(biāo)框,而丟棄掉其它與該框存在很大重疊,且類屬相同的候選框。為了實(shí)現(xiàn)該目標(biāo),首先從所有的檢測(cè)框中找到置信度最大的框,然后逐個(gè)計(jì)算其與剩余框的交并比(Intersection Over Union,IOU),如果其值大于一定閾值(重合度過高),那么就將該框剔除;然后對(duì)剩余的檢測(cè)框重復(fù)上述過程,直到處理完所有的檢測(cè)框。如圖6所示,當(dāng)IOU閾值過高時(shí)對(duì)knife識(shí)別了2次(圖6左),降低閾值后去掉了重復(fù)的檢測(cè)框(圖6右)。
由于成像過程中存在不同陣元接收回波之間相互串?dāng)_、掃描元器件需要補(bǔ)償?shù)墓潭ㄍǖ勒`差提前預(yù)估不精確等因素將會(huì)導(dǎo)致2維成像中出現(xiàn)較多干擾信息,這些因素降低了成像質(zhì)量,并一定程度上影響了安檢識(shí)別。因此,需要使用圖像處理方法對(duì)圖像進(jìn)行增強(qiáng),如進(jìn)行圖像銳化增加成像對(duì)比度,使用中值濾波、圖像平滑減小成像干擾噪聲等。

圖6 非極大值抑制算法去除重復(fù)預(yù)測(cè)框Fig.6 Removal of repeated prediction box by NMS algorithms
圖7、圖8為實(shí)測(cè)垂直掃描模式近場(chǎng)毫米波3維成像處理結(jié)果,系統(tǒng)工作于Ka波段,信號(hào)寬帶大于3 GHz,陣列長(zhǎng)度大于0.5 m,系統(tǒng)陣列方向分辨率和方位向分辨率約為1 cm,距離向分辨率約為5 cm,但由于采用了最大值投影,所以該方向分辨率未在圖像中體現(xiàn)。
其中圖7為最大值投影后的2維成像結(jié)果,驗(yàn)證了3維BP算法適用于近場(chǎng)安檢成像且圖像分辨率也較高,并證實(shí)了獲得3維成像后用最大值投影方法壓縮到2維平面的方法是有效的。但觀察發(fā)現(xiàn),該成像結(jié)果仍存在較為明顯的柵瓣,影響圖像觀感及后續(xù)識(shí)別的有效性。
圖8為經(jīng)過圖像處理方法后的成像效果。對(duì)于原始成像圖7首先進(jìn)行中值濾波處理減小圖像噪聲信息,然后使用圖像平滑抑制原始圖的重影問題并使圖片顯得均勻,最后使用圖像銳化處理增加成像對(duì)比度使得異物更為明顯。經(jīng)過以上一系列圖像后處理能夠有效減小干擾信息并增強(qiáng)圖像質(zhì)量,處理后的圖像更為勻稱平滑,噪聲較少,并且成像中的重影問題得到了很好的抑制,對(duì)于安檢中識(shí)別率的提高起到了較好的作用。

圖7 原始實(shí)測(cè)成像圖Fig.7 The original measured image

圖8 圖像處理后成像圖Fig.8 The image after processing

圖9 訓(xùn)練分類網(wǎng)絡(luò)的樣本Fig.9 Samples of training classification network
本文需要檢測(cè)的異物分別為:槍(gun),手機(jī)(phone)和刀(knife),訓(xùn)練集原始圖像大小約為800×300。對(duì)基于熱圖的檢測(cè)網(wǎng)絡(luò),需要從訓(xùn)練圖像中剪裁包含目標(biāo)(正樣本:刀、槍、手機(jī))以及非目標(biāo)(負(fù)樣本:噪聲背景以及身體各個(gè)部位成像結(jié)果)的小圖用于訓(xùn)練分類網(wǎng)絡(luò),小圖尺寸為128×128,見圖9。訓(xùn)練過程中平均損失以及準(zhǔn)確率如圖10所示,可以看出隨著迭代次數(shù)的增加,平均損失逐漸減小并趨近于0,而準(zhǔn)確率則逐漸提升并接近于百分百準(zhǔn)確預(yù)測(cè)。
而對(duì)于YOLO網(wǎng)絡(luò),本文在實(shí)驗(yàn)中將輸入網(wǎng)絡(luò)的訓(xùn)練圖片尺寸由800×300插值到608×608。訓(xùn)練過程中損失函數(shù)的變化過程如圖11所示,可以看出20000次訓(xùn)練后已經(jīng)完全收斂,訓(xùn)練模型已經(jīng)能夠擬合訓(xùn)練樣本,此時(shí),訓(xùn)練集樣本準(zhǔn)確率趨于平穩(wěn),測(cè)試集準(zhǔn)確率開始有所下降。為了避免過擬合,本文使用“早停”(early stopping)技術(shù)提前結(jié)束訓(xùn)練。對(duì)比兩種網(wǎng)絡(luò)的訓(xùn)練過程可以看出,相比基于熱圖檢測(cè)的分類子網(wǎng)絡(luò),由于復(fù)雜性更高,YOLO網(wǎng)絡(luò)的訓(xùn)練過程需要更多的迭代次數(shù)以及更長(zhǎng)的訓(xùn)練時(shí)間。

圖10 分類網(wǎng)絡(luò)訓(xùn)練過程中平均損失和準(zhǔn)確率Fig.10 The average loss and accuracy in classification network training

圖11 YOLO網(wǎng)絡(luò)訓(xùn)練過程中的平均損失Fig.11 The average loss in YOLO network training
在本文安檢成像及異物檢測(cè)的實(shí)驗(yàn)過程,本文將異物歸結(jié)為刀、槍和手機(jī)3類并訓(xùn)練YOLO網(wǎng)絡(luò)去實(shí)現(xiàn)異物分類檢測(cè)。為了得到檢測(cè)出異物并正確分類所需合適的尺寸大小,文中將幾組測(cè)試圖片輸入到訓(xùn)練好的YOLO網(wǎng)絡(luò)檢測(cè)之前,對(duì)圖片的尺寸做了一次調(diào)整。如圖12所示為其中一組的檢測(cè)情況,可以看出隨著尺寸從416×416增加到608×608(從左到右尺寸依次為416×416,480×480,544×544,608×608),檢測(cè)準(zhǔn)確率也隨之提高并且當(dāng)尺寸達(dá)到608×608時(shí)不存在漏檢的情況,驗(yàn)證了測(cè)試圖像尺寸在一定范圍內(nèi)越大則檢測(cè)準(zhǔn)確率和預(yù)測(cè)框精度也隨之改善。而且本文在訓(xùn)練YOLO網(wǎng)絡(luò)時(shí)也會(huì)將原始訓(xùn)練集每一張圖像的尺寸調(diào)整為608×608,這種情況也說明了將測(cè)試圖像輸入訓(xùn)練好的網(wǎng)絡(luò)前,調(diào)整圖像尺寸為訓(xùn)練圖像的尺寸608×608檢測(cè)性能最好,因?yàn)樵谕瑯酉袼乇壤膱D片中,測(cè)試圖片中異物形狀更加貼近訓(xùn)練集圖像中對(duì)應(yīng)類別的異物,所得到異物檢測(cè)準(zhǔn)確率也會(huì)更高,所以本實(shí)驗(yàn)中異物檢測(cè)最合適的尺寸大小為608×608。
圖13為連續(xù)經(jīng)過1000,5000,10000,15000和20000(由左至右)次訓(xùn)練后模型的測(cè)試結(jié)果。從圖中可以看出,隨著訓(xùn)練次數(shù)增多,模型的檢測(cè)和識(shí)別能力逐漸提高,預(yù)測(cè)框范圍不斷調(diào)整并逼近目標(biāo)的真實(shí)大小。在訓(xùn)練YOLO網(wǎng)絡(luò)時(shí)本文對(duì)160張圖像進(jìn)行了數(shù)據(jù)擴(kuò)充,包括對(duì)圖像隨機(jī)旋轉(zhuǎn)、隨機(jī)裁剪、隨機(jī)調(diào)整亮度和引入不同噪聲等,共生成了3300張圖像,其中70%的圖像作為訓(xùn)練集圖像,30%的圖像作為測(cè)試集圖像,經(jīng)過實(shí)驗(yàn)證明20000次訓(xùn)練后檢測(cè)平均精確率在90%左右,詳細(xì)測(cè)試結(jié)果表1。在評(píng)測(cè)指標(biāo)中,精確率可以理解為在預(yù)測(cè)結(jié)果中,正確被預(yù)測(cè)為正樣本的數(shù)量在所有預(yù)測(cè)為正樣本中的比例;召回率表示正確被預(yù)測(cè)為正樣本的數(shù)量占原始標(biāo)簽正樣本中的比例。分別求得每個(gè)類別的精確率和召回率,利用PR曲線計(jì)算積分面積即為每一類的平均準(zhǔn)確率(Average Precision,AP),mAP為各個(gè)類別AP的均值。

圖12 YOLO網(wǎng)絡(luò)檢測(cè)結(jié)果隨圖像尺寸變化情況Fig.12 YOLO network detection results of different image size

圖13 YOLO測(cè)試結(jié)果(不同訓(xùn)練次數(shù))Fig.13 YOLO test results (different training numbers)

表1 YOLO網(wǎng)絡(luò)檢測(cè)結(jié)果(%)Tab.1 The YOLO network detection results (%)
為了對(duì)比兩種方法在檢測(cè)過程中的效率,本文使用C程序?qū)Χ哌M(jìn)行測(cè)試,并在Intel core i7-7800、GTX1060計(jì)算環(huán)境下完成。對(duì)于800×300的輸入圖像,基于熱圖的檢測(cè)方法用時(shí)約200 ms(主要開銷為卷積網(wǎng)絡(luò)部分,對(duì)于800×300輸入圖像,需調(diào)用約300次網(wǎng)絡(luò)),而YOLO所需耗時(shí)不足50 ms,可見YOLO網(wǎng)絡(luò)在檢測(cè)效率要優(yōu)于熱圖方法。
如圖14所示,從隨機(jī)取出兩張圖片的不同網(wǎng)絡(luò)檢測(cè)方法試驗(yàn)結(jié)果來看,在檢測(cè)精度上,基于熱圖的檢測(cè)方法檢測(cè)框大小固定并且檢測(cè)范圍很大,相比之下YOLO方法能夠自適應(yīng)調(diào)整檢測(cè)框大小并精準(zhǔn)地框出刀、槍等異物,說明了檢測(cè)精度更高;在檢測(cè)的準(zhǔn)確率上,從圖14中可以看出熱圖方法存在一定程度上的漏檢情況,準(zhǔn)確率不如YOLO檢測(cè)方法;在檢測(cè)時(shí)間上,YOLO網(wǎng)絡(luò)的檢測(cè)時(shí)間遠(yuǎn)小于熱圖方法,檢測(cè)效率更高。對(duì)于目前安檢應(yīng)用,YOLO網(wǎng)絡(luò)的檢測(cè)時(shí)間很短,能夠更好地滿足人流量較大區(qū)域安檢實(shí)時(shí)性的要求,并且該方法較高精度和準(zhǔn)確率的優(yōu)點(diǎn)能夠有效地保障安檢區(qū)域的安全性,相比于熱圖方法,這些優(yōu)點(diǎn)使得YOLO網(wǎng)絡(luò)成為更適合安檢的檢測(cè)算法。
本文對(duì)主動(dòng)式毫米波陣列3維系統(tǒng)成像及目標(biāo)檢測(cè)問題進(jìn)行了研究。研究表明,后向投影算法由于其靈活性,可用于近場(chǎng)毫米波3維成像處理。基于熱圖的檢測(cè)方法和基于YOLO的檢測(cè)方法均可實(shí)現(xiàn)成像中的異物檢測(cè)。基于熱圖的檢測(cè)方法網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單、易訓(xùn)練,但由于需要遍歷整幅待檢測(cè)圖像,運(yùn)算時(shí)間長(zhǎng),且生成的檢測(cè)框尺寸固定,無法適應(yīng)異物尺寸變化。基于YOLO的檢測(cè)算法網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、訓(xùn)練耗時(shí)長(zhǎng),但該方法在檢測(cè)速度與檢測(cè)框精度上優(yōu)勢(shì)明顯,更利于機(jī)場(chǎng)安檢等對(duì)實(shí)時(shí)性要求較高的異物檢測(cè)應(yīng)用。

圖14 基于熱圖和YOLO檢測(cè)結(jié)果Fig.14 Test results based on heat map and YOLO