999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于輕量化SSD算法的行人目標檢測

2022-10-25 11:59:28錢雯倩
計算機仿真 2022年9期
關鍵詞:區(qū)域檢測方法

錢雯倩,王 軍

(蘇州科技大學,江蘇 蘇州 210332)

1 引言

隨著智能機器人技術的發(fā)展,機器人所發(fā)揮的作用不可估量,目標人物跟隨也成為其需要具備的重要功能之一。建筑物內部結構復雜,不確定因素非常多,如地面障礙物以及行人遮擋等,這對于人物跟隨機器人自主導航任務增加了困難。常用的障礙物檢測方法有激光雷達傳感器、超聲波傳感器檢測、紅外傳感器檢測和計算機視覺檢測等。計算機視覺檢測相比于其它障礙物檢測方法具有成本低、能夠有效利用環(huán)境中的顏色與紋理信息等優(yōu)點,所以目標檢測是實現(xiàn)機器人跟隨目標人物任務的關鍵技術。

目標檢測被廣泛應用于視頻監(jiān)控系統(tǒng)和其它領域。目標檢測是用于給圖像或視頻中存在的目標定位的主要技術之一。目標檢測的任務主要使用機器學習和深度學習的方法來檢測準確的目標。人類通過看圖像或視頻來檢測物體,如何讓計算機實現(xiàn)精確的目標檢測是現(xiàn)階段研究的熱點問題之一。

近年來,卷積神經(jīng)網(wǎng)絡在圖片分類和目標檢測領域取得了巨大的成功。常用的目標檢測算法大概可以分為三種:第一種是傳統(tǒng)的目標算法,首先采用滑動窗口,并且設置不同大小,進行區(qū)域選擇,然后利用SIFT、HOG等進行特征提取,最后將特征送入如SVM、Adaboost等分類器進行分類,實現(xiàn)目標檢測。這種方法在復雜場景下的檢測精度較差;第二種是候選區(qū)域/窗結合深度學習分類(通過提取候選區(qū)域,并對相應區(qū)域進行以深度學習方法為主的分類的方案,如:R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN等),其優(yōu)勢是速度快,但是均勻的密集采樣的一個重要缺點是訓練比較困難,這主要是因為正樣本與負樣本(背景)極其不均衡,導致模型準確度較低;第三種是基于深度學習的回歸方法,如YOLO、SSD、DenseBox等方法,以及最近出現(xiàn)的結合RNN算法的RRC detection,結合DPM的Deformable CNN等,通過深層卷積結構自動學習圖像的高階特征,從而生成更加精確可靠的檢測結果。

在目標檢測與嵌入式設備結合的過程中,在真實場景中人群密度不一致導致重復檢測,目標檢測模型太大,是需要解決的主要問題。基于此,本文提出基于SSD的輕量化檢測算法。1)減少篩選區(qū)域候選框以及選用自適應極大值抑制方法排除重疊檢測框,在人群密度不一致的情況下,提高了檢測的精度和速度。2)通過使用MobilenetV2網(wǎng)絡代替?zhèn)鹘y(tǒng)的VGG網(wǎng)絡進行特征提取,減少模型規(guī)模。

2 相關工作

2.1 SSD檢測算法

針對傳統(tǒng)目標識別中的問題,基于深度學習的目標識別檢測方法被提出,Ross Girshick等人于2014年提出R-CNN算法,這是首個將深度學習成功應用于目標識別檢測上的算法,Ross Girshick等人又于2015年提出Fast R-CNN,只對圖像進行一次特征圖像提取,但是這種方法生成候選框還是會耗費大量時間。同年,Ren等人提出了Faster R-CNN算法,改進生成候選框方法,利用區(qū)域建議網(wǎng)絡RPN(Region Proposal Network)生成候選框,比之前的方法快了將近200倍。2015年,Joseph Redmon等人提出了基于單個神經(jīng)網(wǎng)絡的目標檢測算法YOLO,這種方法檢測速度快,能夠滿足實時檢測的要求,但是對小目標以及遮擋程度高的物體檢測能力低,精度也比Faster R-CNN低。

SSD于2016年被Liu等人提出,是經(jīng)典的單階段目標檢測模型之一。它的精度可以媲美Faster R-CNN雙階段目標檢測方法,但速度卻比之間的檢測算法更快,達到了59FPS。SSD集合了Faster R-CNN的anchor機制以及YOLO的回歸思想。

傳統(tǒng)的SSD網(wǎng)絡結構采用VGG16作為基礎模型,其框架結構如圖1所示,在VGG16的基礎上新增了卷積層來獲得更多的特征圖以用于檢測,是一種多尺度特征地圖目標檢測算法。SSD算法利用不同尺度的特征映射來檢測不同大小的目標,并在后續(xù)的金字塔結構中為不同的特征映射選擇不同尺度的候選框。

圖1 SSD網(wǎng)絡框架

2.2 SSD損失函數(shù)

在SSD目標檢測算法中,如其它檢測方法一樣使用多任務的損失函數(shù),其損失函數(shù)定義為位置誤差(locatization loss,loc)與置信度誤差(confidence loss,conf)的加權和。

其損失函數(shù)為

(1)

其中,是候選框的正樣本數(shù)量;為類別置信度預測值;為候選框的所對應邊界框的位置預測值;為真實預測框的位置參數(shù)。

(,)為區(qū)域候選框在多類別置信度c上的softmax損失,其公式為

(2)

(3)

式(2)中分為兩個部分,一部分為正樣本()的損失,即除背景外被分類為某種類別的損失,另一部分為負樣本()的損失,即被識別為背景的損失。

(,,)為位置回歸函數(shù),其公式為

(4)

(5)

(6)

(7)

(8)

其中,(,)為補償后的候選框的中心,(,)為候選框的寬和高。

3 改進的SSD算法

3.1 SSD區(qū)域候選框

SSD的區(qū)域候選框借鑒了Faster R-CNN中錨點(anchor)的理念,每個單元設置了尺度或者長寬比不相同的區(qū)域候選框,預測得到的真實框是以這些區(qū)域候選框為基準的,在一定程度上減少了訓練難度。一般情況下,每個預測單元會設置多個區(qū)域候選框,其尺度和長寬比存在差異,然后根據(jù)每個候選框內預測的各類目標的概率以及區(qū)域候選框的位置偏移量對每個區(qū)域候選框進行置信度打分,最后經(jīng)過非極大值抑制NMS(Non Maximum Suppression)找出最有可能出現(xiàn)目標物的框,根據(jù)對應的偏移量來調整候選框最后的位置以及形狀,得到最終檢測框。區(qū)域候選框定義如下式

(9)

本實驗中,由于人的行為特征、生理特征可能出現(xiàn)行為姿態(tài)各異的情況,所以對區(qū)域候選框進行了尺寸上的設置。寬高比為2或3的候選框不符合實際情況,所以排除這兩個寬高比的區(qū)域候選框,此時每個單元格內就只有4個區(qū)域候選框。本文在不同層的特征圖上設置了不同的區(qū)域候選框,覆蓋住不同層上原圖上的不同大小的人或物體,這樣能夠更加準確的對目標候選框進行回歸,減少運算量及時間。

3.2 改進模型

傳統(tǒng)SSD算法使用VGG網(wǎng)絡,其網(wǎng)絡模型參數(shù)較多,且特征提取等操作需要GPU的強大算力做支撐,雖然其精度和速度都已經(jīng)達到了目前眾多目標檢測算法中較為可觀的程度,但是應用在沒有強大GPU的移動設備的嵌入式系統(tǒng)中,SSD算法還需要進行改進,由此,本文選擇MobileNetV2輕量化網(wǎng)絡代替原本的VGG網(wǎng)絡。

MobileNet網(wǎng)絡就是對卷積操作進行輕量化處理,使用深度可分卷積(depthwise separable convolution)來減少模型的參數(shù)量。其處理方式是將標準卷積分為深度卷積(dephwise convolution)和點卷積(pointwise convolution)兩個過程。深度可分卷積雖然大幅降低了計算量,但是在實際訓練時會出現(xiàn)很多訓練失敗的卷積核,所以在輸出特征圖時,它的維度也很小,它的特征圖在通過ReLU激活函數(shù)后會產生信息丟失。

MobileNetV2應用了如圖2所示的倒殘差網(wǎng)絡結構減少信息丟失。它首先對輸入的特征圖用1×1的卷積核進行升維處理,擴展數(shù)據(jù)中的通道數(shù)量,然后再用3×3的普通卷積進行特征提取,最后用1×1的卷積核進行降維,自動選擇有用的特征,減少參數(shù)數(shù)量。在倒殘差網(wǎng)絡中為了解決ReLU函數(shù)會丟失信息的情況,就只對高維的特征圖使用ReLU函數(shù),對低維的特征圖使用線性激活函數(shù)。由于本文是將識別算法應用于移動設備的嵌入式系統(tǒng)中,所以用ReLU6代替ReLU函數(shù),ReLU6能夠增強模型的穩(wěn)定性,整個結構中,特征圖在一系列處理后其大小維度都不會改變,所以能夠單獨使用在任意卷積網(wǎng)絡中,實現(xiàn)網(wǎng)絡輕量化。

圖2 倒殘差網(wǎng)絡結構圖

其中,經(jīng)過第一個1×1卷積后使用ReLU6激活函數(shù),經(jīng)過3×3卷積后,使用ReLU6激活函數(shù),最后降維得到的特征圖使用線性激活函數(shù)。

MobileNetV2網(wǎng)絡應用在SSD中如圖3,此方法結合了MobileNetV2網(wǎng)絡對模型計算量減少的優(yōu)點以及SSD算法本身對目標檢測速度塊以及精確度高的優(yōu)點,使得這個新的目標檢測模型在移動設備的嵌入式設備中得到高效率以及高精度的效果。這個模型使用了以MobileNetV2為特征提取網(wǎng)絡,SSD多尺度檢測方法來進行對不同大小物體的檢測,使用了五種不同尺度的特征圖,分別為19×19、10×10、5×5、3×3、1×1,這五個尺度特征圖生成不同大小比例的候選框進行預測回歸,最后通過NMS去除無用候選框,得到最終結果。

圖3 MobileNetV2網(wǎng)絡應用于SSD算法的模型結構圖

3.3 自適應非極大值抑制方法-Adaptive NMS

根據(jù)畫面目標識別出來的多個候選框出現(xiàn)重疊時,通過候選框的IOU值,排除其它重疊框,留下極大值的候選框。針對公共場所內,人流量密集稀疏程度帶來目標檢測效率低,容易出現(xiàn)人物重疊等問題,本文使用了一種判斷目標密集和稀疏情況的自適應非極大值抑制方法(Adaptive NMS),它在soft-NMS基礎上加了一個目標密度預測,其公式如下:

(10)

:=max()

(11)

(12)

其中函數(shù)是一個的函數(shù),會隨著的變化來增大減小分數(shù),即當與的值大于時,=1-或者=(-),為-中的抑制閾值,是的目標密度。該方法將抑制策略法分為三類情況討論:

第一種是當相鄰的框遠離目標時,使用;第二種,當位于密集區(qū)域時,則使用-,會被保留;第三種,當位于稀疏區(qū)域時,=(是一個更高的閾值)。

該方法相較于NMS與soft-NMS,其對于不同行人密度情況下,能夠自動改變閾值大小,其效率更高。

4 實驗與結果分析

4.1 實驗環(huán)境

本文算法的具體實驗使用的是深度學習框架PyTorch,實驗環(huán)境為Ubuntu16.04操作系統(tǒng),使用NVIDIA 1080Ti圖像處理器(GPU)運算。本文使用Caltech行人數(shù)據(jù)集進行訓練和評估。該數(shù)據(jù)集大約拍攝10個小時,分辨率為640×480,標注了大約250000幀,其中約120000幀圖像包含行人,350000個矩形框,2300個行人。本文選取Caltech數(shù)據(jù)集中set00-set05中的2000幀圖像作為訓練集。將訓練好的網(wǎng)絡在VOC2007的數(shù)據(jù)集上進行測試。

4.2 評價標準

由于應用的側重點不同,目標檢測算法的評估標準也有很多,本文使用精度檢測,檢測效率和模型大小對本文模型進行評估。采用mAP(mean average precision)來評估模型在行人目標檢測上性能的好壞,使用每秒檢測幀數(shù)FPS(frames per second)來評估檢測效率,使用MB(MByte)來評估模型的大小。通過實驗證明測試模型的各個性能。

4.3 實驗結果與分析

為了驗證本文算法的有效性,在真實場景中進行檢測實驗。實驗結果如圖4所示,在復雜的室內場景中,能夠對行人進行精確的檢測,不會出現(xiàn)重復檢測導致檢測框重疊的情況。

圖4 行人檢測

1)本節(jié)通過改變輸入圖像的尺度,評估檢測精度,檢測效率和模型的大小。如表1所示,改變輸入圖像的尺度對檢測精度,檢測效率的影響幾乎沒有;而提高輸入圖像的分辨率可以有效的提高網(wǎng)絡的檢測精度,其原因是因為隨著分辨率的增加,行人目標在圖像中的尺寸也隨之增加,提高了網(wǎng)絡的檢測精度。

2)為了與現(xiàn)在其它流行的目標檢測網(wǎng)絡做對比,證實實驗方法的有效性。本節(jié)在VOC2007測試數(shù)據(jù)集上對模型進行評估。其中Tiny SSD和Tiny YOLO是目前最流行的兩種輕量級目標檢測網(wǎng)絡。

表1 不同輸入尺度下的網(wǎng)絡實驗結果

實驗對比結果如表2所示。本文所提出的網(wǎng)絡結構SSD+MobileNetV2相比于傳統(tǒng)的目標檢測方法,在模型大小方面明顯優(yōu)于這兩種方法,更能適用于嵌入式的系統(tǒng)中。目標檢測的進度方面達到了71.8%,明顯優(yōu)于Tiny YOLO和Tiny SSD這這種輕量化的網(wǎng)絡模型,在模型大小上,本文提出的算法小于Tiny YOLO,Tiny SSD算法雖然模型參數(shù)更小,但是檢測精度方面較低。權衡目標檢測的評估標準,本文提出的網(wǎng)絡結構SSD+MobileNetV2的性能最好。

表2 不同檢測網(wǎng)絡精度模型對比

5 結論

本文針對嵌入式場景內的行人檢測的遮擋,存在障礙物和人流密度不同的問題,提出了一種基于SSD的目標檢測算法,實現(xiàn)了基于深度學習的輕量化目標檢測模型。以MobileNetV2為基礎的網(wǎng)絡,實現(xiàn)了網(wǎng)絡模型的輕量化。通過引入自適應極大值抑制方法,針對場景中不同行人密度,自動改變閾值大小,其網(wǎng)絡的檢測效率更高。

實驗表明本文提出的輕量化行人檢測網(wǎng)絡在Caltech數(shù)據(jù)集上的訓練結果在各項評估指標中表現(xiàn)更為優(yōu)秀,與其它的輕量化網(wǎng)絡模型相比,在檢測的精確性都更加優(yōu)秀。在未來的工作中將會在嵌入式的機器人方面進行進一步的實時測試。

猜你喜歡
區(qū)域檢測方法
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
小波變換在PCB缺陷檢測中的應用
關于四色猜想
分區(qū)域
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
基于嚴重區(qū)域的多PCC點暫降頻次估計
電測與儀表(2015年5期)2015-04-09 11:30:52
主站蜘蛛池模板: 在线国产91| 国产毛片片精品天天看视频| 国产麻豆精品在线观看| 国产毛片片精品天天看视频| 91久久偷偷做嫩草影院电| 亚洲国产一成久久精品国产成人综合| 91在线国内在线播放老师| 沈阳少妇高潮在线| 成人国产精品网站在线看| 中文字幕不卡免费高清视频| 午夜成人在线视频| 国产精品一线天| 波多野结衣一区二区三区四区视频 | 婷婷久久综合九色综合88| 香蕉eeww99国产在线观看| 亚洲一区毛片| 无遮挡国产高潮视频免费观看| 伊人大杳蕉中文无码| 午夜性刺激在线观看免费| 天天干天天色综合网| 激情影院内射美女| 美女视频黄频a免费高清不卡| 国产欧美日韩在线在线不卡视频| 91色在线视频| 91精品亚洲| 国产成人久久综合777777麻豆| 4虎影视国产在线观看精品| 四虎永久在线视频| 四虎永久在线精品国产免费| 自拍偷拍欧美日韩| 久久一色本道亚洲| 国产特一级毛片| 最新国产网站| 中文字幕亚洲第一| 国产麻豆精品在线观看| 97色伦色在线综合视频| 91色国产在线| 亚洲成人免费在线| 九色视频最新网址| 日本日韩欧美| 亚洲精品动漫| 青青青国产免费线在| 亚洲美女一区二区三区| 在线欧美日韩| 国产精品无码一区二区桃花视频| 国产精品hd在线播放| 日韩久久精品无码aV| 国产天天色| 国产小视频免费| 色欲色欲久久综合网| 91福利国产成人精品导航| 免费黄色国产视频| 免费观看无遮挡www的小视频| 亚洲永久视频| 午夜影院a级片| 四虎影视库国产精品一区| 精品久久高清| 伊人久久影视| 在线免费观看AV| 任我操在线视频| 精品久久久久久久久久久| 亚洲欧洲日本在线| 热九九精品| 先锋资源久久| 久青草免费在线视频| 女同久久精品国产99国| a天堂视频| 欧美福利在线播放| 丁香五月婷婷激情基地| 亚洲高清中文字幕在线看不卡| 成人在线不卡视频| 亚洲天堂免费观看| 91色国产在线| 男人天堂亚洲天堂| 无码国内精品人妻少妇蜜桃视频| 97se亚洲综合不卡| 人人看人人鲁狠狠高清| 亚洲免费福利视频| 成人av专区精品无码国产| 久久毛片网| 国产精品太粉嫩高中在线观看| 99草精品视频|