999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進的SSD行人檢測算法

2020-06-09 12:20:59姜敏王力王冬冬
軟件 2020年2期
關鍵詞:深度學習

姜敏 王力 王冬冬

摘 ?要: 針對行人檢測中檢測速度慢,不能實現實時性檢測的問題,提出一種改進的SSD(Single Shot MultiBox Detector)行人檢測算法。改進網絡通過調整基礎網絡中卷積層的數量,去除冗余的卷積層,降低模型復雜度,提高檢測速度;不同尺度特征圖進行預測之前加入殘差塊,進一步提取特征,提高準確率。提取PASCAL VOC數據集中的行人圖像和INRIA數據集形成混合數據集進行訓練,增加模型泛化性,實驗證明本方法擁有較高的精度和較快的速度,具有良好的泛化性,滿足實時性要求。

關鍵詞:?行人檢測;單發多框檢測器;卷積神經網絡;深度殘差網絡;深度學習

中圖分類號:?TP391.4????文獻標識碼:?A????DOI:10.3969/j.issn.1003-6970.2020.02.012

【Abstract】: To solve the problem that the detection speed is too slow to realize real-time detection in pedestrian detection, an improved SSD (Single Shot Multibox Detector) pedestrian detection algorithm is proposed. By adjusting the number of convolution layers in the basic network and removing the redundant convolution layers, the complexity of the model can be reduced and the detection speed can be improved. Residual blocks are added before different scale feature maps are predicted to further extract features and improve the accuracy. The person images of PASCAL VOC dataset are combined with INRIA dataset to form a mixed dataset for training, and the generalization of the model is increased. Experiments show that the method has high accuracy and speed, good generalization and real-time requirements.

【Key words】: Pedestrian detection; SSD; Convolutional neural network; Deep residual network; Deep learning

0??引言

近年來,隨著深度學習在在計算機視覺領域的成功應用,目標檢測也得到了快速發展。行人檢測是通用目標檢測中一個典型且最具挑戰性的問題,受到了社會各界的廣泛關注[1]。當前的深度學習模型在追求高精度的同時,導致網絡結構復雜化,需要高性能的硬件設備才能完成相關研究,所以構建輕量化網絡,可以減少模型的計算開銷,提升檢測速度,降低硬件成本。

行人檢測技術可以分為基于手工設計特征的方法和基于深度學習網絡特征的方法。手工設計特征如方向梯度直方圖(Histogram Of Oriented Gradient, HOG)、局部二值模式(Local Binary Pattern, LBP)等方法能很好的表征姿態各異尺度多變的行人特征,可變型組建模型(Deformable Part Model, DPM)更是拿下了PASCAL VOC行人檢測挑戰賽2006年度的冠軍。但是這類特征也有很明顯的不足,特征依賴人工設計,工作量大且對設計人的經驗要求高,設計的特征只局限于某幾種類型,對不同環境下的檢測任務不具有普適性。深度卷積神經網絡作為一種能自動直接從原始數據中提取抽象特征的特征提取器[2],在圖像處理、語音識別和自然語言處理等領域取得的成就引起廣泛關注。

基于深度學習的目標檢測方法可分為兩階段網絡和單階段網絡。兩階段網絡主要有R-CNN[3]、Fast R-CNN[4]、Faster R-CNN[5]、R-FCN[6]等,此類網絡在檢測精度方面表現優異,但是在檢測速度方面由于模型復雜度高,網絡參數龐大使得檢測速度緩慢。而以YOLO(You Only Look Once)[7]和SSD[8]為代表的單階段網絡,在檢測速度上有很大的優勢,尤其是SSD網絡檢測精度高,實時性好。但是SSD網絡復雜度依然很高,不容易訓練,對小目標的檢測性能不佳,容易造成漏檢和誤檢。針對以上問題,本文基于原始SSD網絡框架,調整基礎網絡部分的卷積層數量,減少特征的計算量,提升模型檢測速度;在特征圖進入檢測層之前融入殘差網絡,進一步融合特征,提高檢測準確率。

1 ?SSD算法

1.1 ?SSD網絡結構

SSD算法作為一種優秀的單階段通用目標檢測

算法,利用多尺度的檢測特性,使其能適應大目標和小目標檢測任務,SSD網絡結構如圖1所示,基礎網絡部分保留了VGG-16[9]的前五組卷積層進行淺層特征提取,隨后連接的是由VGG-16的前2個全連接層改成的卷積層即fc6層與fc7層,并額外增加4組卷積層,對淺層特征進一步提取,新增的每一組卷積層由1?1大小的卷積核和3?3大小的卷積核組成,前者負責降通道,后者負責增通道。原始圖像經過特征提取后,選取不同層的特征輸出進行預測,預測目標框的位置偏移以及類別置信度,最后經過loss層的非極大抑制(Non-Maximum Suppression, NMS)方式得到最終檢測結果。

1.2 ?區域候選框的計算

網絡中不同層次的特征圖具有不同的感受野(receptive field),即不同層次特征圖上的特征值對應于原始圖像不同尺寸的圖像塊[10]。在不同尺度的特征圖上設置不同的縮放因子來調整區域候選框的大小,以適應原始圖片上大小不一的目標。假設選取個特征圖進行預測,則每個特征圖中的區域候選框的尺寸計算如下所示。

2 ?改進SSD算法

2.1 ?基礎網絡部分

SSD方法采用VGG-16作為基礎網絡,網絡參數龐大,在特征提取過程中耗費了大量時間,很大程度上增加了硬件開銷,使檢測速度變慢,首先通過對基礎網絡部分的調整,以提高檢測實時性,調整后的網絡結構表1所示。

由表1中的參數與原始SSD的網絡參數對比可知,改進的基礎網絡部分去除每一組卷積層中重復的卷積層,Fc6和Fc7保持不變,額外增加一個卷積層Conv10,使卷積輸出的特征圖尺寸為1?1,新的每一個卷積組中只含有一個卷積層和一個池化層,在每一個卷積層后面量加入批量正則化BN(Batch Normalization)[11]層,平滑不同特征圖之間的偏差,以提高模型的魯棒性,BN層后使用非線性單元ReLU函數以加快模型的收斂。為了避免調整基礎網絡過后,特征提取不充分,模型的檢測精度受到影響,于是在作為預測輸入的特征圖進入分類與回歸之前,加上深度殘差塊作為附加特征提取部分。

2.2??附加特征提取部分

深度殘差網絡(Resnet)[12]是2015年何凱明等人提出的由殘差塊(Resblock)堆疊而成的深度卷積神經網絡模型,殘差塊有不同的結構及其變體,這里遵循文獻[13]提出的關于殘差塊的設計思想,殘差塊的作用是學習高級抽象特征,而基礎網絡中包含的低級特征則在高級檢測信息中保持原封不動。殘差塊的結構圖如圖2所示。

殘差塊中使用1?1大小的卷積核和3?3大小的卷積核交替連接,特征圖在第一個1?1大小卷積處進行降維,在第二個1?1卷積處做了還原,3?3大小卷積層能很好的表示模型的淺層特征,1?1大小和3?3大小的卷積層交替連接使得卷積層的輸入輸出通道數都減小,參數數量進一步減小,在殘差塊的層與層之間加入批量歸一化(BN)層和非線性激活函數,增加特征的非線性表達。加入殘差塊可以提升SSD框架的檢測性能,解決基礎網絡輕量化帶來的精度退化問題。

2.3??改進網絡結構

改進SSD算法的整體網絡結構如圖3所示,在文獻[14]中為了節約計算開銷,不。使用38?38大小的特征圖,但是會導致淺層特征提取不充分,所以這里與原始SSD類似,選取同樣大小的特征圖作為預測輸入,這里選取的是Conv4、Fc7、Conv7、Conv8、Conv9和Conv10,輸出尺度分別為38?38、19?19、10?10,5?5、3?3和1?1,原始圖片經過基礎網絡進行特征提取后,得到的不同尺度特征圖作為殘差塊的輸入,將殘差塊輸出的特征圖送入檢測層進行分類與回歸。

3??實驗分析

3.1??數據集

INRIA數據集是目前使用最廣泛的靜態行人檢測數據集,有正樣本和負樣本兩部分,其中正樣本共有902張圖片,614張圖片作為訓練集,包含行人樣本2416個,288張圖片作為測試集,包含行人樣本1126個,圖片中的人多為站立姿勢且高度大于100像素,數據集場景豐富,清晰度高,標注準確。

PASCAL VOC數據集是極具代表性的目標檢測數據集,很多經典算法都在該數據上完成訓練與驗證,數據集包含20 個檢測類別,人是20個分類中的一個,所以手動提取VOC數據集中的行人圖片參與訓練,提高模型的泛化性。

采用幀率(frames per second, FPS)來評估模型的檢測速度,幀率也叫每秒檢測數,等于處理一張圖片耗費的時間的倒數。

3.3??訓練過程

實驗設備配置如下,CPU為Intel i7-8700,內存為16G,操作系統為64位Windows 10,GPU型號為GTX1660Ti 6G顯卡,實驗框架為keras 深度學習開源框架。訓練和驗證損失如圖4所示。

網絡訓練使用優化算法為Adam,初始學習率為0.0001,迭代75000次。從圖4的迭代損失圖中可以看出,隨著迭代次數的增加,訓練損失在40000到次60000之間趨于平穩下降,并在70000次左右趨于收斂,驗證損失在60000次左右趨于收斂。

3.4??實驗結果與分析

(1)混合數據集和單一數據集使用評估

從VOC數據集中提取的行人圖片在這里叫做VOC person,將INRIA數據集和VOC person組成混合訓練集共同訓練,混合數據集中的驗證集為VOC數據集中的person 驗證集;INRIA數據集單獨訓練,混合數據和單一數據均在INRIA的測試集上完成模型評估。

由表2結果可以看出,測試集在兩個模型上的平均正確分別為88.5%和90.1%,混合數據集訓練的模型在平均正確率上較單一數據集訓練的模型有1.6%的提升,可見混合數據集能提升模型的檢測性能,這與文獻[15]中對于混合數據集能降低行人誤檢率的結論相吻合,所以下面的實驗在混合數據集上完成。

(2)改進SSD算法與原始SSD算法性能對比

本文分別對比原始SSD算法和改進SSD算法在混合數據集上的檢測性能,包括平均正確率和檢測速度。首先計算模型的檢測速度,隨機抽取10張圖片檢測,并分別記錄在兩個模型在batchsize=1時的檢測時間,結果如表3所示。

與表中檢測時間相對應的幀率如圖5所示。

從圖5中可以看出,原始SSD算法與改進SSD算法的檢測速度在第一張圖片處相差7FPS,在第8張圖片處相差了13FPS,改進SSD算法平均檢測速度為51.7FPS,原始SSD的檢測速度平均為41.6FPS,結合檢測精度,兩個模型在測試集上的綜合性能對比如表4所示。

由表4可以看出,改進SSD算法比原始SSD算法在檢測速度上平均高出10FPS,改進SSD算法在INRIA測試集上表現優異,取得了90.1%的平均正確率,但相比原始SSD算法的91.5%降低了1.4%,這是由于調整網絡結構時,去除了重復的特征層,犧牲了一點精度換取速度的提升,使模型具有更好的實時性。

4 ?結束語

為了解決行人檢測速度慢,檢測模型復雜度高,網絡參數龐大的問題,提出通過調整模型結構,刪除重復的卷積層,在卷積層之后加上BN層的改進方法,加快模型收斂,達到提升檢測速度的效果。調整基礎網絡過后,為了避免檢測精度退化,在特征圖進入預測層之前,加入殘差塊,對特征進一步提取,以提高模型的檢測精度。在同一測試集上對比了單一數據集訓練的模型和混合數據集訓練的模型的檢測精度,混合數據集訓練的模型檢測效果更好,能提高模型的泛化性與檢測精度。實驗結果表明,本方法檢測速度與原始方法對比有明顯的提高,具有良好的實時性,但犧牲了一點精度。下一步的研究方向,是在不明顯影響速度的前提下提升模型檢測精度。

參考文獻

黃同愿, 向國徽, 楊雪姣. 基于深度學習的行人檢測技術研究進展[J].重慶理工大學學報(自然科學), 2019, 33(4): 98-109.

Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553):?436.

R. Girshick, J. Donahue, T. Darrell, et al. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]. IEEE Computer Vision and Pattern Recognition, Columbus, 2013, 580-587.

GIRSHICK R. Fast r-cnn[C]//Proceedings of the IEEE International Conference on Computer Vision. Santiago, Chile: IEEE, 2015: 1440-1448.

Ren S, He K, Girshick R, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 39(6):?1137-1149.

Dai J, Li Y, He K, et al. R-FCN: object detection via region-based fully convolutional networks [C]// Neural Information Processing Systems. 2016: 379-387.

Redmon J, Divvala S, Girshick R, et al. You only look once: unified, real-time object detection [C]// Computer Vision and Pattern Recognition. 2016: 779-788.

Liu W, Anguelov D, Erhan D, et al. SSD: single shot multibox?detector [C]// Proc of European Conference on Computer Vision. Springer, 2016: 21-37.

SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [C]// Proceedings of International Conference on LearningRepresentations. ?[S.l.]: Computational and Biological Learning Society, 2015: 1-14.

邢浩強, 杜志岐, 蘇波.基于改進SSD的行人檢測方法[J].計算機工程, 2018, 44(11):?228-233, 238.

王華利, 鄒俊忠, 張見, 等.基于深度卷積神經網絡的快速圖像分類算法[J].計算機工程與應用, 2017, 53(13): 181-188.

He K, Zhang X, Ren S, et al. Deep residual learning for image recognition[C]//Computer Vision and Pattern Recognition. 2016: 770-778.

Kyoungmin Lee, Jaeseok Choi, Jisoo Jeong, and Nojun Kwak. Residual features and unified prediction network for single stage detection?[EB/OL]. arXiv preprint arXiv:1707.05031, 2017. https://arxiv.org/abs/1707.05031.

Wang R. J., Li X., Ao S. and Ling C. X. 2018 Pelee: A Real-Time Object Detection System on Mobile Devices?[EB/OL]. arXiv preprint arXiv:1804.06882. https://arxiv.org/?abs/1804.06882.

郝旭政, 柴爭義. 一種改進的深度殘差網絡行人檢測方法[J/OL]. 2019, 36(6). [2018-03-16]. http://www.arocmag.com/?article/02-2019-06-057.html.

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 欧洲高清无码在线| 毛片在线区| AV不卡无码免费一区二区三区| 狠狠色噜噜狠狠狠狠色综合久| 午夜影院a级片| 人禽伦免费交视频网页播放| 制服丝袜国产精品| 2020国产在线视精品在| 囯产av无码片毛片一级| 另类专区亚洲| 丰满的熟女一区二区三区l| 欧美午夜网| 久青草免费在线视频| 中文字幕欧美日韩高清| 成·人免费午夜无码视频在线观看 | 日韩一二三区视频精品| 成年片色大黄全免费网站久久| 亚洲浓毛av| 少妇被粗大的猛烈进出免费视频| 色呦呦手机在线精品| 免费A级毛片无码免费视频| 国产精品女主播| 日韩成人免费网站| 国产精品手机在线播放| 日韩a在线观看免费观看| 亚洲精品福利视频| 久久这里只有精品23| 久久亚洲国产一区二区| 99热这里只有精品在线播放| 色婷婷电影网| 国产麻豆永久视频| 性视频久久| 久久综合伊人77777| 无码人妻免费| 中文字幕无码中文字幕有码在线| 亚洲无码日韩一区| 精品福利视频导航| 播五月综合| 国产乱子精品一区二区在线观看| 欧美人与动牲交a欧美精品| 亚洲综合狠狠| 亚洲成年人片| 四虎永久在线精品影院| 99热国产在线精品99| 国产精品.com| 国产成人高清精品免费| 亚洲 欧美 偷自乱 图片 | 亚洲日韩精品欧美中文字幕| 色偷偷一区| 久久这里只精品国产99热8| 九九九精品成人免费视频7| 国产成人无码Av在线播放无广告| 人人看人人鲁狠狠高清| 波多野结衣一区二区三区88| 亚洲天天更新| 国产簧片免费在线播放| 国产区免费| 日日拍夜夜嗷嗷叫国产| 日韩高清一区 | 欧美日一级片| 国产香蕉在线视频| 天天摸夜夜操| 国产美女一级毛片| 毛片免费在线视频| 免费看美女自慰的网站| 欧美在线观看不卡| 国产精品黑色丝袜的老师| 午夜免费小视频| 国产尤物视频在线| 久久99国产视频| 都市激情亚洲综合久久| 亚洲精品无码av中文字幕| aⅴ免费在线观看| 免费一级毛片完整版在线看| 免费观看亚洲人成网站| 国产成人免费视频精品一区二区 | 一级成人a毛片免费播放| 久久精品国产91久久综合麻豆自制| 精品成人免费自拍视频| 日韩成人在线视频| 免费jizz在线播放| 免费看美女毛片|