沈子龍
摘 要:通常在相對復雜的場景下,會對入場車輛產生嚴重遮擋的情況,再加之部分車輛尺寸較小,所以車輛識別系統在識別車輛的過程中會存在別率低、虛警率高等難題。為了有效解決該問題,本次研究中提出一種基于深度學習的復雜場景下有效識別車輛的方法。可以根據場景當中車輛存在的特點,以可視化解析的方式分析公開數據集當中的標注性文件,運用深度學習對復雜場景下車輛進行有效識別。
關鍵詞:深度學習;車輛識別;應用
0.? 引言
我國城市化的不斷深入以及交通道路的快速發展使我國公路車輛的數量不斷攀升,進而造成城市交通擁堵、難停車等一系列負面問題。為了減輕這類問題的嚴重性,有學者提出使用深度學習法分析與調整城市交通和停車狀況,從而引發一定程度上的關注。
對于復雜場景下的目標識別方法,國內外學者提出了許多的內容和觀點。盡管如此,但是在車輛識別的過程中都會面臨著目標圖像背景復雜、尺寸相差大、遮擋嚴重等因素引起的目標識別率較低、虛警率高、實時性差等一系列問題。
在研究過程中,發現 YOLO v2利用回歸法可以實現車輛的分類與檢測同步進行,進而使車輛的訓練與識別實踐縮短。
為了滿足復雜的場景下有效識別車輛的需要,本次研究在 YOLO v2網絡模型基礎上提出深度學習的車輛識別方法,配合標注文件解析等方法規范數據集標注文件,確保學習樣本的準確性。在運用回歸的基礎上使計算速度得到提升。經過實踐應用最終得出結論,基于深度學習的車輛識別算法可以有效的提升車輛識別率,實用性較強。
1.? 深度學習基礎上的車輛快速識別方法
1.1???? 數據預處理
數據預處理的終于要內容包括對數據的裁剪、標注、批量規范、化、數據增強。
(1) 對標注文件進行可視化解析與調整
通過對攝像頭和網絡采集的數據進行人為標注,在深度網絡模型訓練當中可能會用到這些數據。
在本次研究中使用 LabelImg 法對每張圖片當中存在的車輛進行標注并整理訓練數據集,每張圖片現實汽車標注的工作完成以后,使用 Labe- lImg 法會在原圖目錄的基礎上,會生成與原圖相匹配的 xml 格式文件,在這個文件的內容中,對該圖片的路徑、標記框的相對位置、標記框內物體的類別等內容進行了明確的標注[1]。
如果發現需要標注的圖像當中車輛太小,就可以選擇放棄將次圖片加入到訓練集當中。
微軟公司的 COCO 公共數據集圖像無法實現對觀察標注框內部包圍車輛的實際情況進行清晰觀察。為了避免這種情況帶來的一系列負面問題,所以在本次研究編寫腳本的過程中可以用可視化分析方法處理公共數據集標注文件,重新標注漏標、誤標等一系列情況,進而使訓練數據集的質量得到提升。
(2) 增強數據
所謂的數據增強是在每一次訓練正式開始之前在特定范圍內旋轉、對隨即曝光度進行設計、對隨機飽和度進行設計。
通過增強數據等方式可以有效預處理訓練集,進而在最大程度上降低由于計算機視覺模型泛化產生的誤差。在實際的測試過程中,可以把同一輸入通過不同的版本傳遞到模型,模型比例的不同決定了模型輸出的不同,即通過集成法有效解決問題,泛化誤差程度被降低。結合傳感器的采集特點可以實現在將訓練集和驗證集融入到特定場景的圖像當中,由此場景目標識別的效果就會得到增強。
1.2???? YOLO 模型的物體識別方法
使用 YOLO 模型的物體識別方法可以實現對回歸問題進行求解,進而使原始圖像從輸入到輸出物體的位置與類別[2]。
使用 YOLO 模型的物體識別方法,無論是檢測還是訓練都是在一個獨立的網絡中進行的。 YOLO v2使用全新的網絡,常用的卷積核為3*3, 一次池化操作結束后,通道的數量就會出現翻倍增長。YOLO 模型的物體識別方法在使用的過程中可以引用 network in network 思想,將卷積核1*1穿插在卷積核3*3中間,使目標特征被壓縮。
YOLO v2技術的內部含有卷積層、最大值池化層,分別是19個、5個。最后一層網絡數量為13*13,相比曾經的7*7網絡,處理細粒度目標數量就會出現成倍增加,相比26*26的特征,與13*13實現同時決策,包括貢獻為雙層、SSD 網絡大于4層都是相等的,因而計算量增加程度并不顯著。
為了使 YOLO v2可以在任何尺度下進行任務檢測,有學者曾試驗使用分辨率不同的圖片使網絡的適應性得到提升,不過該方法只運用到了卷積層與池化層,如此一來在進行動態調整時將會更加有效[3]。
2.? 實踐與分析
為了證明上述分析的有效性,接下來通過 COCO 數據集和 PCAR 數據集分析與對比不同深度學習網絡模型識別性能[3]。
COCO 數據集是一種以微軟維護為前提的圖像數據集,可以進行一系列的機器視覺任務的數據集工作,包括識別對象、分割圖像、識別圖片中字幕等工作。
COCO 數據集具有較為強大的工作能力,可以處理圖像數量大于30萬、實例大于200萬、對象80大于類實現同時處理。本次研究中僅選擇數據集當中的一部分進行使用,數據集主要由兩部分組成,含其中車輛訓練圖8290張、車輛測試圖4051張,圖片分辨率全部都在640*640以下。
本次研究進行了三組實驗進行相互對比,在實驗中除了運用到 YOLO 以外,還運用到了 SSD 以及改良版的 COCO 算法,數據上行訓練集結束后,可以使用 COCO 測試集進行測試。
本次研究中運用到 YOLO、SSD、改良版 COCO 數據三種技術,通過三種算法對 COCO 數據集進行訓練,分別對同一張圖片進行測試,測試效果相對直觀,首先在 YOLO 、SSD、改良版 COCO 測試結果技術的基礎上觀察車輛識別效果,可以清晰的看出無論使用 YOLO 還是 SSD 模型進行圖片測試,均存在虛警現象,YOLO 技術會出現將多輛車與背景識別為一輛車的情況,SSD 技術車輛識別圖像當中會將公路、花壇、摩托車錯誤的識別為車輛。改良版 COCO 可以在一定程度上規避將其它目標或背景錯誤識別為車輛[4]。
經過實踐證明,改良版 COCO 增強了車輛識別精確強度,將虛警現象有效消除。
結論:
復雜場景下的車輛識別是長期以來對工作人員造成困擾的一項難題,本次研究從深度學習的角度出發對復雜場景下車輛識別方法進行研究。具體做法是針對傳統的 COCO 法文件進行重新標注,隨后使用 YOLO、SSD 以及改良版的 COCO 法對復雜場景下的車輛識別進行實踐分析,發現無論是 YOLO 還是 SSD 都存在將周圍的非車輛目標識別為車輛,進而增大了實驗誤差,最終結果顯示改良版的 COCO 法在復雜場景下的車輛識別工作中展現出更出眾的效果。
參考文獻:
[1] 石鑫,趙池航,林盛梅,李彥偉,薛善光,錢子晨.基于深度學習網絡模型的車輛類型識別方法研究 [J]. 筑路機械與施工機械化,2020,37(04):67-73+78.
[2] 程遠航,吳銳.基于圖像實例分割的行人車輛檢測識別方法[J].信息與電腦(理論版),2020,32(06):130-132.
[3] 石鑫,趙池航,張小琴,李彥偉,薛善光,毛迎兵.基于融合特征稀疏編碼模型的車輛品牌識別方法[J].筑路機械與施工機械化,2020,37(03):59-63.[4]朱文佳,付源梓,金強,余燁.視角相關的車輛型號精細識別方法[J].合肥工業大學學報(自然科學版),2020,43(02):205-210+279.
[5] 蘇婕,張磊,申欣,徐海豐.基于號牌識別數據的車輛出行鏈分離方法研究[J].汽車與安全,2020(02):88-91.
[6] 王也. 基于深度學習與虛擬數據的車輛識別與狀態估計研究[D].吉林大學,2019.