張向清 楊銳 白濤 王金妮

摘要:本文擬建立道路交通中視頻目標檢測所使用的數據集,用通用的樣本標注規則,完成高速公路場景中小車、卡車、大巴車和行人4類目標的標注,對不符合要求的數據進行刪選,創建的數據集在不同場景下具有很好的魯棒性。
關鍵詞:自制數據集;樣本標注;標注規則
中圖分類號:TP181 文獻標識碼:A 文章編號:1007-9416(2020)02-0035-01
在視頻目標檢測領域,數據集的質量好壞對檢測結果起著至關重要的作用,當前,各種通用數據集由于涉及的應用領域多、覆蓋面廣,致使對于特定的道路場景并不適用。現有通用數據集包括ImageNet、Microsoft COCO、Pascal VOC等[1],其中ImageNet數據集包含各類目標共600萬張,是當前大數據領域最全最完整的數據庫,并且每個目標數據經過標注和處理,但其大多數樣本采集源于國外的道路場景且目標形狀與國內的大相徑庭。另外,Microsoft COCO數據集主要應用于圖像分割和對場景中目標進行加字幕標注,微軟公司實現的核心功能是完成圖像中目標的分割和場景語義描述等功能,這樣標注的數據集顯然并不適用目標檢測領域。其次,Pascal VOC數據集[3]是最早應用于視頻目標檢測領域,VOC數據集因其具有圖像質量好、標注完備、樣本量適中的特點,作為自制數據集的標注和評估的基準數據集,但其所包含每一類樣本較少,容易發生過擬合現象。因此,結合目前流行的數據集的標注方法,制定特定場景下的專用數據集勢在必行。
1 現有交通數據集的優劣
通用數據集由于其適用場景較多,致使對每一類目標的檢測精度并不高。因此,一些研究機構建立了專有的數據集滿足部分應用場景,比如應用于自動駕駛領域的KITTI數據集[2],它所包含的數據樣本大多來源于行車記錄儀的視頻或者采用平行視角方式獲取樣本資源,其標注樣本的格式和規則并不適用于攝像機角度較高的樣本;另外,Udacity數據集和CityScape數據集等優化了樣本的多樣性,但其標注的樣本大多應用于目標分割和語義分析,如果將其應用于目標檢測領域,需要重新進行樣本的標注,額外增加了工作量。因此,對于復雜的交通場景,建立自己的專用數據集是必不可少的。
2 數據集的制作方法
2.1 攝像機采集樣本
為了實現在高速公路場景下采集樣本,需要在高速路邊架設相對較高的攝像機裝置(通常約為10米左右),并利用遠程控制來拍攝視頻或圖像。在采集視頻中目標時,可以通過軟件來控制攝像機的角度和方向。安裝好攝像機裝置后,可以在云端等間隔時間段內獲取視頻流,這些視頻流可以分為:不同時段的視頻流、不同天氣狀況下的視頻流、不同比例的視頻流和交通異常下的視頻流。獲取的視頻流,將其轉換為不同時間幀,其中對于一些無效的幀進行剔除,保留那些目標清晰可見的幀,挑選好的樣本需統一格式,并進行可行性測試和分析,最后選出場景豐富、樣本特征明顯的數據。
2.2 虛擬仿真樣本
目前,隨著大數據和虛擬現實技術的日趨發展,可以對已有樣本數據進行分析,并將其轉換為不同特征的樣本。尤其是深度學習模型的訓練需要大量的樣本,由于設備和技術的不成熟,短暫時間內無法采集到更多可靠有效的樣本。因此,可以利用現有的網絡資源和編程開發平臺,合成一些不常用或者現實生活中不存在的樣本分布特征,并對圖像中的顏色紋理特征進行修改,增加樣本的豐富性。
2.3 目標選取范圍
整理好的數據樣本需要進行目標的標注,對于不同的應用場景,其標注方法和規則不盡相同。本文為了提高檢測的準確度,需對高速公路場景下對樣本進行精細標注,在劃定的區域內將同一目標進行大小分類,具體實施方法如圖1所示:
(1)為了能從攝像機采集的視頻中分出時間和地點,加入一些標記信息,但會造成目標樣本的遮擋,因此1號場景內不選取樣本。
(2)選取的樣本盡可能大、清晰,將相機角度轉到合適位置,如圖1所示的2號區域,標記此區域的所有樣本。
(3)不同的文獻中對于遠處的小目標有不同的標注方法,本文著重檢測近場景的目標,因此3號區域的小目標暫不進行標注。
(4)另外選取的部分視頻流中目標較擁堵,影響最后的檢測效果,所以提前剔除包含擁堵場景的樣本。
3 實驗結果
本文起初標注樣本采用photoshop軟件選取目標矩形框,并將矩形框的位置信息保存,然后利用算法實現標注文件的生成,但由于選取矩形框容易出現反選的錯誤,致使在訓練模型時很難發現問題。因此,后期采用LabelImg標注工具,直接在選中目標后生成標注文件,提高了標注的效率和成本。
4 結語
本文以高速公路場景為研究對象,針對場景內的數據樣本,實現樣本的獲取,樣本的標注以及樣本的擴充。創建的數據集,經過訓練模型,其檢測的平均準確率達到92%,但是由于目標樣本分辨率為1920×1080,導致訓練過程十分緩慢,檢測速率只能達到6.8fps。因此,后期主要研究方向為如何將樣本分辨率降低提高檢測速度,并對數據集做進一步的優化,形成統一標準的文檔。
參考文獻
[1] 張向清.高速公路場景下基于深度學習的車輛目標檢測與應用研究[D].西安:長安大學,2018.
[2] 宋煥生,李瑩,楊瑾,等.基于高速公路場景的車輛目標跟蹤[J].計算機系統應用,2019,28(6):82-88.
[3] 張向清.基于深度學習方法的復雜場景下車輛目標檢測[J].計算機應用研究,2018,35(4):1270-1273.
Construction of? Datasets Based on Deep Learning in Highway Scenarios
ZHANG Xiang-qing,YANG Rui,BAI Tao,WANG Jin-ni
(School of? Mathematics and Computer Science, Yan'an University, Yan'an? Shaanxi? 716000)
Abstract:This paper intends to establish a data set used for video target detection in road traffic, and use common sample labeling rules to complete the labeling of 4 types of targets: cars, trucks, buses, and pedestrians in highway scenes. Deletion, the created data set is very robust in different scenarios.
Key words:homemade data set; sample labeling; labeling rules