吳 亮 梁 振 張燚鑫 王子磊
(1.安徽醫科大學生物醫學工程學院 合肥 230000)
(2.合肥綜合性國家科學中心人工智能研究院 合肥 230000)
目標檢測作為車輛自動駕駛的核心技術,也是計算機視覺的基礎任務,廣泛應用于工業檢測[1]、智能駕駛[2]、醫學圖像診斷[3]等諸多領域,具有重要的現實意義。在實際的交通場景下,由于采集的數據通常呈現長尾分布,訓練時分類器各類別性能失衡,導致檢測精度下降問題。因此解決樣本不平衡帶來的性能損失問題是交通多目標檢測算法的關鍵,也是目標檢測領域的研究重點。
目前主流的數據集(例如Pascal VOC[4]和COCO[5]等)經過人工篩選后,各類別的樣本數量相對均衡。交通場景下的數據通常呈現長尾分布,各類別樣本數量失衡,導致檢測器出現精度損失。性能損失主要來自兩個方面:首先,訓練集中沒有充足的尾部類別(樣本很少的類)樣本,難以讓模型在訓練過程中充分學習尾部類別的特征[6],引起尾部類的精度下降;其次,訓練集中的頭部類別(具有許多樣本的類)的樣本占較多比例,模型的分類器會偏向于頭部類。
當前長尾學習的主流方法是數據重采樣和代價敏感學習。數據重采樣旨在通過對訓練數據中尾部類的樣本進行多種采樣,讓各類樣本數量接近。Wang 等[6]提出的動態課程學習采用一種動態采樣策略,在訓練過程的后期根據動態策略采用更多的尾部類樣本,讓模型學習數量相近的不同類別樣本。Kang 等[8]提出的LWS 通過多個不同的采樣策略訓練表征模塊和分類器,以獲得泛化性更好的表征模塊和更加平衡的分類器?!?br>