李大湘,辛嘉妮,劉 穎
(西安郵電大學 通信與信息工程學院,陜西 西安 710121)
隨著飛行器與通信技術的快速發展,無人機作為一種新型的拍攝工具,憑借獨特的拍攝視角,以及攜帶方便與成本低的特點,在民用和軍事方面得到了廣泛的應用[1]。面向無人機航拍影像,為了提高用戶對航拍內容的觀看效率,基于機器學習技術設計無人機航拍圖像目標檢測算法已經成為當今計算視覺領域中的一個新興研究分支[2]。
近年來,深度學習作為無人機航拍圖像目標檢測的主流方法,根據是否使用錨框相關算法可分為兩大類。基于錨框(Anchor-based)的代表性算法有Faster R-CNN[3],Cascade R-CNN[4],SSD[5]與YOLOv4[6]等。針對航拍圖像目標檢測的應用需求,Yang 等[7]提出了用于小目標檢測的QueryDet 網絡,設計了一種簡單有效的級聯稀疏查詢機制,有效地利用航拍圖像高分辨率特征,提高對小目標的檢測性能。Li 等[8]提出了一種Oriented RepPoints 空中目標檢測方法,通過引入靈活的自適應點,能夠捕捉任意方向實例的幾何信息。Liang 等[9]提出了一個稱之為DEA-Net 的動態錨點增強網絡,該網絡實現了基于錨的單元和無錨單元之間的交互式樣本篩選,以生成合格樣本,提高檢測小目標的性能。這類基于錨框的方法雖然在航拍圖像目標檢測中取得了較好的性能,但在檢測過程中要依賴于人工預先設置的錨框信息,不僅會增加模型超參的數量(如:錨框的數量、尺寸與高寬比等),還會增大參數調試的復雜性,即無法通過反向傳播進行端到端訓練,通常需要人為仔細地調整錨框參數才能獲得最佳的檢測性能。……