蔣镕圻 謝郭蓉
武警工程大學 研究生大隊 陜西 西安 710086
近年來在無人機技術不斷成熟無人機趨于小型化、智能化的背景之下,民用無人機市場成為整個無人機市場的主要成分。隨著我國對低空空域的逐步開放,民用消費級無人機使用數量逐年成指數增長,由此引發的無人機竊取隱私、擾亂航空秩序等事故也是逐年攀升,給公共設施和軍事等領域構成了巨大威脅。
自目標檢測這一概念提出以來,國內外學者針對這個問題做出了不懈的努力[1],有包括經典的運動目標檢測算法[2]和傳統的目標檢測[3],到現在流行的基于深度學習的目標檢測算法相繼被提出[4-5]。近年來,基于視頻的入侵無人機目標檢測已經有了初步的研究與應用,特別是在目標檢測算法上的不斷創新,使得檢測無人機這種弱小目標成為可能。
基于傳統方法的檢測通常包括經典的運動目標檢測和傳統的目標檢測的方法。
經典的運動目標檢測是尋找運動目標和靜態背景之間的差異進行檢測,主要包括光流法、幀間差分法和背景減除法。由于光流法[6]受光照變化等環境因素影響非常嚴重且復雜度較高難以滿足實時性,所以幀間差分法、背景減除法以及兩者的結合算法成為檢測無人機的常用方法[7],例如Li等人通過使用三幀差分法改善兩幀差分法存在的“空洞”等問題。運動目標檢測算法能檢測出運動的物體卻無法區分識別目標,同時幀間差分法與背景減除法都要求背景保持一致,特殊天氣下會出現極大的虛警,使得此類方法的使用受限。但由于此類方法能較快檢測出運動目標,所以多與傳統的目標檢測法結合使用。
傳統的目標檢測方法多基于滑動窗口搜索整張圖像提取候選區域,再提取區域的特征并輸入到分類器進行分類。此方法通過人為提取相關特征[3]并訓練出合適的分類器即可分類[8],例如Eren U等人基于無人機的SURF特征提高檢測效果,又通過提取無人機的傅里葉描述子特征實現無人機與鳥類區分。但此類方法需要人為提取相關的特征,在面對環境多樣性的條件下魯棒性較差;同時以滑窗搜索整張圖片再進行處理的步驟會帶來巨大的運算量,無法達到實時檢測的效果。
基于深度學習的目標檢測主要分為兩階段法和端到端的單階段法。
兩階段法遵循“候選區域+分類”的思路,在R-CNN網絡的基礎上不斷發展并應用于無人機的檢測[4],例如翟等人引入殘差網絡抑制深層次的卷積神經網絡中出現的難以收斂的問題。以YOLO模型為代表的基于端到端的單階段檢測由于其快速檢測的特性滿足無人機目標實時檢測的要求被眾多研究者引用[5]。也有研究人員針對兩者目標檢測的效果做出了對比,通過實驗證明基于候選區域的方法在檢測準確率和定位精度上占優勢,但檢測時間較長,而基于端到端一階段檢測方法雖檢測速度上較有優勢,檢測精度卻比不上前者。就目前深度神經網路趨向輕量化、實時化的趨勢來看,更多的研究人員更加側重于研究在一階段檢測算法的基礎上提升對無人機目標的檢測性能。
但基于深度學習的檢測算法需要大量的數據集做支撐,目前缺乏相關的公共數據集是研究入侵無人機目標檢測的基礎問題,大部分學者都是通過自己建立小樣本實現對深度神經網絡的訓練,都是對簡單背景下的單一無人機進行檢測,并不能滿足實際的情況要求。
雖然目前研究人員提出了多種無人機的檢測方式,但上述檢測多處于簡單背景下的研究,并沒有實現在光線不充足、有飛鳥干擾、城市高樓等干擾物龐雜的復雜環境下的檢測;同時無人機數據集的不足是基于深度學習檢測方法的硬限制,而傳統的目標檢測雖然在小的數據集中性能良好,但其巨大的計算量嚴重影響了實時性要求。目前擴大無人機數據集,研究適合檢測無人機這類小目標的輕量化深度神經網絡是目前對入侵無人機目標檢測算法研究的主要趨勢。