胡文杰,雷兵強
(咸陽職業技術學院 陜西 咸陽 712000)
目前,基于深度神經網絡的計算機視覺技術通過模擬生物視覺,使用經過訓練的神經網絡模型來執行多項任務,例如圖像分類、圖像分割和目標檢測等。計算機視覺的主要應用領域是無人駕駛,幾乎所有的路徑規劃和無人化控制都需要借助計算機視覺技術來實現,通過將基于神經網絡的計算機視覺任務的結果輸入到路徑規劃、導航算法中,求得最優和避障路徑。如果在無人機上加載一個有效的計算機視覺系統和決策系統,那么無人機將擁有與人類相仿的眼睛和大腦,在多維復雜的環境中,可以實時有效地檢測到周圍的物體并進行目標檢測、物體分類、障礙物劃分、危險等級劃分等處理,從而在路徑規劃問題上及時做出最佳決策。
計算機視覺包含許多復雜的任務,這些任務可以切分為語義分割、實例分割、圖像分類和目標檢測等基本任務。它們的簡單定義如圖1所示。

圖1 計算機視覺任務
(1)語義分割需要預測所輸入圖像的每個像素屬于哪種類型的標簽。
(2)實例分割還需要在語義分割的基礎上確定同一類型不同個體的具體個數。
(3)圖像分類需要預測圖像中物體的類別。
(4)目標檢測需要在圖像分類的基礎上進一步識別物體的位置。
目標檢測是一項比較實用且極具挑戰性的計算機視覺任務,可以看作是圖像分類和目標定位的結合。給定一張圖片,目標檢測系統需要識別圖片中指定對象的類別并給出其位置。……