朱婷婷
摘要:目標檢測是電子計算機所涉及的一個課題之一,且具有一定的挑戰性。本文基于深度學習的單步目標檢器特征增強算法展開了討論和實驗,希望能夠有效的促進我國電子計算機應用技術的進一步發展。
關鍵詞:單步目標檢測技術;特征增強算法;深度學習
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2019)06-0132-01
0 引言
眾所周知,主觀判斷是與所接受的視覺信息相互聯系的,而對于人類來說,圖像以及動態視頻能夠清晰的將信息進行有效的表達和傳遞。因此,在新的形勢之下,對目標檢測技術進行更深層次的研究具有一定積極的意義,能夠促使我國進一步有效的實現城市交通智能化、工業檢測智能化、航空航天智能化。在目標檢測技術的研究基礎上,能夠對圖像進行有效的處理,從而將出現在圖像動態視頻中的目標物以最短的時間檢測出來。根據相關研究表明,在目標檢測系統中,要想進一步有效的實現實時性和魯棒性,是具有一定困難。對于魯棒性來說,無法對目標人群的行為軌跡進行有效的預判,需要將環境中的不確定因素進行考慮;而實時性是系統所必須具備的基礎性能,鑒于該系統的圖像處理方法不能過于復雜,本文在傳統的行人特征基礎上,對單步目標檢測技術展開了課題性研究。
1 單步目標檢測器特征增強算法的相關概述
行人單步目標檢測算法是電子計算機進行視覺領域中的研究課題之一,為進一步有效的實現該項計算,需要在原有的計算體系基礎上將圖像處理、模式識別、機器學習等相關專業技術進行添加。就目前來說,進行單步目標檢測便是通過特征加強機器學習的方式來展開研究,并將機器學習的算法進行有效的創新和優化,以達到課題研究目標。但是對于單步目標檢測算法來說,仍舊存在許多不足和可改進之處[1]。(1)行人外形特征無法確定,圖像中的目標人群會因為穿著的改變而在形象上發生改變,當目標行人與行人之間的距離發生改變后其大小特征同樣會隨之發生改變。(2)行人所處的環境發生改變也會影響檢測算法的準確性和穩定性,一般來說,影響因素為客觀環境、自然環境等等。(3)單步目標檢測算法一般都是應用到視頻監控中,這也就意味著目標點會隨時處于動態化,需要在實際應用過程中具有實時性。
2 單步目標檢測器特征算法
2.1 傳統目標檢測算法
目標檢測是電子計算機進行視覺領域研究的重要課題之一,也是最為基礎的項目,其主要研究目標在于能夠對圖像或動態視頻中的目標進行精確的定位或分類。就傳統目標檢測算法來說,在較長的一段時間段,都是以可變形組件模型算法為基礎算法。隨著信息技術的不斷創新與發展,在傳統目標檢測算法基礎上進行了計算法的研究和應用,逐漸形成了更多具有優勢的計算方法。
2.2 基于卷積神經網絡的單步檢測算法
為進一步有效的提高現代化網絡效率,相關研究學者提出了一種基于卷積神經網絡的檢測計算方法,即YOLO網絡。在新的網絡環境中,能夠以更快的速度來對所鎖定的目標人群進行精準定位和分類。該網絡更進一步在所有卷積層中加入批標準化概念,并應用卷積網絡取代傳統意義上的全連接層,支持邊框預測功能的實現。除此以外,SSD網絡以Anchor Box為基礎,支持多個特征層的同步性預測。同時,為進一步有效保證單步檢測計算正確率,該項網絡要對損失函數進行有效的規劃和設計,從而將極端樣本所存在的種種問題進行及時的解決和優化,盡可能的將其所有優勢都展現出來[2]。
3 網絡架構
3.1 單步目標檢測器SSD
在卷積層基礎上進行SSD網絡構建。SSD網絡系統中進行了采樣卷積層的添加,被添加的卷積層、基礎網絡層都被應用到邊框預測中,用于確定置信度和目標實際偏移量。所有預測出來的數值都將由兩個獨立的卷積層所產生,對于每一個卷積層來說在其邊框回歸上會產生四個數值,并產生不同類別的置信度,最后采用相關的計算法對所有數據進行準確的計算。
3.2 具有方向性的特征提取塊
在對網絡結構進行特征提取時,常常采用的是級聯的方式來輔助網絡的計算與檢測,并對加深層網絡展開采樣活動。因此,對于這一類結構來說,為準確獲取到目標圖片的基礎信息或語義信息,需要在網絡深度的基礎上進行有效的提取,才能夠為目標群體的信息分類提供一定的幫助。但是,隨著網絡深度的不斷加深,很有可能會將目標信息所要獲取的信息弄丟,且在準確性上也無法保證。但是,對于多尺度的預測來說,整個信息數據預測過程中都沒有將尺度特征進行有效的關聯。特征層的卷積將特征提取的方式進行了統一,因此,所提取到的信息及圖片特征在各個方向上不具備差異性[3]。
3.3 多尺度預測
將特征提取模塊與多尺度特征進行有效的融合,仍然需要進行特征圖金字塔的建立,從而有效的實現對于數據進行多尺度的預測。因此,在進行研究過程中,將特征金字塔加入到其中,并對大小不同的每層特征圖進行多尺度預測。
3.4 網絡訓練
為了構建魯棒性強的模型,在數據擴增方面,與經典SSD的方法基本一致,通過對原始數據進行隨機裁切、翻轉操作,來擴充訓練數據集。為了檢測具有不同寬高比的各類物體,本文設置了具有5種不同寬高比的默認檢測框,與經典SSD的一致,分別是1、2、3、1/2、1/3。實際中,以默認檢測框為中間變量,來實現檢測框與預測檢測框之間的轉換。在準備訓練數據時,需要將實際檢測框與最符合的對應起來,形成從實際檢測框與默認檢測框的對應[4]。
實際訓練中我們發現預選框與真實框經過匹配后產生的負樣本(沒有匹配到真實框的預選框)數量一般要遠大于正樣本(匹配到真實框的預選框)數量,這種正負樣本不平衡會導致網絡預測值向負樣本靠近以及網絡難以收斂等問題。因此算法訓練時將負樣本按照置信損失進行排序,選擇排名靠前的負樣本作為訓練,使得正負樣本數量平衡(一般指定正樣本和負樣本的比例達到1:3),提升網絡分類性能。
4 結語
綜上所述,隨著深度卷積神經網絡的不斷發展與應用,人們對于目標檢測算法的準確率有著越來越高的要求,作為電子計算機視覺領域的研究課題之一目標檢測技術面臨著巨大的挑戰與全新的機遇。本文提出了一種基于深度學習的單步目標檢測器特增強算法,能夠在保證數據計算準確率的同時保證系統的及時性。
參考文獻
[1] 寇大磊,權冀川,張仲偉.基于深度學習的目標檢測框架進展研究[J].計算機工程與應用,2019(11):25-34.
[2] 路雪,劉坤,程永翔.一種深度學習的非機動車輛目標檢測算法[J].計算機工程與應用,2019(8):182-188+214.
[3] 師燕妮.基于深度學習目標檢測與跟蹤技術的研究[J].電子設計工程,2019,27(6):59-63.
[4] 袁明新,張麗民,朱友帥,等.基于深度學習方法的海上艦船目標檢測[J].艦船科學技術,2019(1):111-115+124.
Feature Enhancement Algorithm of Single-step Target Detector Based on Deep Learning
ZHU Ting-ting
(Gaoxinxing Science and Technology Group Co., Ltd. , Guangzhou Guangdong? 510530)
Abstract:Target detection is one of the topics involved in computer, and it is challenging to some extent. In this paper a one-step target detector feature enhancement algorithm based on in-depth learning is discussed and experimented, hoping to effectively promote the further development of computer application technology in China.
Key words:single-step target detection technology; feature enhancement algorithm; in-depth learning