趙年年,郭 翔
跟蹤算法是計算機視覺領域中的重要研究內容,隨著卷積神經網絡和濾波等新興技術的出現與融合,提高了整體研究水平。在深度學習技術背景下,跟蹤算法的應用范圍得到了進一步擴展,包括人流量分析、醫療圖像、異常行為識別、智能控制、人機交互等方面,文章就此針對目標檢測跟蹤技術進行了系統研究。
當下,跟蹤算法和檢測算法相比,在檢測實時性上還存在較大的不足之處,為此在跟蹤領域中應用相應的檢測方法能夠進一步提高跟蹤算法速度。
從當下實際發展狀況分析,大部分物質檢測方法都是以水平檢測方法為主將目標置信度較高的區域,但因為水平框對于各種不規則的形狀目標而言,并不適用于各種方向。為此檢測邊界框內覆蓋了各種和真正目標沒有任何聯系的區域,影響了檢測性能。針對該種問題,文章以最小的目標邊界框劃分方法為基礎,盡量降低邊界框范圍中的各種影響因素,從而提高后期場景跟蹤過程中的應用效率。
跟蹤任務即在某視頻序列初始幀位置和目標區域范圍給定的條件下,對后續幀中的目標位置和范圍進行準確預測。在將初始化目標框輸入后,還會于下一幀內出現各種候選框,并對各種候選框的突出特征進行合理提取,隨后為候選框進行科學評分,便在評分中選出最高得分的候選框,將其當成預測目標,或結合多種預測值進行融合獲得最優預測目標[1]。
目標跟蹤具體可以分成五種研究內容:第一是選取運動模型,并在相關運動模型的基礎上生成各種候選樣本。第二是提取運動特征,即將某些特征當成主要特征。第三是集成調優方法,即將多種決策有機融合起來,從而獲得一種優質決策結果。
通常情況下,創建出來的學習網絡層次較多,為此其中也包含多種學習參數,針對該種現象,需要保證訓練樣本的充足性,從而能夠有效預防出現擬合現象。此次實驗主要是以有限數據集為目標,通過隨機擴展數據方法,結合現有數據集,把數據集內的人放置于各種背景當中,并通過仿射變換,具體如下面公示所示,對目標的傾斜角度合理矯正過來,不但能夠促進數據集的有效擴充,同時還能夠避免扭曲、復雜背景下出現錯檢和漏檢等問題。結合通用行人檢測相關數據庫對檢測模型實施訓練檢驗[2]。
跟蹤部分主要利用TLD 框架,把跟蹤劃分為幾種不同的模塊[3]。第一部分是優化后的光流法跟蹤裝置,其主要負責對檢測裝置檢測目標進行跟蹤,結合光流特征,利用下面公式確定下一幀中目標跟蹤位置。第二部分屬于檢測部分,即前面所應用的離線訓練模型和檢測裝置可以通過實施在線微調進一步提升模型整體精度,同時該部分主要是在跟蹤視野內負責檢測目標,隨后聯系相應的跟蹤位置,對跟蹤器進行合理矯正,結合最優結果獲得目標最終實時位置。第三部分屬于在線學習模塊,該模塊中主要是通過8維空間,將某一時刻中的目標狀態刻畫出來,而這八位空間便是目標中心坐標,估測目標速度、高度值、長寬比。具體公式如下:

在實施訓練中,結束大模型的訓練工作后,利用CONFIG 文件能夠發現權值較小的一邊,并將其徹底去除,隨后繼續訓練模型。讓部分邊共用相同權值,使其能夠滿足縮減參數的個數要求。假設相鄰兩層屬于處于全連接模式,每層中的節點個數是1000個,則兩層便有1000×1000=100萬個權重參數。把一百萬個權值當成聚類,結合各類均值替代該類中的各個權值大小,而同一類中的多個邊可以共享相同權值,并利用量化處理措施縮減模型大小,神經網絡模型相關參數主要是通過長度為32bit 的浮點型數進行表示,但其實無需維持如此高的精度,比如通過0到255表示32個bit 原本所代表的精度,通過精度犧牲降低權值占用空間[4]。
經過反復的模型壓縮操作后,模型大小程度也從原來的30M 減少到6M,進一步縮減了模型空間,為嵌入式設備穩定運行提供了更多便利。
此次主要把目標檢測和跟蹤技術放置于公交車系統中對乘客流量進行實時統計。
結合通用數據集訓練模型對人體目標進行準確識別,對測試集與訓練集進行合理劃分,繼續擴展訓練集,XML 文件數據將目標識別圖片類型有效裁剪出來,并按照9比1的比例對測試集與訓練集進行合理劃分,在裁剪的過程中,還需要針對訓練集圖實施擴增,合理統計訓練集圖片具體尺寸,掌握三通道平均值。結合RGB 三通道最終平均值對圖像實施灰化度處理,從而幫助我們對各種干擾因素進行有效處理,提升整體召回率和準確率[5]。
因為對乘客流量進行檢測的過程中,只需要對有效范圍中的目標人體進行檢測跟蹤即可,所以在線預訓練的過程中僅需要區分人與背景目標的檢測模型即可。實施在線跟蹤的過程中,利用學習模塊對模型進行微調,具體如圖1所示。

圖1 在線微調數據LOSS實況
學習系統能夠在多種候選框內利用跟蹤器對位置評分,計算得到置信度,并將那些低評分的候選框徹底刪除,將最高測評分結果的候選框當成ID下一刻的實時位置目標,即對ID 初始位置進行跟蹤,在脫離有效范圍后,ID 的TRACKER 便失去效用,依次循環,從而能夠實時在線跟蹤系統中所呈現出來的公交車流動人數,為公交司機和交通人員進行資源配置提供可靠的參考依據[6]。最后通過測試,能夠發現視頻設備中所嵌入的模型能夠達到每秒42幀的監測速度,具體如圖2所示。
綜上所述,本文通過相關檢驗最終實現了通過匹配跟蹤目標和檢測結果,實現多個目標同時跟蹤的目的,有效降低復雜環境下的跟錯和跟丟問題,不但可以促進嵌入式設備運行速度的有效提升,同時還能夠達到在線準確實時跟蹤目標的目的。