周正浩,曹 兵
(南京理工大學 機械工程學院,江蘇 南京 210094)
圖像處理技術是利用計算機對圖像信息進行處理的技術,其熱門研究課題——目標識別已在航天和航空技術、生物醫學工程、通信工程、工業和工程、軍事和公安、文化與藝術等方面獲得了廣泛的應用。紅外跟蹤技術通過檢測目標的紅外輻射,能自動、實時地實現對目標物的定位。將紅外跟蹤技術應用于軍事領域,使武器裝備不僅能探測目標,更能識別、追蹤目標,大大增強了武器裝備的智能化特性。
當前,出于人道主義的考慮,為了減少戰斗人員的傷亡及更為精準有效地打擊目標,世界各軍事強國均把高新技術裝備作為研究重點進行攻關,大力推進其智能化與信息化的發展。對圖像處理技術在軍事領域的應用情況進行梳理總結,是智能武器相關技術繼續發展的基礎。本文主要介紹了目標識別與跟蹤技術的發展現狀與其在軍事領域內的具體應用場景,并對未來圖像處理技術的軍事化應用做了展望和建議。
作為當代網絡信息傳遞的主要載體之一,圖像是對實體對象直觀且真實的描述。根據記錄方式的不同,圖像又可被分為數字圖像和模擬圖像。數字圖像由模擬圖像數字化得到,由大量基本元素——像素組成,信息量巨大,可以用數字計算機或數字電路進行存儲和處理。隨著時代的進步,人工處理圖像信息的效率和準確度已無法滿足高科技行業的要求,計算機圖像處理技術應運而生。與人類識別圖像的過程相似,計算機圖像識別能夠自動提取圖像中的相關重要信息,并與預設的處理規則進行比對分析,以便進行后續操作[1]。除此之外,計算機圖像處理技術還具有處理速度快、準確度高、靈活性好等人工手段難以媲美的優勢[2],目前在智能交通、生物醫療、農業生產、工業制造等領域都有較為廣泛的應用。
1.2.1 目標識別概述
目標識別是指將一個特定目標從其他目標中區分出來的過程,它既包括了兩個極為相似的目標的識別,也包括不同類別的目標之間的識別等。在計算機視覺領域,目標識別作為其基本目的和研究熱點,已經得到越來越成熟的發展。
目前目標識別的算法主要基于兩種思路,一種是不依賴于先驗知識,直接從圖像序列中檢測到運動目標并進行識別,另一種是基于運動目標的建模,在圖像序列中實時找尋相匹配的運動目標。此外,計算機圖像識別技術具有信息存儲量大、關聯性強、人為因素影響較大等特點[3]。
目標識別的主要過程包括以下幾個部分:
(1)獲取信息資料?,F代智能傳感器的廣泛應用使得圖像信息的獲取更為便捷高效,清晰完整的信息資料是進行有效目標識別工作的基礎。
(2)圖像預處理。為了增強圖像的可讀性,尤其是在復雜背景下的圖像識別率,需要進行圖像預處理工作,使其重要特征顯露出來。常用的預處理方法有濾波、灰度變換、二值化、圖像復原、圖像增強、平滑去噪、輪廓提取等。
(3)提取選擇特征。復雜背景下,不同時間點獲取的待識別目標很可能以不同的亮度、對比度、大小、姿態呈現。隨著科技與生產力的飛速發展和個性化需求的激增,如車輛、服裝、武器裝備等識別目標的形式朝著多樣化發展,使得構建泛化模型的難度也越來越大。提取特征的方法可分為人工特征提取和自動學習特征提取。傳統的人工特征提取手段是在選定的感興趣圖像區域內進行手工設計提取目標特征;而近年來快速發展的自動學習特征提取則是通過大量的訓練樣本自動學習后進行特征提取。除此之外,針對具有多重類型特征的目標,應在進行分類器設計之前根據目標本身的特點對各特征加以選擇。
(4)設計分類器。建立特征空間訓練集后,分類器是解決目標識別問題的有效手段。常用的分類器有最小距離分類器、貝葉斯網絡分類器、神經網絡分類器、支持向量機以及傳統的模板匹配分類法等[4-7]。
1.2.2 目標識別常用算法
目前在目標識別中應用較為廣泛的算法主要有卷積神經網絡(Convolutional Neural Networks,CNN)算法、深度遷移學習算法等。
作為深度學習的代表算法之一,CNN 是一種仿照生物視知覺構建的、由多種算法層組成的、具有平移不變特性的前饋神經網絡,一般由輸入層、卷積層、池化層、全連接層和輸出層等組成。輸入層可以處理多維數據,但數據或其他特征輸入前一般需進行標準化處理,以提升算法的運行效率和學習表現。卷積層由大量卷積單元組成,可以獲取圖像較為完整的特征信息。池化層接收卷積層運算所得圖像特征并進行篩選剔除,保留有效正確的信息。全連接層類似于前饋神經中的隱含層,主要起各層間的傳遞作用,在某些CNN 中也可由全局均值池化代替其部分功能。輸出層的工作原理和功能與傳統前饋神經中相似,在不同的工作要求和環境下,輸出層輸出不同的結果。由于其具有稀疏連接性質、表征學習能力和生物學相似性等特點,CNN 被廣泛地應用于多種領域[8-9]。
CNN 是深度學習的重要組成部分,雖然其在圖像處理領域表現優異,但訓練過程中需要大量數據信息及硬件資源,影響了應用的實時性和實用性。遷移學習是一種運用已有知識求解其他相關領域問題的新型機器學習方法,在目標域進行模型訓練時,可借助從源數據和特征中提取的信息,實現在相似或相關領域內的復用和遷移,使得傳統的零基礎學習轉變為積累型學習,強化了深度學習的效果。在深度學習基礎上進行優化的深度遷移學習,較好地解決了可用數據不足情況下的可應用性[10]。
除此之外,圖像識別領域使用較多的算法還有不變矩算法和語義分割算法等。不變矩算法以二階中心和三階中心為理論依據,通過創建不變矩來實現圖像平移、旋轉、縮放過程中數學特征保持不變,一般將其與D-S 理論配套使用。圖像的語義分割指的是對圖像進行像素級的理解,并對每個像素點進行標簽標注和分類,從而達到識別圖像內每個物體的目的。分割過程中一般需使用閾值法、像素聚類法、圖像邊緣分割法等方法[11-12]。
1.2.3 常用算法優劣勢分析
傳統的模板匹配算法根據目標特征進行遍歷匹配,算法簡單,識別率高,能解決眾多實際工程應用問題;但識別速度較慢,且應用于復雜背景下目標識別問題時需要龐大的模板數據庫,增加了識別難度。深度學習的出現與發展便較好地解決了傳統識別方法的不足。CNN 作為目前最為常用的深度學習知識模型,其最大的特點就是可以自動從大量數據中學習目標特征,省去了傳統算法中繁瑣的特征提取與選擇步驟。雖需經過大量訓練生成數據訓練集,訓練時間較長,但可以保證目標識別的實時性與魯棒性,提高識別的準確度。此外,CNN 算法的識別系統性能可持續提升,這也是傳統的模板匹配難以企及的。在此基礎上,將遷移學習與神經網絡結合,生成深度神經網絡模型,將極大提升復雜目標的識別準確率和識別速度,且由于遷移學習基于預訓練的源模型,在目標域訓練集上的學習收斂速度提高,網絡訓練時間也隨之減少。因此,結合了遷移學習的算法往往能獲得較好的泛化性能,再加上眾多研究機構已發布了基于超大數據集的模型,使得源模型的選擇更為方便,在一些小樣本工程問題中應用廣泛。值得注意的是,遷移學習只在源模型深度特征為泛化特征時才能起作用,自行開發源模型較為困難。
1.3.1 紅外跟蹤技術概述
作為計算機視覺領域另一大研究熱點——目標跟蹤的一種形式,紅外跟蹤技術是指通過探測目標的紅外輻射,獲取其二維空間角坐標,形成誤差信號,通過跟蹤回路使光軸實時、自動地瞄準輻射源或對輻射源進行定位的過程、裝置和技術。紅外目標跟蹤可大致分為點源非成像跟蹤和成像跟蹤兩類,也可按照目標截獲過程不同分為人工和自動兩種形式。紅外技術最先應用于軍事方面,隨著社會的發展,其在建筑、工業制造、航空航天、醫療、農業、火災探測、氣體檢測、社會安全、交通等領域也得到了廣泛的應用,紅外技術同樣也隨之得到不斷的豐富和提升。圖1 所示為紅外跟蹤示例。

圖1 紅外跟蹤示例圖
1.3.2 紅外跟蹤常用算法
Kalman 濾波算法是一種在線性高斯環境下,通過觀測系統的輸入與輸出數據,對系統進行最優估計的濾波算法。作為目前應用最為廣泛的濾波方法,Kalman 濾波在通信、導航、制導、控制等領域都得到了較好的應用,在目標跟蹤和狀態估計方面也占據著重要地位。具體來說,Kalman 濾波根據一較為準確的初始值不斷進行修正估計,從而使得修正值逐步接近真實值,其中數據質量直接影響到濾波效果。而跟蹤目標時容易受到噪聲、雜波、復雜背景以及其他不利因素的影響,難以得到準確的觀測值,從而削弱濾波效果。故在針對弱小目標或復雜背景下,直接利用Kalman 濾波器進行精確的紅外目標跟蹤變得難以實現。然而,若使用Kalman 濾波器對弱小目標位置進行初步定位及預估,再借助其他手段對預估區域內的運動目標再次匹配,則有望提高跟蹤目標定位的準確性。
Mean-Shift 算法是一種密度函數梯度估計的非參數聚類算法,通過迭代逼近,在樣本密度高的區域找到概率分布的極值,以此來確定目標位置。其具體算法思想是假設不同簇類的數據集概率密度分布也不相同,找到任一樣本點密度增大的最快方向,樣本密度高的區域對應于該分布的最大值,這些樣本點最終會在局部密度最大值處收斂,而收斂到相同局部最大值的點被歸為同一簇類。由于其具有可以處理各種形狀的簇類、參數設置簡單、算法結果穩定等優點,該算法在目標跟蹤問題中也得到了廣泛的應用[13]。
1.3.3 兩種算法對比分析
Kalman 濾波是一種優秀的線性系統狀態估計和預測算法,在解決目標快速運動或受到干擾、遮擋等情景時能發揮較好的功能;但應用于非線性系統時,處理速度會顯著降低,且針對于運動目標狀態發生變化的情況,如轉彎、加減速等,往往無法取得令人滿意的效果。相比較而言,由于Mean-Shift 算法依據相似性最大化原理,在目標物發生嚴重遮擋或速度過快時容易丟失目標,但對于運動物體尺寸和形狀的變化有優良的適應性。若將兩種算法結合使用,即無遮擋時采用Mean-Shift 算法,遮擋時引進Kalman 濾波器,則可有效地弱化單一算法產生的弊端。
基于機器視覺的傳統匹配方法和基于CNN的深度學習方法等是目前國際上常用的兩類目標識別方法。隨著云計算與大數據等概念的出現與發展,基于CNN的深度學習方法逐漸成為目標識別技術中的主流。對于環境復雜的軍事目標識別,深度學習更是有著傳統計算機視覺方法無法企及的優勢。
與我國相比,一些發達國家在軍事目標識別領域的建樹頗豐,理論更成熟,落地項目更多。比如搭載在美國福特號航母上的宙斯盾系統以及愛國者反導系統,可以實現對敵方導彈的定位追蹤并預測其飛行軌跡;俄羅斯的米-28 武裝直升機可以實現對空中飛行目標的自動識別;一些歐美國家研制的戰術偵查車,均可以完成在較遠距離探測范圍內實時跟蹤強機動性目標物。我國在偵查探測與目標識別方面起步較晚,技術水平相對落后,很多技術手段還停留在理論構想與實驗測試階段,列裝部隊的目標識別平臺也少之又少,具有良好識別準確率與穩定性的軍事目標識別系統亟需深入研究[14]。
軍事目標可分為海、陸、空三大類,現代戰場復雜的環境對海、陸、空目標識別技術都提出了嚴峻的挑戰。
首先,海陸空三大領域的目標識別技術難點略有不同,主要表現為:
(1)海上軍事目標主要指海軍艦船。識別艦船時可能會受到海面波浪、空中云層的影響,同時低灰度值的艦船目標將造成目標與背景對比度過低,對于目標特征提取與精確識別提出了考驗。海戰中復雜的電磁環境也是影響艦船目標識別的一大因素,因此,今后對于目標識別中抗電磁干擾技術的研究會成為提升海洋目標識別的關鍵問題。
(2)地面軍事目標主要包括人員、卡車、坦克、裝甲車、火炮等武器裝備。隨著現代戰爭的發展,軍事目標的偽裝變形已成為常態,是否能正確且快速地識別真假目標是評價目標檢測系統有效性的一個重要考量。此外,根據地面目標的特性,針對地面弱小目標的識別以及目標發生遮擋時的處理手段也會成為未來的重點研究方向。
(3)空中軍事目標主要指軍用飛機、無人機、導彈等。由于空中目標通常進行快速移動且會出現狀態快速變化的情形,如轉向、翻滾、加減速等,這對軍用目標識別技術的實時性提出了較高的要求。研究高效的圖像預處理方法,并提高數據處理速度,對于確保識別的實時性具有重大意義。
其次,出于保密性考慮,公開的軍事目標數據資料稀少,難以進行大規模的數據訓練。為此,革新現有技術,研究面向小樣本的識別算法,或是利用深度遷移學習將成熟的源模型應用至軍事領域變得至關重要。
除此之外,由于軍事偽裝變形技術的廣泛應用與各種反識別、反偵察手段的日漸成熟,戰場信息呈現出一定的模糊性與欺騙性。另有一點值得注意的是,目標識別需遵循國際軍事目標識別原則,對于不從事敵對活動或具有攻擊豁免權的對方目標應準確判斷,避免陷入國際戰爭倫理問題。利用圖像處理技術消除軍事目標識別中的不確定性,是完善軍用目標識別系統,提高其識別準確度與穩定性的關鍵所在。
最后,軍方研究人員通常根據軍事目標特性及軍事應用實例進行識別算法的開發與研究,其算法的普適性不高。為了方便軍事領域其他分支的遷移應用,可對初始算法模型進行深入挖掘,提高其泛化特性,同時完善現有的目標識別評價體系,提升目標識別算法的質量,以推動目標識別技術在軍用領域的快速發展。
在軍事領域中,目標跟蹤技術對于加強國防力量建設具有重要的意義[15]。基于目標跟蹤的視頻監控可以幫助我方更快地掌握戰場環境并對敵方單位進行搜索與跟蹤,了解敵方動態,以求在戰爭中搶占先機,處于主導地位。除此之外,融合了目標跟蹤技術的機器人視覺導航系統也是一個值得研究的方向??伸`活移動的云臺將使得目標跟蹤的智能化與實時性大大增強。最后,目標跟蹤中的智能視頻監控手段也能快速偵測到邊防的敵對分子或其他不利情況,為保護我國軍事機密提供技術支持。
目前國際上已有大量武器裝備應用了目標跟蹤技術,主要包括應用于高炮、導彈、坦克等武器裝備的火控系統以及一些紅外搜索系統等。坦克火控系統自誕生至今其功能逐步完善,目前部分裝備了穩像式火控系統的三代主戰坦克已具備目標跟蹤功能,配合駕駛員人工操作可以顯著提升坦克裝備在行進期間跟蹤和打擊運動目標物的能力。例如,美國的M1A2SEP 型坦克在加裝雷神公司研制的目標跟蹤模塊后,已成為美軍現役最先進的數字化坦克;德國的豹2A6 坦克已部分裝備FLP-10/EMES-18 型火控系統,以便車長和炮長在全天候條件下進行目標捕捉。
受到計算機技術水平的限制,國內對軍事目標跟蹤技術的研究起步較晚。20 世紀90 年代以后,隨著國內計算機水平的大跨步發展,國內各高校和科研機構在目標識別與跟蹤等圖像處理技術上進行了大量科研工作并深入挖掘其在軍事領域的應用場景。21 世紀初期,我國在某型主戰坦克上首次實現了視頻圖像目標的自動跟蹤,裝備了穩像式火控系統后,該型號坦克可以在行進間對機動目標進行攻擊,炮手發現目標并按下跟蹤按鈕后,系統可自動完成目標鎖定追蹤至發射火炮的全過程,已基本達到國外先進的坦克用目標跟蹤系統水平[16]。
軍事目標跟蹤以目標識別為前提,除了需要應對目標識別過程中產生的挑戰,還要解決如下幾點難題。
首先,戰場中虛假、偽裝目標干擾嚴重,單特征跟蹤已無法適應現代戰爭的復雜環境。為保證目標跟蹤的魯棒性,可以進行多特征信息融合算法的研究。其中,如何完成特征融合準則的有效設計以實現最佳融合和利用多傳感器組網技術獲取目標的深度特征是兩個值得研究的方向。
其次,單目標跟蹤已無法滿足現代戰爭的需求,能夠兼顧準確性與實時性的多目標跟蹤技術將成為未來軍事目標跟蹤的發展趨勢。目標局部或完全遮擋、目標數目隨機性、強機動性目標難跟蹤等問題將成為制約多目標跟蹤發展的幾個重點難題,亟需予以攻關。
最后,基于多目標跟蹤研究的基礎,可將其遷移至民用監控安防等領域,屆時如何解決密集目標重疊、咬合問題及大數量目標檢測與跟蹤將會成為新的熱點。
圖像處理技術與軍事武器裝備的融合將成為未來武器裝備發展的潮流,為此,對現有圖像處理技術的不足之處進行優化改良將會成為未來幾十年的重點難題。重點解決海陸空目標識別難題,應對樣本稀缺、信息不確定、算法普適性不高等挑戰,以及基于多信息融合和多目標跟蹤的研究,是軍事目標識別與跟蹤技術發展的重要助推力。深化圖像處理技術在軍事領域的應用,對于提升我軍作戰能力,提高我國國防科技實力意義重大。