神經網絡在航跡檢測中的應用

2020-12-18 02:07:58謝廷堯呂宇宙

無線電工程 2020年1期

關鍵詞：模型

謝廷堯，姜偉，呂宇宙，葉舟

(上海航天電子通訊設備研究所，上海 201109)

0 引言

傳統雷達航跡起始算法，主要有兩大類：順序處理算法和批處理算法。順序處理算法以基于邏輯的方法和基于規則的方法為主[1-3]。順序處理算法在運算復雜度和空間復制度上都很低，對于硬件資源較少的雷達數據處理組件比較友好。但是，順序處理算法不適用于雜波較多的環境，對于地物雜波較重的低空目標航跡處理，無法做到在較低的虛警率請求下有較高的發現概率。

批處理算法[4-6]主要以霍夫變換和基于改進霍夫變換的算法為主[7-9]。批處理算法和順序處理算法相比，批處理算法計算復雜度更高、空間復雜度也更高，但批處理算法能處理高密度雜波下的航跡起始任務，比順序處理算法的魯棒性好。

傳統的航跡起始算法各有其優點，但在一些方面也有所欠缺。近年來，神經網絡在各方面的應用[10-16]越來越廣泛、成熟，如何將成熟的神經網絡用于航跡處理中，將是人工智能與傳統雷達航跡處理結合時研究的重點。本文將著重研究對于空域中是否存在航跡的判別。

傳統航跡處理算法建立在數學模型基礎上，性能的好壞與建立的數學模型、真實航跡以及環境的吻合程度有很大關系。本文提出的航跡判別算法利用真實數據訓練航跡判別模型，所得出的航跡判別模型與真實的航跡以及環境吻合度很高，相對于傳統航跡處理算法更加真實。

1 基礎理論

航跡判別模型主要用到主成分分析(PCA)降維和卷積神經網絡。

1.1 PCA降維

PCA是一種用于無監督學習的降維方法，使用一個新的坐標系去描述原來坐標系中的數據，舍棄原來坐標系中不重要的分量。被保留的分量稱為主成分，因此，PCA實質上是一種坐標變換，如下所示：

Y=XUT，

(1)

式中，U表示原始的特征矩陣，每一行表示一個數據，每一列表示一個特征。這里假設X∈Rm×n是投影矩陣每一列表示一個投影的方向，轉移矩陣U∈Rk×n，k表示降維后的特征個數，X∈Rm×n表示原始數據(降維前)。

PCA降維算法主要由去平均值、協方差矩陣計算、協方差矩陣特征值與特征向量計算、特征值排序與挑選、數據特征向量構建幾個步驟構成。

通過PCA降維后，數據的絕大部分維度特征被保留，將方差基本為零的特征維度剔除，有利于后續的航跡判別。

1.2 卷積神經網絡

航跡判別模型使用的卷積神經網絡是圖像處理和自然語言處理與神經網絡結合的研究重點。卷積神經網絡主要由輸入層、卷積層、池化層、軟分類層和輸出層組成。相對于傳統神經網絡，卷積神經網絡將卷積層加入傳統神經網絡的輸入層和全連接層之間，通過卷積層，使傳統神經網絡的很多問題得以解決，例如網絡模型參數較多、神經網絡最大層數限制等。

卷積神經網絡的卷積層通過限制隱含單元與輸入單元的連接，使每個隱含單元只連接輸入信號的一部分相鄰區域，如圖1所示。通過卷積層，數據的鄰接關系將被卷積核提取。卷積層的主要作用是提取特征，通過卷積操作，將輸入矩陣的特征提取成卷積特征矩陣。

圖1 卷積神經網絡計算示意圖Fig.1 Convolution neural network calculation diagram

1.3 交叉熵損失函數

在卷積神經網絡提取出特征后，需要損失函數對提取出的特征進行判斷。對于航跡判別模型，在特征識別階段需要對提取出的特征經行分類，而交叉熵損失函數在特征分類上效果很好。

交叉熵損失函數結合歸一化指數函數，可以構建利于神經網絡梯度下降的凸函數。在邏輯回歸問題中，通常使用均方誤差函數作為損失函數，此時損失函數如式(2)所示(沒有加入歸一化指數函數)：

(2)

實際輸出在經過歸一化指數函數之后如式(3)所示：

(3)

經指數歸一化后的均方誤差函數如式(4)所示：

(4)

圖2 經指數歸一化后均方誤差圖Fig.2 Mean square error graph

而使用交叉熵損失函數，可以使損失函數為凸函數，從而能達到全局最優。交叉熵損失函數如式(5)所示：

(5)

本課題屬于二分類問題，相應的交叉熵損失函數圖形如圖3所示。從圖3中可以看出，交叉熵損失函數是凸函數，并且距離越大梯度也越大。所以交叉熵損失函數能使損失函數達到全局最優并且利于損失函數的優化。

通常在使用數據之前，會對輸入數據做標準化處理：處理后的任意一個特征在數據集中所有樣本上的均值為0、標準差為1。標準化處理輸入數據使各個特征的分布相近，更有利于訓練出有效的模型[17]。

圖3 交叉熵損失函數示意圖Fig.3 Schematic diagram of cross entropy loss function

1.4 Batch Normal

通常來說，數據標準化預處理對于淺層模型就足夠有效了。隨著模型訓練的進行，當每層中參數更新時，靠近輸出層的輸出較難出現劇烈變化。但對于深層神經網絡來說，即使輸入數據已做標準化，訓練中模型參數的更新依然很容易造成靠近輸出層輸出的劇烈變化。這種計算數值的不穩定性通常難以訓練出有效的深度模型。

為解決這一問題，提出了批量歸一化，即Batch Norml，在模型訓練時，批量歸一化利用小批量上的均值和標準差，不斷調整神經網絡中間輸出，從而使得整個神經網絡在各層的中間輸出的數值更穩定。

2 模型構建

用于航跡判別的神經網絡整體結構如圖4所示。訓練數據通過深度神經網絡后的輸出值同真實值(標簽)對比，使用交叉熵損失函數計算損失值，再通過梯度反向傳播來調整每一層的網絡參數，達到訓練目的。訓練網絡由PCA預處理模塊、特征提取模塊和分類決策模塊組成。PCA模塊對數據進行降維處理，使得輸入數據具有相同的維度(由于輸入雷達的點跡個位非定長，如果不進行降維處理，會導致輸入神經網絡的數據大小不一)；特征提取模塊由2層卷積層組成，用于提取雷達點跡的特征；決策模塊由一個線性分類器組成，用于將提取到的特征進行分類，從而達到分類目的。

圖4 航跡判別神經網絡結構圖Fig.4 Structure diagram of flight path discrimination neural network

2.1 數據結構

采用真實雷達數據進行訓練與測試，部分數據(即網絡輸入數據的結構)如表1所示。每一行代表一個點，總的行數等于點的個數。對于每一個點，第1列表示目標距離，第2列表示目標相對雷達的方位角，第3列表示目標相對雷達俯仰角。

表1 雷達數據結構
Tab.1 Radar data structure

距離/m方位/(°)俯仰/(°)180 00160.5212.933177 94160.4772.93317 606160.4992.944………17194160.4882.955

訓練用標簽由0，1組成，“0”代表樣本中不含航跡信息；“1”代表樣本中含有航跡信息。總的樣本數為339 053個，其中將30%的數據用于測試，70%的數據用于訓練。

2.2 超參設置

神經網絡的超參設置如表2所示，卷積層的主要超參有卷積層的輸入通道數、輸出通道數、卷積核大小、步長以及標準化，全連接層的主要超參有輸入通道數和輸出通道數。初始batchsize設置為128，學習率設置為0.01，在訓練400次之后學習率設置為0.005，batchsize改為64。

表2 神經網絡超參設置
Tab.2 Neural network hyperparameter settings

卷積層輸入通道數輸出通道數卷積核大小步長標準化Conv111621TrueConv2163221True全連接層1922///

2.3 結果分析

訓練過程中，總共迭代1 200次，代價函數變化趨勢如圖5所示。從圖5中可以看出，隨著迭代次數增加，代價函數逐漸減小，并且減小幅度越來越小，組合基本趨于穩定并且收斂，表明模型的訓練是有效的。

圖5 代價函數變化趨勢Fig.5 Variation trend of cost function

在測試階段，其中30%(101 716個)測試樣本在訓練好的神經網絡上的表現如表3所示。其中40 087個正樣本(樣本中存在航跡)被正確檢測出37 551個，發現概率為93.673 7%；61 629個負樣本(樣本中不存在航跡)被錯誤判斷2 347個，虛警率為4.099%。

表3 測試集測試結果
Tab.3 Test results of test set

預測值真實標簽有航跡無航跡有航跡37 5512 347無航跡2 53659 282

模型的魯棒性對于模型十分重要，魯棒性越好表明模型的可重復性越好，其隨機的成分越低。通過將數據重排然后以相同的比例分配訓練集、測試集再放入模型進行訓練、測試，重復10次的結果如圖6所示。從圖6中可以看出，在10次重復的試驗中，準確率基本穩定在95%，說明模型的魯棒性很好，可以在實際工程中應用。

圖6 模型魯棒性測試結果Fig.6 Model robustness test results

3 結束語

由于雷達的作戰場景多樣化，針對不同的場景，用于雷達濾波的濾波器參數也將不同。神經網絡使用真實場景數據訓練的濾波器能自適應地匹配真實場景，能降低主觀因素對于濾波器的影響。并且，針對不同的用途，可以結合目標與背景，訓練專用的神經網絡用于復雜環境下的航跡檢測。