李宏博,吳文華,張 云
(1.哈爾濱工業大學 電子與信息工程學院,哈爾濱 150001;2.對海監測與信息處理工信部重點實驗室(哈爾濱工業大學),哈爾濱 150001)
高分辨距離像(high resolution range profile,HRRP)攜帶雷達徑向方向的目標距離維信息,包含目標形狀特征,如目標的尺寸、目標散射點分布情況等,常用于雷達目標的分類識別,是國內外雷達領域的研究熱點[1-3]。空間錐體是一種常見的雷達目標,在空間中除了平動以外,往往伴隨進動和章動等微動。對空間進動錐體目標進行連續成像處理可以獲得一維距離像序列,研究人員常常通過分析空間錐體目標的一維距離像序列的調制特性來提取微動參數[4]。一維距離像序列變化主要受錐體平動和進動影響,平動往往具有很強的規律性,對于進動而言,從連續多次成像結果中可以發現,一維距離像的強散射點的位置會產生周期性變化,與目標進動規律一致[5]。因此,理論上空間進動錐體的一維距離像序列預測能夠實現。
高分辨距離像序列預測即根據已知的若干幀高分辨距離像,學習并預測之后的高分辨距離像。單幀一維距離像攜帶目標的徑向距離信息,連續多幀一維距離像序列具有較強的前后時間關聯特性,類似于視頻預測,這就要求網絡模型既能夠提取一維距離像的空間信息,又能夠挖掘一維距離像序列時間上含有的目標運動規律。
光流法[6]是計算機視覺領域經典的預測算法,基于亮度恒定(同一目標在不同幀間運動時,其亮度不會發生改變)、時間連續性(時間的變化不會引起目標位置的劇烈變化,相鄰幀之間位移較小)兩個假設,利用圖像像素在時間域上的變化信息計算物體的運動情況實現圖像的預測。對于空間進動錐體而言,不滿足亮度恒定和時間連續性假設,光流法難以適用。近年來,神經網絡迅速崛起,具有泛化性能好、數據挖掘能力強等優點,廣泛應用于數據預測領域。其中循環神經網絡(RNN)能夠記憶歷史輸入數據,主要用于處理時間序列,但RNN存在梯度消失或爆炸以及對長期信息不敏感問題[7]。針對RNN的不足,長短時記憶網絡(LSTM)增加了門控設置,能夠很好地處理長序列問題,能夠有效地提取時間序列信息[8]。但對于包含空間信息的時間序列而言,LSTM適應性明顯降低,難以進行處理。而卷積網絡(CNN)則可以有效地提取圖像中的空間信息,因此有學者將卷積神經網絡應用于圖像預測問題,某些場景中也取得了不錯的效果[9]。在此基礎上,文獻[10]提出了卷積長短時記憶模型(convolutional long short-term memory,ConvLSTM),該模型具有預測攜帶有時空信息數據的能力,能夠學習到數據隱含的時間和空間關聯信息。
文獻[10-11]已將ConvLSTM方法應用于氣象雷達進行臨近天氣預測。針對寬帶雷達觀測空間進動錐體目標獲得的高精度一維距離像的特點,本文將該網絡算法應用于HRRP序列預測分析,為了提高網絡空間特征提取的能力,在ConvLSTM網絡提取到時空信息之后加入二維卷積網絡(Conv2d),并采用二值交叉熵作為損失函數,能夠在有效提取數據特征的同時縮短模型收斂時間。本文建立空間進動錐體HRRP序列仿真數據集,在時空尺度上采用ConvLSTM網絡進行預測分析,并與經典二維卷積神經網絡預測結果對比。實驗結果表明,本文設計的網絡模型能夠實現高分辨距離像的預測,并具有較好的預測性能。
空間錐體目標通常會采用繞軸線旋轉的方式來確保發射的穩定性和提高命中率,但是錐體在自旋過程中不可避免地會受到橫向擾動,進而產生進動。空間錐體的進動由繞錐體對稱軸的自旋運動和圍繞進動軸的錐旋運動復合而成。如圖1所示,以雷達位置為原點建立雷達坐標系Q-UVW,參考坐標系O-U′V′W′與雷達坐標系平行,本體坐標系O-XYZ固連在錐體目標上,以錐體旋轉對稱軸為OZ軸,參考坐標系與本體坐標系都以錐體目標重心為原點。錐體目標圍繞自身對稱軸OZ軸做自旋運動,同時OZ軸圍繞進動軸ON以角速度ω進動,進動角為θ,γ為雷達視線與進動軸夾角,即俯仰角。α為雷達視線內側與自旋軸之間的夾角,即姿態角。

圖1 空間錐體進動模型
設雷達發射線性調頻脈沖信號s(t),其表達式為
(1)

經過解線性調頻處理和消除殘余項后,進行傅里葉變換可得到一維距離像回波[12]為
(2)
式中:RΔi=Ri(t)-Rref(tm),Ri(t)為第i個散射點的距離;N為散射點個數;sinc(·)為辛格函數;σi為第i個散射點的RCS;λc為載波中心頻率對應波長。
ConvLSTM是基于LSTM網絡發展起來的,能夠直接處理二維數據。模型中的卷積運算主要負責提取數據中包含的空間信息,而LSTM結構善于處理時間序列數據,ConvLSTM網絡將二者特點有效結合,能夠學習到時間和空間兩個維度特征。如圖2所示,傳統LSTM網絡模型采用全連接的方式實現狀態轉換,而ConvLSTM網絡模型通過將卷積運算應用于LSTM的“輸入到狀態”和“狀態到狀態”兩部分以改進LSTM,通過多層卷積操作提取輸入和狀態的空間特征,以決定在每個空間位置上的狀態變量和輸入信息的取舍,然后采用LSTM相似的門控單元控制當前輸入特征的傳遞,確定當前時刻的輸出[13]。對于空間進動錐體目標的一維距離像序列,ConvLSTM網絡中的卷積狀態轉換能夠提取目標的空間(目標形狀)信息,LSTM序列處理能夠有效提取到目標的一維距離像隨時間變化的有效信息(包括受重力和進動影響導致像的形狀的變化),ConvLSTM網絡適用于空間進動錐體一維距離像序列的預測問題。

圖2 ConvLSTM結構
從圖2可以看到,ConvLSTM單元包含遺忘門(ft)、輸入門(it)和輸出門(ot),通過這些門來調控數據信息的獲取并更新單元狀態。各個門之間的傳遞關系為:
it=σ(Wxi*Xt+Whi*Ht-1+bi)
(3)
ft=σ(Wxf*Xt+Whf*Ht-1+bf)
(4)
ot=σ(Wxo*Xt+Who*Ht-1+bo)
(5)
Gt=tanh(Wxg*Xt+Whg*Ht-1+bg)
(6)
Ct=ft°Ct-1+it°Gt
(7)
Ht=ot°tanh(Ct)
(8)
式中:“°”為矩陣對應元素相乘;“*”為卷積運算;σ為sigmoid激活函數;it為輸入門,它采用激活函數對輸入數據與上一節點輸出數據進行選擇性接收,決定了當前節點數據的輸入;ft為遺忘門,主要作用是決定對上一節點輸出數據的遺忘比例;Ct為t時刻神經元的單元狀態,它是上一節點單元狀態與當前輸入數據綜合后的結果;Gt為當前時刻積累的信息;ot為輸出門,主要控制當前單元狀態的輸出比例,輸出結果即為本次單元輸出Ht。
2.2.1 數據預處理
應對HRRP幅度敏感性問題,對每幀HRRP都進行取模運算,并按min-max方式進行歸一化處理。因為ConvLSTM網絡最后一層采用softmax激活,歸一化到[0,1]范圍內有利于數據處理。歸一化公式為
(9)
式中:xnorm為歸一化后的一維距離像數據向量,x為歸一化前的一維距離像數據向量。
假設使用前m幀HRRP數據預測后n幀,即采用大小為m+n的滑動窗口對HRRP序列進行遍歷。
Si=[xi,xi+1,…,xi+m-1]
(10)
llabeli=[xi+m,xi+m+1,…,xi+m+n-1]
(11)
式中:i=1,2,…,N-m-n+1,N為原HRRP序列長度;Si為第i個訓練樣本矩陣;llabeli為第i個訓練樣本對應的標簽矩陣。
如圖3所示,假設每幀HRRP的距離單元個數為M,對每個HRRP序列樣本都進行這樣的滑動處理即可得到所需的樣本集和標簽。這樣的處理也起到了增廣數據的作用,對一個長度為N的HRRP序列進行上述的滑動窗口處理,可以得到N-m-n+1個樣本。圖4為利用滑動窗口的方式創建的樣本和標簽示例,圖中為第2個樣本和標簽即i=2,采用16幀樣本預測1幀,即m=16、n=1。

圖3 滑動窗口處理示意

圖4 樣本和標簽數據示例
ConvLSTM模型主要是為二維影像數據而設計的[14],因此需要按照影像數據形式對輸入數據重排列。ConvLSTM網絡輸入為五維張量,尺寸為(samples,time,rows,cols,channels),其中time為輸入數據時間步長。若進行多步預測輸出也為五維張量,尺寸為(samples,timesteps,output_row,output_col,filters),其中timesteps為待預測時間步長;若進行單步預測,輸出為四維張量,尺寸為(samples,output_row,output_col,filters)。單幀距離像維度為1×M,將其排列為1×M×1圖像形式的三維張量作為網絡輸入的基本單元,3個維度分別為圖像的長、寬和通道。對于k組包含m個時間步的數據來說,訓練數據應該重排列為k×m×1×M×1。同理,為了保持輸出數據尺寸的一致性,訓練樣本標簽也需要進行上述重排列。
2.2.2 網絡結構
本文提出的HRRP序列ConvLSTM預測網絡結構見圖5。為了提取數據的高層次時序特征,模型采用4層ConvLSTM層和1層二維卷積層。

圖5 ConvLSTM預測模型結構
網絡各層輸出數據大小和參數數量見表1。

表1 網絡模型結構參數
數據流經過ConvLSTM網絡單元時,經過卷積運算后輸出數據的最后一個維度大小取決于卷積操作過程中卷積核的個數。每幀一維距離像包含360個距離單元,每層ConvLSTM層包含30個卷積核,因此輸出數據的最后一個維度為30,在4層ConvLSTM層后加入只包含一個卷積核的二維卷積層對ConvLSTM網絡輸出數據進行特征提取,將輸出數據的最后一個維度降為1,該二維卷積層采用sigmoid激活函數激活,使輸出數據大小映射到0~1范圍內。模型采用單幀預測方式,根據HRRP序列的前16幀,預測后1幀HRRP。
為提高網絡的非線性表征能力,前3層ConvLSTM層添加Relu激活函數。為了防止出現網絡梯度的爆炸和消失問題,在每層ConvLSTM之后采用批標準化層(batch normalization,BN),BN層可以將數據分布變換為標準分布,用于加快網絡的訓練速度[15]。
2.2.3 損失函數
一般情況下,對于機器學習中的回歸問題通常采用均方誤差MMSE(MSE)和平均絕對值誤差MMAE(MAE)等作為損失函數,而二值交叉熵(binary cross-entropy)常用于二分類問題。實驗過程中發現,采用二值交叉熵作為損失函數,預測效果明顯優于MSE或MAE作為損失函數的情況。
假設采用MSE作為損失函數,sigmoid函數作為激活函數,則MSE損失函數為
(12)

若采用二值交叉熵作為損失函數,sigmoid作為激活函數,那么二值交叉熵函數為
(13)

(14)



圖時,二值交叉熵隨yi的變化規律

為驗證ConvLSTM網絡的有效性,本文仿真產生了不同參數空間錐體目標的HRRP序列。雷達中心頻率設置為10 GHz,帶寬為1.5 GHz,目標距離雷達初始距離為800 km,本文采用經典的物理光學法(PO)來仿真錐體目標的RCS。設置雷達信號的極化方式為垂直極化,信噪比為10 dB,噪聲類型為高斯白噪聲,每幀一維距離像長度設置為360個距離單元,目標參數設置見表2。

表2 實驗數據設置
鑒于高斯白噪聲的隨機性,表2中,在每一種目標參數下重復仿真10次,每次仿真空間錐體目標運動過程中在成像間隔下的連續1 000幀一維距離像。一維距離像仿真結果見圖7,圖7(a)~(h)分別為表2中編號1~8條件下的一維距離像仿真結果,圖中橫坐標距離以錐體重心為坐標零點,幅度經過歸一化處理。

圖7 一維距離像仿真結果
初始仿真數據共包含80 000個樣本。實驗中采用前16幀HRRP序列預測后1幀HRRP的方式,本文提出的ConvLSTM網絡還可以進一步推廣至多幀預測場景,但需要更充分的數據集進行訓練。經過數據預處理之后,總的樣本個數為78 720個。實驗中設置訓練集、驗證集和測試集樣本大小比例為3∶1∶1,即訓練集大小為47 232,驗證集和測試大小為15 744。
本實驗在Python環境下利用Keras框架實現。損失函數為二值交叉熵,優化器設置為Adam,批大小設置為64,迭代次數為100次,共設置4層ConvLSTM層,每層ConvLSTM層卷積核大小為(1,10),卷積核數量為30,網絡最后一層為二維卷積層,卷積核大小為(1,10),卷積核數量為1。
為客觀驗證ConvLSTM網絡預測HRRP序列的準確性,采用平均絕對誤差(MMAE)和皮爾遜相關系數(r)對預測結果進行評價分析。
平均絕對誤差是所有預測值與真實值之間的絕對誤差平均值。
(15)

皮爾遜相關系數又稱皮爾遜積矩相關系數,常用于度量2個變量之間的相關性。
(16)
式中X、Y為隨機變量。
為了對比分析ConvLSTM網絡模型的性能,本實驗在相同的數據集下比較了ConvLSTM與二維卷積2種深度學習神經網絡模型的預測效果,并對2種模型預測效果采用平均絕對誤差和皮爾遜相關系數評價指標進行評價。其中,二維卷積神經網絡預測方法是通過將多幀HRRP序列重排列為單通道圖像形式[16],卷積神經網絡通過卷積獲取數據的時間和空間信息。
從測試集隨機抽取3個樣本,二維卷積網絡和ConvLSTM網絡預測效果如圖8所示,圖8(a)~(d)分別為GroundTruth、ConvLSTM網絡和二維卷積神經網絡的預測結果以及2種網絡的預測絕對誤差對比。

圖8 Conv2d與ConvLSTM模型預測誤差對比
以上3個樣本2種網絡模型對一維距離像峰值位置預測結構見表3。

表3 峰值位置預測結果對比
可以看出,經典卷積神經網絡和ConvLSTM網絡均能實現HRRP序列的預測,相較于經典卷積神經網絡,ConvLSTM網絡波峰位置與GroundTruth相比更為接近,原因是ConvLSTM網絡包含LSTM網絡結構,對時間序列處理能力更強,對于輸入的16幀HRRP數據,經典卷積神經網絡對于時間前后信息無差別處理,而ConvLSTM網絡引入了門控操作,能學習到更多時間維信息,對HRRP序列的預測也更加準確。
為了更全面地評價ConvLSTM網絡對HRRP序列的預測能力,在整個測試集上分別計算2種網絡模型皮爾遜相關系數和平均絕對誤差。經典二維卷積神經網絡2個指標數值分別為0.953 4和0.040 3,而ConvLSTM網絡模型2個指標數值分別為0.973 1和0.033 4。可看出,ConvLSTM網絡的皮爾遜相關系數較經典卷積神經網絡更大,而平均絕對誤差MMAE較經典卷積神經網絡更小,說明ConvLSTM網絡能夠更有效地提取HRRP序列的特征,并對HRRP作出更準確的預測。
綜上所述,可以看出:
1)ConvLSTM網絡模型皮爾遜相關系數和平均絕對誤差分別為0.973 1和0.033 4,具有較高的皮爾遜相關系數和較低的平均絕對誤差,說明ConvLSTM網能夠實現HRRP序列的預測,并且具有較高的預測精度。
2) 與二維卷積神經網絡相比,ConvLSTM網絡模型預測結果更接近于GroundTruth,并且皮爾遜相關系數較二維卷積神經網絡提高了0.019 7,平均絕對誤差較二維卷積神經網絡降低了0.006 9,表明ConvLSTM網絡能從大量HRRP序列數據中學習到更多時間和空間信息,有效提高了數據的利用率。
3)經典卷積預測結果在噪聲基底部分出現明顯波紋,而ConvLSTM網絡預測結果在噪聲基底部分抖動更小,說明ConvLSTM網絡能夠學習到HRRP序列的主要規律,并抑制高頻噪聲。
針對空間進動錐體高分辨距離像序列預測問題,設計了一種基于卷積長短期記憶網絡模型的HRRP序列預測方法。該網絡模型充分利用了卷積神經網絡和長短期記憶網絡提取空間和時間特征的特性,將2種網絡有效結合,因此ConvLSTM網絡能夠實現HRRP序列的預測。實驗結果表明,ConvLSTM網絡預測得到的HRRP形狀與物理光學法計算得到的回波距離像形狀非常相似,且預測數值上具有很高的精度,具有更高的皮爾遜相關系數和更低的平均絕對誤差。