鐘昊



摘要:多無人機協同無源定位移動輻射源目標,需要實時優化調整多機組合航向,不斷追求多機與目標之間的動態最優構型,以提高和穩定定位精度。針對傳統集中式優化方法由于航向計算時延和信息分發時延造成的定位精度低和穩定性差,本文提出一種多機航向協同自主生成方法,通過離線構建多樣化構型和最優航向數據集,基于圖神經網絡離線機器學習組合航向與最優構型下的隱式規則,線上各無人機航向決策神經網絡基于一致實時態勢,自主預測本機航向和協同生成最優航向組合。仿真驗證表明,該方法相對于傳統方法能夠更快達到更高定位精度,且提高了定位跟蹤穩定性。
Abstract: In order to improve and stabilize the positioning accuracy, it is necessary to optimize and adjust the Multi-UAV combination heading in real time, and constantly pursue the dynamic optimal configuration between the Multi-UAV and the target. In view of the low positioning precision and poor stability caused by the time delay and information distribution delay of the traditional centralized optimization method, a Multi-UAV combination heading cooperative autonomous generation method is proposed in this paper. The multiple configurations and optimal heading data sets are constructed off line, and the combination course and the optimal structure are machine learned off-line based on the graph neural network. Under the implicit rule, the line decision neural network based on the unmanned aerial vehicle (UAV) is based on the consistent real time situation and independently predicts the course direction and cooperative generation of the optimal course combination. Simulation results show that the proposed method can achieve higher positioning accuracy and improve the stability of location tracking compared with traditional methods.
關鍵詞:多機無源定位;航向自主生成;圖神經網絡;動態構型;克拉羅美下界
Key words: multi-UAV passive location;autonomous generation heading;graph neural network;dynamic configuration;Cramer-Rao Lower Bound
中圖分類號:V24;TP3? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)12-0254-05
0? 引言
隨著無人機集群技術、現代電子戰技術和航空通信技術的迅猛發展,多無人機對移動信號輻射源目標進行無源協同定位,在軍事偵察、環境監測、反恐維穩和應急救援諸多領域具有巨大應用潛力。在運動狀態下,多無人機與目標的之間的動態構型,即各無人機與目標之間的實時距離,以及任意兩架無人機與目標之間的實時角度,直接影響多機協同無源定位精度以及穩定跟蹤效果。如何在線生成各無人機實時航向指令,實現多無人機與目標之間的最優動態構型,從而提高無源定位精度和跟蹤穩定性,成為熱點研究問題之一[1-2]。
當前針對面向無源定位的多機航向動態生成問題,主要采用集中式實時優化方法(Centralized Real-Time Optimization,CRTO)[3-6],基于測角、測頻或測TOA等無源定位方式,獲得目標位置估計值后,以卡拉美羅下界卡拉羅美下界(Cramer-Rao Lower Bound,CRLB)[7]為定位精度指標,并假設環境電磁噪聲服從高斯分布,然后實時計算搜索下一時刻CRLB最小的多機組合航向,最后逆推各無人機當前航向指令。該方法存在兩個問題,一是無源定位精度對組合航向敏感,需要對航向粒度進行細致劃分,隨著無人機數量增多,可選組合航空決策變量空間呈指數增加,從而導致計算延時過大,難以滿足對高速移動目標定位需求;二是需要對所有無人機的航向指令進行集中計算,然后分發給各無人機,增加了通信延時,且存在中心節點,在作戰環境下,造成無人機集群抗毀性差。
針對CRTO方法存在的問題,本文提出分布式協同自主生成方法(Distributed Cooperative and Autonomous Generation Approach,DCAG),即基于自組織協同思想和機器學習方法[8-9],為每架無人機最優航向決策構建均構建一個多隱含層神經網絡,并大樣本仿真多無人機與目標的不同構型數據集和離線搜索最優航向標簽集,實現神經網絡線下機器學習如何針對不同構型生成最優航向,線上根據真實無源定位信息,自主快速輸出最優航向指令,確保多機自同步按照最優航跡飛行,不斷減小定位誤差和保持跟蹤穩定性,使得多機無源定位中計算量大耗時長的航向組合實時優化問題,被轉化為低功耗低時延的分布式在線預測問題,使得該問題得以有效解決。
1? 問題描述與建模
理論上單機測向,雙機即可完成定位,但是存在環境電磁噪聲,定位會存在誤差。在信號處理和定位算法確定的條件下,且假設無人機速度方向始終與航向始終保持一致,要提高對移動目標的無源定位精度,需要在線組合優化多無人機實時組合航向,從而直接決定多無人機下一時刻航跡點,達到不斷追求多無人機與目標之間的動態最優構型的目的。由于CRLB可以屏蔽無人機輻射信號和環境噪聲對定位精度的影響,因此通過計算CRLB值,定量比較多無人機可選組合航向下的不同定位精度,從而找出CRLB最小的組合航向,即為使得定位精度最高的最優航向組合。
假設無人機數量為M,可選航向粒度為θ,無人機可機動航向角區間為[?準1,?準2],則每一時刻多無人機協同航向組合可選決策空間數量規模如式(1)所示,隨M的增加呈指數增長,為NP-Hard問題。
根據上述分析,在X-Y絕對二維坐標下,以各無人機下一時刻最優航向為決策變量,以下一時刻CRLB最小為目標函數,建立下一時刻最優航向的優化模型,如式(2)-(8)所示,其中,式(2)是受各無人機與目標實時時刻位置影響的目標函數,式(3)表示無人機下一時刻位置更新方程,且受實時航向VUdi影響,式(4)是移動目標位置更新方程,式(5)是最大可選航向邊界約束條件。
2? 傳統集中式實時優化方法
針對上述多無人機航向組合優化問題,傳統集中式實時優化方法CRTO需要將各無人機實時測向數據及其實時定位信息,發送至中心無人機,根據協同定位算法結算目標估計位置,然后以式(2)所示目標函數,面向大規模組合優化變量空間,運用啟發式或超啟發式等智能優化算法進行求解,然后通過搜索尋優得到多機組合最優航向,最后中心無人機通過機載數據鏈將每一時刻最優航向指令不斷分發給其他對應的無人機,如圖1所示。根據工程經驗,由實時優化計算各無人機組合航向和分發航向指令帶來的延時超過2秒以上,易造成精度降低和跟蹤穩定性降低。
3? 分布式協同自主生成方法
3.1 方法框架
針對CRTO方法帶來的延時過長問題,本文所提DCAG方法針對CRLB直接反映構型對定位精度影響這一特點,在地面離線仿真生成大樣本多無人機與目標的構型數據,并運用智能優化算法離線搜索每種構型下各無人機最優航向組合,由此一對一地形成面向每架無人機的帶標簽數據集,實現離線訓練測試各無人機航向決策圖神經網絡,在線使用訓練好的各無人機神經網絡,如圖2所示。
通過DCAG方法,各無人機只需要實時共享各自的定位信息和測向數據,在求出目標估計值一致的條件下,就能基于圖神經網絡快速自主運算生成本機最優航向,從而避免在線實時優化NP-Hard問題,造成的過長延時。同時,由于各機神經網絡離線學習到自主協同生成最優航向組合的隱式規律,在線生成實時最優航向天然即為組合最優,從而也避免了由于中心計算組合航向需要分發帶來的通信延時。
3.2 圖神經網絡構建
圖神經網絡[10,11]是為了在圖結構的數據信息基礎上進行學習而建立起來的。本文所研究多架無人機在定位過程中的航跡生成,其本質屬于圖數據下的構型變換,因此本文采用圖神經網絡進行學習訓練,實時生成不同時刻每架無人機航跡角輸出。
為了實現多無人機之間的在線協同飛行以減小定位誤差,需要將所有無人機當前時刻到目標的構型圖作為每架無人機神經網絡的輸入。在目標真實位置未知條件下,以目標無源定位估計值近似為目標真實位置。神經網絡輸出則設計為所控制無人機的下一時刻最優航向。神經網絡結構采用多個隱含層和全連接結構。設無人機數量為M,則隱含層數量和每個隱含層的節點數可以設置為M和2M。
3.3 網絡離線訓練測試
按照無人機航向決策圖神經網絡的輸入和輸出構建好數據集和標簽集后,采用TensorFlow[12]進行網絡的離線訓練和學習。在訓練過程中需要注意三點:一是對于神經網絡在兩種坐標軸角度下表示預測航向,需要分別與真實最優航向相減后,以偏差最小值作為損失函數值;二是選擇Adam學習算法優化網絡的權重和閾值;三是在每一輪訓練完成后都輸入測試數據集,判斷損失函數值是否連續變小作為訓練終止條件之一,以防止過擬合,具體流程如圖3所示。
4? 仿真驗證分析
4.1 仿真示例描述
以雙機無源定位移動通信輻射源仿真示例,驗證本文所提DCAG方法的有效性,并假設如下:①無源定位算法采用AOA到達角測量法;②信噪比為0.05;③雙機速度在單次仿真中固定,多次仿真中變化范圍為[120,200];④目標速度大小在單次仿真中固定,多次仿真中變化范圍為[100,180];⑤目標速度方向始終為雙機位置連線中點至目標方向;⑥無人機每秒內完成50次測向信號采樣;⑦目標與各無人機之間的距離不大于15000,不小于1000;⑧雙機之間的距離不小1000;⑨用于離線訓練各無人機無源定位航向圖神經網絡產生的部分數據集如表1所示。