卞偉偉,呂鑫,劉蟬,賈彥翔,邱旭陽
(北京機械設備研究所,北京 100854)
為了有效應對低空、慢速、小型無人機帶來的威脅,裝備可靠的主動防范系統成為各國軍方和安防企業關注的焦點[1-3]。目前,用于低慢小目標攔截的手段主要有激光燒蝕毀傷、無線電干擾誘騙、柔性網攔截等。其中,無線電干擾的攔截手段作用力強,成功率相對較高,但易影響其他正常的社會民生活動,并且由于無人機預先設定的程序模式不同,會出現墜落、懸停或返航等不同后果;激光燒蝕毀傷武器易受限于大霧、大雨、塵霾等外界環境的影響,同時,在城市環境下使用時,不宜使用激光進行燒蝕毀傷;柔性網攔截雖能對目標實施較高精度的防二次毀傷處置攔截,但受限于發射動能限制,其攔截范圍相對較小。這些攔截手段在防范距離、能效目標、場景/環境適應性、多目標處置等方面性能不一、各有所長,尚難有效可靠地解決典型防控場景下無人機類目標的處置攔截問題[4-6]。可見,面對不同的使用場景與環境約束,單一的攔截手段無法滿足目標防控需求,需要研究多種攔截裝備協同合作的途徑,以增強系統的防控效能[7]。
低慢小目標襲擾事件一般具有突發性,從發現目標到處置攔截的時間較短,對指揮決策的時效性和攔截策略的精確度都提出了很高的要求。傳統攔截決策依靠人為控制的方式無法在有限的時間內給出多種攔截裝備的任務規劃方案,需要研制自動化的指揮決策技術,實現多種攔截手段的有效協同,發揮出系統使用效能,實現對目標的復合攔截。
多體制裝備的復合攔截任務規劃,屬于典型的非線性規劃問題,其問題要素及規模以幾何級關系決定了其解空間的大小。為了有效地解決復合攔截任務規劃問題,需要將動態和靜態結合起來研究。枚舉法與動態規劃法等比較常用的算法,數學邏輯上雖然易于實現,但程序編寫繁雜,計算資源要求高,同等條件下算法收斂過程持續時間過長,適用解決的任務分配問題有限[8]。隨著智能技術的飛速發展,蟻群、遺傳等進化算法被引入于求解攔截任務規劃問題,但面對復雜場景,進化算法也難以保證求解精度與時間性能的匹配[9-10]。
本文針對低慢小目標的多體制處置手段的復合攔截任務規劃問題,研究引入一種改進的種群控制方法,編輯攔截效能可行域的編碼,縮小復合裝備的攔截性能與目標距離、航跡和飛行速度等要素構建的非線性規劃解空間,對規劃算法的主要影響參數進行分析,避免算法早熟,將合適的攔截裝備分配給那些滿足攔截條件的目標,以提高復合攔截任務規劃算法的性能。
低慢小目標的多體制處置手段的復合攔截任務規劃問題,主要是對諸如激光燒蝕毀傷、無線電干擾誘騙、柔性網攔截等異構處置手段的協同任務進行規劃,充分協調利用各資源的效能,以期通過多體制處置手段進行復合攔截以及時有效地對目標進行處置。為定量描述攔截裝備攔截任務分配問題,需要綜合考慮來襲低慢小目標的威脅程度、攔截裝備的處置攔截能力,下面討論求解攔截效能最佳的復合攔截任務規劃策略。
假設攔截裝備有nM個,攔截裝備集合表示為
UM={M1,M2,…,MnM}.
(1)
來襲目標有nT個,且其集合表示為
UT={T1,T2,…,TnT}.
(2)
設Pij代表第i個攔截裝備對第j個目標的攔截概率,Pij=0時表示攔截裝備不能對相應的目標實施處置攔截,Pij=1時表示攔截裝備能對相應的目標實施有效的攔截。則攔截裝備對目標的處置攔截性能矩陣可表示為
(3)
設Si為第i個攔截裝備擬處置攔截的目標序號,攔截裝備攔截任務規劃方案描述為
S={S1,S2,…,SnM}.
(4)
定義決策變量如下:當且僅當Si=j(表示第i個攔截裝備處置第j個目標)時,決策變量dij=1,否則dij=0。
定義目標的威脅系數為WT,表征來襲目標對防控區域的威脅權重:
WT={w1,w2,…,wnT}.
(5)
定義復合攔截效能函數為使攔截裝備對所有目標處置攔截概率之和為最大:
(6)
考慮上述處置手段的任務適應性,低慢小目標多體制處置手段的復合攔截任務規劃可轉化為一個受約束的優化問題,約束條件歸納如下:
(1) 攔截裝備與目標配對的0-1規劃問題[11],對于處置攔截低慢小目標的激光燒蝕毀傷、電子干擾誘騙、柔性網攔截等裝備來說,處于工作模式下時,每個攔截裝備Mi每次僅能處置攔截一個目標Tj:
(7)
式中:i=1,2,…,nM,j=1,2,…,nT,k=1,2,…,nT。
(2) 分配給激光、電子干擾誘騙、柔性網等攔截裝備Mi的目標必須在其攔截能力范圍內,且有
pij>0,(dij=1).
(8)
以式(6)作為目標函數,式(7),(8)為約束條件,即構成了復合攔截任務規劃數學模型。
規定nD維解空間中存在n個不同變量的粒子x=(x1,x2,…,xnD),對應的第m個粒子為xm=(xm1,xm2,…,xmnD),其位置為pm=(pm1,pm2,…,pmnD),速度為vm=(vm1,vm2,…,vmnD),種群全局最優粒子為pg=(pg1,pg2,…,pgnD)。
設l為粒子進化代數,則粒子群優化進化如下:
(9)
式中:變量b=1,2,…,nM為攔截裝備維數;隨機數r1,r2在[0,1]區間內均勻分布;學習因子c1,c2分別是粒子的自我認知和群體協同能力,w為粒子慣性權重。
設定粒子速度及位置約束如下:
(10)
(11)
在進化算法更新過程中,為保證進化算法結構保持連續粒子位置和速度更新中的迭代運算,采用直接離散化的方法以滿足獲取整數配對的需要,可通過對式(10),(11)中的粒子位置進行取整,并通過粒子對應的目標函數來評價此解的質量。
第l代的慣性權重系數更新的策略為
w=wini+(wend-wini)·l/lmax,
(12)
式中:wini,wend分別為對粒子群算法進化起始代到終止代慣性權重的限制;lmax為總進化代數。

(13)

如圖1所示,為了縮小任務規劃的映射空間,提升算法迭代速度,基于攔截效能可行域進行編碼。

圖1 粒子編碼Fig.1 Particle coding process

在群體數量不變的情況下,樣本濃度隨著搜索空間的增大而降低。為控制算法的搜索過程,以增強群體的覆蓋范圍,定義第l代群體的樣本濃度為1/ρl,并引進度量公式為
(14)

為了避免算法發生早熟從而陷入局部最優,通過濃度允許值改變粒子群的收縮與擴展運動,以增大群體聚集時的樣本空間,具體策略如下:
(1) 當ρl<ρmin時,可采用速度更新策略如下:
(15)
(2) 當ρl>ρmin時,采用式(10),(11)更新策略。

由表1可知,序號為2,3,6和7的武器可攔截第1個目標,序號為1,3,4,7和8的武器可攔截第2個目標,序號為1,4,6和9的武器攔截可第3個目標,序號為2,5,6和8的武器可攔截第4個目標,序號為2,3,5,7和9的武器可攔截第5個目標,序號為1,6和8的武器可攔截第6個目標,序號為2,4,5和7的武器可攔截第7個目標。

表1 攔截武器-目標毀傷概率Table 1 Weapon-target damage probability %
當學習因子設置為c1=c2=2時,計算得到全局最優粒子為Pg=(1,3,1,3,3,3,1,3,1),復合攔截分配方案為S=(2,5,1,7,7,4,1,6,3),復合攔截概率為f=87.17%,其復合攔截任務規劃方案如表2所示。

表2 不同學習因子對應的任務規劃方案Table 2 Assignment schemes with different learning factors
由表3可知,威脅值大的目標期望的攔截概率越大,由于第1和第7個目標的威脅值較高,所以分配了較多的武器:第1個目標由第3,7個武器復合攔截;第7個目標由第4,5個武器復合攔截,規劃結果符合實際作戰情況。

表3 任務規劃方案Table 3 Weapon-target assignment scheme
由圖2,3可知,采用新的粒子編碼策略,縮小了規劃任務問題的解空間的同時,效能函數具有更快的收斂速度,迭代過程具有全局尋優能力。

圖2 復合攔截效能Fig.2 Composite interception efficiency with different c1 & c2

圖3 粒子群尋優過程Fig.3 Particle swarm optimization process with different c1 & c2
通常而言,學習因子的取值越大,代表粒子的學習能力就越強,而對粒子群算法的影響相對較小。不失一般性,學習因子取值c1=c2=2。表4為不同種群規模對應的進化算法計算時間。

表4 不同群體規模對應的程序運算時間Table 4 Assignment schemes with different group size
由表4可見,隨著種群規模的增大,程序運算時間易隨之增長,這是由于算法計算的空間復雜度增加了。效能函數與粒子群尋優過程見圖4,5。
由圖4,5可見,隨著粒子數種群規模的增大,算法收斂速度變快;如果種群規模較小,算法的收斂速度也將隨之變小,同時算法的收斂精度也相對較低。種群規模可根據問題的復雜程度嘗試取值。

圖4 不同種群規模對應的復合攔截效能Fig.4 Composite interception efficiency with different N

圖5 不同種群規模對應的粒子群尋優過程Fig.5 Particle swarm optimization process with different N
表5給出了不同慣性權重所對應的任務規劃方案,圖6,7為不同慣性權重所對應的效能函數變化情況與粒子群尋優過程。

表5 不同慣性權重對應的任務規劃方案Table 5 Assignment schemes with different w
由圖6,7可見,隨著慣性權重的增大,粒子收斂速度變快,說明其繼承當前速度的程度相對較大,其局部的搜索能力也相對較強;反言之,慣性權重取值較小時,粒子的全局搜索能力相對較強,局部搜索能力變弱。本文后續算法中,慣性權重采用線性遞減法取值,且wmax=0.9,wmin=0.4,wt=wmax-t(wmax-wmin)/tmax。

圖6 不同慣性權重對應的復合攔截效能Fig.6 Composite interception efficiency with different w

圖7 不同慣性權重對應的粒子群尋優過程Fig.7 Particle swarm optimization process with different w
低慢小目標區域協同防控過程多體制攔截裝備復合攔截任務規劃是一個非常典型的多約束條件下的0-1整數規劃問題,其目的是盡可能發揮系統的最大防控作戰效能。本文研究引入了一種基于常見攔截裝備攔截效能可行域的粒子編碼方法,以縮小規劃問題的解空間,加快粒子尋優過程的搜索速度,避免了算法早熟現象,獲得更高效的全局尋優能力的同時擺脫局部最優限制,對于低慢小目標協同防控過程多體制攔截裝備復合攔截的任務規劃可提供一定的參考。