周尚輝,曾德賢,胡晶晶,3,張岐龍,楊江波
(1.航天工程大學(xué), 北京 101416;2.中國人民解放軍95806部隊(duì), 北京 100076;3.中國人民解放軍31638部隊(duì), 昆明 650100)
隨著航天技術(shù)在國家安全、經(jīng)濟(jì)、社會服務(wù)和軍事等眾多領(lǐng)域的廣泛應(yīng)用,人類對太空的依賴性日益增強(qiáng),太空已成為維護(hù)國家安全和國家利益的戰(zhàn)略制高點(diǎn)[1]。世界各航天強(qiáng)國紛紛致力于推動航天發(fā)射任務(wù)和太空武器建設(shè),試圖搶占有限的太空資源。由此引發(fā)了太空目標(biāo)數(shù)量呈指數(shù)級的增長和太空武器技術(shù)呈多樣化的發(fā)展,給預(yù)警監(jiān)視任務(wù)中雷達(dá)組網(wǎng)有限的資源調(diào)配帶來了嚴(yán)峻挑戰(zhàn)。截至2021年底,地球上空已有超過4900顆衛(wèi)星、空間站、航天飛船等航天器保持穩(wěn)定在軌運(yùn)行。預(yù)計到2028年,隨著“星鏈”(starlink)、“一網(wǎng)”(oneweb)等全球大量低軌互聯(lián)網(wǎng)通信衛(wèi)星星座完成發(fā)射部署,地球太空軌道上將有超過50 000顆衛(wèi)星[2-4]。與此同時,臨近空間飛行器、高超音速導(dǎo)彈等一系列新型太空武器也相繼問世。基于經(jīng)驗(yàn)、半經(jīng)驗(yàn)?zāi)P偷睦走_(dá)組網(wǎng)人工資源調(diào)度方法已難以與日益繁重的預(yù)警監(jiān)視任務(wù)相適應(yīng)。
針對當(dāng)前預(yù)警監(jiān)視任務(wù)中雷達(dá)組網(wǎng)資源調(diào)度方法難以與太空目標(biāo)數(shù)量井噴式增長、太空武器多樣化發(fā)展的趨勢相適應(yīng)的問題,基于人工智能算法,面向反導(dǎo)預(yù)警和空間目標(biāo)監(jiān)視2類任務(wù)開展雷達(dá)組網(wǎng)資源調(diào)度方法研究,合理調(diào)配系統(tǒng)資源,充分發(fā)揮雷達(dá)組網(wǎng)探測效能,推動系統(tǒng)向自主任務(wù)處理、自動目標(biāo)分配與自適應(yīng)指揮控制方向發(fā)展,可為提高預(yù)警監(jiān)視能力建設(shè)水平和戰(zhàn)斗力生成發(fā)揮重要技術(shù)支撐作用。
預(yù)警監(jiān)視雷達(dá)組網(wǎng)作為預(yù)警監(jiān)視系統(tǒng)的主體部分,集“戰(zhàn)略預(yù)警”與“天域感知”于一體,利用系統(tǒng)中多種類型的專用裝備和兼用裝備構(gòu)建預(yù)警監(jiān)視網(wǎng),在反導(dǎo)預(yù)警和空間目標(biāo)監(jiān)視作戰(zhàn)任務(wù)中對目標(biāo)進(jìn)行跟蹤探測,通過各傳感器節(jié)點(diǎn)間的信息共享實(shí)現(xiàn)“一點(diǎn)發(fā)現(xiàn)、全網(wǎng)皆知”,是國家遂行戰(zhàn)略安全任務(wù)的“壓艙石”與“制高點(diǎn)”。預(yù)警監(jiān)視雷達(dá)組網(wǎng)的工作效能在很大程度上取決于對組網(wǎng)內(nèi)各雷達(dá)有限探測資源的合理分配調(diào)度。同時,在“陸、海、空、天、電”五位一體的現(xiàn)代高技術(shù)局部戰(zhàn)爭中,諸如電磁干擾、反輻射導(dǎo)彈等作戰(zhàn)手段都給預(yù)警監(jiān)視雷達(dá)組網(wǎng)中裝備的生存帶來了極大威脅。因此,對預(yù)警監(jiān)視雷達(dá)組網(wǎng)內(nèi)資源的合理調(diào)度,對于提升系統(tǒng)效能和魯棒性具有極其重要的意義。
面向預(yù)警監(jiān)視任務(wù)的雷達(dá)組網(wǎng)資源調(diào)度,是在滿足任務(wù)需求和約束條件的基礎(chǔ)上,通過對其所包含探測資源在時間維度上的合理調(diào)度[5],優(yōu)化目標(biāo)分配排序作業(yè)方案,以實(shí)現(xiàn)對預(yù)警監(jiān)視目標(biāo)更加精準(zhǔn)高效探測的過程。而以最優(yōu)資源調(diào)度為目標(biāo)的探測任務(wù)旨在資源受限的條件下盡可能地提高協(xié)同探測性能,或在滿足任務(wù)需求情況下盡可能地降低系統(tǒng)資源消耗[6],由此帶來資源調(diào)度問題場景復(fù)雜、計算量大、精度要求高的特性[1]。
1.2.1反導(dǎo)預(yù)警任務(wù)中的資源調(diào)度原則
反導(dǎo)預(yù)警任務(wù)是指在面臨來襲的彈道導(dǎo)彈目標(biāo)時,根據(jù)探測后計算得到的導(dǎo)彈運(yùn)動參數(shù)預(yù)測導(dǎo)彈的飛行彈道與時序,為我方開展相應(yīng)防御行動提供預(yù)警時間以避免或減小遇襲損失,同時指示彈道導(dǎo)彈防御系統(tǒng)對其進(jìn)行攔截的一類作戰(zhàn)任務(wù),主要由反導(dǎo)預(yù)警系統(tǒng)負(fù)責(zé)實(shí)施[7]。
反導(dǎo)預(yù)警任務(wù)的最終目的是對來襲導(dǎo)彈發(fā)出預(yù)警,從而開展防御攔截行動。因此,預(yù)警力量將更多地關(guān)注投入到具有實(shí)質(zhì)性威脅的彈頭目標(biāo)上,同時對系統(tǒng)的目標(biāo)截獲能力提出了很高的要求,確保威脅目標(biāo)在波束掃描過程中不被漏掉。通常情況下,預(yù)警雷達(dá)會根據(jù)任務(wù)需要設(shè)立搜索屏,在目標(biāo)穿屏?xí)r將其截獲,也會通過增設(shè)搜索屏的方式提高系統(tǒng)的目標(biāo)截獲能力。反導(dǎo)預(yù)警任務(wù)中,雷達(dá)組網(wǎng)將盡可能掌握威脅目標(biāo)和提高目標(biāo)截獲概率作為其資源調(diào)度的原則。
1.2.2空間目標(biāo)監(jiān)視任務(wù)中的資源調(diào)度原則
空間目標(biāo)監(jiān)視任務(wù)是指利用雷達(dá)等探測設(shè)備對所有人造天體進(jìn)入、離開空間以及在空間中運(yùn)行的過程進(jìn)行探測,并據(jù)此結(jié)合相關(guān)太空目標(biāo)情報資料,綜合處理分析出目標(biāo)軌道、功能、威脅等基本信息,生成全要素的空間態(tài)勢,以向各類航天活動提供有效信息支持的一類作戰(zhàn)任務(wù)[8]。其主要特點(diǎn)是探測活動的非合作性、信息要素的完備性以及監(jiān)視過程的長期性等。
空間目標(biāo)監(jiān)視任務(wù)旨在監(jiān)視空間目標(biāo)在軌狀態(tài),通過獲取的軌道信息生成全要素的空間態(tài)勢。因此,監(jiān)視力量需要以較高的測量精度對目標(biāo)精確定軌,將其作為識別編目工作的依據(jù)。空間目標(biāo)監(jiān)視任務(wù)中,雷達(dá)組網(wǎng)將保證雷達(dá)對目標(biāo)的測量精度作為其資源調(diào)度的原則。
實(shí)戰(zhàn)條件下的預(yù)警監(jiān)視雷達(dá)組網(wǎng)往往承擔(dān)著預(yù)警與監(jiān)視2個類別中的多項(xiàng)作戰(zhàn)任務(wù)。當(dāng)面臨多個任務(wù)沖突時,需要依據(jù)任務(wù)的優(yōu)先級給出雷達(dá)組網(wǎng)有限資源的調(diào)配建議,供指揮員決策參考,最終制定生成一套全局作戰(zhàn)方案,確保投入的作戰(zhàn)力量與任務(wù)的優(yōu)先級成正比。為了更加科學(xué)、合理地對任務(wù)進(jìn)行評估,采用層次分析法對任務(wù)優(yōu)先級進(jìn)行劃分。
基于層次分析法的任務(wù)優(yōu)先級劃分將任務(wù)優(yōu)先級作為目標(biāo)層;將任務(wù)重要程度、任務(wù)緊急程度、先驗(yàn)情報完備程度以及作戰(zhàn)決心作為準(zhǔn)則層;將待劃分的各作戰(zhàn)任務(wù)(以3個任務(wù)為例)作為方案層,構(gòu)建遞階層次結(jié)構(gòu)模型,如圖1所示。

圖1 遞階層次結(jié)構(gòu)模型
模型將復(fù)雜問題分解為多個組成因素便于分析,分析過程中以相對重要程度為依據(jù),采用兩兩比較的方式構(gòu)造判斷矩陣An*n,其中元素aij表示該層次中對象Bi與對象Bj基于上一層次的重要程度之比,aji=1/aij,取值采用1~9標(biāo)度法表示,并通過計算一致性指標(biāo)C.I.和一致性比率C.R.檢驗(yàn)判斷矩陣的一致性。
在構(gòu)造判斷矩陣的基礎(chǔ)上,運(yùn)用特征值法求得本層次各對象相對于上一層次的權(quán)重系數(shù),填充權(quán)重矩陣,如表1所示。由任務(wù)優(yōu)先級的計算公式計算各作戰(zhàn)任務(wù)的任務(wù)優(yōu)先級OPi,并按照從大到小的順序進(jìn)行任務(wù)優(yōu)先排序[9]。

表1 任務(wù)優(yōu)先級權(quán)重矩陣
OPi=wC1wC1i+wC2wC2i+wC3wC3i+wC4wC4i
(4)
假設(shè)預(yù)警監(jiān)視雷達(dá)組網(wǎng)由N部雷達(dá)組成,在K個單位作戰(zhàn)時間內(nèi)對M個目標(biāo)進(jìn)行協(xié)同探測,在滿足充分利用探測資源的條件下,盡可能實(shí)現(xiàn)探測目標(biāo)價值累積與跟蹤質(zhì)量最大化。定義三維分配矩陣Xm*n*k,表示各時刻雷達(dá)對目標(biāo)探測的跟蹤資源分配,如圖2所示,同一目標(biāo)的跟蹤情況用同一顏色表示,其中元素xijt為0-1變量。當(dāng)xijt=1時,表示t時刻分配第j部雷達(dá)資源對第i個目標(biāo)進(jìn)行跟蹤探測[10],否則xijt=0。

圖2 三維分配矩陣示意圖
N部雷達(dá)具有不同的跟蹤測量精度pj和探測容量cj,M個目標(biāo)依據(jù)價值不同被賦予不同價值等級wi。用tij0、tijs分別表示第i個目標(biāo)進(jìn)入和飛出第j部雷達(dá)探測范圍的時刻,其差值為第i個目標(biāo)在第j部雷達(dá)探測范圍內(nèi)的駐留時間tij。
tij=tijs-tij0
(5)
當(dāng)目標(biāo)進(jìn)入雷達(dá)探測范圍,雷達(dá)對目標(biāo)進(jìn)行搜索,截獲方向與雷達(dá)陣面法線方向之間存在波束指向角eij[11]。雷達(dá)天線在不同波束指向角條件下用于發(fā)射/接收能量的等效口徑面積不同,因而雷達(dá)波束的能量大小也不同,直接影響雷達(dá)對目標(biāo)的搜索截獲及探測效果,如圖3所示,天線等效口徑面積As為法線方向時面積A在等相面上的投影。隨著波束指向角增大,天線等效口徑面積減小,天線增益隨之下降,等效天線方向用于搜索截獲目標(biāo)的雷達(dá)波束能量相應(yīng)減弱。

圖3 波束指向角對天線等效口徑面積的影響
由此可得目標(biāo)函數(shù):
式中,K1、K2、K3分別為對目標(biāo)價值等級、雷達(dá)測量精度、波束指向能量的賦權(quán)值。依據(jù)不同任務(wù)場景及用戶需求靈活取值,表示對影響目標(biāo)跟蹤探測效能3個因素的不同看重程度。
在反導(dǎo)預(yù)警和空間目標(biāo)監(jiān)視2類任務(wù)場景中,探測任務(wù)對預(yù)警監(jiān)視雷達(dá)組網(wǎng)的目標(biāo)跟蹤探測提出了不同的需求,且任務(wù)對象具有不同特性,由此帶來2類任務(wù)場景下模型參數(shù)的不同配置。
在反導(dǎo)預(yù)警任務(wù)中,彈道導(dǎo)彈目標(biāo)作為任務(wù)對象,包括彈頭、彈體、誘餌、碎片等多類目標(biāo),且在飛行過程中呈多組團(tuán)目標(biāo)分布,每組團(tuán)目標(biāo)中主體目標(biāo)周圍有若干伴飛物[12],各目標(biāo)依據(jù)威脅程度不同被賦予不同威脅等級,即價值等級wi。雷達(dá)在對團(tuán)目標(biāo)進(jìn)行探測時,由于團(tuán)目標(biāo)內(nèi)各目標(biāo)間距離相對于探測距離而言可以小到忽略不計,因此近似認(rèn)為同一團(tuán)目標(biāo)內(nèi)各目標(biāo)均在tij0和tijs時刻進(jìn)入和飛出雷達(dá)探測范圍,即駐留時間tij相同。反導(dǎo)作戰(zhàn)的特殊性決定了預(yù)警監(jiān)視雷達(dá)組網(wǎng)的“不容閃失”,首要任務(wù)就是預(yù)警來襲的彈頭目標(biāo),及時截獲并傳遞信息給攔截武器,以清除對我防衛(wèi)目標(biāo)的威脅。因此模型目標(biāo)函數(shù)應(yīng)更加關(guān)注目標(biāo)威脅程度和搜索截獲能力帶來的影響,適當(dāng)增加目標(biāo)價值等級和波束指向能量在目標(biāo)函數(shù)中的權(quán)重,使K1、K3高于K2。
在空間目標(biāo)監(jiān)視任務(wù)中,空間目標(biāo)飛行在大氣層以外的外層空間,距離探測雷達(dá)很遠(yuǎn),而精確定軌是進(jìn)一步開展識別編目的前提條件,從而對預(yù)警監(jiān)視雷達(dá)組網(wǎng)的測量精度提出了很高的要求[13]。同時,空間目標(biāo)監(jiān)視任務(wù)為監(jiān)視活動,旨在監(jiān)視目標(biāo)在軌狀態(tài),目標(biāo)不存在直接威脅,僅依據(jù)關(guān)注程度劃分價值等級。因此模型目標(biāo)函數(shù)應(yīng)更加關(guān)注測量精度帶來的影響,弱化對目標(biāo)價值的區(qū)分和截獲時效性,適當(dāng)增加雷達(dá)測量精度在目標(biāo)函數(shù)中的權(quán)重,使K2高于K1、K3。
2.3.1時間約束
在反導(dǎo)預(yù)警任務(wù)場景中,遠(yuǎn)程預(yù)警雷達(dá)跟蹤探測目標(biāo)后引導(dǎo)交接給精確識別雷達(dá),最終生成火力攔截引導(dǎo)信息。攔截武器具有安全近界,需要目標(biāo)在安全近界之外進(jìn)行火力攔截才有效,同時遠(yuǎn)程預(yù)警雷達(dá)需要一定時長生成引導(dǎo)信息并向后傳遞。因此雷達(dá)的有效探測受限于一個時間約束的距離區(qū)間,包括一個近界和一個遠(yuǎn)界,近界為預(yù)警截止時間tijl帶來的約束,遠(yuǎn)界為雷達(dá)最大探測距離,受到目標(biāo)進(jìn)入雷達(dá)探測范圍時刻tij0的約束。
xijt=0 ?t∈(0,tij0)∪(tijl,∞), ?i,j
(7)
在空間目標(biāo)監(jiān)視任務(wù)場景中,雷達(dá)對目標(biāo)的探測目的為監(jiān)視目標(biāo)在軌狀態(tài),不需要向攔截武器傳遞信息,僅受限于目標(biāo)進(jìn)入和飛出雷達(dá)探測范圍的時刻tij0、tijs。
xijt=0 ?t∈(0,tij0)∪(tijs,∞), ?i,j
(8)
2.3.2方向約束
執(zhí)行預(yù)警監(jiān)視任務(wù)的相控陣?yán)走_(dá)由大量獨(dú)立可控的小型天線元件構(gòu)成其天線陣面,包含多個陣元。雷達(dá)可通過計算機(jī)系統(tǒng)控制各陣元電流的相位,以達(dá)到改變波束掃描方向的目的,陣元數(shù)目越多,則波束掃描方位的范圍就越大[14]。而預(yù)警監(jiān)視雷達(dá)組網(wǎng)中部分相控陣?yán)走_(dá)陣面固定,不具備隨動功能,受限于旁瓣能量衰減和陣元數(shù)目有限,僅能夠在與雷達(dá)陣面法線一定夾角范圍內(nèi)進(jìn)行有效探測,即存在方位約束角θ。該約束僅取決于雷達(dá)裝備性能,在反導(dǎo)預(yù)警與空間目標(biāo)監(jiān)視任務(wù)場景下均成立。
xijt=0 ?eij>θ, ?i,j,t
(9)
2.3.3容量約束
雷達(dá)同一時刻可探測的目標(biāo)數(shù)量受限于裝備的探測容量,表現(xiàn)為預(yù)警監(jiān)視系統(tǒng)探測資源的飽和。該約束僅取決于雷達(dá)裝備性能,在反導(dǎo)預(yù)警與空間目標(biāo)監(jiān)視任務(wù)場景下均成立。
2.3.4冗余約束
在預(yù)警監(jiān)視雷達(dá)組網(wǎng)探測過程中,多部雷達(dá)共同探測同一目標(biāo)可通過融合手段有效提升協(xié)同探測整體效果,并增強(qiáng)系統(tǒng)的魯棒性,但過多的重復(fù)探測則會造成探測資源的浪費(fèi),形成目標(biāo)占用冗余。通常認(rèn)為2~3部雷達(dá)共同探測較為合理,多于3部雷達(dá)重復(fù)探測則屬于資源浪費(fèi),違背了充分利用跟蹤探測資源的初衷。該約束僅取決于提高資源利用率原則,在反導(dǎo)預(yù)警與空間目標(biāo)監(jiān)視任務(wù)場景下均成立。
2.3.5連續(xù)性約束
在反導(dǎo)預(yù)警任務(wù)場景中,目標(biāo)被劃分為多組團(tuán)目標(biāo),團(tuán)目標(biāo)內(nèi)各目標(biāo)間距離相近,區(qū)分難度大。為保證目標(biāo)跟蹤的連續(xù)性,避免因雷達(dá)頻繁交接而帶來時空配準(zhǔn)偏差,最終導(dǎo)致目標(biāo)交叉匹配錯誤,因此在跟蹤探測目標(biāo)過程中需要盡可能減少雷達(dá)間交接。當(dāng)一個雷達(dá)資源被分配對目標(biāo)i進(jìn)行跟蹤探測,則自此時刻起,該雷達(dá)保持對目標(biāo)i的持續(xù)探測,直至無法對目標(biāo)i進(jìn)行有效探測,不在中途向其他雷達(dá)交接。
在空間目標(biāo)監(jiān)視任務(wù)場景中,目標(biāo)獨(dú)立在軌運(yùn)行,不存在團(tuán)目標(biāo)內(nèi)目標(biāo)交叉匹配錯誤的問題,且目標(biāo)運(yùn)動遵循開普勒定律,軌跡相對穩(wěn)定,不受雷達(dá)交接頻次的限制。而雷達(dá)通過對空間目標(biāo)飛行軌跡中一個弧段的跟蹤探測,多次取樣獲取不同時刻的目標(biāo)位置信息,從而計算軌道參數(shù),取樣次數(shù)越多,定軌精度就越高。為滿足空間目標(biāo)監(jiān)視定軌精度的要求,需要對每部雷達(dá)限制最小連續(xù)探測時長,用于生成有效監(jiān)視弧段。因此,雷達(dá)對目標(biāo)的連續(xù)探測時長不得小于有效監(jiān)視弧段時長tmin[15]。
3.1 基礎(chǔ)算法概述
3.1.1模擬退火算法
模擬退火算法(simulated annealing,SA)是一種基于概率的隨機(jī)全局優(yōu)化算法,其基本思想源于對物理學(xué)中固體物質(zhì)冷卻退火過程的模擬。模擬退火過程中,處于高溫的固體物質(zhì)內(nèi)能極大,內(nèi)部分子呈無序運(yùn)動,隨著溫度的降低,固體物質(zhì)逐漸冷卻,內(nèi)部分子的運(yùn)動逐漸從無序化向有序化過渡,直到某一低溫時固體物質(zhì)內(nèi)能降至最小,達(dá)到相對穩(wěn)定的狀態(tài)。
模擬退火算法依據(jù)Metropolis準(zhǔn)則以一定的概率接受較差的新解,能夠在解空間內(nèi)不斷概率性地跳出局部最優(yōu)解,具有較強(qiáng)的全局搜索能力[16]。
3.1.2粒子群算法
粒子群算法(particle swarm optimization,PSO)是一種基于群體智能的優(yōu)化算法,其基本原理源于對鳥群覓食行為的研究,以信息的社會共享為基礎(chǔ),利用多個帶有記憶的粒子作為個體在空間中進(jìn)行最優(yōu)解搜索。在搜索過程中,各粒子既保留自身向認(rèn)知區(qū)域最優(yōu)解靠近的趨勢,又通過粒子之間的信息傳遞獲取群體的經(jīng)驗(yàn),在搜索空間中追隨最優(yōu)粒子,實(shí)現(xiàn)“和而不同”的粒子群搜索。
粒子群算法采用速度-位移的簡單模型,通過慣性因子對前次迭代的速度進(jìn)行繼承,并通過學(xué)習(xí)因子在“自我認(rèn)知”與“社會經(jīng)驗(yàn)”間進(jìn)行平衡,在保留自身認(rèn)知的同時追隨最優(yōu)粒子,在每一步長搜索后,利用自身的記憶功能對個體最佳位置和群體最佳位置進(jìn)行更新,逐次迭代更新直至搜索到全局最優(yōu)解[17]。
根據(jù)建立的雷達(dá)組網(wǎng)資源調(diào)度模型,將粒子群算法引入資源調(diào)度問題的求解,通過其與模型目標(biāo)函數(shù)、約束條件的有機(jī)結(jié)合,并融合模擬退火算法的優(yōu)化思想,對算法適應(yīng)度函數(shù)、編碼方式及執(zhí)行策略等進(jìn)行改進(jìn),提出面向目標(biāo)分配排序作業(yè)的模擬退火混合離散粒子群算法(improved simulated annealing &binary particle swarm optimization algorithm,ISABPSO),將雷達(dá)組網(wǎng)的目標(biāo)分配排序作業(yè)方案視作粒子,每一種方案對應(yīng)一個三維分配矩陣Xm*n*k。由此將問題轉(zhuǎn)化為離散空間的組合優(yōu)化問題,運(yùn)用二進(jìn)制離散粒子群算法,將模型目標(biāo)函數(shù)直接作為適應(yīng)度函數(shù),在眾多方案中搜索使適應(yīng)度函數(shù)取得最大值的方案,即最優(yōu)解。
3.2.1編碼離散化
大量粒子在D維目標(biāo)搜索空間中進(jìn)行搜索,任一粒子c在空間中的位置可由D維位置矢量Xc表示,粒子單位步長移動的距離,即飛行速度可由D維速度Vc表示,粒子的優(yōu)劣程度可由適應(yīng)度F(Xc)表示。每個粒子對應(yīng)的三維分配矩陣Xm*n*k由m×n×k個元素xijt構(gòu)成,取值為{0,1},每個元素代表一個維度。可將三維分配矩陣Xm*n*k變換為一行m×n×k列的向量粒子,其中元素xijt按照i、j、t依次遞增遍歷的順序排列,如圖4所示。

圖4 粒子編碼結(jié)構(gòu)
Xc=(xc1,xc2,…,xcD)
(14)
Vc=(vc1,vc2,…,vcD)
(15)
D=m×n×k
(16)
粒子在各維度的尋優(yōu)空間限定在0~1,即任一粒子c位置矢量在d維上的分量xcd取值為{0,1}。粒子在各維度的飛行速度可通過Sigmoid函數(shù)轉(zhuǎn)換為一個范圍[0,1]的概率選擇參數(shù)s,用于判定粒子在該維度移動后的位置矢量取值為0或1,使算法完成編碼離散化,適用于離散二進(jìn)制空間。
3.2.2初始化粒子群
按照設(shè)定的群體規(guī)模M,隨機(jī)生成M個向量粒子,作為初始粒子群,其中每個粒子有D個元素,各元素在{0,1}中取值。資源調(diào)度問題求解的目的是在滿足充分利用探測資源的條件下,盡可能實(shí)現(xiàn)探測效益的最大化,原則上所有目標(biāo)在整個作戰(zhàn)時間內(nèi)都會被3部雷達(dá)探測到。為了提高算法的求解效率,在構(gòu)造初始粒子群中的每個粒子時,生成3×m×k個1元素,隨機(jī)放入一行m×n×k列的向量粒子中,其他各元素取值為0,使各粒子的適應(yīng)度更接近于問題最優(yōu)解的最大適應(yīng)度,以此加快收斂速度。
3.2.3極值更新
在每次迭代過程中,粒子(c)都以個體極值Pbest,c和全局極值Gbest等2個極值為目標(biāo)來實(shí)現(xiàn)自我更新,并通過對比適應(yīng)度存儲新的極值,經(jīng)歷多次迭代,最終得到適應(yīng)度最大的最優(yōu)粒子。其中,個體極值Pbest,c為粒子自身搜索到的歷史最優(yōu)解,用以表示目前個體最佳位置,全局極值Gbest為整個粒子群搜索到的歷史最優(yōu)解,用以表示經(jīng)所有粒子搜索后的群體最佳位置。
Pbest,c=(pc1,pc2,…,pcD)
(18)
Gbest=(g1,g2,…,gD)
(19)
3.2.4粒子更新
在粒子更新過程中,運(yùn)用完全型粒子群算法公式對粒子各維度的速度和位置進(jìn)行更新。粒子在每一步長的運(yùn)動中,均以追尋當(dāng)前2個極值為目標(biāo),通過對自身速度和位置在各維度上的更新,實(shí)現(xiàn)迭代尋優(yōu)。
粒子c的d維速度更新公式為:
可見速度更新公式由慣性部分、認(rèn)知部分、社會部分等3個部分組成。慣性部分通過慣性因子w控制粒子前次迭代速度對當(dāng)前迭代速度的影響大小;認(rèn)知部分通過自我學(xué)習(xí)因子c1調(diào)節(jié)粒子移動步長受自我影響因素的大小;社會部分通過群體學(xué)習(xí)因子c2調(diào)節(jié)粒子移動步長受群體影響因素的大小[18]。其中,學(xué)習(xí)因子c1和c2均不為0,避免出現(xiàn)“盲目從眾”或“盲目自大”的現(xiàn)象。式(22)中r1和r2均表示取值范圍[0,1]的隨機(jī)數(shù),用于增強(qiáng)算法的搜索隨機(jī)性。粒子在3個部分的共同作用下,綜合各影響因素以決定下一步的移動,如圖5所示,其中,灰色線條表示前次迭代速度對粒子的影響,藍(lán)色線條表示個體最佳位置對粒子的影響,紅色線條表示群體最佳位置對粒子的影響。粒子更新的速度變化范圍限定在[-vmax,d,vmax,d]內(nèi)。

圖5 粒子更新示意圖
在粒子速度得到更新后,通過對概率選擇參數(shù)s的判斷,完成粒子位置的更新。隨機(jī)產(chǎn)生一個0到1之間的隨機(jī)數(shù)ρ,若ρ小于此刻的Sigmoid函數(shù)值,則粒子位置矢量在該維度更新后取值為1,否則取值為0。
粒子c的d維位置更新公式為:
3.2.5模擬退火機(jī)制
針對二進(jìn)制離散粒子群算法易陷入局部最優(yōu)的問題,在算法執(zhí)行過程中增加模擬退火機(jī)制,利用模擬退火算法在搜索過程中概率突跳的能力對其進(jìn)行混合改進(jìn),增強(qiáng)其全局搜索能力。
根據(jù)初始粒子群中全局極值的適應(yīng)度計算得出模擬退火機(jī)制的初始控制溫度T0,并設(shè)定降溫函數(shù)。
Tk+1=λTk
(25)
基于Metropolis準(zhǔn)則,通過將個體極值Pbest,c和全局極值Gbest視作模擬退火的新解和舊解,計算各Pbest,c的退火適應(yīng)度,用于確定接受較差新解的概率[19]。
運(yùn)用輪盤賭選擇法,從所有個體極值Pbest,c中選取一個作為本次迭代的新解,用以替換全局極值Gbest舊解。通過對各Pbest,c的退火適應(yīng)度依次累加,計算得到累積概率comfit(n),隨機(jī)產(chǎn)生一個0到1之間的隨機(jī)數(shù)pBet,使累積概率無限逼近它,選用滿足條件comfit(r-1) 在粒子更新后判定是否滿足終止條件,若滿足則輸出最優(yōu)解,否則通過降溫函數(shù)降低控制溫度后,在新的控制溫度Tk下,再次迭代搜索最優(yōu)解。 算法步驟如下。 步驟1將三維分配矩陣Xm*n*k中元素xijt按照i、j、t依次遞增遍歷的順序排列,進(jìn)行m×n×k位的二進(jìn)制編碼,并通過Sigmoid函數(shù)將粒子速度轉(zhuǎn)換為用于判定的概率選擇參數(shù)s,使粒子的位置更新適應(yīng)二進(jìn)制編碼,完成離散化處理。 步驟4根據(jù)全局極值的適應(yīng)度計算得到模擬退火過程的初始控制溫度T0。 步驟5基于Metropolis準(zhǔn)則,計算當(dāng)前溫度下各粒子個體極值的退火適應(yīng)度。 步驟6通過對各粒子個體極值的退火適應(yīng)度依次累加,計算得到累積概率comfit(n),運(yùn)用輪盤賭選擇法,依累積概率從所有粒子個體極值中選取一個替換速度更新公式中的全局極值。 步驟7通過粒子的速度和位置更新公式對粒子進(jìn)行更新。 步驟8粒子更新后依據(jù)約束條件對其進(jìn)行判定,若不滿足約束條件需進(jìn)行群體修正后轉(zhuǎn)入后續(xù)步驟。 步驟9通過對比各粒子與其個體極值的適應(yīng)度,更新個體極值,通過對比全局所有粒子個體極值的適應(yīng)度,更新全局極值。 步驟10判定是否滿足終止條件,若目標(biāo)函數(shù)值收斂或達(dá)到最大迭代次數(shù),則對當(dāng)前全局極值進(jìn)行解碼,輸出最優(yōu)目標(biāo)分配排序作業(yè)方案,否則依降溫函數(shù)進(jìn)行退火操作后返回步驟5。 算法的流程圖如圖6所示。 圖6 ISABPSO算法流程 選用計算時間、資源節(jié)省率和算法合格率作為評價指標(biāo),通過與枚舉法對比以驗(yàn)證算法的可靠性與先進(jìn)性。其中,計算時間是指在設(shè)定的計算機(jī)配置條件下,算法從開始運(yùn)行直至結(jié)束所消耗的時間;資源節(jié)省率是指在滿足任務(wù)要求情況下空閑單位探測資源數(shù)量占總探測資源數(shù)量的比例;算法合格率是指蒙特卡洛實(shí)驗(yàn)環(huán)境下超過設(shè)定目標(biāo)函數(shù)合格線(最大值的90%)的實(shí)驗(yàn)次數(shù)占總實(shí)驗(yàn)次數(shù)的比例。 構(gòu)建一個空間目標(biāo)監(jiān)視任務(wù)仿真實(shí)例:4部雷達(dá)裝備(如表2所示)組成預(yù)警監(jiān)視雷達(dá)組網(wǎng),在15個單位作戰(zhàn)時間內(nèi)對16個價值等級不同的空間目標(biāo)(如表3所示)進(jìn)行協(xié)同探測。設(shè)定有效監(jiān)視弧段時長tmin為3個單位作戰(zhàn)時間;各目標(biāo)進(jìn)入和飛出雷達(dá)探測范圍的時刻tij0、tijs以及各雷達(dá)截獲目標(biāo)時的波束指向角eij如表4所示。 表2 雷達(dá)裝備指標(biāo) 表3 空間目標(biāo)價值等級 表4 目標(biāo)進(jìn)出雷達(dá)探測范圍時刻及截獲時波束指向角 以仿真實(shí)例為背景,在2.8 GHz Intel Core i7處理器和8G內(nèi)存的計算機(jī)配置條件下進(jìn)行計算,分別用枚舉法(ENUM)和ISABPSO算法求解,ISABPSO算法參數(shù)取值如表5所示。 表5 ISABPSO算法參數(shù)取值 2種方法下目標(biāo)函數(shù)曲線分別如圖7和圖8所示,ENUM算法中目標(biāo)函數(shù)在循環(huán)800次時取得最大值0.726 57;而ISABPSO算法中目標(biāo)函數(shù)僅在迭代70次時取得最大值0.7873。以甘特圖形式表示ISABPSO算法下的最優(yōu)目標(biāo)分配排序作業(yè)方案,如圖9所示,并記錄2種方法下的評價指標(biāo)數(shù)值,如表6所示。 表6 ISABPSO算法與ENUM算法對比 圖7 ENUM算法目標(biāo)函數(shù)曲線 圖8 ISABPSO算法目標(biāo)函數(shù)曲線 圖9 最優(yōu)目標(biāo)分配排序作業(yè)方案甘特圖 本研究創(chuàng)造性地提出“預(yù)警任務(wù)+監(jiān)視任務(wù)”的研究思路,將層次分析法和人工智能算法引入預(yù)警監(jiān)視雷達(dá)組網(wǎng)資源調(diào)度,面向預(yù)警與監(jiān)視任務(wù)場景構(gòu)建資源調(diào)度模型,在模擬退火算法和粒子群算法的基礎(chǔ)上提出了ISABPSO算法,對預(yù)警監(jiān)視任務(wù)中的雷達(dá)組網(wǎng)資源調(diào)度問題進(jìn)行求解。根據(jù)仿真實(shí)驗(yàn)可得出以下結(jié)論: 1) ISABPSO算法有效提高了求解方法的運(yùn)算速度。 2) ISABPSO算法有效提高了資源調(diào)度方案的資源利用率。 3) ISABPSO算法有效提高了求解方法的魯棒性。 綜上所述,運(yùn)用ISABPSO算法,可通過更具優(yōu)勢的智能手段解決預(yù)警監(jiān)視任務(wù)中的雷達(dá)組網(wǎng)資源調(diào)度問題,探索了一條開展預(yù)警監(jiān)視系統(tǒng)資源調(diào)度研究的新途徑、新思路,能夠在一定程度上為預(yù)警監(jiān)視領(lǐng)域研究學(xué)者和裝備操控技術(shù)人員開展后續(xù)研究提供幫助。3.3 算法流程



4 仿真驗(yàn)證








5 結(jié)論