白釗銘, 廖可非,2*, 歐陽繕,2, 李晶晶, 黎愛瓊
(1.桂林電子科技大學信息與通信學院,桂林 541004;2.衛星導航定位與位置服務國家地方聯合工程研究中心 (桂林電子科技大學),桂林 541004)
在日益復雜多變的作戰場景中,突發事件隨時都有可能發生。多功能組網雷達不僅需要實時快速地應付突發事件,還需要同時完成對多個目標的搜索、跟蹤和成像等任務,因此,在短時間內得到最優的多功能組網雷達資源調度方案對優化雷達的整體性能顯得尤為重要。然而,目前對于多功能組網雷達資源調度的研究主要是針對在有限資源條件下對多目標搜索和跟蹤的優化[1-8],并沒有考慮目標成像任務對多功能組網雷達資源調度的影響。文獻[3-4]在聯合估計目標狀態的認知雷達網絡系統中,針對多目標跟蹤問題,根據目標狀態和信道狀態的估計值來計算出克拉美羅下界,并以此作為優化標準采用近似貪婪算法來選擇天線和進行功率分配;文獻[5]針對多功能組網雷達對不同區域進行搜索監控的現實情況,采用改進的粒子群算法,對偵察、探測及干擾等不同場景下的組網雷達調度方法進行了研究;文獻[6]通過分析組網中不同雷達對目標的跟蹤連續性與準確性,并將雷達對目標跟蹤的連續性作為目標函數,雷達資源作為約束條件,對組網雷達系統資源進行了分配安排,最終在確保目標跟蹤數目多與跟蹤精度最優化的前提下,提高了組網雷達資源利用。而若要考慮目標成像的問題,在完成搜索和跟蹤任務的資源調度之后,還需要分出一部分固定連續的雷達時間資源來完成目標成像,將導致雷達工作效率不高。針對這一問題,文獻[9]以脈沖交錯技術為基礎,在實現目標搜索與跟蹤任務調度的情況下,利用基于壓縮感知的成像方法實現了目標成像任務的調度處理。另一方面,按照優先級原則對組網資源進行調度時,優先級高的目標任務的實際執行時刻在時間窗允許范圍內沒有進行移動,導致了有些目標任務被舍棄,不能對其執行搜索或者跟蹤處理。由此可以知道,當申請調度的目標搜索與跟蹤任務增多時,會導致更多的目標任務被丟失。
針對以上問題,提出基于調度效益最大化的多功能組網認知雷達資源優化調度算法。該算法將搜索與跟蹤任務的時間窗考慮到目標函數中,即雷達對目標任務的調度效益通過目標任務的重要性(優先級)和有效性(時間窗)兩個因素的加權來表示,根據調度效益最大準則建立并求解資源調度模型。在求解模型過程中,首先對目標任務進行雷達分配,然后利用遺傳算法得出每部雷達中針對目標搜索與跟蹤任務的最優化調度時序,最后在此時序的基礎上,將剩余的空閑時間資源用于目標成像任務的隨機分配。仿真實驗對調度時序圖與性能指標進行了分析,驗證了該方法更能提高組網雷達的整體效能。


1.1.1 搜索跟蹤類任務的駐留時間ΔTi,j
雷達完成對目標搜索跟蹤的處理過程一般會包括信號發射、等待以及接收3個部分,如圖1所示。

圖1 雷達任務的駐留時間Fig.1 Radar mission dwell time
圖1中:i表示雷達編號;j表示雷達目標任務的序號;tti,j表示第i部雷達對第j個目標任務發射脈沖信號所耗的時間;twi,j表示雷達等待脈沖信號所耗的時間;tri,j表示雷達接收脈沖信號所耗的時間。這3個部分所耗的時間均用于對一個目標的處理,將第j個目標任務的發射時間、等待時間和接收時間作為一個整體就形成了第j個目標任務的駐留時間,即第i部雷達對第j個目標任務執行一次所占用雷達時間資源的長度,則駐留時間可以表示為
ΔTi,j=tti,j+twi,j+tri,j
(1)


(2)
1.1.3 目標任務的優先級Pi,j


(3)
式(3)中:ωa、ωb、ωc表示3個參數的權重系數(ωa、ωb、ωc≥0且ωa+ωb+ωc=1);Pref表示優先級的基準值,根據不同的任務類型設定不同整數值,由專家確定。
1.2.1 調度效益
因為按照目標優先級進行資源調度易造成目標任務的丟失,因此將搜索與跟蹤任務的時間窗考慮到目標函數中。調度效益主要是從目標任務的的重要性(優先級)和有效性(期望執行時間與時間窗)兩個方面對雷達調度效果進行綜合分析。另一方面,由于目標成像任務的相干積累時間通常情況下會大于雷達的調度間隔并且目標成像任務是在相干積累時間內進行隨機稀疏分配的,所以目標成像任務的調度收益等于其優先級即可。因此,第i部雷達對第j個目標任務的調度收益Gi,j可以表示為
Gi,j=

(4)
式(4)中:tdi,j表示第i部雷達對第j個目標任務的期望執行時刻;Wi,j表示第j個目標任務在第i部雷達進行移動的時間窗(即目標任務的實際執行時刻能在期望執行時刻前后移動的有效范圍);ω1與ω2分別表示兩個方面的權重系數,且滿足ω1+ω2=1。從exp(·)函數中可以看出期望執行時刻在時間窗有效范圍內從前往后移動的值是逐漸減小的。
1.2.2 基于調度效益最大化的多功能組網資源調度模型的建立
基于以上參數分析,假設多功能組網雷達系統是由M部雷達組成,在組網系統中有N個目標任務申請調度,且每部雷達的調度間隔為T,根據調度效益最大原則建立目標優化函數:

(5)
式(5)中:tdi,j表示第i部雷達對第j個目標任務的實際執行時刻;ΔTi,j表示第i部雷達對第j個目標搜索和跟蹤任務的執行時間長度(駐留時間);Nst,i表示第i部雷達在一個調度間隔中執行目標搜索和跟蹤任務的數量總和;Nimg,i表示第i部雷達在一個調度間隔中執行目標成像任務的數量,PPRF表示脈沖重復頻率。約束條件中:第1個表示的是目標在組網雷達中的分配矩陣Xi,j,Xi,j=1表示將第j個目標任務分配給第i部雷達,Xi,j=0則表示未將第j個目標任務分配給第i部雷達;第2個是針對目標搜索與跟蹤任務的雷達分配、實際執行時刻及任務間不發生沖突的約束;第3個是針對目標成像任務的雷達分配與實際執行時刻的約束;第4個是雷達資源的約束。
由于上述模型屬于N-P(non-deterministic polynomial)難題,難以獲得目標函數的最優解,所以利用啟發式算法來求得目標函數的次優解。又因為在每部多功能雷達的調度中,目標成像任務都是在對目標搜索和跟蹤任務進行分配安排后,再利用其剩余的空閑時間資源進行隨機分配。因此可以將問題轉化為保證每部雷達對目標搜索和跟蹤任務的調度效益最大化之后再對目標成像任務進行分配的問題。而針對每部雷達對目標搜索和跟蹤任務的調度效益最大化問題可以利用遺傳算法進行求解。遺傳算法具體步驟如下。
(1)種群初始化。主要對遺傳算法中的種族群體大小n(隨機產生)、相應的交叉概率pc、相應的變異概率pm以及在處理過程中的最高迭代的次數ggenmax等參數進行設置。
(2)計算個體的適應度值(調度收益值)。主要根據式(5)中的第2個約束條件對每個個體候選調度序列進行分析,利用式(4)計算個體的適應值,對個體進行執行、延時或刪除的處理并得到相應的處理序列。
(3)選擇處理。將精英選擇和輪盤賭方法進行結合完成該動作的處理,首先對種群按調度收益從大到小排序,將前面的m個調度收益較高的個體直接傳給下一代,對剩余的n-m個個體計算相應的適應度值,公式為

(6)
再采用輪盤賭方法對剩余的n-m個個體進行處理得到相應的選擇概率,即

(7)
(4)交叉處理。選取單點交叉的方法完成該動作的處理,首先對所有個體產生0~1的隨機數,然后找出這些隨機數中小于設定的交叉概率pc的個體,之后隨機選取其中的兩個個體用來完成基因片段的互換處理,同時為了防止進入局部收斂,要確保每個個體仍然保持1~n隨機排序。
(5)變異處理。首先對所有個體均產生0~1的隨機數,將其與變異概率pm作比較,若隨機數比pm的值小,則對該個體隨機選取變異位置進行變異處理。
(6)判斷是否達到最高迭代的次數ggenmax,若達到,則輸出最優調度結果;否則跳轉至(2)。算法流程如圖2所示。

圖2 遺傳算法流程Fig.2 Genetic algorithm flowchart
算法的實現步驟如下。
(1)多功能組網雷達中的M部雷達均對目標任務進行特征認知,確定距離、速度、航向角、優先級以及方位向觀測脈沖數等參數。
(2)確定各雷達的調度間隔長度。
(3)對目標任務進行分組,確定分配矩陣Xi,j。針對目標搜索跟蹤任務,根據距離近優先分配原則確定一部雷達對目標任務進行處理;針對目標成像任務,則根據尺寸信息量大的優先分配原則確定3部不共線的雷達對目標任務進行處理。
(4)多功能組網中的雷達均進行資源調度,首先令雷達i=1。
(5)首先對目標搜索和跟蹤任務利用上面所說的遺傳算法進行調度處理得到一個調度時序,然后在該調度時序的基礎上,對目標成像任務在空閑的時間資源采用隨機插入的方法進行處理,輸出最終的調度時序結果。
(6)判斷雷達i=i+1是否全部調度結束,若沒有,則令i=i+1,重復步驟(5),直到所有的雷達完成了對目標的資源調度。
為了對該算法的有效性進行驗證,提出調度成功率(scheduling success rate,SSR)與脈沖資源利用率(pulse utilization rate,PUR)兩個性能指標,其表達式分別為

(8)

(9)
式中:M表示雷達數目;T表示每部雷達的調度間隔;N′表示組網雷達中成功完成調度的目標任務數;N表示組網雷達中申請調度的目標任務總數;PSSR表示調度成功率,PPUR表示脈沖資源利用率;Nst,i表示第i部雷達在一個調度間隔內成功執行目標搜索和跟蹤的任務數,Nimg,i表示第i部雷達在一個調度間隔內成功執行目標成像的任務數。
仿真場景假設多功能組網雷達系統是由6部ISAR雷達構成,其位置坐標為:雷達1(20 km,100 km,0)、雷達2(195 km,10 km,0)、雷達3(392 km,10 km,0)、雷達4(594 km,100 km,0)、雷達5(392 km,190 km,0)、雷達6(195 km,190 km,0),每部雷達的最遠跟蹤距離均為400 km,每部雷達的調度間隔均為50 ms,同時在多功能組網雷達中有40個跟蹤目標,3個成像目標,并且每部雷達在每個調度間隔中有1個目標搜索任務。遺傳算法中的參數為:種族群體的大小n=100、相應的交叉概率pc=0.5、相應的變異概率pm=0.1以及處理過程中最高迭代的次數ggenmax=200,經仿真得到基于優先級最大和基于調度效益最大化兩種算法的資源調度時序對比結果,如圖3所示。

圖3 兩種算法的資源調度時序對比(50 ms)Fig.3 Comparison chart of resource scheduling timing of two algorithms (50 ms)
從圖3(a)~圖3(c)中可以看出,兩種算法在目標搜索與跟蹤任務申請調度比較少的場景下,雷達在完成目標搜索與跟蹤任務的同時,也可以實現多目標成像任務的隨機稀疏分配;從圖3(d)~圖3(f)中可以明顯看出,在目標搜索與跟蹤任務申請調度比較多的場景下,基于調度效益最大化的多功能組網雷達資源優化調度算法相對于基于優先級的多功能組網雷達資源調度算法可以實現更多的目標搜索與跟蹤任務,減少了任務丟失的數量。
為了進一步說明該算法的有效性,利用統計分析方法在保持3個成像目標進行任務調度請求與每部雷達在每個調度間隔中有1個目標搜索任務請求前提下,針對不同目標跟蹤任務數(最多目標跟蹤數目為120)的場景下進行了1 000次隨機資源分配實驗,得到兩種不同算法在一個調度間隔中的性能指標均值統計比較結果,如圖4所示。

圖4 兩種算法的性能指標對比Fig.4 Comparison of performance indicators of the two algorithms
從圖4(a)可以看出,兩種算法的調度成功率隨著目標跟蹤任務數目的增加而降低,同時在目標跟蹤任務數目相同的條件下,基于調度效益最大化的調度算法對目標任務的調度成功率要高于基于優先級的調度算法。從圖4(b)可以看出,兩種算法的資源利用率隨著目標跟蹤任務數目的增加而增加,同時基于調度效益最大化的調度算法比基于優先級的調度算法更早趨于資源飽和狀態。結合這兩幅圖可以知道,基于調度效益最大化的調度算法比基于優先級的調度算法對多功能組網雷達的調度更加有效,更能提高組網認知雷達的資源利用率。
提出了基于調度效益最大化的多功能組網認知雷達資源優化調度算法,建立了調度優化模型,并對算法求解進行了描述,得到以下結論。
(1)在目標搜索與跟蹤任務比較少的情況下,本文算法既能完成目標搜索與跟蹤任務的調度,也能合理安排目標成像任務,并到達組網雷達資源的最優分配。
(2)在目標搜索與跟蹤任務比較多的情況下,本文算法能減少目標任務丟失的數量,提高了任務的調度成功率與組網雷達資源的利用率。