陳 鞭,伍友利,吳 鑫,甘躍鵬
(空軍工程大學,西安 710038)
紅外對抗是紅外空空導彈與目標相互博弈的一個過程。紅外對抗是高非線性、高復雜性問題,對其研究的關(guān)注點是在不同的對抗場景下,紅外導彈能否命中目標,即脫靶量是否滿足要求。但是紅外對抗中的影響因素眾多,包括導彈、目標、誘餌以及彈目相對態(tài)勢等方面,且存在很大的不確定性。對于這種超復雜的紅外對抗問題,雖然目前無法直接給出各影響因素與脫靶量之間的函數(shù)關(guān)系,但是仍然需要研究其之間的聯(lián)系,發(fā)現(xiàn)影響導彈抗干擾能力的一些規(guī)律。
關(guān)聯(lián)規(guī)則分析是數(shù)據(jù)挖掘中最活躍的研究方法之一,目的是在一個數(shù)據(jù)集中找出各項之間的關(guān)聯(lián)關(guān)系,而這種關(guān)系并沒有在數(shù)據(jù)中直接表現(xiàn)出來。文獻[3]利用關(guān)聯(lián)規(guī)則探索危險源原因,從而挖掘出導致危險源的不安全事件。文獻[4]采用關(guān)聯(lián)規(guī)則方法挖掘圖書館圖書流通數(shù)據(jù),不僅幫助讀者找到不同學科知識之間的內(nèi)在聯(lián)系,同時還有利于圖書館調(diào)整資源布局。文獻[5]使用關(guān)聯(lián)規(guī)則方法研究隧道管片滲漏與盾構(gòu)掘進參數(shù)之間的關(guān)聯(lián)性,分析關(guān)鍵掘進參數(shù)滲漏原理。文獻[6]根據(jù)數(shù)據(jù)挖掘理論,挖掘出民航鳥擊事件中各屬性間的關(guān)系,從而發(fā)現(xiàn)導致鳥擊事件的相關(guān)因素。文獻[7]通過關(guān)聯(lián)規(guī)則方法對數(shù)據(jù)進行挖掘分析,根據(jù)得到的關(guān)聯(lián)規(guī)則強弱對紅外抗干擾評估指標體系進行約簡。同樣,關(guān)聯(lián)規(guī)則方法也可應用到紅外對抗問題中,但以上文獻中對于連續(xù)型因素都是直接根據(jù)經(jīng)驗人為取值或劃分區(qū)間來進行離散化,未充分利用已有數(shù)據(jù); 同時,對于挖掘出的關(guān)聯(lián)規(guī)則,直接作為最終規(guī)則使用,沒有對規(guī)則本身進行深入分析和篩選。
為此,本文將基于獲取的試驗數(shù)據(jù),采用-Means聚類算法對連續(xù)因素離散化,預處理后用FP-Growth算法進行關(guān)聯(lián)規(guī)則挖掘,然后用和兩個指標對所得規(guī)則作進一步分析和篩選。
紅外對抗示意圖如圖1所示。紅外導彈打擊目標飛機時,飛機會投擲誘餌彈來干擾導彈,從而影響導彈的作戰(zhàn)效能。導彈、目標飛機、誘餌是紅外對抗過程中的三個主要因素,此外,還有彈目相對態(tài)勢、自然環(huán)境等。

圖1 紅外對抗示意圖Fig.1 Schematic diagram of infrared countermeasure
基于以上分析,本文確定的紅外對抗因素見表1。

表1 紅外對抗因素
其中,誘餌齊投數(shù)及方向取值:1表示單發(fā)左右交替投擲,即目標向左側(cè)投擲1枚誘餌,經(jīng)過相應的組內(nèi)時間間隔后,再向右側(cè)投擲1枚,然后經(jīng)過組內(nèi)時間間隔后,再向左側(cè)投擲1枚,如此循環(huán),每次僅投擲1枚,直至這一組誘餌投完; 2表示單發(fā)左右同時投擲,即目標同時向兩側(cè)各投擲1枚誘餌,經(jīng)過相應的組內(nèi)時間間隔后,再同時向兩側(cè)各投擲1枚,如此循環(huán),每次共投擲2枚,直至這一組誘餌投完; 3表示雙發(fā)同時左邊投擲,即目標向左側(cè)一次性投擲2枚誘餌,經(jīng)過相應的組內(nèi)時間間隔后,再向左側(cè)一次性投擲2枚,如此循環(huán),每次投擲2枚,直至這一組誘餌投完; 4表示雙發(fā)同時右邊投擲,與3類似。
誘餌組數(shù)蘊含在因素的取值中,可由誘餌總數(shù)除以每組誘餌數(shù)得到,如誘餌總數(shù)為12枚,每組誘餌數(shù)為4枚,則有3組。一組投完后,經(jīng)過相應的組間時間間隔,再接著投下一組,且每一組均按照選定的誘餌齊投數(shù)及方向投擲誘餌。組與組之間可能有交集:當組內(nèi)時間間隔較大,而組間時間間隔較小時,一組誘餌可能還沒投擲完,就已經(jīng)經(jīng)過了相應的組間時間間隔,需要開始投擲下一組誘餌了,這種情況是可以的。因為在誘餌投擲器中,每組誘餌之間互不干涉,按照設(shè)定的程序各自獨立投放誘餌,每組的工作持續(xù)時間可能有“干涉”。
目標機動類型取值:1為無機動; 2為右轉(zhuǎn)彎機動; 3為左轉(zhuǎn)彎機動; 4為躍升機動; 5為俯沖機動。目標的每種機動類型數(shù)據(jù),都是通過軟件生成的,已經(jīng)包含了飛行速度、機動過載、飛行高度等因素值的設(shè)定,生成的機動數(shù)據(jù)直接裝訂到仿真系統(tǒng)中,試驗時直接選用。
誘餌投擲時刻、導彈水平進入角、彈目初始距離為連續(xù)型因素。導彈垂直進入角設(shè)為0°。
為了獲取大量數(shù)據(jù),基于MATLAB2018和Visual Studio2010,開發(fā)了紅外對抗仿真平臺。仿真原理如圖2所示。在表1中,各因素取一個具體值后,構(gòu)成一個水平組合,即一個具體的對抗場景。由拉丁超立方抽樣方法得到不同的水平組合,即可設(shè)置出覆蓋面廣的對抗場景進行仿真試驗,得到所需數(shù)據(jù)。

圖2 仿真原理圖Fig.2 Simulation schematic diagram
由于關(guān)聯(lián)規(guī)則方法無法處理連續(xù)型數(shù)值變量,為了將原始數(shù)據(jù)轉(zhuǎn)換為適合建模的格式,需要對數(shù)據(jù)進行離散化。而聚類算法可以充分利用已有數(shù)據(jù)對連續(xù)型因素進行離散化處理。
聚類分析是在沒有給出劃分類別的情況下,根據(jù)數(shù)據(jù)相似度進行樣本分組的一種方法。聚類模型可以建立在無類標記的數(shù)據(jù)上,是一種非監(jiān)督的學習算法。聚類的輸入是一組未被標記的樣本,聚類根據(jù)數(shù)據(jù)自身的距離或相似度將其劃分為若干組,劃分的原則是組內(nèi)樣本最小化而組間距離最大化。常用的聚類方法有劃分方法、層次分析法等,本文采用劃分方法中的-Means算法進行離散化處理。-Means聚類算法是典型的基于距離的非層次聚類算法,在最小化誤差函數(shù)的基礎(chǔ)上將數(shù)據(jù)劃分為預定的類數(shù),采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大。則誘彈投擲時刻、導彈水平進入角、彈目初始距離聚類離散化后的結(jié)果如表2所示。

表2 連續(xù)型因素離散分組表
根據(jù)表1~2對數(shù)據(jù)進行預編號,如表3所示。表中共有41個編號,分別對應10個參數(shù)的不同項。其中,脫靶量是仿真結(jié)果,表示在對應輸入因素作用下,運行紅外對抗仿真系統(tǒng)所得導彈脫靶量。至此數(shù)據(jù)預處理完畢,可用于后續(xù)關(guān)聯(lián)規(guī)則挖掘。

表3 數(shù)據(jù)編號規(guī)則
關(guān)聯(lián)規(guī)則分析也稱為購物籃分析,最早是為發(fā)現(xiàn)超市銷售數(shù)據(jù)庫中不同商品之間的關(guān)聯(lián)關(guān)系,從而采取有效措施來增加超市整體利潤。常用的關(guān)聯(lián)規(guī)則方法有Apriori算法,該算法是通過連接產(chǎn)生候選項及其支持度,然后通過剪枝生成頻繁項集。但是,每次生成新的頻繁項集都要對數(shù)據(jù)庫進行一次完整掃描,當數(shù)據(jù)庫較大時,其效率低下。而FP-Growth算法(Frequent Pattern Growth Algorithm)通過構(gòu)造頻繁模式樹將數(shù)據(jù)庫進行壓縮,極大地減少數(shù)據(jù)庫掃描次數(shù),提高算法效率,非常適用于紅外對抗仿真大規(guī)模高維度數(shù)據(jù)挖掘。
關(guān)聯(lián)規(guī)則挖掘中通常使用的度量指標有支持度和置信度兩個,定義如下:
(1) 支持度
支持度表示因素組合項在整個數(shù)據(jù)記錄中發(fā)生的可能性,公式為

(1)
式中:(→)表示因素項發(fā)生的同時因素項發(fā)生,(,)為因素項{,}的頻數(shù),()為數(shù)據(jù)庫所包含的記錄數(shù)。
(2) 置信度
置信度表示因素項發(fā)生的前提下因素項發(fā)生的可能性大小,公式為

(2)
置信度過低,則一般認為因素項發(fā)生的前提下因素項發(fā)生的可能性很小,說明該規(guī)則→可信度很低。
關(guān)聯(lián)規(guī)則挖掘就是要找出形如→的表達式,使其支持度、置信度都不小于最小支持度和最小置信度。FP-Growth算法的主要步驟為:首先,根據(jù)數(shù)據(jù)構(gòu)造出FP樹; 然后,通過FP樹發(fā)現(xiàn)滿足最小支持度的所有頻繁項集; 最后,從提取的頻繁項集中找出滿足置信度要求的關(guān)聯(lián)規(guī)則。
基于預處理數(shù)據(jù),為得到含有數(shù)據(jù)量比較少的因素的規(guī)則,最小支持度設(shè)為0.05,最小置信度設(shè)為0.65,通過FP-Growth算法,初步挖掘出關(guān)聯(lián)規(guī)則。
支持度指標受數(shù)據(jù)記錄總數(shù)影響,其度量性能較差,僅用支持度和置信度對關(guān)聯(lián)規(guī)則進行評價不夠全面,需要添加新指標來進一步過濾關(guān)聯(lián)規(guī)則。為此,引入(Kulczynski)和(Imbalance Ratio)兩個指標。和兩個度量指標與數(shù)據(jù)記錄總數(shù)無直接關(guān)聯(lián),而是與因素項本身的個數(shù)有關(guān),可度量出因素項之間相關(guān)性的強弱。當用支持度和置信度得到關(guān)聯(lián)規(guī)則后,因為支持度要考慮到數(shù)據(jù)記錄總數(shù),這時可能會遺留一些實際上相關(guān)性弱的規(guī)則,如果與其他規(guī)則一起分析和使用,可能會產(chǎn)生矛盾或得到錯誤的結(jié)論。而由和兩個指標可過濾掉相關(guān)性不強的規(guī)則,使剩下的關(guān)聯(lián)規(guī)則更可靠,留下更感興趣的規(guī)則。
(1)指標
指標可以視為因素項集{,}之間置信度的平均值,即


(3)
若(,)<0.5,則因素項集{,}之間是負相關(guān); 若(,)=0.5,則因素項集{,}之間無明顯關(guān)聯(lián); 若(,)>0.5,則因素項集{,}之間是正相關(guān); 且(,)值越接近0.5,因素項集{,}之間關(guān)聯(lián)越弱。
(2)指標
指標是度量因素集{,}間的不平衡程度,即



(4)
當(,)值接近0.5時,需要用指標進行二次判斷。若(,)值越接近0,則因素集{,}之間關(guān)聯(lián)越弱; 若(,)值越接近1,則因素集{,}之間關(guān)聯(lián)越強。
設(shè)置<04或>0.6,min=04,若04≤≤06,則判斷≥min。對于初步獲得的關(guān)聯(lián)規(guī)則,經(jīng)過和指標評價后,共刪減掉69條關(guān)聯(lián)規(guī)則,得到最終規(guī)則。將最終規(guī)則分為脫靶量的規(guī)則和僅含對抗因素的規(guī)則。部分規(guī)則分別如表4~5所示。

表4 含脫靶量的關(guān)聯(lián)規(guī)則
表4為紅外對抗因素與導彈脫靶量之間的關(guān)聯(lián)規(guī)則,部分規(guī)則分析如下,其余不再贅述。
序號2:規(guī)則G1, I1→J1的支持度為30%,置信度為90%,表示導彈水平進入角在0°~60°、彈目初始距離在3~6 km時,脫靶量小于10 m的概率達到90%。此種態(tài)勢下彈目距離較近,導彈從尾后攻擊目標,目標飛機尾焰暴露在導引頭視場中,且輻射特征明顯。導彈能識別目標,不會輕易被誘餌誘偏,能穩(wěn)定跟蹤目標,命中概率大,脫靶量較小。
序號12:規(guī)則F1, G2, I2→J3表示誘餌投擲組間間隔為0.2 s、導彈水平進入角在60°~110°、彈目初始距離在6~8 km時,脫靶量大于30 m的概率達到75%。此種態(tài)勢下彈目距離較遠,導彈側(cè)向攻擊目標,目標部分尾焰被機身遮蔽,且誘餌組間間隔取最小值0.2 s,誘餌能持續(xù)保持高輻射,對導彈產(chǎn)生強干擾。此時,導彈被誘偏后,需要較長時間才能再次定位,目標容易逃離導引頭視場,使導彈脫靶,產(chǎn)生很大的脫靶量。
序號13:規(guī)則D2, G2, H4→J2表示誘餌投擲時刻在1~2.5 s、導彈水平進入角在60°~110°、目標躍升機動時,脫靶量基本在10~30 m。此種態(tài)勢下導彈側(cè)向攻擊目標,目標部分尾焰被機身遮蔽,且目標躍升逃逸; 同時,當目標發(fā)現(xiàn)導彈后較早地投擲誘餌彈,導彈容易被誘偏,對抗場景十分復雜,對導彈造成很強的干擾,命中率很低,脫靶量一般比較大。
表5為紅外對抗因素之間的關(guān)聯(lián)規(guī)則,表示各對抗因素之間不易發(fā)現(xiàn)的關(guān)系。

表5 對抗因素之間的關(guān)聯(lián)規(guī)則
序號6:規(guī)則F1, B2→D2表示在單發(fā)誘餌兩邊同時投擲、組間時間間隔為0.2 s時,誘餌投擲時刻基本上取在1~2.5 s。序號10:規(guī)則B1, H3, I1→D1表示彈目初始距離在3~6 km、目標左轉(zhuǎn)彎機動、誘餌單發(fā)左右交替投擲時,誘餌投擲時刻基本上取在1 s以內(nèi)。序號12:規(guī)則D1, E4, I1→B1表示彈目初始距離在3~6 km、誘餌投擲時刻在1 s以內(nèi)、組內(nèi)時間間隔為0.4 s時,誘餌投擲方式基本上選單發(fā)左右交替投擲。當然,所得各對抗因素之間的一般關(guān)系及其組合的效果,還需通過試驗結(jié)果進行驗證。
(1) FP-Growth算法可以挖掘出隱藏在紅外對抗因素和導彈脫靶量中的內(nèi)在關(guān)系,為紅外彈的抗干擾評估和作戰(zhàn)使用提供參考。
(2)-Means聚類算法可對連續(xù)數(shù)據(jù)進行離散化處理,能充分利用已有數(shù)據(jù),避免人為取值而影響挖掘效率和效果。
(3) 由過濾的69條規(guī)則可知,和兩個指標能對挖掘結(jié)果進行深度篩選。
文中主要考慮紅外導引頭的外部因素,對于其內(nèi)部參數(shù)和相關(guān)算法等方面沒有進行深入分析。同時,獲取更真實的數(shù)據(jù)、選取合理的類別數(shù)、確定合適的篩選指標值,均需要慎重考慮。以上不足和問題都是后續(xù)的工作方向。