紅外對抗中各因素之間關(guān)系的深度挖掘

2022-08-11 01:32:10伍友利甘躍鵬

航空兵器 2022年3期

陳鞭，伍友利，吳鑫，甘躍鵬

(空軍工程大學，西安 710038)

0 引言

紅外對抗是紅外空空導彈與目標相互博弈的一個過程。紅外對抗是高非線性、高復雜性問題，對其研究的關(guān)注點是在不同的對抗場景下，紅外導彈能否命中目標，即脫靶量是否滿足要求。但是紅外對抗中的影響因素眾多，包括導彈、目標、誘餌以及彈目相對態(tài)勢等方面，且存在很大的不確定性。對于這種超復雜的紅外對抗問題，雖然目前無法直接給出各影響因素與脫靶量之間的函數(shù)關(guān)系，但是仍然需要研究其之間的聯(lián)系，發(fā)現(xiàn)影響導彈抗干擾能力的一些規(guī)律。

關(guān)聯(lián)規(guī)則分析是數(shù)據(jù)挖掘中最活躍的研究方法之一，目的是在一個數(shù)據(jù)集中找出各項之間的關(guān)聯(lián)關(guān)系，而這種關(guān)系并沒有在數(shù)據(jù)中直接表現(xiàn)出來。文獻[3]利用關(guān)聯(lián)規(guī)則探索危險源原因，從而挖掘出導致危險源的不安全事件。文獻[4]采用關(guān)聯(lián)規(guī)則方法挖掘圖書館圖書流通數(shù)據(jù)，不僅幫助讀者找到不同學科知識之間的內(nèi)在聯(lián)系，同時還有利于圖書館調(diào)整資源布局。文獻[5]使用關(guān)聯(lián)規(guī)則方法研究隧道管片滲漏與盾構(gòu)掘進參數(shù)之間的關(guān)聯(lián)性，分析關(guān)鍵掘進參數(shù)滲漏原理。文獻[6]根據(jù)數(shù)據(jù)挖掘理論，挖掘出民航鳥擊事件中各屬性間的關(guān)系，從而發(fā)現(xiàn)導致鳥擊事件的相關(guān)因素。文獻[7]通過關(guān)聯(lián)規(guī)則方法對數(shù)據(jù)進行挖掘分析，根據(jù)得到的關(guān)聯(lián)規(guī)則強弱對紅外抗干擾評估指標體系進行約簡。同樣，關(guān)聯(lián)規(guī)則方法也可應用到紅外對抗問題中，但以上文獻中對于連續(xù)型因素都是直接根據(jù)經(jīng)驗人為取值或劃分區(qū)間來進行離散化，未充分利用已有數(shù)據(jù)；同時，對于挖掘出的關(guān)聯(lián)規(guī)則，直接作為最終規(guī)則使用，沒有對規(guī)則本身進行深入分析和篩選。

為此，本文將基于獲取的試驗數(shù)據(jù)，采用-Means聚類算法對連續(xù)因素離散化，預處理后用FP-Growth算法進行關(guān)聯(lián)規(guī)則挖掘，然后用和兩個指標對所得規(guī)則作進一步分析和篩選。

1 對抗因素分析

紅外對抗示意圖如圖1所示。紅外導彈打擊目標飛機時，飛機會投擲誘餌彈來干擾導彈，從而影響導彈的作戰(zhàn)效能。導彈、目標飛機、誘餌是紅外對抗過程中的三個主要因素，此外，還有彈目相對態(tài)勢、自然環(huán)境等。

圖1 紅外對抗示意圖Fig.1 Schematic diagram of infrared countermeasure

基于以上分析，本文確定的紅外對抗因素見表1。

表1 紅外對抗因素

其中，誘餌齊投數(shù)及方向取值：1表示單發(fā)左右交替投擲，即目標向左側(cè)投擲1枚誘餌，經(jīng)過相應的組內(nèi)時間間隔后，再向右側(cè)投擲1枚，然后經(jīng)過組內(nèi)時間間隔后，再向左側(cè)投擲1枚，如此循環(huán)，每次僅投擲1枚，直至這一組誘餌投完； 2表示單發(fā)左右同時投擲，即目標同時向兩側(cè)各投擲1枚誘餌，經(jīng)過相應的組內(nèi)時間間隔后，再同時向兩側(cè)各投擲1枚，如此循環(huán)，每次共投擲2枚，直至這一組誘餌投完； 3表示雙發(fā)同時左邊投擲，即目標向左側(cè)一次性投擲2枚誘餌，經(jīng)過相應的組內(nèi)時間間隔后，再向左側(cè)一次性投擲2枚，如此循環(huán)，每次投擲2枚，直至這一組誘餌投完； 4表示雙發(fā)同時右邊投擲，與3類似。

誘餌組數(shù)蘊含在因素的取值中，可由誘餌總數(shù)除以每組誘餌數(shù)得到，如誘餌總數(shù)為12枚，每組誘餌數(shù)為4枚，則有3組。一組投完后，經(jīng)過相應的組間時間間隔，再接著投下一組，且每一組均按照選定的誘餌齊投數(shù)及方向投擲誘餌。組與組之間可能有交集：當組內(nèi)時間間隔較大，而組間時間間隔較小時，一組誘餌可能還沒投擲完，就已經(jīng)經(jīng)過了相應的組間時間間隔，需要開始投擲下一組誘餌了，這種情況是可以的。因為在誘餌投擲器中，每組誘餌之間互不干涉，按照設(shè)定的程序各自獨立投放誘餌，每組的工作持續(xù)時間可能有“干涉”。

目標機動類型取值：1為無機動； 2為右轉(zhuǎn)彎機動； 3為左轉(zhuǎn)彎機動； 4為躍升機動； 5為俯沖機動。目標的每種機動類型數(shù)據(jù)，都是通過軟件生成的，已經(jīng)包含了飛行速度、機動過載、飛行高度等因素值的設(shè)定，生成的機動數(shù)據(jù)直接裝訂到仿真系統(tǒng)中，試驗時直接選用。

誘餌投擲時刻、導彈水平進入角、彈目初始距離為連續(xù)型因素。導彈垂直進入角設(shè)為0°。

2 數(shù)據(jù)獲取及預處理

2.1 數(shù)據(jù)獲取

為了獲取大量數(shù)據(jù)，基于MATLAB2018和Visual Studio2010，開發(fā)了紅外對抗仿真平臺。仿真原理如圖2所示。在表1中，各因素取一個具體值后，構(gòu)成一個水平組合，即一個具體的對抗場景。由拉丁超立方抽樣方法得到不同的水平組合，即可設(shè)置出覆蓋面廣的對抗場景進行仿真試驗，得到所需數(shù)據(jù)。

圖2 仿真原理圖Fig.2 Simulation schematic diagram

2.2 聚類離散化

由于關(guān)聯(lián)規(guī)則方法無法處理連續(xù)型數(shù)值變量，為了將原始數(shù)據(jù)轉(zhuǎn)換為適合建模的格式，需要對數(shù)據(jù)進行離散化。而聚類算法可以充分利用已有數(shù)據(jù)對連續(xù)型因素進行離散化處理。

聚類分析是在沒有給出劃分類別的情況下，根據(jù)數(shù)據(jù)相似度進行樣本分組的一種方法。聚類模型可以建立在無類標記的數(shù)據(jù)上，是一種非監(jiān)督的學習算法。聚類的輸入是一組未被標記的樣本，聚類根據(jù)數(shù)據(jù)自身的距離或相似度將其劃分為若干組，劃分的原則是組內(nèi)樣本最小化而組間距離最大化。常用的聚類方法有劃分方法、層次分析法等，本文采用劃分方法中的-Means算法進行離散化處理。-Means聚類算法是典型的基于距離的非層次聚類算法，在最小化誤差函數(shù)的基礎(chǔ)上將數(shù)據(jù)劃分為預定的類數(shù)，采用距離作為相似性的評價指標，即認為兩個對象的距離越近，其相似度就越大。則誘彈投擲時刻、導彈水平進入角、彈目初始距離聚類離散化后的結(jié)果如表2所示。

表2 連續(xù)型因素離散分組表

根據(jù)表1～2對數(shù)據(jù)進行預編號，如表3所示。表中共有41個編號，分別對應10個參數(shù)的不同項。其中，脫靶量是仿真結(jié)果，表示在對應輸入因素作用下，運行紅外對抗仿真系統(tǒng)所得導彈脫靶量。至此數(shù)據(jù)預處理完畢，可用于后續(xù)關(guān)聯(lián)規(guī)則挖掘。

表3 數(shù)據(jù)編號規(guī)則

3 關(guān)聯(lián)規(guī)則挖掘

關(guān)聯(lián)規(guī)則分析也稱為購物籃分析，最早是為發(fā)現(xiàn)超市銷售數(shù)據(jù)庫中不同商品之間的關(guān)聯(lián)關(guān)系，從而采取有效措施來增加超市整體利潤。常用的關(guān)聯(lián)規(guī)則方法有Apriori算法，該算法是通過連接產(chǎn)生候選項及其支持度，然后通過剪枝生成頻繁項集。但是，每次生成新的頻繁項集都要對數(shù)據(jù)庫進行一次完整掃描，當數(shù)據(jù)庫較大時，其效率低下。而FP-Growth算法(Frequent Pattern Growth Algorithm)通過構(gòu)造頻繁模式樹將數(shù)據(jù)庫進行壓縮，極大地減少數(shù)據(jù)庫掃描次數(shù)，提高算法效率，非常適用于紅外對抗仿真大規(guī)模高維度數(shù)據(jù)挖掘。

3.1 FP-Growth算法

關(guān)聯(lián)規(guī)則挖掘中通常使用的度量指標有支持度和置信度兩個，定義如下：

(1) 支持度

支持度表示因素組合項在整個數(shù)據(jù)記錄中發(fā)生的可能性，公式為

(1)

式中：(→)表示因素項發(fā)生的同時因素項發(fā)生，(,)為因素項{,}的頻數(shù)，()為數(shù)據(jù)庫所包含的記錄數(shù)。

(2) 置信度

置信度表示因素項發(fā)生的前提下因素項發(fā)生的可能性大小，公式為

(2)

置信度過低，則一般認為因素項發(fā)生的前提下因素項發(fā)生的可能性很小，說明該規(guī)則→可信度很低。

關(guān)聯(lián)規(guī)則挖掘就是要找出形如→的表達式，使其支持度、置信度都不小于最小支持度和最小置信度。FP-Growth算法的主要步驟為：首先，根據(jù)數(shù)據(jù)構(gòu)造出FP樹；然后，通過FP樹發(fā)現(xiàn)滿足最小支持度的所有頻繁項集；最后，從提取的頻繁項集中找出滿足置信度要求的關(guān)聯(lián)規(guī)則。

基于預處理數(shù)據(jù)，為得到含有數(shù)據(jù)量比較少的因素的規(guī)則，最小支持度設(shè)為0.05，最小置信度設(shè)為0.65，通過FP-Growth算法，初步挖掘出關(guān)聯(lián)規(guī)則。

3.2 深度篩選

支持度指標受數(shù)據(jù)記錄總數(shù)影響，其度量性能較差，僅用支持度和置信度對關(guān)聯(lián)規(guī)則進行評價不夠全面，需要添加新指標來進一步過濾關(guān)聯(lián)規(guī)則。為此，引入(Kulczynski)和(Imbalance Ratio)兩個指標。和兩個度量指標與數(shù)據(jù)記錄總數(shù)無直接關(guān)聯(lián)，而是與因素項本身的個數(shù)有關(guān)，可度量出因素項之間相關(guān)性的強弱。當用支持度和置信度得到關(guān)聯(lián)規(guī)則后，因為支持度要考慮到數(shù)據(jù)記錄總數(shù)，這時可能會遺留一些實際上相關(guān)性弱的規(guī)則，如果與其他規(guī)則一起分析和使用，可能會產(chǎn)生矛盾或得到錯誤的結(jié)論。而由和兩個指標可過濾掉相關(guān)性不強的規(guī)則，使剩下的關(guān)聯(lián)規(guī)則更可靠，留下更感興趣的規(guī)則。

(1)指標

指標可以視為因素項集{,}之間置信度的平均值，即

(3)

若(,)<0.5，則因素項集{,}之間是負相關(guān)；若(,)=0.5，則因素項集{,}之間無明顯關(guān)聯(lián)；若(,)>0.5，則因素項集{,}之間是正相關(guān)；且(,)值越接近0.5，因素項集{,}之間關(guān)聯(lián)越弱。

(2)指標

指標是度量因素集{,}間的不平衡程度，即

(4)

當(,)值接近0.5時，需要用指標進行二次判斷。若(,)值越接近0，則因素集{,}之間關(guān)聯(lián)越弱；若(,)值越接近1，則因素集{,}之間關(guān)聯(lián)越強。

設(shè)置<04或>0.6，min=04，若04≤≤06，則判斷≥min。對于初步獲得的關(guān)聯(lián)規(guī)則，經(jīng)過和指標評價后，共刪減掉69條關(guān)聯(lián)規(guī)則，得到最終規(guī)則。將最終規(guī)則分為脫靶量的規(guī)則和僅含對抗因素的規(guī)則。部分規(guī)則分別如表4～5所示。

表4 含脫靶量的關(guān)聯(lián)規(guī)則

表4為紅外對抗因素與導彈脫靶量之間的關(guān)聯(lián)規(guī)則，部分規(guī)則分析如下，其余不再贅述。

序號2：規(guī)則G1, I1→J1的支持度為30%，置信度為90%，表示導彈水平進入角在0°～60°、彈目初始距離在3～6 km時，脫靶量小于10 m的概率達到90%。此種態(tài)勢下彈目距離較近，導彈從尾后攻擊目標，目標飛機尾焰暴露在導引頭視場中，且輻射特征明顯。導彈能識別目標，不會輕易被誘餌誘偏，能穩(wěn)定跟蹤目標，命中概率大，脫靶量較小。

序號12：規(guī)則F1, G2, I2→J3表示誘餌投擲組間間隔為0.2 s、導彈水平進入角在60°～110°、彈目初始距離在6～8 km時，脫靶量大于30 m的概率達到75%。此種態(tài)勢下彈目距離較遠，導彈側(cè)向攻擊目標，目標部分尾焰被機身遮蔽，且誘餌組間間隔取最小值0.2 s，誘餌能持續(xù)保持高輻射，對導彈產(chǎn)生強干擾。此時，導彈被誘偏后，需要較長時間才能再次定位，目標容易逃離導引頭視場，使導彈脫靶，產(chǎn)生很大的脫靶量。

序號13：規(guī)則D2, G2, H4→J2表示誘餌投擲時刻在1～2.5 s、導彈水平進入角在60°～110°、目標躍升機動時，脫靶量基本在10～30 m。此種態(tài)勢下導彈側(cè)向攻擊目標，目標部分尾焰被機身遮蔽，且目標躍升逃逸；同時，當目標發(fā)現(xiàn)導彈后較早地投擲誘餌彈，導彈容易被誘偏，對抗場景十分復雜，對導彈造成很強的干擾，命中率很低，脫靶量一般比較大。

表5為紅外對抗因素之間的關(guān)聯(lián)規(guī)則，表示各對抗因素之間不易發(fā)現(xiàn)的關(guān)系。

表5 對抗因素之間的關(guān)聯(lián)規(guī)則

序號6：規(guī)則F1, B2→D2表示在單發(fā)誘餌兩邊同時投擲、組間時間間隔為0.2 s時，誘餌投擲時刻基本上取在1～2.5 s。序號10：規(guī)則B1, H3, I1→D1表示彈目初始距離在3～6 km、目標左轉(zhuǎn)彎機動、誘餌單發(fā)左右交替投擲時，誘餌投擲時刻基本上取在1 s以內(nèi)。序號12：規(guī)則D1, E4, I1→B1表示彈目初始距離在3～6 km、誘餌投擲時刻在1 s以內(nèi)、組內(nèi)時間間隔為0.4 s時，誘餌投擲方式基本上選單發(fā)左右交替投擲。當然，所得各對抗因素之間的一般關(guān)系及其組合的效果，還需通過試驗結(jié)果進行驗證。

4 結(jié) 論

(1) FP-Growth算法可以挖掘出隱藏在紅外對抗因素和導彈脫靶量中的內(nèi)在關(guān)系，為紅外彈的抗干擾評估和作戰(zhàn)使用提供參考。

(2)-Means聚類算法可對連續(xù)數(shù)據(jù)進行離散化處理，能充分利用已有數(shù)據(jù)，避免人為取值而影響挖掘效率和效果。

(3) 由過濾的69條規(guī)則可知，和兩個指標能對挖掘結(jié)果進行深度篩選。

文中主要考慮紅外導引頭的外部因素，對于其內(nèi)部參數(shù)和相關(guān)算法等方面沒有進行深入分析。同時，獲取更真實的數(shù)據(jù)、選取合理的類別數(shù)、確定合適的篩選指標值，均需要慎重考慮。以上不足和問題都是后續(xù)的工作方向。