曹冠平,王躍利,張立韜
(軍事科學(xué)院,北京 100091)
關(guān)聯(lián)知識(shí)反映了一個(gè)事件和其他事件的依賴或關(guān)聯(lián),通過關(guān)聯(lián)知識(shí)的分析,可以找到現(xiàn)實(shí)中事物間的某些規(guī)律并指導(dǎo)工作實(shí)踐。關(guān)聯(lián)規(guī)則挖掘的目的就是發(fā)現(xiàn)隱藏在海量數(shù)據(jù)中的關(guān)聯(lián)知識(shí),幫助用戶找到有用的信息,為用戶合理決策提供有效支撐。當(dāng)前,關(guān)聯(lián)規(guī)則挖掘已在商業(yè)、教育、醫(yī)療等領(lǐng)域廣泛應(yīng)用并取得了很好地效果[1]。顧苗將關(guān)聯(lián)規(guī)則挖掘運(yùn)用于招聘信息系統(tǒng)中,通過對(duì)企業(yè)招聘信息的挖掘,得到不同企業(yè)的招聘要求傾向,為用戶提供了有用參考[2]。汪麗等對(duì)分布式數(shù)據(jù)挖掘方法進(jìn)行了研究,并將其運(yùn)用到教育決策支持系統(tǒng)中,幫助用戶查找有用的決策信息[3]。高生鵬通過對(duì)子宮肌瘤治療相關(guān)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,得到該疾病治療效果與藥品種類和用藥量的關(guān)聯(lián)程度,為優(yōu)化疾病的治療方法提供了參考[4]。王圣通過對(duì)大量物流交易數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘,提出了改進(jìn)實(shí)際物流業(yè)務(wù)和庫存管理相關(guān)建議[5]。莊細(xì)清通過對(duì)公司大量交易數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,為公司提出了最佳促銷方案和最可靠商品售賣組合等個(gè)性化推薦[6]。劉惠通過對(duì)海量物流信息進(jìn)行關(guān)聯(lián)規(guī)則挖掘,實(shí)現(xiàn)了貨物運(yùn)輸平臺(tái)信息的推薦功能,幫助用戶根據(jù)運(yùn)輸貨物選擇最佳運(yùn)輸平臺(tái)[7]。李政等對(duì)關(guān)聯(lián)規(guī)則挖掘在電子對(duì)抗目標(biāo)分析中的應(yīng)用進(jìn)行了研究,提出采用頻繁模式增長(zhǎng)挖掘算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘,取得了較好效果,有效增強(qiáng)了作戰(zhàn)決策的合理性[8]。芮少輝等人通過對(duì)航空發(fā)動(dòng)機(jī)工作日志進(jìn)行關(guān)聯(lián)規(guī)則挖掘,較好地實(shí)現(xiàn)了航空發(fā)動(dòng)機(jī)的故障檢測(cè)[9]。
信息網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)的發(fā)展,各類傳感器和智能設(shè)備廣泛運(yùn)用于作戰(zhàn)實(shí)驗(yàn)中,促使作戰(zhàn)實(shí)驗(yàn)采集的數(shù)據(jù)急劇增加,這些海量的數(shù)據(jù)中蘊(yùn)含了豐富的軍事知識(shí)。受存儲(chǔ)和計(jì)算能力等因素的限制,傳統(tǒng)數(shù)據(jù)分析方法不能很好地滿足海量作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)分析要求。鑒于此,本文將分布式存儲(chǔ)和并行計(jì)算技術(shù)運(yùn)用到作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)分析中,構(gòu)建了海量數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘框架,明確了挖掘流程,并對(duì)現(xiàn)有關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了改進(jìn)。最后,設(shè)計(jì)了一個(gè)簡(jiǎn)單的作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘案例,驗(yàn)證所提框架和流程的有效性以及改進(jìn)后算法的挖掘效率。
作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)包括基礎(chǔ)數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、作戰(zhàn)環(huán)境數(shù)據(jù)和裝備性能數(shù)據(jù)等。隨著科技的發(fā)展,高性能偵察探測(cè)設(shè)備、測(cè)量設(shè)備、感知設(shè)備、傳感設(shè)備和記錄存儲(chǔ)設(shè)備等在作戰(zhàn)實(shí)驗(yàn)中廣泛運(yùn)用,作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)采集的方式更加靈活、手段更加多樣,信息網(wǎng)絡(luò)的大范圍覆蓋,使得數(shù)據(jù)采集范圍更加廣泛。當(dāng)前作戰(zhàn)實(shí)驗(yàn)所采集的數(shù)據(jù)和傳統(tǒng)實(shí)驗(yàn)數(shù)據(jù)相比,有了明顯的區(qū)別:一是數(shù)據(jù)規(guī)模海量化,急劇拓展的戰(zhàn)場(chǎng)空間、龐雜的武器裝備和作戰(zhàn)環(huán)境數(shù)據(jù),加上敵我對(duì)抗的復(fù)雜化,作戰(zhàn)實(shí)驗(yàn)中的數(shù)據(jù)量呈爆炸式增長(zhǎng),由過去的MB躍升至GB、TB,甚至PB以上;二是數(shù)據(jù)類型多樣化,作戰(zhàn)實(shí)驗(yàn)手段和技術(shù)的發(fā)展,同時(shí)帶來了數(shù)據(jù)類型的增加,數(shù)據(jù)格式不再是單一的結(jié)構(gòu)化數(shù)據(jù),諸如視頻、圖像、聲音、文本等類型的非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)越來越多;三是數(shù)據(jù)處理快速化,隨著技術(shù)的發(fā)展,作戰(zhàn)實(shí)驗(yàn)過程中數(shù)據(jù)產(chǎn)生速度更快,不僅要求對(duì)數(shù)據(jù)分析和處理更加快速,有時(shí)甚至要求進(jìn)行實(shí)時(shí)處理;四是數(shù)據(jù)隱性價(jià)值化,作戰(zhàn)實(shí)驗(yàn)過程中采集的海量數(shù)據(jù),雖然分布廣泛且雜亂無章,但卻蘊(yùn)含著豐富的價(jià)值,通過合理地挖掘分析能夠揭示其中隱藏的有用價(jià)值,為實(shí)驗(yàn)結(jié)論的分析提供重要參考。
海量的作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)中,絕大多數(shù)來源于不同的站點(diǎn),存儲(chǔ)于分布式數(shù)據(jù)庫中。傳統(tǒng)的數(shù)據(jù)分析方法在對(duì)作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析時(shí)存在如下瓶頸:一是存儲(chǔ)和計(jì)算能力不足,傳統(tǒng)的數(shù)據(jù)關(guān)聯(lián)挖掘大多以單機(jī)的形式進(jìn)行處理。隨著數(shù)據(jù)的增加,對(duì)單機(jī)的計(jì)算性能和穩(wěn)定性要求越來越高,面對(duì)海量作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù),單機(jī)的處理能力遠(yuǎn)遠(yuǎn)不能滿足需要,很難及時(shí)存放和分析處理;二是無法應(yīng)對(duì)多源異構(gòu)數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)處理方法主要基于結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計(jì)方法,通過對(duì)篩選后的樣本數(shù)據(jù)進(jìn)行分析來查找相關(guān)規(guī)律,但對(duì)于半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)則束手無策;三是因果關(guān)系難追溯,傳統(tǒng)的數(shù)據(jù)挖掘分析側(cè)重于因果關(guān)系的查找,信息化戰(zhàn)爭(zhēng)復(fù)雜多變,戰(zhàn)爭(zhēng)的各因素相互交織、關(guān)聯(lián),一因多果、一果多因、多因多果或無因果的情況普遍存在,單純從數(shù)據(jù)中追溯因果關(guān)系十分困難。
“關(guān)聯(lián)而非因果”是進(jìn)行海量數(shù)據(jù)分析的重要理念,相比于追溯海量數(shù)據(jù)中的因果關(guān)系,更可行和有效的方法是通過關(guān)聯(lián)規(guī)則挖掘,查找各因素之間的關(guān)聯(lián)關(guān)系。相比于傳統(tǒng)的數(shù)據(jù)分析方法,大數(shù)據(jù)關(guān)聯(lián)分析具有明顯優(yōu)勢(shì):一是數(shù)據(jù)存儲(chǔ)和計(jì)算能力強(qiáng)大,借助分布式集群處理方式,將海量數(shù)據(jù)進(jìn)行分布式存儲(chǔ),同時(shí)利用集群處理器進(jìn)行分布式并行運(yùn)算,能夠很好地解決存儲(chǔ)和計(jì)算能力不足的問題;二是支持多源異構(gòu)數(shù)據(jù),通過非關(guān)系數(shù)據(jù)庫,能很好地支持圖片、音頻、視頻等半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)、管理、查詢和分析;三是關(guān)聯(lián)挖掘容易實(shí)現(xiàn),關(guān)聯(lián)分析不需要理清關(guān)系網(wǎng)絡(luò)和證明前因后果的時(shí)序邏輯,只需要進(jìn)行關(guān)聯(lián)挖掘就可以得到關(guān)聯(lián)結(jié)論,進(jìn)而分析出有用信息,且整個(gè)過程可以通過計(jì)算機(jī)程序?qū)崿F(xiàn),操作比較簡(jiǎn)單。
因此,通過引入分布式和并行計(jì)算技術(shù),構(gòu)建分布式數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘模型,明確具體流程,同時(shí)改進(jìn)或創(chuàng)新挖掘算法,可以實(shí)現(xiàn)作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)的高效分析,挖掘出有用信息,為決策提供重要參考。
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的主要任務(wù)之一,其核心內(nèi)容是通過掃描數(shù)據(jù)集合,發(fā)現(xiàn)其中的頻繁項(xiàng)集,并在此基礎(chǔ)上構(gòu)造關(guān)聯(lián)規(guī)則。
令I(lǐng)={i1,i2,…,im}是所有數(shù)據(jù)項(xiàng)的集合,D表示所有事務(wù)的集合,T={t1,t2,…,tm},(ti?I)表示D中的一個(gè)事務(wù),用TID進(jìn)行唯一標(biāo)識(shí),A和B分別表示由若干數(shù)據(jù)項(xiàng)組成的集合,D中的關(guān)聯(lián)規(guī)則是形如A?B的蘊(yùn)含式(其中,A?I,B?I且A∩B=?)。
衡量D中關(guān)聯(lián)規(guī)則A?B的兩個(gè)常用指標(biāo)是支持度s和置信度c。其中,支持度表示關(guān)聯(lián)規(guī)則出現(xiàn)的頻度,即D中包含集合A、B的事務(wù)數(shù)占D中所有事務(wù)數(shù)的比值,用于衡量關(guān)聯(lián)規(guī)則“量”的多少;置信度則表示關(guān)聯(lián)規(guī)則的強(qiáng)度,即D中同時(shí)包含A、B的事務(wù)數(shù)與D中僅包含A的事務(wù)數(shù)的比值,體現(xiàn)了關(guān)聯(lián)規(guī)則在“質(zhì)”上的可靠程度。s和c分別由下列公式求得
s=sup(A?B)=P(A∪B)
(1)
c=conf(A?B)=P(B|A)=P(A∪B)/P(A)
(2)
假設(shè)min sup為用戶設(shè)定的最小支持度,min conf為最小置信度,若:sup(A?B)>min sup且conf(A?B)>min conf,則關(guān)聯(lián)規(guī)則A?B為強(qiáng)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘的目的就是在給定一個(gè)事務(wù)集D的情況下,運(yùn)用挖掘算法,依據(jù)用戶設(shè)定的最小支持度和最小置信度,找出符合要求的關(guān)聯(lián)規(guī)則。
作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)挖掘是在分布式存儲(chǔ)和分布式并行計(jì)算技術(shù)的基礎(chǔ)上,通過一定的關(guān)聯(lián)規(guī)則挖掘算法對(duì)各類多源異構(gòu)作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行挖掘,得出強(qiáng)關(guān)聯(lián)規(guī)則,最后,經(jīng)過分析得出有用知識(shí)。根據(jù)關(guān)聯(lián)規(guī)則挖掘原理和作戰(zhàn)實(shí)驗(yàn)特點(diǎn),作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘框架(如圖1)。框架自底向上分為數(shù)據(jù)采集層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)表達(dá)層、數(shù)據(jù)計(jì)算層和數(shù)據(jù)分析層等5層。其中,數(shù)據(jù)采集層是關(guān)聯(lián)規(guī)則挖掘的基礎(chǔ),主要負(fù)責(zé)作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)的采集,采集方法有傳感器網(wǎng)絡(luò)采集、系統(tǒng)自動(dòng)采集、人工記錄采集和背景調(diào)查采集等;數(shù)據(jù)存儲(chǔ)層主要負(fù)責(zé)將采集層的海量實(shí)驗(yàn)數(shù)據(jù)分塊存儲(chǔ)到事先構(gòu)建好的計(jì)算集群中,并提供高速的數(shù)據(jù)訪問讀寫服務(wù);數(shù)據(jù)表達(dá)層是在數(shù)據(jù)存儲(chǔ)的基礎(chǔ)上,對(duì)各類不同類型結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行表示,以便進(jìn)行數(shù)據(jù)計(jì)算;數(shù)據(jù)計(jì)算層采用MapReduce計(jì)算模型,實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的并行計(jì)算處理;數(shù)據(jù)分析層是用戶根據(jù)實(shí)驗(yàn)?zāi)康?運(yùn)用一定挖掘算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘并對(duì)結(jié)果進(jìn)行分析,最后得到有用知識(shí)。

圖1 作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘框架
作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘的目的是從采集到的海量作戰(zhàn)數(shù)據(jù)中找出強(qiáng)關(guān)聯(lián)規(guī)則,并通過分析抽取出數(shù)據(jù)中蘊(yùn)含的有用知識(shí)。其流程主要包括3階段:數(shù)據(jù)預(yù)處理、關(guān)聯(lián)規(guī)則挖掘和分析形成結(jié)論(如圖2)。其中,數(shù)據(jù)預(yù)處理階段主要對(duì)采集的數(shù)據(jù)進(jìn)行凈化、去噪、一致性處理、抽象描述和規(guī)模壓縮等處理,以消除缺失、重復(fù)、相似和不一致的數(shù)據(jù),并將數(shù)據(jù)轉(zhuǎn)化為適合關(guān)聯(lián)規(guī)則挖掘的模式;關(guān)聯(lián)規(guī)則挖掘階段主要是運(yùn)用分布式并行計(jì)算技術(shù),運(yùn)用相關(guān)挖掘算法,找出滿足符合用戶要求的頻繁項(xiàng)集,并根據(jù)頻繁項(xiàng)集挖掘出符合用戶要求的強(qiáng)關(guān)聯(lián)規(guī)則;分析形成結(jié)論階段主要是對(duì)挖掘結(jié)果進(jìn)行軍事層面的提煉,得到有用知識(shí)供指揮和參謀人員參考使用和輔助決策。

圖2 作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘流程
典型的挖掘算法是Apriori算法,其優(yōu)點(diǎn)是結(jié)構(gòu)簡(jiǎn)單、易于理解,為提高算法的效率,許多學(xué)者對(duì)Apriori算法進(jìn)行了改進(jìn),提出了分布式并行關(guān)聯(lián)規(guī)則挖掘算法[10],文獻(xiàn)[11]通過MapReduce編程框架實(shí)現(xiàn)了分布式CD算法,較好地提高了挖掘效率,其過程主要是:1)由主進(jìn)程根據(jù)k-1項(xiàng)頻繁集求得k項(xiàng)候選集并將候選集均勻分發(fā)給各節(jié)點(diǎn);2)各節(jié)點(diǎn)運(yùn)用Map函數(shù)并行計(jì)算其數(shù)據(jù)中的k項(xiàng)候選集的支持?jǐn)?shù)并將結(jié)果提交給reduce函數(shù);3)Reduce函數(shù)根據(jù)Map函數(shù)提交的支持?jǐn)?shù)求得k項(xiàng)候選集的全局支持?jǐn)?shù);4)根據(jù)Reduce函數(shù)得出的結(jié)果,主進(jìn)程求得k+1項(xiàng)頻繁項(xiàng)集。但算法存在兩個(gè)較大問題:1)需要迭代k次(即運(yùn)行多次MapReduce函數(shù))才能求得最終的頻繁項(xiàng)目集,而迭代次數(shù)越多,效率越低;2)挖掘過程中需要多次掃描原始數(shù)據(jù)集,隨著數(shù)據(jù)集的增大,挖掘效果逐漸降低。對(duì)此,本文提出一個(gè)改進(jìn)的并行關(guān)聯(lián)規(guī)則挖掘算法。
在運(yùn)用MapReduce程序完成頻繁項(xiàng)集挖掘時(shí),關(guān)鍵之處就是通過掃描1次原始數(shù)據(jù)集,運(yùn)用Map函數(shù)一次性求得數(shù)據(jù)集的全部項(xiàng)集,包括1至k項(xiàng)所有項(xiàng)集,同時(shí)產(chǎn)生
步驟一:將原始數(shù)據(jù)集劃分為N個(gè)大小相當(dāng)?shù)淖蛹?
步驟二:運(yùn)用Map函數(shù)求得各子集的全部項(xiàng)集,同時(shí)產(chǎn)生
步驟三:,在Map端調(diào)用Combine函數(shù),對(duì)具有相同key的鍵值對(duì)進(jìn)行合并(即求得項(xiàng)集的局部支持?jǐn)?shù)),并將結(jié)果提交給Reduce函數(shù);
步驟四:Reduce函數(shù)根據(jù)提交的鍵值對(duì)求得相同key項(xiàng)集的全局支持?jǐn)?shù);
步驟五:根據(jù)用戶設(shè)定的最小支持度,求得到最終頻繁項(xiàng)集。
由算法描述可知,改進(jìn)后的算法只需要掃描1次原始數(shù)據(jù)集,而且只需要提交一次MapReduce任務(wù),減少了迭代次數(shù),有效克服了文獻(xiàn)[11]中所提算法的不足。
在運(yùn)用空地仿真系統(tǒng)進(jìn)行航空兵突防效果仿真實(shí)驗(yàn)中,要求分析紅方突防方法與突防效果的關(guān)系,其中,紅方擬采用的突防方法有:1)采用反輻射武器打擊敵對(duì)空雷達(dá)陣地(用J表示);2)實(shí)施遠(yuǎn)距離電子干擾(用R表示);3)運(yùn)用遠(yuǎn)程導(dǎo)彈進(jìn)行突防(用Y表示);4)運(yùn)用中程導(dǎo)彈進(jìn)行突防(用Z表示);5)運(yùn)用超聲速空地導(dǎo)彈進(jìn)行高中空突防(用G表示);6)運(yùn)用亞聲速巡航導(dǎo)彈進(jìn)行超低空突防(用D表示),J、R、Y、Z、G、D等均區(qū)分“是”和“否”兩種情況。突防效果用E表示,區(qū)分“好”和“一般”兩種情況。
在進(jìn)行仿真運(yùn)算時(shí),仿真系統(tǒng)詳細(xì)記錄了每次突防過程的具體數(shù)據(jù),在進(jìn)行關(guān)聯(lián)規(guī)則挖掘之前,首先需要對(duì)采集的數(shù)據(jù)進(jìn)行預(yù)處理,主要是將每一條仿真記錄按照{(diào)TID,J,R,Y,Z,G,D,E}的格式進(jìn)行統(tǒng)一表示,TID表示仿真序號(hào),預(yù)處理后的數(shù)據(jù)如表1所示。
4.3 數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘及結(jié)果分析
運(yùn)用本文設(shè)計(jì)的挖掘算法對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,設(shè)定最小支持度為25%,最小置信度為90%,得出所有頻繁項(xiàng)集,并篩選出以作戰(zhàn)效果E為結(jié)論的強(qiáng)關(guān)聯(lián)規(guī)則(如表2)。

表1 預(yù)處理后的實(shí)驗(yàn)數(shù)據(jù)集

表2 篩選后的強(qiáng)關(guān)聯(lián)規(guī)則
最后,對(duì)表2中的強(qiáng)關(guān)聯(lián)規(guī)則進(jìn)行篩選解讀,可以得到以下幾條規(guī)則:
規(guī)則1:紅方實(shí)施遠(yuǎn)距離電子干擾,突防效果好(規(guī)則的置信度為91%)。
規(guī)則2:紅方采用反輻射制導(dǎo)武器打擊敵對(duì)空雷達(dá)陣地,突防效果好(規(guī)則的置信度為92%)。
分析以上2條規(guī)則表明,在進(jìn)行突防時(shí),應(yīng)當(dāng)盡量壓制敵探測(cè)感知效果和手段,即提升突防效果。一方面,可以通過對(duì)敵實(shí)施強(qiáng)電子干擾,壓縮敵雷達(dá)探測(cè)距離,降低突防殲擊機(jī)的發(fā)現(xiàn)概率;另一方面,可以通過運(yùn)用反輻射制導(dǎo)武器打擊敵對(duì)空雷達(dá),實(shí)現(xiàn)對(duì)敵探測(cè)手段的硬摧毀。
規(guī)則3:紅方運(yùn)用遠(yuǎn)程空地導(dǎo)彈進(jìn)行突防,突防效果好(規(guī)則的置信度為93%)。
規(guī)則4:紅方運(yùn)用中近程空地導(dǎo)彈進(jìn)行突防,突防效果一般(規(guī)則的置信度為91%)。
規(guī)則5:紅方運(yùn)用遠(yuǎn)程空地導(dǎo)彈進(jìn)行突防,同時(shí)運(yùn)用中近程空地導(dǎo)彈進(jìn)行突防,突防效果好(規(guī)則的置信度為97%)。
分析以上規(guī)則表明,突防時(shí),采用遠(yuǎn)程空地導(dǎo)彈突防時(shí),由于導(dǎo)彈可在敵防區(qū)外發(fā)射,突防效果較好,但由于遠(yuǎn)程空地導(dǎo)彈造價(jià)相對(duì)昂貴,作戰(zhàn)效費(fèi)比不高。采用中近程空地導(dǎo)彈突防時(shí),需要載機(jī)突進(jìn)敵防區(qū)內(nèi),載機(jī)被攔截的風(fēng)險(xiǎn)較大,平均突防導(dǎo)彈數(shù)量減少,突防效果一般。當(dāng)采用遠(yuǎn)程和中近程組合攻擊方式時(shí),突防效果好。故可以先運(yùn)用少量遠(yuǎn)程空地導(dǎo)彈打擊敵防空系統(tǒng),壓縮敵防空殺傷區(qū),降低中近程空地導(dǎo)彈載機(jī)被攔截風(fēng)險(xiǎn),再運(yùn)用中近程進(jìn)行攻擊,以此達(dá)到較好的突防效果,且相比單獨(dú)使用遠(yuǎn)程空地導(dǎo)彈,效費(fèi)比更高。
規(guī)則6:紅方運(yùn)用超聲速空地導(dǎo)彈進(jìn)行中高空突防,突防效果一般(規(guī)則的置信度為92%)。
規(guī)則7:紅方運(yùn)用亞聲速巡航導(dǎo)彈進(jìn)行超低空突防,突防效果一般(規(guī)則的置信度為90%)。
規(guī)則8:紅方運(yùn)用超聲速空地導(dǎo)彈進(jìn)行中高空突防,同時(shí)運(yùn)用亞聲速巡航導(dǎo)彈進(jìn)行超低空突防,突防效果好(規(guī)則的置信度為98%)。
分析以上規(guī)則表明,突防時(shí),若只運(yùn)用單一類型和單一彈道空域的導(dǎo)彈進(jìn)行突防,不能達(dá)到很好的突防效果,應(yīng)當(dāng)采用多類型、多彈道相結(jié)合的方式,分散敵防空火力和雷達(dá)探測(cè)資源,提升突防效果。
為檢驗(yàn)算法的有效性,本文對(duì)案例背景進(jìn)行了擴(kuò)展以增加仿真數(shù)據(jù)規(guī)模,綜合考慮影響突防效果的紅方兵力類型(區(qū)分轟炸機(jī)、殲擊轟炸機(jī)、多用途戰(zhàn)斗機(jī)等)、兵力規(guī)模(區(qū)分小、中、大規(guī)模)、保障形式(區(qū)分預(yù)警偵察、空中掩護(hù)、指揮引導(dǎo)等)等20余種因素;同時(shí),區(qū)分?jǐn)巢捎貌煌烙w系和不同防御方式下的突防情況,將突防效果細(xì)化為“非常好”、“好”、“一般”、“不好”等層次。最后,在仿真結(jié)果數(shù)據(jù)集中分別選取10 000 條,20 000條,30 000條,50 000條仿真記錄,運(yùn)用Apriori算法、文獻(xiàn)[11]算法和本文所提算法進(jìn)行挖掘,找出強(qiáng)關(guān)聯(lián)規(guī)則,效果對(duì)比如圖3。

圖3 各算法挖掘效率對(duì)比圖
結(jié)果顯示,相比Apriori算法,分布式并行挖掘算法在數(shù)據(jù)集較小的情況下,效果并不明顯,但隨著數(shù)據(jù)集的增大,挖掘效果逐漸顯現(xiàn),這表明,分布式并行技術(shù)比較適用于處理海量作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)。此外,結(jié)果也表明,由于只需要提交一次MapReduce任務(wù),且對(duì)原始數(shù)據(jù)集只掃描了一次,本文所提算法挖掘效率較文獻(xiàn)[11]中的算法也有一定的提高。
作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘是作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)分析的重要方面,可以拓展作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)分析方法,深化對(duì)作戰(zhàn)實(shí)驗(yàn)問題的研究。本文針對(duì)傳統(tǒng)數(shù)據(jù)分析方法存在的不足,將分布式并行處理技術(shù)運(yùn)用到作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘中,構(gòu)建了分布式作戰(zhàn)實(shí)驗(yàn)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘框架,明確了挖掘流程。為提升挖掘效率,本文還對(duì)現(xiàn)有關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了改進(jìn)。最后,進(jìn)行了案例分析,結(jié)果表明,分布式并行處理技術(shù)能夠更好地處理海量數(shù)據(jù),通過挖掘得到關(guān)聯(lián)規(guī)則,能夠很好地反映作戰(zhàn)要素間的相互聯(lián)系,經(jīng)過合理篩選分析,能夠有效揭示數(shù)據(jù)中蘊(yùn)含的軍事知識(shí),為作戰(zhàn)決策者提供重要參考。此外,通過在不同數(shù)據(jù)集上進(jìn)行關(guān)聯(lián)規(guī)則挖掘的仿真實(shí)驗(yàn),也驗(yàn)證本文所提算法的有效性。