錢昭勇,曹裕華,燕如意,劉現(xiàn)明,史增凱
(1.航天工程大學(xué), 北京 101416; 2.國(guó)防大學(xué)聯(lián)合勤務(wù)學(xué)院, 北京 100858,3.中國(guó)人民解放軍93110部隊(duì), 北京 100036)
當(dāng)前實(shí)戰(zhàn)化訓(xùn)練背景下,裝備在役考核過(guò)程中產(chǎn)生和統(tǒng)計(jì)的數(shù)據(jù)量大面廣、種類繁多、結(jié)構(gòu)不一,對(duì)這些海量數(shù)據(jù)的深層次分析與處理需求日益凸顯。然而,傳統(tǒng)的數(shù)據(jù)分析處理方法對(duì)海量考核數(shù)據(jù)利用效率較低,很少揭示數(shù)據(jù)間的關(guān)聯(lián)規(guī)則和相互關(guān)系,難以立足于歷史和當(dāng)前數(shù)據(jù)預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì),很難對(duì)裝備使用情況進(jìn)行客觀可信的評(píng)估。如何設(shè)計(jì)出科學(xué)、合理、好用的裝備在役考核指標(biāo)體系,以便從大量雜亂無(wú)序并受噪聲干擾的各種裝備數(shù)據(jù)中“智能地”和“自動(dòng)地”挖掘出有價(jià)值的信息,是目前我軍裝備信息化和智能化發(fā)展面臨的瓶頸之一,也是對(duì)數(shù)據(jù)挖掘應(yīng)用于在役考核的技術(shù)倒逼和挑戰(zhàn)。為此,本文開(kāi)展了數(shù)據(jù)挖掘方法在裝備在役考核領(lǐng)域的應(yīng)用研究。從數(shù)據(jù)挖掘的全過(guò)程和裝備在役考核評(píng)估的全流程出發(fā),首先介紹了裝備在役考核與數(shù)據(jù)挖掘的內(nèi)涵;繼而對(duì)比分析了挖掘工具和算法應(yīng)用;最后立足于挖掘結(jié)果的解釋,重點(diǎn)剖析了考核指標(biāo)體系構(gòu)建模型評(píng)估和知識(shí)表示等相關(guān)問(wèn)題。
數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、隨機(jī)的數(shù)據(jù)中,獲取隱藏在其中的、有價(jià)值的潛在知識(shí)的過(guò)程[1]。數(shù)據(jù)挖掘可分為預(yù)處理、挖掘?qū)嵤┖徒Y(jié)果解釋3個(gè)階段,如圖1所示。

圖1 數(shù)據(jù)挖掘過(guò)程框圖
預(yù)處理階段將高頻數(shù)據(jù)從數(shù)據(jù)庫(kù)中選取出來(lái),進(jìn)行轉(zhuǎn)換后構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),目的是為抽取足夠且有效的數(shù)據(jù);數(shù)據(jù)挖掘階段通過(guò)選用有效的挖掘工具和算法,科學(xué)地運(yùn)用挖掘模型對(duì)前期數(shù)據(jù)進(jìn)行分析處理;結(jié)果解釋階段將依據(jù)模型的各項(xiàng)指標(biāo)對(duì)比分析數(shù)據(jù)結(jié)果,并進(jìn)行結(jié)果的可視化表示與知識(shí)的合理解釋。
新裝備在全壽命周期的試驗(yàn)可分為性能試驗(yàn)、作戰(zhàn)試驗(yàn)和在役考核3類[2]。性能試驗(yàn)是解決“能用”的問(wèn)題,作戰(zhàn)試驗(yàn)是解決“管用”的問(wèn)題,在役考核是確保武器裝備列裝部隊(duì)后“好用”。在役考核與美軍后續(xù)的作戰(zhàn)試驗(yàn)鑒定類似,主要立足部隊(duì)實(shí)際條件,結(jié)合平時(shí)成建制、成體系的訓(xùn)練、演練,全時(shí)空、全領(lǐng)域、全要素地跟蹤掌握部隊(duì)裝備使用、保障和維修情況,既考核裝備部署部隊(duì)的適編性和服役期的經(jīng)濟(jì)性,又檢測(cè)部分在性能試驗(yàn)和作戰(zhàn)試驗(yàn)階段難以考核的指標(biāo)。裝備在役考核的基本過(guò)程分為考核設(shè)計(jì)(編報(bào)在役考核大綱)、數(shù)據(jù)采集與存儲(chǔ)、考核評(píng)估分析、問(wèn)題反饋和處理等關(guān)鍵環(huán)節(jié),如圖2所示。

圖2 數(shù)據(jù)挖掘介入裝備在役考核過(guò)程框圖
由圖2可知,數(shù)據(jù)挖掘技術(shù)應(yīng)用于裝備在役考核過(guò)程中,將對(duì)考核流程里的每個(gè)關(guān)鍵節(jié)點(diǎn)發(fā)揮重要作用。依據(jù)裝備鑒定定型試驗(yàn)總案,通過(guò)使用數(shù)據(jù)挖掘輔助設(shè)計(jì)合理的考核指標(biāo)體系,對(duì)考核采集的基礎(chǔ)數(shù)據(jù)進(jìn)行預(yù)處理后,選擇恰當(dāng)?shù)臄?shù)據(jù)挖掘工具和算法進(jìn)行考核評(píng)估分析,最后通過(guò)對(duì)挖掘模型評(píng)估和知識(shí)表示,總結(jié)規(guī)律,反饋問(wèn)題,起到輔助決策的作用。
裝備在役考核的數(shù)據(jù)挖掘預(yù)處理,相對(duì)于對(duì)傳統(tǒng)統(tǒng)計(jì)數(shù)據(jù)預(yù)先處理,既重視數(shù)據(jù)的質(zhì),也注重?cái)?shù)據(jù)的量。其本質(zhì)就是通過(guò)一系列的方法和手段,確保裝備在役考核數(shù)據(jù)的質(zhì)和量,為實(shí)施數(shù)據(jù)挖掘奠定基礎(chǔ)。
實(shí)施數(shù)據(jù)挖掘的首要前提是數(shù)據(jù)的量達(dá)到一定的程度,并且數(shù)據(jù)的維度需要盡可能完整全面。畢竟數(shù)據(jù)挖掘是使用局部樣本來(lái)代替和反映整體,挖掘結(jié)果不可避免會(huì)出現(xiàn)局部樣本無(wú)法完全正確反映整體而出現(xiàn)偏差。事實(shí)上,在役考核數(shù)據(jù)采集是一個(gè)長(zhǎng)久持續(xù)的活動(dòng),絕大多數(shù)都不是短期的、一次性的,而是從裝備列裝服役到退役報(bào)廢整個(gè)過(guò)程,涉及部隊(duì)作戰(zhàn)指揮、裝備管理、維修保障和使用操作等所有與裝備相關(guān)的要素,這就決定了考核指標(biāo)采集數(shù)據(jù)的特點(diǎn)有:分布廣泛、數(shù)據(jù)繁多、動(dòng)態(tài)變化、類型多樣等[3]。為確保數(shù)據(jù)的量可以覆蓋考核裝備的全維度特性,可以把裝備在役考核數(shù)據(jù)按照應(yīng)用需求的方式總體分為連續(xù)型和離散型兩類。連續(xù)型裝備數(shù)據(jù)以時(shí)間為軸,主要統(tǒng)計(jì)考核裝備從列裝定型到退役報(bào)廢所有相關(guān)性能參數(shù)變化情況,形成時(shí)間序列,進(jìn)而分析裝備的性能變化趨勢(shì),以及預(yù)測(cè)裝備的剩余壽命等。離散型裝備在役考核數(shù)據(jù),更多立足于平時(shí)的演訓(xùn),主要將考核裝備置于各種不同的應(yīng)用場(chǎng)景,結(jié)合復(fù)雜環(huán)境的作用,豐富裝備的應(yīng)用模式,增強(qiáng)數(shù)據(jù)的層次范圍,從而增加裝備的評(píng)估維度,不僅僅統(tǒng)計(jì)演訓(xùn)中按照各種既定預(yù)案展開(kāi)使用裝備的情況,而是可以通過(guò)場(chǎng)景(實(shí)際或仿真)的加入使得每一次演訓(xùn)中裝備的應(yīng)用數(shù)據(jù)都能得到極大的擴(kuò)展,從而真正有針對(duì)性地實(shí)現(xiàn)裝備考核大數(shù)據(jù)的創(chuàng)造。
在役考核中裝備數(shù)據(jù)的質(zhì)量如何,是考核評(píng)估是否科學(xué)合理的關(guān)鍵,擁有較好質(zhì)量的數(shù)據(jù)將較大提高挖掘的效率,取得更好的考核效果。為解決考核裝備數(shù)據(jù)時(shí)間差異性、平臺(tái)多樣性、數(shù)據(jù)不穩(wěn)定性等問(wèn)題,消除噪聲,糾正數(shù)據(jù)不一致性,不僅需要對(duì)裝備在役考核數(shù)據(jù)嚴(yán)格執(zhí)行ETL(Extract-Transform-Lord)過(guò)程,結(jié)合考核目的和算法對(duì)數(shù)據(jù)削減和集成也是非常重要的預(yù)處理分析環(huán)節(jié)[4]。數(shù)據(jù)削減是在不影響挖掘效果前提下,通過(guò)數(shù)據(jù)壓縮、聚合、維數(shù)降減、數(shù)據(jù)塊削減等方式,縮小數(shù)據(jù)規(guī)模。例如,衛(wèi)星系統(tǒng)在役考核數(shù)據(jù)包括型號(hào)、批次、出廠日期、服役日期、組網(wǎng)數(shù)量、編制信息、功能性能、維修情況等具體指標(biāo)信息,而在考核其作戰(zhàn)效能的時(shí)候,傳統(tǒng)的人機(jī)結(jié)合指標(biāo)明顯不符合也不適用于考核意圖,為此與人機(jī)結(jié)合相關(guān)的指標(biāo)屬性應(yīng)該舍棄,不予考慮。數(shù)據(jù)集成是指將來(lái)自多個(gè)不同數(shù)據(jù)源、格式性質(zhì)各異的數(shù)據(jù)在邏輯上或物理上合并到一起構(gòu)成一個(gè)完整的數(shù)據(jù)集,常使用聯(lián)邦式、中間件和數(shù)據(jù)倉(cāng)庫(kù)等集成架構(gòu)一個(gè)數(shù)據(jù)集成平臺(tái),該平臺(tái)具有全面、統(tǒng)一、經(jīng)濟(jì)等特點(diǎn),能更有效地進(jìn)行數(shù)據(jù)挖掘操作和更快地做出數(shù)據(jù)驅(qū)動(dòng)型業(yè)務(wù)決策。
針對(duì)裝備在役考核數(shù)據(jù)特征,選取具有代表性的數(shù)據(jù)挖掘工具,分別從數(shù)據(jù)存取、處理、分析建模、可視化展示、編程語(yǔ)言、是否開(kāi)源等方面對(duì)數(shù)據(jù)挖掘軟件進(jìn)行比較分析和評(píng)估,有關(guān)情況如表1所示。

表1 數(shù)據(jù)挖掘工具能力
通過(guò)表1比較分析,裝備在役考核中,須對(duì)各種不同類型的考核數(shù)據(jù)分類采集,使用ODM、Rapid Miner、Knime等工具進(jìn)行數(shù)據(jù)存取更加快捷高效,便于維護(hù);在數(shù)據(jù)處理方面,SPSS、SAS、Knime、Apache Mahout等工具在對(duì)數(shù)據(jù)排序、轉(zhuǎn)換、檢索、傳送等方面功能強(qiáng)大,兼容性好,容錯(cuò)性高;在分析建模方面,SAS、ODM、Orange、Weka等工具擁有完整的集成模型,且滿足差異化建模訴求,有較好的可擴(kuò)展性;在可視化展示方面,SPSS、Rattle、Rapid Miner、Orange等工具常用表格或圖形的方式反映考核數(shù)據(jù)的特征和模式,甚至還可以按照用戶自定的維度探索數(shù)據(jù)背后的信息,更加直觀,增強(qiáng)了人機(jī)交互和知識(shí)感知的能力[5]。
數(shù)據(jù)挖掘工具較多,大多繼承了人工智能和模式識(shí)別等許多新技術(shù)的最新發(fā)展應(yīng)用成果,把讓數(shù)據(jù)“說(shuō)話”的思想和相關(guān)算法進(jìn)行了科學(xué)的平臺(tái)整合。裝備在役考核中,選擇更加恰當(dāng)?shù)墓ぞ?,?shí)現(xiàn)海量數(shù)據(jù)的科學(xué)分析與評(píng)估,將為在役考核提供高效的處理方法和可信的決策支持。
在役考核中,數(shù)據(jù)挖掘的核心在于合理科學(xué)地運(yùn)用各種算法,基于裝備產(chǎn)生的海量數(shù)據(jù),在考核評(píng)估裝備適用性、適編性、適配性、穩(wěn)定性、作戰(zhàn)效能、經(jīng)濟(jì)性、體系貢獻(xiàn)率等方面發(fā)揮明顯優(yōu)勢(shì)。
數(shù)據(jù)挖掘的主要任務(wù)在于描述和預(yù)測(cè)。描述性任務(wù)依據(jù)數(shù)據(jù)基本特征,按照相似程度進(jìn)行分組,進(jìn)而歸納總結(jié)數(shù)據(jù)所蘊(yùn)含的規(guī)則;預(yù)測(cè)性任務(wù)立足歷史和當(dāng)前數(shù)據(jù),通過(guò)學(xué)習(xí)和訓(xùn)練,對(duì)未來(lái)發(fā)展情況作出預(yù)判和推理。描述性任務(wù)通常使用聚類分析方法(包括K-means算法、K-medoids算法、FCM算法、神經(jīng)網(wǎng)絡(luò)聚類算法等);預(yù)測(cè)性任務(wù)通常包括關(guān)聯(lián)分析(Apriori算法、FP-growth算法)、分類(KNN算法、Adaboost算法、Bayes分類算法、決策樹(shù)算法、SVM算法)、回歸分析(線性/非線性回歸、Logistic算法)、演變分析(時(shí)間序列分析算法)等[6]。裝備在役考核應(yīng)用過(guò)程中通常采用多種數(shù)據(jù)挖掘算法,或采用有效集成的技術(shù),結(jié)合若干方法的優(yōu)點(diǎn)。例如,在裝備可靠性的在役考核方面,目前涉及裝備的各類應(yīng)用信息庫(kù)、數(shù)據(jù)庫(kù)管理系統(tǒng)中存儲(chǔ)的數(shù)據(jù)量急劇增加。具體包括歷年的裝備統(tǒng)計(jì)實(shí)力、裝備財(cái)務(wù)實(shí)力、裝備訓(xùn)練數(shù)據(jù)、裝備維修數(shù)據(jù)等數(shù)字與非數(shù)字?jǐn)?shù)據(jù)庫(kù)。無(wú)論從時(shí)間還是空間因素考慮,傳統(tǒng)的數(shù)據(jù)分析手段(方差均值、專家打分、層次分析等)只能獲得這些數(shù)據(jù)的表層信息,很難對(duì)數(shù)據(jù)進(jìn)行深層次的處理,造成大量數(shù)據(jù)資源的浪費(fèi)。然而,通過(guò)時(shí)間序列算法,就能充分利用裝備從列裝部隊(duì)服役以來(lái)的各種數(shù)據(jù),獲得數(shù)據(jù)屬性之間的內(nèi)在關(guān)聯(lián)和隱含的規(guī)則與模式[7]。以對(duì)衛(wèi)星裝備的在役考核為例,其中一個(gè)重要的途徑就是通過(guò)對(duì)在軌衛(wèi)星的工作狀態(tài)及健康狀況保持持續(xù)監(jiān)控,根據(jù)歷史每天積累下來(lái)的各種類型遙測(cè)參數(shù)數(shù)據(jù),進(jìn)行相關(guān)性檢驗(yàn),通過(guò)對(duì)衛(wèi)星這些海量異構(gòu)數(shù)據(jù)的變化規(guī)律進(jìn)行關(guān)聯(lián)分析,判斷哪些參數(shù)類型的變化與對(duì)應(yīng)衛(wèi)星分系統(tǒng)真正故障緊密相關(guān);通過(guò)時(shí)間序列算法預(yù)測(cè)未來(lái)相關(guān)參數(shù)的演變趨勢(shì),可以掌握部件或分系統(tǒng)隨時(shí)間的衰減情況,判斷在軌衛(wèi)星以后發(fā)生故障的時(shí)間預(yù)測(cè)區(qū)間,為檢驗(yàn)考核系統(tǒng)或部件質(zhì)量穩(wěn)定性提供重要參考依據(jù);通過(guò)搭建使用分類算法為主的多層感知器模型,綜合考慮衛(wèi)星分系統(tǒng)或元部件的健康狀態(tài),為下一步衛(wèi)星系統(tǒng)維護(hù)和系統(tǒng)級(jí)容錯(cuò)控制策略提供決策支持。不僅如此,衛(wèi)星的各種組網(wǎng)運(yùn)行控制方式,其中的過(guò)程整體行為遠(yuǎn)比構(gòu)成這個(gè)整體的部分復(fù)雜,從某種角度也可以視為一種復(fù)雜的自適應(yīng)系統(tǒng),通過(guò)恰當(dāng)運(yùn)用神經(jīng)網(wǎng)絡(luò)、模糊C均值聚類、集成學(xué)習(xí)等各種挖掘算法,甚至可以評(píng)估和探索衛(wèi)星體系的涌現(xiàn)現(xiàn)象,進(jìn)而對(duì)衛(wèi)星體系的整體考核評(píng)估提供理論參考。
根據(jù)反映影響裝備戰(zhàn)斗力發(fā)揮的關(guān)鍵問(wèn)題或困擾裝備建設(shè)的實(shí)際問(wèn)題需求分類,在役考核的內(nèi)容主要包括適用性、適編性、適配性、穩(wěn)定性、作戰(zhàn)效能、經(jīng)濟(jì)性、體系貢獻(xiàn)率等方面。按照這些內(nèi)容指標(biāo)的分類,分析匹配更加合適的挖掘算法,構(gòu)建起數(shù)據(jù)挖掘在武器裝備在役考核中的應(yīng)用,有關(guān)框圖如圖3所示。

圖3 數(shù)據(jù)挖掘算法在裝備在役考核中的應(yīng)用框圖
在役考核中數(shù)據(jù)挖掘的結(jié)果解釋包括兩個(gè)方面:模式評(píng)估和知識(shí)表示。模式評(píng)估是針對(duì)裝備在役考核的目的(某種興趣度度量),識(shí)別表示知識(shí)的真正有趣的模式;知識(shí)表示是使用可視化等知識(shí)表示技術(shù),有效展示問(wèn)題求解的結(jié)果。
設(shè)計(jì)良好的在役考核指標(biāo)體系是后續(xù)數(shù)據(jù)采集和分析處理的基本依據(jù),也是數(shù)據(jù)分析挖掘的基礎(chǔ)需求,直接決定在役考核的結(jié)果。
在役考核評(píng)估的本質(zhì)是對(duì)裝備全壽命周期產(chǎn)生的海量信息數(shù)據(jù)進(jìn)行科學(xué)分析處理。采用傳統(tǒng)的考核指標(biāo)體系設(shè)計(jì)方法(大多僅僅考慮考核各階段任務(wù)分工、完成的主要功能等)和簡(jiǎn)單的統(tǒng)計(jì)分析手段,只能獲得數(shù)據(jù)表層信息,很難進(jìn)行深層次的處理,而且不能獲得數(shù)據(jù)屬性之間的內(nèi)在關(guān)聯(lián)和隱含規(guī)則,導(dǎo)致“數(shù)據(jù)爆炸但知識(shí)貧乏”現(xiàn)象[8]。將數(shù)據(jù)挖掘應(yīng)用于在役考核評(píng)估指標(biāo)設(shè)計(jì),就是發(fā)揮數(shù)據(jù)挖掘分類、聚類、關(guān)聯(lián)分析、異常偵測(cè)等算法功能,在基于統(tǒng)計(jì)學(xué)、系統(tǒng)工程、應(yīng)用數(shù)學(xué)、圖形圖像等理論基礎(chǔ)上,選擇適合的工具進(jìn)行分析,找出能夠更好反映考核整體效果的指標(biāo),如表2所示。

表2 在役考核指標(biāo)體系設(shè)計(jì)模式的考核指標(biāo)
由表2可知,在考核指標(biāo)的數(shù)據(jù)源處理模式上,相對(duì)于一般統(tǒng)計(jì)分析,利用數(shù)據(jù)挖掘技術(shù)處理海量數(shù)據(jù)更加高效準(zhǔn)確。在考核指標(biāo)選擇模式上,傳統(tǒng)方法主要以當(dāng)前的需求驅(qū)動(dòng),往往難以更新,而數(shù)據(jù)挖掘技術(shù)的核心在于數(shù)據(jù)驅(qū)動(dòng)、建立模型、提取動(dòng)態(tài)規(guī)則模式,可以隨時(shí)更新“升級(jí)”指標(biāo)庫(kù),隨著數(shù)據(jù)倉(cāng)庫(kù)的不斷更新,數(shù)據(jù)挖掘方法就可以及時(shí)發(fā)現(xiàn)數(shù)據(jù)庫(kù)所最新隱含的規(guī)則、知識(shí)、模式,這也可以防止裝備在役考核評(píng)估指標(biāo)脫離實(shí)際。在考核指標(biāo)設(shè)計(jì)方面,開(kāi)發(fā)并使用關(guān)聯(lián)規(guī)則、分類、聚類分析等算法優(yōu)勢(shì),與傳統(tǒng)的專家打分等方法相比,指標(biāo)的冗余度較低,更具有客觀性和可操作性。在考核指標(biāo)權(quán)重分配上,通過(guò)神經(jīng)網(wǎng)絡(luò)、分層聚類、集成聚類等賦權(quán)聚類的自優(yōu)化功能,真正用數(shù)據(jù)“說(shuō)話”,大大減少了人為的主觀判斷影響,避免了采用專家打分、AHP、德?tīng)柗品ǖ却_定權(quán)重時(shí)主觀性噪音、過(guò)擬合等缺點(diǎn),確保了指標(biāo)體系系統(tǒng)性和全局一致性[9]。在預(yù)期效果上,傳統(tǒng)的在役考核指標(biāo)體系旨在滿足特定的考核任務(wù)需求(例如,檢驗(yàn)評(píng)估裝備在役使用的適用性、可維修性、作戰(zhàn)效能、經(jīng)濟(jì)性等),而通過(guò)數(shù)據(jù)挖掘方法還期待能探索發(fā)現(xiàn)裝備生命周期里內(nèi)在規(guī)律與聯(lián)系,找到隱含的知識(shí)、規(guī)律和模式(例如,無(wú)人機(jī)集群或衛(wèi)星組網(wǎng)里的涌現(xiàn)等),這一點(diǎn)也是數(shù)據(jù)挖掘技術(shù)在裝備在役考核指標(biāo)體系設(shè)計(jì)時(shí)特別突出的應(yīng)用優(yōu)勢(shì)。
數(shù)據(jù)挖掘的結(jié)果往往是模式和規(guī)則,而新穎有效的、易于理解的、潛在有用的模式或規(guī)則就是知識(shí)。知識(shí)的表示方法決定了知識(shí)應(yīng)用的形式,將直接影響決策者利用知識(shí)的程度和范圍。為此,采取適當(dāng)?shù)闹R(shí)表示方法,不僅可以提高裝備在役考核決策分析的效率,而且可以更好地確??己私Y(jié)果的準(zhǔn)確性與完備性。
知識(shí)表示是知識(shí)的符號(hào)化和形式化的過(guò)程,表示方法有很多,主要包括語(yǔ)義網(wǎng)絡(luò)、框架、謂詞邏輯、產(chǎn)生式、本體等。
語(yǔ)義網(wǎng)絡(luò)使用帶屬性的實(shí)體節(jié)點(diǎn)之間構(gòu)成有向圖網(wǎng)絡(luò)來(lái)傳遞和表達(dá)知識(shí),可以清晰直觀地表達(dá)事物間的關(guān)聯(lián)關(guān)系。例如,在對(duì)衛(wèi)星的質(zhì)量穩(wěn)定性考核評(píng)估過(guò)程中,使用關(guān)聯(lián)規(guī)則挖掘的結(jié)果知識(shí),通過(guò)語(yǔ)義網(wǎng)絡(luò)解析表示為接收的異常數(shù)據(jù)集與衛(wèi)星各分系統(tǒng)故障狀態(tài)之間的關(guān)聯(lián)關(guān)系,便于準(zhǔn)確定位故障設(shè)備并加以及時(shí)處置。
框架表示是基于槽和側(cè)面等形式來(lái)展現(xiàn)層次結(jié)構(gòu)明確的知識(shí),具有一定的推理與匹配功能。例如,衛(wèi)星故障模式進(jìn)行分類時(shí),往往是根據(jù)已知的故障信息,通過(guò)與故障知識(shí)庫(kù)中預(yù)先存儲(chǔ)的框架進(jìn)行匹配,以決定接受或放棄預(yù)選框架,便于形式化描述故障模式。
謂詞邏輯將對(duì)象、特征、狀態(tài)和關(guān)系通過(guò)邏輯公式進(jìn)行表示,采用符號(hào)對(duì)確定事實(shí)或規(guī)則進(jìn)行描述和推理。例如,在考核評(píng)估裝備的適編性時(shí),利用決策樹(shù)算法得出的結(jié)果知識(shí),可以通過(guò)一階謂詞邏輯的方式進(jìn)行表示,使推理過(guò)程更加嚴(yán)密規(guī)范,實(shí)現(xiàn)模型精確表達(dá)。
產(chǎn)生式以“條件-結(jié)論”的方式揭示因果關(guān)系或啟發(fā)性知識(shí),不僅能表示確定性知識(shí),而且能表示不確定性知識(shí)。例如,常使用四元組(對(duì)象,屬性,值,可信度)表示不確定性知識(shí),“衛(wèi)星姿態(tài)控制分系統(tǒng)很可能存在2個(gè)故障”可以表示為 (姿態(tài)控制,故障,2,0.8)。產(chǎn)生式知識(shí)表示結(jié)構(gòu)相對(duì)固定,形式簡(jiǎn)單,已是人工智能中應(yīng)用最多的一種知識(shí)表示方法[10]。
本體表示是指共享概念模型明確的形式化規(guī)范說(shuō)明[11]。通過(guò)顯式地描述概念和行為,本體支持知識(shí)的重用和互操作,其核心在于知識(shí)共享。數(shù)據(jù)挖掘結(jié)果使用本體描述,就是用概念對(duì)知識(shí)進(jìn)行形式化表示,不僅可反映知識(shí)之間內(nèi)在關(guān)系,還可以為裝備在役考核工作小組提供一個(gè)統(tǒng)一的規(guī)范模型,使來(lái)自不同崗位、完成不同任務(wù)分工的人員之間都可以在語(yǔ)義一致的基礎(chǔ)上進(jìn)行交流。
當(dāng)然,以上知識(shí)表示方法都有各自的特點(diǎn),可以針對(duì)數(shù)據(jù)挖掘的內(nèi)容和目的進(jìn)行選擇,用于結(jié)果知識(shí)的合理解釋。但它們都屬于知識(shí)的替代表示方法,不能直觀地、可交互地對(duì)知識(shí)進(jìn)行理解探索和優(yōu)化應(yīng)用。為此,需要結(jié)合知識(shí)的可視化進(jìn)行處理。知識(shí)可視化是指所有可以用來(lái)建構(gòu)和傳遞復(fù)雜見(jiàn)解的圖解手段,就是將數(shù)據(jù)挖掘結(jié)果中的模式、關(guān)系、規(guī)則、趨勢(shì)等用最常見(jiàn)的各種圖表進(jìn)行展示,具有直觀化、結(jié)構(gòu)化、深度化和高效化等特點(diǎn)[12]。知識(shí)可視化立足于人類強(qiáng)大的視覺(jué)處理能力,通過(guò)創(chuàng)建知識(shí)形象視圖,融入人機(jī)交互技術(shù),使數(shù)據(jù)挖掘結(jié)果生動(dòng)直觀地呈現(xiàn)出來(lái),大大增強(qiáng)決策者對(duì)知識(shí)的感知和判斷能力,有效促進(jìn)決策者對(duì)知識(shí)的獲取吸收與整合轉(zhuǎn)化。
裝備在役考核蘊(yùn)含大量的數(shù)據(jù)信息,這些數(shù)據(jù)復(fù)雜多樣、種類繁多,而數(shù)據(jù)挖掘技術(shù)在應(yīng)對(duì)海量數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)安全、數(shù)據(jù)分析與處理等多方面具有獨(dú)特的優(yōu)勢(shì)。因此,基于數(shù)據(jù)挖掘的裝備在役考核評(píng)估方法具有很強(qiáng)的應(yīng)用潛力和重要的軍事價(jià)值。本文重點(diǎn)介紹了數(shù)據(jù)挖掘的預(yù)處理、挖掘?qū)嵤┖徒Y(jié)果解釋3個(gè)階段在裝備在役考核中的應(yīng)用形式,全流程分析了基于數(shù)據(jù)挖掘技術(shù)的裝備在役考核評(píng)估程序。數(shù)據(jù)挖掘技術(shù)能夠引入更有效的評(píng)估指標(biāo)體系,有效避免了傳統(tǒng)方法帶來(lái)的資源浪費(fèi)、人為主觀因素影響等不足。后續(xù)仍需從數(shù)據(jù)挖掘的流程出發(fā),更深入地研究武器裝備在役考核過(guò)程中的數(shù)據(jù)特征,選擇適當(dāng)挖掘工具,充分應(yīng)用各類算法模型解決具體問(wèn)題,使在役考核更加科學(xué)、高效。