曹俊彬,邵 航,姜 坤,李俊杰,王正武,劉萬(wàn)鎖
(空軍工程大學(xué) 航空機(jī)務(wù)士官學(xué)校,河南 信陽(yáng) 464000)
習(xí)主席指出,當(dāng)今世界正經(jīng)歷百年未有之大變局[1]。縱觀全球,世界強(qiáng)國(guó)必是航空強(qiáng)國(guó),航空強(qiáng)國(guó)必有航空領(lǐng)域國(guó)家戰(zhàn)略科技力量[2]。在大數(shù)據(jù)與人工智能時(shí)代,航空科技領(lǐng)域成為了大數(shù)據(jù)與人工智能技術(shù)落地應(yīng)用的重要行業(yè)領(lǐng)域[3]。同時(shí),數(shù)據(jù)挖掘與人工智能技術(shù)也成為了賦能航空科技發(fā)展,保障航空質(zhì)量安全水平的有力技術(shù)支撐手段。
航空質(zhì)量控制,特別是軍用航空質(zhì)量控制,強(qiáng)調(diào)通過(guò)對(duì)機(jī)務(wù)人員上崗資質(zhì)、航空裝備完好狀態(tài)、航空裝備使用壽限等使用狀態(tài)層面進(jìn)行全面質(zhì)量管理,來(lái)全面提升航空質(zhì)量水平,保障航空質(zhì)量安全。
質(zhì)量缺陷與安全事故是同株異面的雙生花。航空質(zhì)量控制涉及與航空安全相關(guān)的人、機(jī)、料、管、環(huán)的方方面面。ISO9001標(biāo)準(zhǔn)指出:“質(zhì)量是一組固有特性滿(mǎn)足要求的程度”[4],質(zhì)量特性則是滿(mǎn)足某種要求的質(zhì)量水準(zhǔn)所表現(xiàn)出的某些固有特性[5]。而關(guān)鍵質(zhì)量特性則是“若超過(guò)規(guī)定的特性值要求,會(huì)直接影響到產(chǎn)品安全性、產(chǎn)品整體功能或者顧客對(duì)產(chǎn)品滿(mǎn)意程度的質(zhì)量特性[5]”。
探尋軍用航空器事故包含的關(guān)鍵質(zhì)量特性,就是通過(guò)對(duì)各種途徑采集到的關(guān)于航空器質(zhì)量安全保障的屬性值開(kāi)展數(shù)據(jù)分析,將所采集到的屬性值數(shù)據(jù)根據(jù)業(yè)務(wù)流程特點(diǎn)分解到機(jī)務(wù)專(zhuān)業(yè)對(duì)于的人、機(jī)、料、管、環(huán)等層面,以及可以被標(biāo)記與識(shí)別的二級(jí)層面,進(jìn)而從預(yù)防軍用航空器事故發(fā)生的角度,開(kāi)展全面質(zhì)量管理;這個(gè)過(guò)程就是尋找引致軍用航空器事故的關(guān)鍵質(zhì)量影響因素,以便在今后的工作中以更有效的航空質(zhì)量控制手段加以約束,從而使得航空質(zhì)量安全水平得到根本性的提升。
本研究將構(gòu)建一種軍用航空器事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘模型,以對(duì)內(nèi)和對(duì)外的兩種數(shù)據(jù)分析需求為牽引,以“從數(shù)據(jù)到情報(bào)”的信息層級(jí)躍遷為導(dǎo)向,組建不同功能模塊層次,最終輸出可供航空維修一線(xiàn)人員參考使用的軍用航空器事故關(guān)鍵質(zhì)量特性分析情報(bào),輔助航空裝備維修保障和質(zhì)量控制人員改善工作流程與作業(yè)方式,提高航空裝備的質(zhì)量安全水平。
該軍航事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘系統(tǒng)模型滿(mǎn)足了我方對(duì)外和對(duì)內(nèi)兩個(gè)方面的數(shù)據(jù)分析需求,既有利于智能感知外軍航空兵器的建設(shè)與運(yùn)用情況,為我國(guó)安全態(tài)勢(shì)分析與外軍戰(zhàn)略企圖研判提供智力支持;又有利于智慧管理我軍航空兵器的維修與保障情況,為內(nèi)部質(zhì)量安全績(jī)效考核與裝備維護(hù)完好狀況掌控提供決策依據(jù)。
在數(shù)據(jù)挖掘系統(tǒng)模型的功能架構(gòu)上,采用4階3層的模式架構(gòu),即通過(guò)A層、B層和C層3個(gè)數(shù)據(jù)處理功能層的計(jì)算與處理,使得有關(guān)事故數(shù)據(jù)按照“數(shù)據(jù)→信息→知識(shí)→情報(bào)”[6]的信息層級(jí)躍升,最終提煉出軍航事故的關(guān)鍵質(zhì)量特性,形成可供決策與行動(dòng)的航空質(zhì)量安全情報(bào)。其中,A層為數(shù)據(jù)收集與預(yù)處理層,該層從互聯(lián)網(wǎng)和內(nèi)部網(wǎng)這兩個(gè)相互物理隔離的網(wǎng)絡(luò)中,以人工智能方法和數(shù)據(jù)庫(kù)方法爬取信息、抽取字段、并組建標(biāo)準(zhǔn)化和字段化的事故檔案;B層為數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)層,該層集成了眾多先進(jìn)的機(jī)器學(xué)習(xí)算法,并提供了算法擴(kuò)展和二次開(kāi)發(fā)的接口,做到了算法互通,以最前沿、最有效的機(jī)器學(xué)習(xí)算法對(duì)標(biāo)準(zhǔn)化字段化的軍航事故檔案開(kāi)展數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn);C層為數(shù)據(jù)可視化與情報(bào)分析層,該層集成了眾多先進(jìn)的可視化方案,以數(shù)據(jù)可視化的方式展示數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)的成果,并促進(jìn)知識(shí)發(fā)現(xiàn)成果的可視化智能決策。將經(jīng)過(guò)數(shù)據(jù)挖掘得到的與關(guān)鍵質(zhì)量特性有關(guān)的情報(bào)成果,分解為航空質(zhì)量控制專(zhuān)業(yè)所關(guān)注的,如:人員資質(zhì)、完好狀態(tài)、使用壽限等層次的情報(bào)產(chǎn)品,分發(fā)給與之相關(guān)的機(jī)務(wù)保障部門(mén)使用,可以切實(shí)地提升航空裝備維護(hù)保障的質(zhì)量安全水平。軍航事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘系統(tǒng)模型,如圖1所示。

圖1 軍航事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘系統(tǒng)模型
生成標(biāo)準(zhǔn)化、字段化的航空事故檔案是進(jìn)行下一步數(shù)據(jù)挖掘的前提與基礎(chǔ)。我們通過(guò)以外部網(wǎng)絡(luò)空間為主渠道的數(shù)據(jù)獲取方式,來(lái)獲得與我們所需的國(guó)際軍用航空器事故相關(guān)的文本、圖片、音頻、視頻等海量異構(gòu)的數(shù)據(jù)信息,通過(guò)網(wǎng)絡(luò)爬蟲(chóng)和人工智能技術(shù)將這些信息轉(zhuǎn)化為標(biāo)準(zhǔn)化、字段化的航空事故檔案。如圖2所示,就展示了將網(wǎng)絡(luò)新聞文本轉(zhuǎn)換為標(biāo)準(zhǔn)化、字段化的事故檔案的過(guò)程。

圖2 外需版軍航事故檔案標(biāo)準(zhǔn)字段內(nèi)容的生成過(guò)程
通過(guò)自然語(yǔ)言處理模塊對(duì)新聞文本進(jìn)行分詞,并使用深度神經(jīng)網(wǎng)絡(luò)對(duì)分詞以后的特性語(yǔ)句(如包含時(shí)間、機(jī)型等信息的語(yǔ)句)進(jìn)行識(shí)別并自動(dòng)填入檔案的字段。與此同時(shí),(數(shù)據(jù)獲取與預(yù)處理模塊)經(jīng)過(guò)訓(xùn)練的高級(jí)深度神經(jīng)網(wǎng)絡(luò)還具備自動(dòng)糾偏的功能。例如:在本例中,該墜機(jī)事件發(fā)生的真正時(shí)間是2019年3月31日(并非頁(yè)面時(shí)間2021-06-18),它由“3月份最后一天”和“2019年墜毀的第10架飛機(jī)”這兩個(gè)語(yǔ)句通過(guò)深度學(xué)習(xí)的邏輯分析整合而成。
根據(jù)數(shù)據(jù)挖掘系統(tǒng)的需求分析和結(jié)構(gòu)設(shè)計(jì),主要考慮從互聯(lián)網(wǎng)獲取的外軍軍航事故的進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)特性和任務(wù)實(shí)際,本文設(shè)計(jì)了如圖3所示的數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)層算法流程,該算法流程可以實(shí)現(xiàn)對(duì)外軍軍航事故的時(shí)間、空間和關(guān)聯(lián)規(guī)則層面的關(guān)鍵質(zhì)量特性的挖掘與分析。

圖3 軍航事故關(guān)鍵質(zhì)量特性數(shù)據(jù)挖的算法流程
所設(shè)計(jì)的算法流程目前擁有關(guān)鍵時(shí)間質(zhì)量特性、關(guān)鍵空間質(zhì)量特性以及關(guān)鍵關(guān)聯(lián)質(zhì)量特性3個(gè)數(shù)據(jù)挖掘子模塊,所設(shè)計(jì)的功能模塊和算法流程具有兼容性和開(kāi)放性,并且留有二次開(kāi)發(fā)的接口,在同一個(gè)系統(tǒng)平臺(tái)之下,可以整合利用不同的計(jì)算機(jī)語(yǔ)言所編寫(xiě)的程序及軟件,且支持使用本系統(tǒng)的單位自行開(kāi)發(fā)定制化的功能模塊。
本模塊基于對(duì)時(shí)間相關(guān)字段的統(tǒng)計(jì)分析和指標(biāo)計(jì)算,建立起關(guān)鍵時(shí)間質(zhì)量特性的分析框架,并為后續(xù)的時(shí)間序列分析和時(shí)間關(guān)聯(lián)分析等算法的加入做好了數(shù)據(jù)儲(chǔ)備。
首先,對(duì)標(biāo)準(zhǔn)化、字段化的事故檔案的日期、星期等與時(shí)間有關(guān)字段進(jìn)行計(jì)數(shù);然后,以合適的可視化方法進(jìn)行初步描述性統(tǒng)計(jì),以反映星期規(guī)律和季節(jié)規(guī)律等;最后,可以調(diào)用有關(guān)算法進(jìn)行時(shí)間序列分析,并對(duì)裝備失效和事故致因行為進(jìn)行早期預(yù)警。
為了更精確和更深入地定量分析墜機(jī)事件的安全態(tài)勢(shì)狀況,本文設(shè)計(jì)了依從時(shí)間序列統(tǒng)計(jì)的有傷率(Injury Ratio)、無(wú)傷率(Safety Ratio)和墜機(jī)風(fēng)險(xiǎn)態(tài)勢(shì)指標(biāo)(Situation Ratio)3個(gè)量化指標(biāo),其定義式如下
(1)
式中:N表示數(shù)據(jù)集中墜機(jī)事件的總量;墜機(jī)事件被不重復(fù)也不遺漏地二分為有傷亡的墜機(jī)事件(其數(shù)量為Ninj)和無(wú)傷亡的墜機(jī)事件(其數(shù)量為Nsaf)。
最后,本模塊的挖掘結(jié)果,還可以作為時(shí)間序列分析等高級(jí)數(shù)據(jù)分析方法的數(shù)據(jù)輸入。
本模塊基于GIS系統(tǒng),聚焦軍航事故空間特性,使用GIS軟件內(nèi)置地學(xué)算法,對(duì)所提取的標(biāo)準(zhǔn)化、字段化的軍航事故檔案地理特性字段進(jìn)行可視化分析,包括但不限于計(jì)數(shù)分析、密度分析、堆疊分析、緩沖區(qū)分析等,進(jìn)而發(fā)現(xiàn)這些事故在地理空間上的規(guī)律,為輔助決策提供直接的空間分析依據(jù)。圖4是本研究擬啟用的關(guān)鍵空間質(zhì)量特性挖掘的GIS系統(tǒng)功能模塊。

圖4 關(guān)鍵空間質(zhì)量特性挖掘的GIS系統(tǒng)功能模塊
本模塊基于關(guān)聯(lián)規(guī)則開(kāi)展數(shù)據(jù)挖掘,它被用于無(wú)監(jiān)督知識(shí)發(fā)現(xiàn),即搜索大量變量之間的有趣聯(lián)系[7]。Apriori算法[8]由美國(guó)學(xué)者Rakesh Agrawal和Ramakrishnan Srikant于1994年提出,該算法引入先驗(yàn)信念的概念來(lái)減少關(guān)聯(lián)規(guī)則的搜索空間[9]。將度量關(guān)聯(lián)規(guī)則有效性的計(jì)量指標(biāo)定義如下:
(1)X?Y的支持度(Support):定義為前項(xiàng)和后項(xiàng)在整個(gè)數(shù)據(jù)集中同時(shí)發(fā)生的頻率[10]。其中:N表示事務(wù)數(shù)據(jù)集的事務(wù)數(shù)總和,σ(Z) 表示表示事務(wù)集Z的頻數(shù),TX表示包含項(xiàng)目X的事務(wù)集,TY表示包含項(xiàng)目Y的事務(wù)集[10]
(2)
定義X自身的支持度為
(3)
(2)X?Y的置信度(Confidence):定義為支持度與前項(xiàng)頻率之比[10],即發(fā)生過(guò)X后,同時(shí)也會(huì)發(fā)生Y的概率,即
(4)
(3)X?Y的提升度(Lift):定義為置信度和后項(xiàng)頻率之比[10],即度量X與Y的之間的獨(dú)立性,代表了關(guān)聯(lián)強(qiáng)度和規(guī)則價(jià)值(一般地,Lift值大于1,規(guī)則才有價(jià)值[11]),即
(5)
(4)X?Y的出錯(cuò)度(Conviction):定義為X出現(xiàn)而Y不出現(xiàn)的概率,意義在于度量規(guī)則預(yù)測(cè)錯(cuò)誤的概率[12],即
(6)
本文搜集了從2002年11月至2021年1月共218個(gè)月被網(wǎng)絡(luò)媒體公開(kāi)報(bào)道過(guò)的100起Y國(guó)空軍墜機(jī)事件,事件數(shù)據(jù)集涵蓋了根據(jù)我國(guó)軍機(jī)分類(lèi)標(biāo)準(zhǔn)劃分的殲擊機(jī)、攻擊機(jī)、運(yùn)輸機(jī)、教練機(jī)、直升機(jī)和無(wú)人機(jī)共6個(gè)機(jī)種,涉及20個(gè)機(jī)型。按照表1的字段格式整理并錄入Excel 2016版本軟件,另存一份CSV UTF-8格式文件到本地以備用。查看整理后的部分?jǐn)?shù)據(jù)見(jiàn)表2。

表2 Y國(guó)空軍墜機(jī)事件數(shù)據(jù)集
根據(jù)對(duì)數(shù)據(jù)集星期字段的數(shù)據(jù)透視計(jì)數(shù)結(jié)果,繪制Y國(guó)空軍墜機(jī)事件星期分布的柱狀統(tǒng)計(jì),如圖5所示。

圖5 100起公開(kāi)報(bào)道的Y國(guó)空軍墜機(jī)事件的星期維度分布
墜機(jī)事件發(fā)生的概率與飛機(jī)的出動(dòng)強(qiáng)度和維修任務(wù)強(qiáng)度息息相關(guān),一般飛行日的事故概率較高,機(jī)械日的飛行事故概率較低。由圖5可知,近20年的歷史數(shù)據(jù)告訴我們:Y國(guó)空軍的墜機(jī)事件的分布并非均勻,也有自己的“生理期”[13]。Y國(guó)空軍在周一、周四和周末的墜機(jī)數(shù)量明顯低于平均水平,由此可以推測(cè):Y國(guó)空軍大多數(shù)部隊(duì)的機(jī)械日是周一和周四,飛行日是周二、周三和周五,周末實(shí)行雙休制度。周三是兩個(gè)連續(xù)飛行日的第二日,飛行員和機(jī)務(wù)人員的身心疲勞度增加;且隨著累計(jì)飛行時(shí)間增加,飛機(jī)零部件的安全性能下降,根據(jù)軌跡交叉理論[14],當(dāng)諸多不安全因素發(fā)生交叉時(shí),就會(huì)誘發(fā)安全事故。另外,按照周四至周六墜機(jī)數(shù)量的中值,周五墜機(jī)數(shù)量的期望值應(yīng)該為8.5架,但實(shí)際值卻是期望值的近3倍,這表明Y國(guó)空軍有在周五出動(dòng)大機(jī)群執(zhí)行戰(zhàn)訓(xùn)任務(wù)的習(xí)慣。
根據(jù)時(shí)間質(zhì)量特性挖掘模塊設(shè)置的計(jì)算指標(biāo),對(duì)有傷率(Injury Ratio)、無(wú)傷率(Safety Ratio)和墜機(jī)風(fēng)險(xiǎn)態(tài)勢(shì)指標(biāo)(Situation Ratio)3個(gè)量化指標(biāo)進(jìn)行計(jì)算和可視化展示,如圖6和圖7所示。

圖6 一周內(nèi)Y國(guó)空軍墜機(jī)有傷率與墜機(jī)無(wú)傷率分布

圖7 一周內(nèi)Y國(guó)空軍墜機(jī)有傷事件與墜機(jī)無(wú)傷事件數(shù)量之比
由圖5結(jié)合圖6和圖7可知,周三的墜機(jī)數(shù)量最多,但是周四的有傷率和墜機(jī)風(fēng)險(xiǎn)態(tài)勢(shì)指標(biāo)最高,從航空安全的角度而言:周三周四的墜機(jī)概率最大,即“周三周四”效應(yīng)。周日墜機(jī)數(shù)量最少,但周一的無(wú)傷率最高,墜機(jī)風(fēng)險(xiǎn)態(tài)勢(shì)指標(biāo)最低,從航空安全的角度而言:周日和周一的飛行任務(wù)最安全,即“一周之交”效應(yīng)。
基于與Quantum GIS 3.6.2版本軟件的數(shù)據(jù)接口,對(duì)數(shù)據(jù)集“所屬地區(qū)”(District字段)數(shù)據(jù)透視的計(jì)數(shù)結(jié)果進(jìn)行分檔填色地圖形式的地理可視化,圖例分級(jí)采用詹克斯自然最佳斷裂點(diǎn)分類(lèi)(Jenks natural breaks,JNB)方法[15],得到圖8。

圖8 100起公開(kāi)報(bào)道的Y國(guó)空軍墜機(jī)事件的地理分布注:所示的Y國(guó)版圖僅為該國(guó)的合法領(lǐng)土,不含存在爭(zhēng)議的地區(qū)。
墜機(jī)數(shù)量的烈度分布,與Y國(guó)空軍的訓(xùn)練計(jì)劃安排有關(guān),也在一定程度上反映了不同區(qū)域的戰(zhàn)機(jī)出動(dòng)烈度,以及相關(guān)的空軍戰(zhàn)備資源儲(chǔ)備情況;在無(wú)法獲取外軍的訓(xùn)練手冊(cè)與訓(xùn)練計(jì)劃的情況下,通過(guò)墜機(jī)事件的數(shù)據(jù)挖掘可以一定程度地反推外軍組訓(xùn)施訓(xùn)的計(jì)劃與意圖。
由圖8可知,Y國(guó)空軍墜機(jī)事件發(fā)生最多的區(qū)域是位于Y國(guó)西北部的拉賈斯坦邦,是其對(duì)陣B國(guó)的戰(zhàn)略要沖,表明:在Y國(guó)高層的空軍戰(zhàn)略層面,最大的威脅與假想敵是B國(guó);Y國(guó)空軍在應(yīng)對(duì)Z國(guó)的戰(zhàn)略方向上并沒(méi)有放松準(zhǔn)備,與Z國(guó)Z省西部直接毗鄰的喜馬偕爾邦,與Z國(guó)Z省南部直接毗鄰的阿薩姆邦,與Z國(guó)J省接壤的存在爭(zhēng)議的克什米爾地區(qū),以及直面Z國(guó)但被N國(guó)隔開(kāi)的北方邦,這些地區(qū)的墜機(jī)烈度僅次于拉賈斯坦邦,且在墜機(jī)總數(shù)上超過(guò)了拉賈斯坦邦,對(duì)Z國(guó)西部的Z省和J省形成了半環(huán)形的針對(duì)之勢(shì)。
本研究使用基于R語(yǔ)言的算法集成,對(duì)數(shù)據(jù)集展開(kāi)基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘,輸出關(guān)聯(lián)規(guī)則的熱力散點(diǎn)圖(如圖9所示)、分組矩陣圖(如圖10所示)和網(wǎng)絡(luò)結(jié)構(gòu)圖(如圖11所示)。

圖9 Y國(guó)空軍墜機(jī)事件關(guān)聯(lián)規(guī)則的熱力散點(diǎn)圖注:parameter=list(support=0.2,confidence=0.2),找出對(duì)應(yīng)的70條關(guān)聯(lián)規(guī)則。

圖10 Y國(guó)空軍墜機(jī)事件關(guān)聯(lián)規(guī)則的分組矩陣圖

圖11 Y國(guó)空軍墜機(jī)事件關(guān)聯(lián)規(guī)則的網(wǎng)絡(luò)結(jié)構(gòu)
具有高提升度的關(guān)聯(lián)規(guī)則呈現(xiàn)出“低支持度-高置信度”的特性,大部分規(guī)則的支持度在[0.2,0.3]以?xún)?nèi);而置信度的分布則跨越[0.2,0.9],較為集中的高置信度區(qū)間是[0.7,0.9];提升度基本上都在1.2以上,表明所示的規(guī)則均是有意義的,且顏色越深價(jià)值越大。
分組矩陣圖以杰卡德距離[16](Jaccard Distance)來(lái)衡量不同規(guī)則之間的相似程度,并將共同點(diǎn)較多的規(guī)則聚合成類(lèi),以此體現(xiàn)聚類(lèi)規(guī)則的分布情況[17]。圖中圓點(diǎn)的尺寸大小表示支持度的大小,圓點(diǎn)的顏色深淺表示提升度的大小。如圖10所示,先導(dǎo)(LHS)被聚為23類(lèi),后繼(RHS)被聚為10類(lèi)(另有3個(gè)聚類(lèi)因聚類(lèi)效果不明顯,被程序自動(dòng)刪除)。以規(guī)則的結(jié)果,即后繼(RHS)為線(xiàn)索,梳理高價(jià)值(lift>1.6)的規(guī)則群組,見(jiàn)表3。

表3 從分組矩陣圖提煉的高價(jià)值規(guī)則群組
具有高提升度的高價(jià)值規(guī)則被抽象為了6個(gè)群組,涉及墜機(jī)事件的機(jī)種、原產(chǎn)國(guó)、事故致因和事故結(jié)果的4個(gè)層面。為了進(jìn)一步分析重要的關(guān)聯(lián)規(guī)則及其因果關(guān)系,使用網(wǎng)絡(luò)結(jié)構(gòu)圖對(duì)關(guān)聯(lián)規(guī)則進(jìn)行可視化,如圖11所示。
網(wǎng)絡(luò)結(jié)構(gòu)圖表達(dá)了關(guān)聯(lián)規(guī)則的因果關(guān)系,展現(xiàn)出重要的關(guān)聯(lián)規(guī)則。箭頭源頭表示先導(dǎo),箭頭指向表示后繼[17],顏色的深淺表示提升度的大小,尺寸的大小表示支持度的大小。圖11所示的關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)圖譜中,主要呈現(xiàn)出“致死規(guī)則”和“幸存規(guī)則”兩種隱性知識(shí)。
“致死規(guī)則”是 {飛行員傷亡=有}?{原因=操作失誤,星期=星期五,時(shí)段=上午}, 翻譯為自然語(yǔ)言:“因人為操作失誤而導(dǎo)致的墜機(jī)事件,會(huì)很大概率上導(dǎo)致飛行員的傷亡。”飛行員因?yàn)椴僮魇д`而導(dǎo)致原本飛行姿態(tài)正常的戰(zhàn)機(jī)陷入險(xiǎn)情,其背后可能隱藏著飛行員精神狀態(tài)不佳、應(yīng)急操作不熟、身體狀況抱恙等隱性原因。飛行員自身的應(yīng)急處置是守護(hù)自己與戰(zhàn)機(jī)安全的最后一道屏障,如果失守,所致的飛行事故必然是慘重的。此外,致死飛行事故大多發(fā)生在星期五上午,可能是某些Y國(guó)的體制因素導(dǎo)致飛行員在周五上午處于一周中生理與心理狀態(tài)的低谷,且周五上午飛機(jī)出動(dòng)強(qiáng)度較大所致。
“幸存規(guī)則”是 {飛行員傷亡=無(wú)}?{機(jī)種=殲擊機(jī),原產(chǎn)國(guó)=蘇聯(lián),原因=機(jī)械故障}, 翻譯為自然語(yǔ)言:“駕駛蘇系殲擊機(jī)因機(jī)械故障而導(dǎo)致墜機(jī)的,往往不會(huì)發(fā)生飛行員傷亡。”,這條規(guī)則具有“意料之外,情理之中”的藝術(shù)性,但也是科學(xué)嚴(yán)謹(jǐn)?shù)摹R环矫妫琘國(guó)空軍保有的蘇系殲擊機(jī),如米格-21等,是上世紀(jì)50-70年代首飛的老舊機(jī)型,超齡服役、維護(hù)不佳、維修不力等因素使其本身就易發(fā)生機(jī)械故障;另一方面,蘇系殲擊機(jī)具有一定的可靠性,在發(fā)生機(jī)械故障后能給予飛行員一定的應(yīng)急處置時(shí)間,也給予了飛行員在最危急的關(guān)頭選擇彈射逃生的時(shí)間。
本文以Y國(guó)空軍墜機(jī)事件數(shù)據(jù)集為例,對(duì)構(gòu)建的軍用航空器事故關(guān)鍵質(zhì)量特性數(shù)據(jù)挖掘模型進(jìn)行了具體的技術(shù)測(cè)試,結(jié)果表明:該模型能夠很好地處理與分析來(lái)自國(guó)際互聯(lián)網(wǎng)的外軍軍航事故數(shù)據(jù),并從時(shí)間、空間、關(guān)聯(lián)三大維度來(lái)挖掘事故背后的關(guān)鍵質(zhì)量特性,能提取對(duì)我方有益的航空裝備情報(bào),特別是蘇系飛機(jī)維修保障裝備情報(bào);做到了以數(shù)據(jù)挖掘技術(shù)賦能航空裝備保障的智慧決策,為航空質(zhì)量安全水平提升提供了有力支撐。
本算例得到的關(guān)于軍航事故的關(guān)鍵因素與特性規(guī)律,還能被進(jìn)一步地細(xì)化分解。例如:與時(shí)間有關(guān)的關(guān)鍵因素和特性規(guī)律,可進(jìn)一步被分解到與機(jī)務(wù)保障日程相關(guān)的班組工單層面,并能與人、機(jī)、料、管、環(huán)的安全因素維度相關(guān)聯(lián),進(jìn)一步得出更加符合機(jī)務(wù)保障工作實(shí)際細(xì)節(jié)的具體影響因素;時(shí)間字段通過(guò)數(shù)據(jù)擴(kuò)展,可以關(guān)聯(lián)到具體任務(wù)和具體飛機(jī)所處的氣象環(huán)境,并與地理空間特性挖掘的結(jié)果相結(jié)合,得出引致軍航事故發(fā)生的外部環(huán)境質(zhì)量特性;通過(guò)關(guān)聯(lián)分析,將引致軍航事故發(fā)生的外部環(huán)境質(zhì)量特性與飛機(jī)本身固有的可引致軍航事故發(fā)生的內(nèi)部環(huán)境質(zhì)量特性(如:機(jī)型特有的機(jī)械結(jié)構(gòu)或維護(hù)環(huán)節(jié))相結(jié)合,得出相對(duì)完整的軍航事故關(guān)鍵質(zhì)量特性知識(shí)圖譜和關(guān)聯(lián)規(guī)則,為機(jī)務(wù)保障和維修管理提供班組級(jí)的智能化、定制化維修細(xì)節(jié)應(yīng)對(duì)方案。
本文提出了一種軍用航空器事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘模型,由2個(gè)主要的需求牽引型功能板塊和3個(gè)功能層次模塊所組成。以算例驗(yàn)證了本模型的可行性與可靠性,得到以下結(jié)論:
(1)以100起被公開(kāi)報(bào)道的Y國(guó)空軍墜機(jī)事件數(shù)據(jù)集為算例基礎(chǔ),驗(yàn)證了模型的有效性,并提取出了時(shí)間、空間、關(guān)聯(lián)三大維度的規(guī)律,且具備被進(jìn)一步分解到航空機(jī)務(wù)各專(zhuān)業(yè)所關(guān)注的要素的潛質(zhì)。
(2)數(shù)據(jù)挖掘得到的關(guān)鍵質(zhì)量特征知識(shí),會(huì)被向量化地存入系統(tǒng)內(nèi)置知識(shí)庫(kù),具有可擴(kuò)展性和可復(fù)用性,能作為訓(xùn)練集數(shù)據(jù),對(duì)特定輸入情況下、未來(lái)潛在的軍航事故進(jìn)行預(yù)測(cè)與預(yù)警。
(3)內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)通過(guò)挖掘與精煉,在內(nèi)置知識(shí)庫(kù)中積累為一個(gè)巨大的軍航事故關(guān)鍵質(zhì)量特性向量空間,這些質(zhì)量數(shù)據(jù)將成為未來(lái)基于數(shù)字孿生的軍航事故狀態(tài)監(jiān)測(cè)與質(zhì)量控制數(shù)據(jù)分析平臺(tái)的重要基礎(chǔ)。
所構(gòu)建的軍用航空器事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘模型初步達(dá)到了設(shè)計(jì)的目標(biāo),下一階段還需要將封裝好的系統(tǒng)投入實(shí)際使用,以檢驗(yàn)其有效性,并通過(guò)運(yùn)行反饋,不斷迭代與完善,將會(huì)為未來(lái)基于數(shù)字孿生技術(shù)的數(shù)據(jù)挖掘與分析系統(tǒng)的研發(fā)提供良好的數(shù)據(jù)基礎(chǔ)與技術(shù)啟示。