, ,,
近年來,隨著全球新一代信息技術的應用,人類社會進入了一個大規模生產、分享和應用數據的大數據與人工智能時代,數據已經成為軍事信息中不可或缺又亟待開發的重要資源[1]。
大數據與人工智能成為推動各國軍事轉型和軍隊建設的新動力,促進了國家安全和軍事戰略決策方式的變革[2],提高了國防和軍隊建設的精確化水平,催生了新型武器裝備,引導了軍事組織形態變革,轉變了武裝力量的運用模式,推動了戰爭形態的演變[3]。
各類傳感設備在軍事領域的安裝應用以及獲取數據的渠道增多,將會產生海量的數據。未來影響、決定軍事行動的最大核心在于數據,數據的積累量、數據分析和處理能力、數據主導決策以及人工智能水平將是獲得戰場優勢的關鍵。
目前,全軍及各軍兵種啟動建設了各類軍事應用系統,安裝了大量的傳感器及其他數據采集設備,為軍事大數據的收集提供了平臺,為海量數據的挖掘和整合奠定了基礎。
未來工作的重心是努力建構處理大數據的硬件系統、軟件模型,實現大數據“從數據轉化為決策”的智能化和瞬時化,從而引領指揮決策方式變革,優化作戰指揮流程,提高軍事管理水平,提升體系作戰能力[4]。
在部隊裝備建設中,總線裝備運行參數記錄儀計劃安裝到裝備中,采集裝備各部件的運行參數,如××式車采集的參數為300多個,××式車采集的參數為400多個。參數類型既有離散型(如某參數0表示正常,1表示故障);又有連續型(如某參數有效范圍0~250),參數用途類型涵蓋了維修、管理等各環節。
本方案將建立評價指標體系,針對某種類型裝備,模擬總線裝備運行參數記錄儀采集的數據樣本,進行深度的數據融合,利用機器學習算法建立數學模型,挖掘數據中裝備的信息,實時評價單裝的狀態,實時展現部隊裝備的整體態勢。
分析總線裝備運行參數記錄儀采集數據參數的取值情況,將連續型參數離散化。如某參數有效范圍0~250,數據在有效范圍內記為0,在有效范圍外記為1;某參數數值范圍0~500之間,定義400~500為1級,300~399為2級,200~299為3級,200以下為4級。
根據總線裝備運行參數記錄儀采集數據參數范圍情況,將裝備狀態等級分為良好、一般、劣化、嚴重,對應的裝備策略為正常運行、計劃安排維修、盡快安排維修、立即安排維修[5](表1)。

表1 裝備狀態分類與指揮策略
根據總線裝備運行參數記錄儀采集數據參數范圍情況,確定每個等級各參數的取值范圍。如某參數,0表示正常,1表示故障,2表示嚴重故障,則定義裝備狀態等級對應的參數:良好為0,一般為0,劣化為1,嚴重為2。
根據部隊裝備狀態各等級參數取值范圍,隨機生成模擬樣本,每個等級模擬一定量的樣本,各參數取值原則為本級別取值或向優取值,但要保證至少有一個參數為本級別取值[6]。如在“劣化”的等級中,至少有一個參數達到“劣化”標準,參數“發動機自檢信息”,本級別取值為1,向優取值為0,該參數的取值為1或0;如果取值為0,要保證該樣本中其他參數至少有一個為“劣化”水平[7],從而建立模擬樣本集,滿足數據建模對訓練集和測試集樣本的需求[8]。
將模擬樣本集按一定比例隨機劃分為訓練集和測試集。如取訓練集的比例為75%,測試集的比例為25%,利用訓練集訓練模型,選擇k-Nearest Neighboers,Logistic Regression,Decision Tree,Random Forest,Gradient Boosting,Support Vector Machine,Deep Learning等機器學習模型進行對比[9](表2)。

表2 不同模型的準確率比較
從表2可以看出,各類模型對訓練樣本的準確率均較高,其中Random Forest對測試樣本的準確率最高。因此,選擇Random Forest模型,調整模型中的參數,估評模型在訓練集和測試集的準確度[10](表3)。
從表3可以看出,在Random Forest模型選擇參數max_depth=None,n_estimators=500,random_state=0時,模型對測試樣本的準確率的準確率達到了96.0%,因此是較好的選擇。
將單個裝備總線裝備運行參數記錄儀采集的數據輸入Random Forest模型,進行分類預測,得到單個裝備的狀態等級[11]。同時結合裝備實際運行情況,調整指標體系中各指標的權重,使模型更科學合理[12]。

表3 Random Forest模型不同參數的準確率比較
部隊裝備類型多樣,可按照大的類型區分成通用車輛、履帶裝甲、輪式裝甲、工程機械、飛機、船艇等,同類型裝備制定通用模型。并在此基礎上,按照不同武器裝備的不同特性,制定不同型號裝備的具體模型。運行使用時,針對總線裝備運行參數記錄儀采集的數據情況,分別建立評價指標體系,構建評價模型并進行評估。以各單個裝備最新的采集數據為依據,評價部隊全部單個裝備的狀態等級,以旅、軍、戰區軍種、軍兵種為展示單位,進行匯總展示;以各單個裝備狀態等級為基礎,利用Topsis,Projection Pursuit,EDA等方法,對各旅、軍、戰區軍種的全部裝備的總體水平進行評估、排序。隨著總線裝備運行參數記錄儀的普遍安裝,并采集積累一定時間的數據,可以對裝備進行回歸分析、聚類分析、時間序列分析、關聯分析等。
通過對海量大數據進行實時處理,進行多維度數據應用分析,實時監控數據流向,實現數據互動可視化分析[13]。對同個單位不同型號武器裝備數據集、歷史數據集、配套裝備數據集的分析,以及對不同單位同型裝備數據集、異型裝備、同底盤裝備、同上裝裝備等的交叉分析,可清晰地看到同一類裝備在不同單位情況,同一單位不同裝備情況,不同歷史時期裝備情況等全過程、全壽命周期武器裝備動用、使用、保管、保養、維修保障等比對信息[14]。此外,構建的豐富的決策模型,為軍事決策提供精準的分析預測服務,支持軍事首長統攬全局,清晰洞察相關業務領域的客觀現狀,并在動態數據中探索多維變量的相關性和相關領域的發展趨勢,快速科學地制定決策模型,提高決策效率[15]。通過機器學習、深度學習,并結合專家驗證的方法對模型進行優化,不斷升級模型、優化對策,驅動科學決策,提升部隊科學管裝治裝整體水平[16]。