楊建兵,肖 丹,郭 霞
(1.裝甲兵學院,安徽,233013;2.江南計算技術研究所,江蘇,214083;3.南京炮兵學院,江蘇,211132)
數據挖掘,是從有噪聲、數量龐大(通常數兆兆字節或更多)、隨機的、不完全數據中,通過特定的算法,自動地抽取事先未知的、隱含的、具有潛在價值的規則和知識。數據挖掘是一個多學科的交叉領域,吸納了模式識別、機器學習、可視化、數據庫和數據倉庫、統計學、信息檢索、高性能計算和許多應用領域的大量技術。數據挖掘的過程一般分為:數據選取、預處理、轉換、數據開采、模式解釋和知識評估等階段。

圖1.數據挖掘的基本過程
信息化戰爭帶來了瞬變的戰場態勢、復雜的戰場環境、多元的作戰元素,海量戰場數據對作戰指揮系統的數據處理能力提出了更高的挑戰。
信息化戰爭時代,對情報數據的處理能力已經成為決定作戰指揮決策優勢的關鍵因素。如何從多類、大量的信息中提取出對作戰指揮及時、有用、準確的情報,并能使指戰員從海量信息分析處理的繁瑣中解脫出來,而又不損失情報中的有效信息,已成為軍事情報領域的一個關鍵課題。美軍在伊拉克戰爭中依靠網絡中心戰的作戰環境,通過數量鏈將高度分散的作戰力量鏈接在一起,一旦發現敵情,作戰指揮中心便可通過“漫游者”軟件和Link-16 等數據鏈,實時快速地分析與評估作戰對手的實力和規模,優化配置作戰力量,實施有效打擊。
信息化戰場的數據庫極易受不一致數據、噪聲和缺失值侵擾,這是由于數據庫太大,并且來自多個異種數據源。數據挖掘在獲取分析軍事情報的過程中,先要針對指揮系統及指戰員的需求對情報系統的目的意義、環境問題、目標、范圍進行具體的分析,通過數據變換、數據清理、數據歸納、數據集成等方法對數據進行預處理,為進一步搜集資料做好前期工作。同時對整個過程要有時間上的控制,以確保情報搜集的時效性。數據挖掘在獲取分析軍事情報的應用見圖2.

圖2.數據挖掘在獲取分析軍事情報應用示意圖
作戰仿真是提供模擬軟硬件操作、滿足武器裝備認知、論證裝備體系、驗證戰法訓法的有效方法和手段,而仿真數據是完成作戰仿真目標的主要憑據。由于信息化戰爭的涌現性、復雜性、非線性,致使仿真數據海量增加,作戰仿真已進入大數據時代。數據挖掘可高效地對作戰仿真中收集的數據進行分析,發現仿真數據間未知的關系,用新穎的、可理解的、實用的方式來歸納數據,為部隊訓練、裝備論證和作戰等提供支持。通過數據挖掘技術,在海量仿真信息中挖掘實用的信息規律,使戰場信息資源在整個作戰范圍內實現最佳配置,為指戰員提供全面、可靠的數據分析結果,協助指戰員作出決策。

圖3.數據挖掘算法體系
信息化戰爭中的作戰指揮網絡一直處于危險中。隨著作戰指揮網絡規模的增長,多種敵方入侵和攻擊網絡手段和工具的出現,使得維護作戰指揮網絡安全成為網絡戰的關鍵組成部分。敵方網絡入侵可以定義為威脅戰場網絡資源可用性、完整性或機密性的行為。入侵檢測系統和預防系統都監測作戰指揮網絡系統運行和流量,及時發現惡意活動。入侵防御系統的主要效能是識別惡意行為,同時把這些行為的信息寫入日志,以阻止惡意活動并上報這些活動。數據挖掘可以通過使用分類算法、關聯規則挖掘、代價敏感建模、流數據分析、提供可視化和查詢工具等方法,開發強大的敵方入侵檢測和防御系統,以維護作戰指揮網絡的安全。一般來說不存在一個普遍使用的數據挖掘算法,一個算法在特定領域非常有效,但在另一個領域卻可能不太適合。對瞬息萬變的信息化戰場數據而言,應根據具體的需求來選擇合適的數據挖掘方法。在信息化戰爭的大背景下,尋找最適用維護作戰指揮網絡安全的數據挖掘算法,并對相關的具體算法進行改進是十分必要的。
美軍曾明確提出,通過數據挖掘將戰場數據分析能力提高100 倍以上。如果這一目標實現,那在這一領域別國與美軍的差距就不能用簡單的代差來衡量。通過多年發展,美軍已經擁有全球最先進的情報偵察系統。如何處理海量戰場數據,一直是美軍戰場偵察的短板,而數據挖掘能夠幫助美軍突破瓶頸。目前,美國國防部以約每年2.5 億美元建設經費的投入,將數據挖掘建設提升為美軍戰略重點推進。2012 年3 月,美國國防部高級研究計劃局(Defense Advanced Research Projects Agency, DARPA)啟動了“X DATA”計劃,將數據挖掘視為大數據戰略在國防安全領域貫徹的核心功能加以重點發展。不可否認的是,美軍依靠其技術優勢,正將與別國在戰場數據分析技術上的差距進一步拉大。
目前,國內數據挖掘產業還不成熟,從事該方面研究的人員主要集中在高校,只有少數分布在公司或研究所,且大部分研究項目均是由政府資助,主要研究方向集中在數據挖掘的學習算法等理論方面,但對其實際應用問題的研究較少。如何進行數據挖掘技術在信息化戰爭中的系統利用是一個值得關注的重要問題。
信息化戰場復雜多變,在敵我對抗日趨激烈,指戰員需要隨時處理、解決復雜情況。只有在復雜紛繁的海量戰場數據中發現內在的規則,有效快速地形成戰場數據支援和戰場態勢分析,才能把握信息化戰爭的主動權。對于當前軍隊信息化建設,數據挖掘技術具有很大的牽引和拉動作用。
[1] 朱小寧.數據挖掘:信息化戰爭的基礎工程[J].解放軍報,2005:0830(006).
[2] 范明,孟小峰.數據挖掘概念與技術[M].北京,機械工業出版社,2012.
[3] 王惠中,彭安群.數據挖掘研究現狀及發展趨勢[J].工礦自動化,2011(2):29-32.
[4] 許輝輝,許榮榮.云計算在軍事情報融合中的應用研究[J].西安文理學院學報,2014(1):97-100.
[5] 呂正卿,許德斌.“云計算”技術影響下的新軍事變革[J].中國國防報,2011:0407(003).
[6] 成亮星.數據挖掘技術在軍事情報管理系統中的應用[J].科技情報開發與經濟,2010(7):90-92.
[7] 薛青等.面向作戰仿真的數據挖掘[J].四川兵工學報,2013(8):93-95.
[8] Qing XUE. Discussion on Data Mining for the M&S Technique in Armored Equipment Support. System Simulation Technology & Application(Volume 13).
[9]Xue Huifeng. The Intelligence Data Mining[M].Xi’an:The Northwest Technology University Press.2005.