肖占軍,鞠 龍,董東喜
(31700部隊,遼陽 111000)
數據屬于一種重要的資產,隨著時代的發展數據的作用也越加突出,特別是大數據技術的出現帶動了海量數據存儲技術的進步。在未來發展過程中,能夠對軍事行動產生巨大影響的就是數據信息,數據的主導決策與分析處理、儲存能力是戰場中獲得勝利的重要因素。軍事數據復雜繁瑣,需要對戰場中的數據信息進行快速處理,在海量信息中最終發現可靠目標,而可視化技術能夠簡化整個分析過程,讓結果更加容易理解。
大數據與數據倉庫技術主要就是對各種已經存在的數據進行采集、加工轉化的過程,重視信息的提取與挖掘知識等過程,隨著技術的變化,大數據倉庫逐漸通過結構化的數據庫來管理數據存儲工作[1]。以云計算和物聯網為基礎的大數據技術則是一種能夠解決海量信息存儲與處理分析的新型技術。可視化技術則為人類認識世界和感知世界提供了有效渠道,能夠為人們分析數據規律提供可靠的工具。
在處理海量軍事數據信息的過程中,可視化技術、數據挖掘技術、大數據技術、數據庫管理技術、統計分析系統等為軍事數據的挖掘、知識分析、發現、訪問和存儲提供了可靠的操作平臺。軍事數據的可視化分析架構主要包括四部分內容,首先是云儲存部分,其中包括分布式文件、虛擬化系統、操作系統、存儲系統、計算機系統等內容[2]。其次是數據層,其中包括數據庫、關系類型的數據存儲倉庫以及列族數據庫、圖數據庫和文檔數據庫等部分組成,能夠提供訪問能力與持久性的數據儲存功能。再次是預處理層,其中包括異構數據倉庫的轉換抽取、數據挖掘處理、概略數據轉換抽取和語義轉換抽取等,能夠在數據挖掘過程中對其中的數據信息進行預處理工作。最后是數據分析層,其中包括數據倉庫分析、數據挖掘、可視化分析和語義分析等內容,能夠提供多樣化的數據分析挖掘服務。
關系型數據庫隨著時代的發展從已經不是唯一的選擇,數據庫領域中逐漸走向混合持久的發展時代,也就是利用多樣的數據庫處理方法,使用各種數據存儲模型。軍事信息系統內,關系數據庫是多樣化數據統計、查詢、存儲的基礎支撐,但是隨著數據類型的多樣化發展,比如日志數據、目標軌跡以及傳感器等數據的出現,關系數據庫中的訪問和存儲功能已經達到應用的極限,因此在另一方面也突出了NOSQL數據庫存儲擴展性與訪問性能等方面的優勢。而混合方式也將成為未來解決數據存儲持久化問題的主要模式。
未來能夠滿足目前作戰系統中的歷史數據存儲、偵查傳感器數據和系統應用等方面的要求歷史數據資源儲存、混合數據倉庫以及在線操作庫等三級數據存儲模式也相繼誕生。在線操作庫主要是以關系型數據庫系統為基礎建立起來的,能夠有效存儲各種數據信息,比如偵查數據、作戰指揮數據和各種基礎軍事信息等內容,除此之外還能夠存儲用戶、目錄以及元數據等信息,為作戰過程中的管理與指揮提供實時在線數據參考。混合數據倉庫主要是結合不同的需求建立起來的數據主題,其中包含以NOSQL為基礎的大數據倉庫和以關系數據庫為基礎的數據集市等技術。以關系數據庫為基礎的數據集市能夠面向所有的主題內容,比如對比分析實力變化等內容,大數據倉庫中包含推薦系統和以圖數據庫為基礎的儲存位置信息等數據,其中以列族數據庫為基礎,可以實現海量軍事數據的有效存儲,比如日志數據以及實時變化軌跡數據存儲等。歷史數據庫,主要就是能夠對操作庫中的歷史資源數據進行實時在線存儲,其中包括歷史數據儲存,能夠通過鍵值數據庫來進行儲存工作。
在混合存儲架構中,和傳統的工具集相比,數據轉換抽取工具的功能需要在非關系型數據存儲與關系型數據存儲之間的轉換中進行進一步的擴展。除此之外,面對不同的數據挖掘分析工作,數據預處理技術也將變得更加復雜,其中包含屬性轉換、特征篩選、降維、合并等內容。
軍事數據的可視化分析主要是將最終的分析結果通過一種視覺效果呈現出來,同時促進用戶之間的信息交互等。尤其重視用戶利用系統進行數據理解、互動操作與對話等。用戶交互除了能夠有效解決數據過載與可視化空間的矛盾問題外,還能提高用戶對于數據分析的參與性。可視化分析系統也不僅是向用戶傳遞已經完成的信息,而是為用戶提供研究探索數據的平臺和工具。海量軍事數據的可視化分析架構中包括數據倉庫統計、數據挖掘、可視化分析、語義分析以及數據預處理等模塊。
數據的預處理其實就是對當下的歷史數據的人際交互轉換抽取,包括語義信息的轉換抽取,能夠從歷史數據和元數據中挑選出語義信息,并將其傳輸到語義庫當中。其次是概略數據的轉換抽取,從歷史數據中挑選出相應的概略數據,隨后傳輸到概略數據庫內。再次是樣本數據的轉換抽取,從歷史數據庫內抽取模式數據和樣本數據,并將其傳送到挖掘數據庫內。語義分析其實就是語義信息的關聯分析、信息搜尋以及知識圖譜等內容。可視化分析包括復雜多元高維、網絡和層次以及時變等數據的可視化分析。
時變數據就是擁有時間屬性,同時能夠隨著時間的變化而發生改變的數據,比如氣象信息以及目標軌跡的運動變化等。網絡與層次數據就是一種描述數據關系到方法,網絡數據指的是一種多樣、復雜的關系,而層次數據則是指一種單一的關系。復雜多元高維數據中的所有數據都擁有兩個或是兩個以上的相關屬性或獨立的數據。數據倉庫的統計分析其實就是對各種主題的軍事信息進行統計分析,同時將最終結果通過一種可視化視角呈現出來,集成到信息門戶進行應用。
綜上所述,隨著科學技術的發展,目前在海量軍事資源的處理、挖掘過程中可選擇的技術條件也逐漸增加,為了預防技術的單一性,未來的集成走向也必將轉化成一種技術混合架構,同時用戶參與分析與處理的作用也將逐漸提高,可視化技術和大數據技術的應用,為海量軍事數據現實問題的解決提供了可靠的技術支撐。