,
數據管理是指人們對數據進行采集、組織、存儲、加工、傳播和利用等一系列活動的總和,已經歷了人工管理、文件管理和數據庫管理3個階段。21世紀,新一輪科技革命和產業變革興起,全球科技創新呈現出新的發展態勢和特征,數據正以前所未有的速度不斷增長和積累,世界已經進入網絡化的大數據時代。數據主權已經成為繼陸權、海權、空權、天權之后,大國博弈的新焦點[1]。軍事數據是未來信息化戰爭的戰略制高點,聯合作戰、軍隊建設管理和軍事科研活動對軍事數據建設與管理提出了新的要求。針對海量數據,不僅需要具備存儲和查詢能力,更需要從數據海洋中提取隱含的知識,為作戰決策、軍隊管理和軍事科研提供定量支撐。順應大數據時代的歷史潮流,構建完善的軍事數據管理機制,確保其“質”與“量”,對提升基于信息系統的體系作戰能力,提高指揮員認知能力和決策能力,重塑信息化作戰體系和保障體系具有重要意義。
隨著移動互聯網、物聯網、云計算等技術的迅猛發展和廣泛應用,全球數據規模呈爆發式增長,世界已進入由數據主導的“大時代”[2]。大數據在為人們生活提供極大便利的同時,也給傳統的數據管理方式帶來了極大挑戰,并對經濟發展、社會治理、國家和軍隊管理產生了重大影響。近年來,我國大數據技術和相關產業的發展十分迅猛,百度、阿里巴巴、騰訊、網易和京東等互聯網企業都建立了各自的大數據平臺,在分布式計算、信息推薦、非結構化數據處理等技術領域已走在世界前列,在電子商務、互聯網金融等方面的應用也處于領先地位,但在軍事領域,我國與世界發達國家相比仍存在不小差距。美國國防部從2015年起計劃每年投入約2.5億美元,用于支撐軍事發展和軍事決策[3-4]。與民用領域大數據相比,軍事大數據具有數據采集環境復雜、類型多樣、關聯度高、安全保密要求嚴、實時性對抗性強等特點,導致軍事數據質量保證難、高效融合難、數據分發難、精準分析難、安全防護難,給軍事數據管理帶來了嚴峻挑戰。盡管軍委機關有關部門和各軍兵種結合各自業務需求,先期開展了一些大數據項目論證和應用研究,并對本部門相關數據進行了一定程度的采集、存儲和使用,數據規模有了很大程度的提高,在部分領域初步實現了數據的綜合與集成。但總體上看,目前我國軍事大數據發展還處于起步階段,落后于民用行業,與新時代科技興軍要求和建立數據驅動型軍隊發展模式需求還不相適應。從全軍層次、大數據角度對軍事數據綜合管理與使用情況進行審視,可以發現我軍在軍事數據管理機制方面還存在著不少問題,嚴重制約軍事數據創新引擎和決策支撐作用的發揮。
與科技情報研究相似,大數據時代數據管理的首要工作是數據采集,且采集對象十分復雜[5]。由于相關法規制度不完善,我軍在數據管理方面還不同程度地存在著重硬件輕軟件,重功能輕數據等現象;數據采集沒有嚴格的采集制度,對應的管理部門也不夠明確,大量數據未能完全及時有效獲取;還有一些數據處于各個有關部門以及大量有關人員的分別掌握之中,狀態零碎分散[6],因部門或個人利益等原因難以有效歸集;加之數據采集渠道有限、手段較為落后、數據審查機制相對缺失,不僅存在數據短缺、陳舊、零散等問題,而且普遍存在數據流失、低效、重復與失真等情況,直接影響著數據使用分析結果的可信度。
軍事數據管理系統建設頂層設計不足,基礎條件普遍落后,網絡通信、存儲備份、服務器集群等能力還有較大差距,也缺乏一體化的數據管理與共享環境。一是“信息煙囪”現象還較為嚴重,重復建設多,已建成的數據管理系統中存儲大量同類信息,缺乏通用元數據標準,數據不能統一描述,不同部門、不同系統間的數據難以實現協同建設、有效共享和互聯融合;二是數據存儲結構沒有得到充分優化,數據整合度不夠、冗余項較多,存在數據名稱、格式、編碼、量綱不統一的現象,嚴重制約數據的一體化綜合應用;三是在數據安全、數據辨偽、數據抗干擾和數據保密等方面,還不同程度地存在很多技術問題;四是缺少專門的規范數據共享的法規制度,數據共享在行政管理上還缺乏系統性[7]。
由于缺少有效的分析應用,我軍對歷史數據積累重視不夠,數據遺失、舍棄、漏采等問題也比較突出。以往大量珍貴的歷史數據多以紙質形式存放,數字化程度不高,遺失損壞現象時有發生;對傳感器和網絡獲取的海量數據的潛在價值認識不足,大多沒有長期保存;數據采集整體規劃不夠,先進技術手段缺乏,急需的大量數據存在嚴重缺口;尚未建立完善的軍事大數據技術體系,對軍事數據處理、融合、分析、可視化等關鍵技術的探索研究仍處于起步階段,軍事大數據分析方法和模型不夠豐富,導致很多數據不可用、不會用、不夠用、不管用[8]。
信息時代數據管理要求運用數據工程原理,強化數據資源的開發與利用,充分發揮數據的綜合效益。我軍各類數據需求生成、信息審核和有效激勵等方面,還缺少有效的方法手段,挖掘有價值信息困難;各部門力量充分協同、相互配合不夠,不利于數據的有效積累和使用;有些部門的數據管理系統建設缺乏長遠規劃,最終成為面子工程或爛尾工程;有些數據管理系統自動化程度較低,難以滿足快速決策需求;有些數據管理系統實用性較強但受限過多,影響了用戶對數據的訪問與使用,嚴重制約數據價值的挖掘和發揮。
管理機制是指在人類社會有規律的運動中,影響這種運動的各因素的結構、功能及其相互關系,以及這些因素產生影響、發揮功能的作用過程、作用原理及其運行方式[9]。在大數據時代,研究設計科學合理的軍事數據管理機制,是保證軍事領域大數據建設持續、高效開展的基礎。軍事數據管理機制建設中,針對軍事數據管理面臨的矛盾和問題,除了需要不斷完善軍事數據的采集、共享、維護機制外,還需要建立完善軍事數據的需求生成機制、審查機制和激勵機制。
軍事數據管理的6項機制為軍事數據運行管理與有效使用提供制度保障,它們相互作用、耦合關聯,彼此構成了有機的制度體系。總體上看,它以數據需求生成機制為牽引、以數據共享服務機制為核心、以數據采集機制為基礎、以數據審查機制為手段、以數據維護機制為保障、以數據激勵機制為動力,從全壽命角度保障軍事數據的生成、采集、使用與維護,確保軍事數據的按需獲取、高效移動、快速重組、靈活配置和精準服務。圖1為軍事大數據管理6項機制的關系示意圖。

圖1 大數據運行管理6項機制的關系
科學的管理機制是軍事數據運行管理持續、高效開展的基本保證,需基于現有基礎,設計一整套適應國情軍情的軍事數據管理機制,涵蓋數據需求生成機制、數據采集機制、數據審查機制、數據共享機制、數據維護機制和數據激勵機制,從全壽命周期的角度,對海量軍事數據進行全面有效的實時化、專業化和精確化管理。
由于數據采集部門對軍事數據需求理解不深、不透、不全,數據需求方提出的要求未被采集部門充分理解和消化,導致數據與應用脫節,收集的數據難以被有效使用。為此,技術部門或軍事信息系統建設部門與決策部門應就業務工作流程和系統信息流程開展深入溝通,結合軍隊戰略轉型、新質作戰力量建設、國防科研、訓練保障、作戰指揮等深入開展需求分析,分析具體領域、實際業務中的數據應用,明確數據的需求生成方式,保證數據與數據、數據與系統、數據與應用之間的關聯。而且,應明確軍事大數據建設需求主管部門,創建權威的軍事大數據需求生成體系,構建需求信息發布和整合機制,規范數據需求信息的樣式,明確數據信息的要求等。由數據需求主管部門將數據需求信息傳達到有關技術部門或軍事信息系統建設部門,并通過各部門的有效溝通和相互配合,提高技術部門或軍事信息系統建設部門對數據需求信息的理解,提升數據需求信息生成的精準度,同時也使需求主管部門了解當前的技術狀態,避免提出超出實際或不合常規的數據需求。
數據需求生成模式可分為“自上而下”和“自下而上”兩種。“自上而下”模式中,各部門根據各自的數據需求提出請求,經整合處理后通過需求發布機制和收集機制,指導不同資質、不同渠道的數據采集方和供應方提供相關數據;“自下而上”模式中,數據采集方和供應方盡量采集捕獲各類數據,匯總后由決策部門根據各自需求進行分類管理和使用。“自上而下”模式提出的需求有很強的針對性和目的性,而“自下而上”模式則可能觸發新需求,兩種模式互為補充。數據需求生成機制如圖2所示。

圖2 兩種數據需求生成機制
數據是大數據建設和運行的核心,數據采集是數據的主要來源,數據采集機制的科學性、合理性直接決定數據的質量。從流程上看,數據采集一般分為數據采集準備(包含數據來源渠道勘定、數據資源確權、基礎設施建設、資源投入準備等)、數據采集、數據匯總及檢測、數據的確認與驗收、數據的入庫與使用等階段(圖3)。此外,為確保數據庫中有豐富、準確、完備的數據信息,必須明確各類信息源之間的關系,確立不同類型數據采集與認證的責任單位或崗位,明確職責分工,落實各自的工作內容。

圖3數據采集的一般流程
數據采集機制運行,除需要明確執行機構和數據采集類別,建設數據采集手段外,還需要進行數據甄別校驗。一是要明確每個階段的成果和技術狀態,確定需要采集的基礎表、數據字典,明確采集流程中的關鍵節點和其他注意事項;二是加強數據采集手段的建設,強化動態數據的實時收集,通過建立數據通報、發布制度,健全網絡報告、自動分發等機制,提高信息采集的時效性;三是通過競爭機制,遵循準確、完整、時效性強等原則,擇優選擇數據信息的供應機構;四是明確數據采集與認證的責任單位,以及相關入庫工作的責任方,明確任務分工,便于各方有效履行職責。
數據審查機制一般指運用一定的方法、技術,采用特定的指標體系和評價標準,按照規定流程,通過定量、定性分析,對大數據的質量和價值做出客觀、公正的綜合判斷,從而支撐相關決策工作的有效開展。由于大數據建設工作長期處于建用結合的狀態,在應用過程中需要不斷對數據信息進行采集、審核驗證及修訂,確保數據信息的可靠性、適用性、有效性和權威性。這不僅決定著數據應用的效果,同時也決定著相關決策工作的成效。因此,在數據采集機制的基礎上,數據的審查機制尤為重要。
數據審查的體系框架如圖4所示。其中,審查管理部門的主要職責包括制定科學的審查規范,內容包括目的和范圍、審查指標體系、審查方法和審查機制等;組織審查部門開展審查工作,及時發現審查中出現的問題并予以解決,為組織管理層提供有關決策咨詢服務,將審查結果向相關部門或單位公示,并根據反饋的建議改進審查體系或數據管理體系。

圖4 數據信息審查體系框架
在數據審查機制中,審查部門是審查活動的主體,是審查活動的具體執行者,對審查過程和結果負責,可以由專業的第三方審查機構、專門的審查專家委員會、管理咨詢機構等承擔。審查機構需要根據審查規范確定具體的審查范圍、審查對象、設計審查方案、選擇審查方法,并組織審查項目小組或經過大量訓練的人工智能系統人機協同開展嚴肅、公正的審查活動,進行數據分析,完成審查報告。審查機構應與審查委托方建立溝通機制,及時解決審查過程中出現的問題。審查規范是建立數據信息審查機制的基礎,重點研究如何構建客觀、合理、公正的指標體系,包括指標體系的構成要素(如數據覆蓋率、來源權威性等)、各要素的權重等。在構建數據審查指標體系后,重點研究采取何種審查方式組織相關機構對數據的質量、價值進行評估,并生成評估模型,通過第三方審核的引入,加強審查的公正性和權威性。
現階段,我軍已經初步確立了以數據共享庫、共享池為核心的共享數據體系框架,不斷促進數據的有效集成、高效流動和低成本使用[9]。同時,大數據的共享還需要將“按權共享”和“按需共享”相結合,合理設計共享目錄,實現對海量數據的分級管理[10]。此外,還需要加強網絡建設、云計算及數據共享等領域新技術、模型算法和工具的研究與應用,解決好數據控制、審計、分布使用的效率和安全問題,以及在惡劣或拒止環境下、系統受損或失效狀況下的應用服務問題,強化瞬時動態調度與安全移動管理。為解決我軍大數據建設工作中的“信息煙囪”現象,還需要研究數據標準統一存儲和使用模式。
在數據共享機制設計中,需要處理好數據信息采集、數據加工、數據管理及共享過程中的各種關系,重點研究為保障數據信息共享的安全有效運作,需要制定哪些政策法規科學指導數據共享,如何通過機制建設加強數據共享的管理,包括數據標準的制定、數據管理的規程等(圖5)。

圖5 數據信息共享
激勵機制分為外部激勵機制和內部激勵機制,其目標都是促進和推動不同個人、不同部門間數據信息的采集、共享與交換。激勵機制設計需要在保證個體成員自身利益的基礎上,追求全局利益的最大化。通常情況下,很難保證個體與全局利益的完全一致,因此要設計合理、有效的激勵機制,充分發揮激勵機制激發行為及制約行為的作用。激勵機制的運行模型如圖6所示。

圖6 激勵機制運行模型
構建科學合理的激勵機制,包括明確激勵機制內容、激勵主體和客體、激勵目標、激勵手段方式,以及激勵所期望達到目標等。激勵機制的設計原則包括針對不同群體采取多樣化激勵手段,以滿足各個數據提供者合理需要為出發點,采用科學的激勵范圍、激勵力度與頻度,平衡激勵中的獎勵與懲罰,確保公平公正的激勵評價等。
大數據建設使數據的價值得到了最大程度的發揮,但也使數據中的重要信息暴露在無孔不入的網絡面前。隨著信息普及面和數據共享面的拓寬,數據的時效性大大縮短,需要不斷調整并適時更新相關數據、確保數據安全等,這些都離不開數據維護機制的有效運行。數據維護機制如圖7所示。
在數據信息安全方面,按照其管理服務的對象可以分為對外安全管理和對內安全管理兩部分,包括對無意識行為和有意識破壞行為的管理、對不可抗力情況下的災害管理,以及妥善應對的安全技術策略,如容災備份制度、防火墻技術、數據加密技術、數據訪問控制技術以及病毒防治技術等。此外,還需要建立防控主管機構,設置防控預案,采取特定的防控工作流程,定期定人實施排查,既約束內部人員自身的行為,也約束數據訪問者和使用者的動作,確保系統和數據的安全可靠[11]。

圖7數據信息維護運行機制
在數據更新方面,主要包括以下三方面內容。一是確定數據更新周期,要對不同數據的時效性進行分析歸納,確定數據更新的時間間隔和頻率。二是明確數據更新順序,準確分析數據之間的關聯,解決先后順序、關聯情況和制約關系等。三是采用適用的數據更新模式,對數據量較大、結構復雜的數據更新,可以采取數據接口方式實現;對數據更新規模較小,可以采取在線編輯方式實現。
大數據時代的軍事數據管理機制建設是一項復雜的系統工程。本文從軍事數據全壽命管理視角,探討了大數據時代軍事數據管理機制建設的總體框架,提出了軍事數據管理機制的設計思路和方法,為推進我軍軍事數據管理機制建設工作提供參考和借鑒。從目前情況看,我軍還沒有建立起軍事大數據思維觀念,軍事大數據技術基礎還相對薄弱,相關配套設施與資源還不夠完善。要建立操作性強、運行順暢、實用高效的軍事大數據運行管理機制,還有很長的路要走。這不僅是一項艱巨的任務,也是該領域研究的主要努力方向之一。