2011年,美國總統科技顧問委員會認為美國政府缺乏對大數據相關技術的投入,2012年美國科技政策辦公室隨即推出了《大數據研究與發展計劃》,并成立了專門的大數據高級領導小組專職負責美國大數據戰略部署。隨后,美國信息技術與創新基金會于2013年發布了《支持數據驅動型創新的技術與政策》,美國總統行政辦公室于2014年發布了《大數據:把握機遇,保存價值》,大數據高級領導小組于2016年發布了《聯邦大數據研究和發展戰略計劃》。
本文以上述美國大數據戰略文件作為研究對象,結合美軍公開的軍事項目信息,重點分析了與軍事相關的大數據戰略,發現美軍把數據支撐決策作為大數據戰略的中心,安全是美軍大數據戰略的基礎。另外還分析了美軍大數據戰略與美國政府大數據戰略的關系,發現美軍大數據戰略與美國政府大數據戰略有明確的分工和互補,具有暢通的軍民融合機制。
知己知彼,百戰不殆。自古以來,知識和信息在軍事決策中就具有重要作用,決策者綜合運用知識和信息形成智慧決策。準確的信息可以減少不確定性,有利于做出正確的判斷和決策。根據DIKW(Data,Information,Knowledge,Wise)概念鏈模式,數據(Data)經過輸入傳遞系統轉化成信息(Information),信息經主體接收處理后形成知識(Knowledge),知識的綜合運用構成智慧(Wise)。數據是獲取信息、知識和智慧的基礎。在“小數據”時代,信息來源有限,決策人員需要在有限信息基礎上更多地依賴經驗和直覺做出判斷和決策。在這種決策模式下,決策的正確與否主要依賴決策人員的經驗和能力,具有較大的主觀性和偶然性。隨著大數據等科學技術的發展,依據客觀數據進行科學決策有利于擺脫決策的隨意性和主觀性,將決策從經驗推向科學。數據支撐決策是指在決策過程中以數據作為決策和判斷的主要依據,減少根據經驗和直覺進行決策帶來的主觀性和不確定性。目前,美軍決策過程的每一個環節都充滿了海量數據。如何使這些數據更加有效地支撐決策是美軍持續思考和探索的問題。
大數據為開展數據支撐決策、實現決策科學化提供了數據基礎,同時大數據量大、速度快、類型復雜和價值密度低等特點也給開展數據支撐決策提出了新的挑戰,主要體現在海量數據的組織、復雜類型數據的檢索和大規模數據分析3個方面。在美國公布的在研大數據項目中[1],軍事類項目共9項,其中5項圍繞上述3個方面展開。
美軍開發了insight項目[2]用于融合情報、監視和偵察(Intelligence,Surveillance,Reconnaissance,ISR)系統中的海量數據,指揮員和參謀人員能夠隨時使用系統中的數據。ISR系統是美軍C4KISR(Command,Control,Communication,Computer,Kill,Intelligence,Surveillance,Reconnaissance,C4KISR)系統的主要數據來源,包含了分布在美軍的全球軍事基地中的衛星數據、傳感器數據和無人機數據等類型復雜的大規模數據集。數據支撐決策要求這些廣泛分布的數據能夠快速匯集到同一個地方,供指揮員和參謀人員進行決策時使用。美軍在此之前開發的全球信息柵格系統用于對美軍數據的統一管理和使用,但其由于設計思路對大數據的考慮不夠全面而無法滿足大數據條件下開展數據支撐決策的需求。因此,美軍開發了insight項目用于快速接收、索引并存儲數據,實現海量數據的組織與融合,指揮員和參謀人員能夠從中獲得和洞見來自多種復雜數據源中與任務相關的數據。
美軍的大數據中包含大量圖片和視頻數據,包括各類監控視頻、航拍圖片等。傳統的文本檢索方法無法完成對圖片和視頻內容的檢索,如檢索“特朗普”時無法獲取到包含美國總統特朗普的所有圖片和視頻,更無法完整發現決策所需的數據,無法進行數據分析和決策支撐。因此,美軍開發了視頻和圖像檢索與分析工具[3](Video and Image Retrieval and Analysis Tool,VIRAT)用于對視頻和圖像內容的檢索和分析。VIRAT不僅能夠對現有圖片和視頻快速檢索,而且能夠對實時監控視頻進行事件和內容的監控。
大數據分析是數據支撐決策的關鍵,在2018年公布的《美國國防戰略報告概要》中,美軍把大數據分析視作確保打贏未來戰爭的新興技術。美軍現公開的5項與數據支撐決策相關的大數據項目中有3項屬于大數據分析,分別是通用大數據分析工具XData[4]、針對自然語言的機器閱讀理解項目和針對實時視頻的Mind’Eye項目。
XData項目的目標是開發能同時對半結構化和非結構化數據進行分析的通用基礎平臺,可伸縮性和可配置性是XData的兩項基本指標。伸縮性是指能夠滿足不同數據規模的數據分析需求,它是通過云計算架構實現的;可配置性是指XData能夠提供場景可配置的大數據分析方案,以滿足不同軍兵種在各種作戰場景下的數據分析需求。
機器閱讀理解項目是針對美軍大數據中包含的大量自然語言數據而開發的,其目標是代替人工完成部分淺層問題的理解和回答,其背后的支撐技術是知識圖譜和深度學習。從海量文本數據中挖掘出有價值的內容也受到了非軍事領域的重視,微軟研究院、斯坦福大學等國外機構均發布了閱讀理解數據集用以支持這方面的研究,百度、搜狗等國內公司也與哈工大等知名高校合作發起了機器閱讀理解競賽以推動該領域的發展。
Mind’Eye項目以實時視頻為分析對象,主要解決士兵對戰場環境的監視問題。傳統的戰場環境監視做法是士兵隱蔽在監視環境中進行24小時持續檢查,對士兵個人能力有較高的要求而且將士兵暴露于戰場的危險之中。Mind’Eye[5]通過開發智能攝像頭對監視環境進行實施錄像并監視環境中所發生的行為以文字形式實時輸出,只需安排一名士兵在安全的監控室中即可完成對多個監視區域的監視。
數據支撐決策是美軍大數據戰略的核心,大數據分析是數據支撐決策的核心。美軍大數據分析的戰略部署包括開發通用的大數據分析工具和針對特定形態大數據載體的分析工具。出于保密需要美軍或許并沒有完全公開其大數據戰略下的項目,但通過上述5個項目布局可以反映出美軍在數據組織與融合、數據檢索以及數據分析等方面的布局。
安全是一切軍事行動的基礎。數據驅動決策等任何軍事行為的成功都建立安全基礎之上,沒有安全作為保證,一切行動都將面臨泄密乃至失敗的風險。美軍大數據戰略首先考慮大數據本身的安全問題,其次考慮基于大數據技術解決美軍面臨的安全問題。在美軍公開的9項大數據項目中有4項與安全相關,其中兩項針對大數據本身的安全,兩項基于大數據技術避免美軍來自內部或外部的安全威脅。美國大數據白皮書中重點討論了如何在確保隱私的情況下利用大數據技術排查來自內部人員的潛在安全威脅。
大數據本身的安全是大數據戰略的基礎。云計算能夠為大數據提供強大的存儲空間和彈性的計算資源,是大數據分析的基礎。云計算的安全性決定了美軍大數據的安全性,美軍開發了兩個針對云計算安全的項目以保證美軍大數據安全。美軍提出了面向任務的彈性云[6](Mission-oriented Resilient Cloud,MRC)計劃。該計劃通過開發一系列用于檢測、診斷和應對黑客攻擊的技術以應對云計算環境下的傳統安全問題,擬開發一系列技術以允許云計算環境在遭受攻擊時仍然能夠保證大數據分析的可靠運行,以確保戰時敵方持續攻擊情況下美軍大數據能夠正常運行。數據的機密性也是美軍大數據戰略的重點考慮對象,美軍部署了基于加密數據的計算[7](Programming Computation on Encrypted Data,PROCEED)計劃以應對云計算環境下大數據分析面臨的數據泄密問題。PROCEED計劃的特點是能夠對加密的數據進行大數據分析,即在數據分析的全過程中數據一直處于加密狀態以最大程度減少明文數據被竊取的可能性。為達到上述目的,PROCEED開發了專門的程序設計語言和計算機算法。
在確保大數據安全的基礎上,美軍試圖利用大數據技術解決面臨的安全問題,主要包括來自外部的安全挑戰和來自內部的安全威脅。針對外部黑客不斷對美軍網絡空間頻繁實施黑客活動的安全挑戰,美軍開發了虛擬空間威脅[8](Cyber-Insider Threat,CINDER)項目,目標是監控、排查和檢測美軍虛擬網絡中的間諜行為。
相對于來自外部的威脅,美軍更注重對內部人員潛在安全威脅的防范,尤其在斯諾登泄露國家安全局內部文件事件發生后,美軍著手研究利用大數據技術評估內部威脅。根據2015年大數據白皮書的披露[9],國防部已經開始試點對包括陸軍服役人員、文職雇員以及承包商在內的3 370名雇員進行基于大數據的威脅評估調查,成功發現99名人員已經陷入嚴重的經濟危機、家庭暴力、吸毒或賣淫等指控。這些人員最終可能被臨時或永久性撤職,以消除內部人員帶來的潛在安全威脅。美軍為了防范內部人員誤操作帶來的風險,開發了多尺度異常檢測[10](Anomaly Detection at Multiple Scales,ADAMS)項目。該項目主要是防止由于內部人員誤操作等無意識行為引發的潛在威脅。其基本原理是從內部大數據中挖掘出異常模式,對可能帶來安全問題的潛在威脅發出警告并采取防范措施。
安全問題,尤其是網絡空間的安全問題越來越受到美國等軍事強國的重視。2017年8月18日,特朗普宣布美軍網絡司令部從此前的二級功能司令部成為美軍第十個聯合作戰司令部,以增強網絡安全管控和作戰能力。在此背景下,美軍大數據戰略如此重視安全問題也顯得理所當然。
美國政府雖然沒有在官方文件中明確軍民融合發展制度,但是在實際運行中卻能夠保證“戰場”與“市場”之間的順暢通聯。從組織機構來看,美國國防部是美國聯邦政府的15個聯邦部門之一,國防部長、國務卿、司法部長和財政部長被認為是內閣中最重要的4個官員。在美國政府歷次發布的大數據戰略中,美國國防部都是重要的戰略制定者和執行者,美軍大數據戰略也在美國政府大數據戰略中占據較長的篇幅。因此美軍大數據戰略的制定并非孤立存在,一直都是美國政府大數據戰略的重要組成部分,并且與其他行業部門之間有明確的分工。
從美國白宮科技政策辦公室(Office of Science and Technology Policy,OSTP)發布的世界上第一個政府主導的大數據戰略《大數據研究和發展計劃》[11]中可以看出,美國政府在制定大數據戰略時充分考慮了軍事領域的布局。該計劃包含科學、環境、教育和國家安全4個領域,分別由美國國家科學基金會、美國國防部、美國國立衛生研究院、美國能源部和美國地質勘探局5個部門負責組織實施。有關國家安全的戰略計劃由美國國防部直屬機構美國國防部高級研究計劃局(Defense Advanced Research Projects Agency,DARPA)負責具體實施。DARPA的宗旨是“保持美國的技術領先地位,防止潛在對手意想不到的超越”,該機構發布的大數據戰略計劃具有較強的前瞻性和軍事應用價值。美國政府在發布該計劃的同時還發布了一份更為詳細的正在計劃實施的大數據項目清單[1]。該清單包含70余項美國在研大數據計劃,其中DARPA負責的軍事大數據項目共9項,約占總項目的12.5%,與其他部門相比,占據較大比重。美國國防部在美國政府大數據戰略的起草和戰略實施中都扮演了重要角色,說明美國政府已經將軍事大數據納入到政府大數據戰略的通盤考慮之中。
從美國大數據戰略的經費預算分配來看,美軍大數據戰略也是美國大數據戰略中的重要組成部分。網絡與信息技術研究開發計劃(Network and Information Technology Research and Development Program,NITRD)是美國政府在1991年開始部署的一項具有國家戰略意義的研發計劃,提供一套框架和機制整合各聯邦部門資源以支持高級信息技術研發。NITRD計劃囊括了美國政府資助的重大信息技術項目,參與NITRD的各聯邦機構通過項目組成領域(Program Component Area,PCA)協調其開展的NITRD活動[12]。根據2017年發布的NITRD財政預算報告,2016年美國政府在大數據戰略中總共投入5.5億美元,其中軍事大數據投入1.5億美元。雖然2018年政府大數據預算減少至5.1億美元,但軍事大數據的投入增加至1.7億美元。
從美國軍事大數據的部署領域來看,美軍大數據與政府大數據也有密切的分工和配合。美軍大數據主要包括決策和安全領域的大數據戰略,而大數據基礎設施、大數據產業結構等戰略布局則由美國其他部門完成。國防和軍隊作為美國政府的重要組成部分,其軍事大數據戰略是在美國政府大數據戰略全局考慮之下制定的,而非獨立為之。美軍大數據戰略與非軍事部門的大數據戰略有較為明確的分工和配合,基礎設施等領域由非軍事部門完成,為美軍大數據戰略提供支持。美軍聚焦數據驅動決策的大數據戰略和設計安全及隱私的大數據戰略的制定和實施。
美軍把數據支撐決策作為其軍事大數據戰略的核心,與其建設C4KISR軍事信息處理系統、全球信息柵格以及網絡中心戰的理念相一致,是原有軍事戰略思想的進一步發展和提升。根據DIKW概念鏈理論,數據是信息、知識和智慧的基礎。隨著數據采集、傳輸和處理能力的進一步提升以及大數據技術的發展,信息和知識將越來越依托于數據,指揮員將擁有豐富的信息和知識作為決策依據,決策也將更加科學化和理性化,情緒、心理等因素對指揮員決策的影響將越來越小。
安全是軍隊存在的根本價值所在,美軍把安全作為其大數據戰略的基礎也在情理之中。隨著未來戰爭越來越依賴大數據,大數據本身的安全自然成為美軍的焦點。在確保大數據本身安全的基礎上,基于大數據技術維護國家和軍隊安全也會成為未來的發展方向。美國的軍事大數據戰略并非孤立制定,而是在美國大數據戰略整體框架下制定完成的,美軍大數據戰略在美國大數據戰略中占有非常重要的比重。