軍事科研數據資源是現代化作戰和軍事科研的血液,是支撐軍委機關戰略管理和軍事科研創新的重要基礎。面對日益龐大與復雜的數字資源環境、用戶知識化的信息需求、信息技術的廣泛發展及應用等新形勢,軍事科研數據資源建設工作正面臨新的挑戰與機遇。軍事科研數據資源服務產品是軍事科研數據資源建設的外在表現形式,是數據資源服務有形化的承載體,承載著數據資源搜集、加工處理、序化組織、大數據技術研發等建設的重要成果。因此,從產品服務對象、服務需求、服務目標等方面提出了對科研數據資源的搜集范圍、加工處理和序化組織的精細程度等工作的要求,希望對軍事科研數據資源的整體布局建設起到一定的輔助作用。
軍事科研數據資源體系的不斷完備對產品體系建設提供了新思路。大數據時代,數據量的激增使數據來源、收集手段、使用技術和展現方式多樣化。數據資源不再僅限于傳統信息資源,來源于開放獲取的數據、深網挖掘的數據、新媒體傳播的數據,以及各種機構產生的實驗、模型、計算、材料等專業數據,已然成為其中的重要組成部分。因此,必須立足大數據的視野和理念,深入開展軍事科研數據資源服務產品體系建設。
軍事大數據智能挖掘技術的發展對產品體系建設提供了新途徑。近年來,大數據環境下的信息源發現、信息獲取、信息抽取、關聯挖掘等情報挖掘技術不斷取得突破,數據感知、數據融合、知識發現、知識表示、信息價值評估等技術、模型和方法為熱點發現、態勢評估、預警預見、真偽識別等類型的分析產品提供了技術實現途徑。因此,必須充分跟上技術前進的步伐,完善軍事科研數據資源服務產品體系建設。
2011年,美國國防部開展實施的“技術監視和地平線掃描(TW/HS)”項目,重點基于專利、大學學報、期刊進行挖掘,實現對研發初級階段新技術的有效跟蹤。該項目旨在與國防部及情報界協同工作,建立一種廣泛的地平線掃描與技術預報能力,并實施技術凈評估等方法,對技術及“反制這些技術的能力”所呈現的機遇、威脅進行分析判斷,幫助美國了解其在全球科學技術領域的相對位置,確定新興技術對美國國防部能力的潛在影響和未來的威脅環境。
2013年,美海軍啟動了“海軍戰術云參考實施”的大數據云生態系統平臺建設,希望開發融合大數據、云計算和數據分析的平臺系統,實現對多種分布式文件系統和作戰系統的操作,提供相關作戰環境及其數據的實時視圖,為美海軍艦船和海軍特種作戰部隊提供支撐,提升大數據在作戰中的運用能力和效果。2016年,美空軍啟動了“多域指揮控制”計劃,致力于將數據用作武器,獲取來自于地面、空中、太空傳感器等多種途徑的數據,并將其轉變成可供作戰指揮官使用的情報。美空軍認為,指揮官需要來自空中、網絡、太空等所有作戰域發展情況的相關數據以合成作戰態勢圖,從而做出決策并獲得更好的態勢感知。
開源情報(OSINT)包括公開獲取資源、灰色文獻、長格式社交媒體內容和短格式社交媒體內容等4種類型[1]。其中,公開獲取資源是傳統意義上的信息資源,主要來源于開放獲取資源、期刊、報告等商業購買資源、內容聚合網站等[2];灰色文獻是來自研究機構、政府部門、智庫、學界等非公開出版和發行的資源;社交媒體內容是自2005年新媒體快速發展以來催生出的新型數據類型,主要包括博客、Facebook、Twitter、LinkedIn等平臺信息,長、短格式主要按照文本內容的大小區分。2014年,美海軍啟動了“語義目標定位和全源融合框架”自動化系統項目,旨在充分利用社交媒體(如恐怖分子Facebook)、傳感器等的回收數據,尋找、跟蹤和定位“高價值個人”,提高針對關鍵人物的情報分析能力。
專有數據特指有特殊或專門用途的數據,如無人機視頻數據等。2017年4月,美國國防部部署實施代號為“Maven”的計劃,其短期任務是研發計算機視覺算法,幫助軍事情報分析人員克服國防部采集的海量動態視頻數據所帶來的挑戰,將國防部海量數據快速轉換為可付諸于行動的情報及見解。
2013年10月,美國防科學委員會(DSB)為避免受到技術突襲,充分利用“技術監視和地平線掃描(TW/HS)”項目的成果,密切監視國內外新興技術進展趨勢,并結合專家咨詢法,邀請10余位專家聽取80多個一線技術研究項目負責人的匯報,最終形成并發布了《支撐2030年優勢的技術與創新》報告。
2008年,美國國防部發起“密涅瓦”計劃,主要側重于對美國國家安全政策具有戰略意義的領域,廣泛與大學、地方科研機構合作,充分利用其優勢研究力量和深厚的科研基礎數據積累,彌補美國軍方在政策制定、作戰行動過程中在相關領域的不足。此外,美軍也希望借此計劃提高國防部發展尖端研究和跨學科、跨機構研究的能力,摸索出一條將學術研究更有效用于政策咨詢的新模式。截至2017年底,“密涅瓦”計劃通過加強對監測對象社會文化和政治動態的發展推動對輿情信息的分析研判,已通過資助項目向美參謀長聯席會議主席、防御政策決策者、戰場戰斗指揮決策者等提供了大量有價值的研究成果。
2016年,美國國防信息系統局啟動了“網絡態勢感知分析能力大數據平臺”項目,旨在通過大數據平臺(BDP)對國防部信息網(DoDIN)的海量結構化和非結構化數據進行收集、關聯,同時提供分析和可視化處理工具,便于國防部網絡分析人員及作戰人員以一種全新的綜合性視角審視DoDIN上的數據,對數據進行正確理解,從而幫助做出指揮與控制決策。
翻開菜譜更是一股文藝氣兒撲面襲來,不僅每頁都有老北京的各種歷史介紹、地名典故、過年習俗,連每道菜的名字下方都配有不同的詩詞歌賦,盡顯文藝氣息,突然想起那句:“你吃的不是飯,是文化”。
2017年,美媒報道了美軍正在加快建設“F-35高科技機載威脅數據庫”。該項目旨在融合地區、地形數據和敵友雙方不同資產數據,建立機載數據庫,幫助飛行員精確識別在全球不同高風險地區作戰的敵機,快速做出決策以打斷敵人的決策循環,合理預判并先行摧毀對手。
2014年,美國特種作戰司令部發布“自動可視化定制分析報告”項目,通過采集互聯網上符合作戰需求的開源數據,進而進行數據挖掘、過濾并自動形成可視化整理,從而實現將某個特定作戰區域的分析數據分發到作戰人員,及時滿足特種作戰部隊特定需求的目的。該項目可自動生成可視化分析報告。
基于以上需求分析和國外軍事科研數據資源服務產品特點分析,提出了我軍軍事科研數據資源服務產品體系設計思路:突破現有以科技文獻為服務單元的專題服務模式,基于軍事數據資源池,從用戶需求、服務覆蓋面的大小、內容加工顆粒度的精細程度等方面考慮,構建由泛在化共享服務和個性化定制化精細化服務組成的知識服務內容架構,形成由服務門戶、技術平臺、知識庫、領域技術快報、分析評估報告、數據年鑒等多種類型的系列知識服務產品,開發完善網絡服務、移動服務和嵌入式服務等多種知識服務模式,面向軍事科研、軍事管理和聯合作戰提供服務。
3.2.1 泛在化共享服務
泛在化共享服務以通用化數據庫產品為基礎,以服務門戶、服務平臺產品為媒介,面向廣大軍隊和國防工業科研用戶開展的服務,主要包括軍事科學信息服務門戶、軍事數據鏡像服務平臺、武器裝備圖片視頻庫等。
3.2.2 個性化定制化精細化服務
從服務對象對科研數據服務的不同需求入手,個性化定制化精細化服務分為3類。
一是面向軍事科研的數據服務。其中,助推科研信息化的產品主要包括情報協同分析平臺、科研資源共享平臺、科研信息管理與服務平臺等,支撐關鍵技術攻關的產品主要包括技術領域知識庫、特定主題知識庫等,開發技術掃描的產品主要包括國防科技發展動態跟蹤平臺、領域科技快報、機構透視、領域發展綜合態勢分析、軍事科技年度發展概覽等,開發如軍事科技技術預警平臺等技術預警的產品。
二是面向軍事管理的數據服務。針對軍事管理的數據服務主要是立足軍隊建設管理科學化、專業化、精細化需求,圍繞體制機制完善、管理流程再造、資源配置優化、短板弱項發現等問題,開展數據建設和分析,支撐機關運行管理決策,具體分為支撐體制機制完善的產品、支撐管理流程再造的產品、支撐資源配置優化的產品、支撐短板弱項發現的產品等。
三是面向聯合作戰的數據服務。數據服務重點在輔助指揮協調與籌劃、作戰態勢研判上下功夫,將數據服務融入信息化、智能化作戰體系,推動實現戰場感知和作戰決策的智能化,主要分為輔助指揮協調與籌劃的產品和輔助作戰態勢研判的產品。
產品服務模式主要包括3種:通過網絡以服務門戶形式面向廣大用戶提供一站式服務;開發APP應用、微信公眾號等移動服務模式,提高數據服務的便捷性的移動服務;開發鏡像服務系統,將軍事數據服務嵌入到科研、政工、后勤、作戰、裝備等業務環境中的嵌入式服務。
軍事科研數據資源服務產品類型除了包括分析報告、評估報告、年度發展報告等傳統情報研究類型以外,基于大數據環境主要包括以下3種類型。
3.4.1 平臺即服務/產品
平臺不僅僅是網絡平臺,還承載著數據以及開展分析應用的工具、軟件、模型等。因此,平臺本身就是產品。
3.4.2 數據即服務/產品
精細加工及按照特定知識要素和知識結構構建的數據本身就是一種產品,可以直接提供給用戶使用。
3.4.3 知識庫即服務/產品
知識庫是以軍事大數據分析和軍事數據集成組織需求為牽引,采用實體識別、知識抽取和知識構建技術,在文獻、動態、網絡百科、工具書等類型的海量軍事數據中識別、抽取軍事知識實體及相關屬性,并按照知識譜系的建設思想,將不同類型的知識實體進行有序組織、分層疊加構建的以服務門戶為外在表現形式的產品,如作戰計劃知識庫、軍事行動知識庫、機構知識庫等。
蘭德公司是美國最重要的以軍事為主的綜合性戰略研究結構之一,其產品(研究報告)開發方法被描述為“蘭德人+蘭德信息資料+廣泛的關系網絡+人機結合的分析方法=多用途政策研究機器”[4-5]。在專家智慧方面,蘭德不僅注重專家也重視挖掘專家的智力資源,開發了蘭德式理性程序、自動數據分析框架等方法體系。大數據時代,應充分應用大數據挖掘技術優勢,有效契合定量分析工具方法和專家智慧,開發出有價值、有說服力的產品(圖1)。

圖1 產品開發方法
大數據時代,基于軍事科研數據資源的服務產品生產模式在3個環節都可充分采取軍民融合的模式。一是數據資源搜集獲取環節開展信息資源融合。軍地雙方的數據資源各有特色,都有著不可替代的作用,軍地雙方必須發揮各自所長,形成軍地雙方數據資源的有機融合和共享。二是大數據技術研發環節開展“眾包”模式的技術融合。軍事數據多領域、多層次、多形式等特點對傳統信息建設思維、模式和技術手段都提出了更高的要求,技術研發要以自身技術力量培育和能力建設為主,聯合高校、技術公司、企業等外部力量,圍繞特色問題開展軍地雙方的技術研發融合。三是分析研究環節開展“總體+大外圍”的研究優勢融合。建立各領域的外圍專家團隊,充分依托專家的領域優勢和研究力量優勢,開發出高質可信的產品。
面向重點領域和重大任務需求,開展特色知識庫群體系設計,開發知識庫構建與服務平臺及系列工具。廣泛跟蹤搜集國內外相關重點技術領域和重大任務的數據資源,對各領域相關機構、學協會、智庫、實驗室、大學、咨詢公司的新聞動態、科技文獻、多媒體、項目數據、百科等進行深度加工集成,以特色知識庫群為載體,為專家和國防科研人員提供契合需求的知識匯聚服務。知識庫群類型主要包括面向技術領域的知識庫群[6]、面向特定主題的知識庫群、軍事法規政策知識庫群、數據年鑒、軍事科技戰略思想知識庫群、機構透視類知識庫群等。
面向前沿創新領域需求,開展智慧產品體系設計,開辟基于海量數據、人機結合開展智慧服務的新模式。如基于國防科技發展動態跟蹤平臺,對前沿創新技術領域期刊、會議、機構等特定信息源進行持續跟蹤和監測,開展關鍵內容抽取和輔助編譯研究,開發技術掃描類智慧產品開發;基于智能分析平臺和多渠道強關聯的全球科技資源數據,形成多維分析的智慧產品,開發人才評估型、機構評估型、技術交流型、科研評估型和綜合評估型產品,為精準引進、精準合作、交流管控等提供有效支撐。