陳婭婷,張淑鳳,李佳澤,單琳
(中核戰(zhàn)略規(guī)劃研究總院,北京,100043)
自20世紀(jì)50年代起步以來,裝備科技信息工作發(fā)揮了重要的“耳目、尖兵和參謀”作用,為全面推進(jìn)國防和軍隊武器裝備現(xiàn)代化建設(shè)做出重大貢獻(xiàn)[1]。目前,國家安全環(huán)境日趨復(fù)雜,傳統(tǒng)的裝備科技信息工作面臨著巨大挑戰(zhàn),正處于創(chuàng)新發(fā)展的新時代。隨著信息技術(shù)飛速發(fā)展,大數(shù)據(jù)等前沿技術(shù)在軍事領(lǐng)域的廣泛應(yīng)用,裝備科技信息工作也迎來了新的機(jī)遇[2,3]。如何在當(dāng)前復(fù)雜環(huán)境下推動裝備科技信息工作創(chuàng)新發(fā)展,如何利用先進(jìn)的信息技術(shù)手段從海量數(shù)據(jù)中獲取有價值的信息,如何借助大數(shù)據(jù)技術(shù)構(gòu)建有效的裝備科技信息服務(wù)系統(tǒng)架構(gòu),是裝備科技信息工作當(dāng)前亟待研究的問題。
裝備科技信息是指與武器裝備建設(shè)、管理和運(yùn)用直接相關(guān)的可供交流的科技信息或科技知識,包括國內(nèi)外武器裝備建設(shè)、軍事技術(shù)發(fā)展以及國防科研、生產(chǎn)活動中產(chǎn)生的科技報告、技術(shù)資源等各類科技信息[4]。國防科技和武器裝備發(fā)展建設(shè)規(guī)劃、計劃的制定,軍事技術(shù)發(fā)展方向、重點(diǎn)的確定,武器裝備和技術(shù)發(fā)展項目的擬定,都要有相應(yīng)的科技信息作為依據(jù)[5]。裝備科技信息工作對于提高裝備管理決策效率、促進(jìn)裝備科技創(chuàng)新發(fā)展和加快新裝備形成戰(zhàn)斗力等方面發(fā)揮著重要作用。當(dāng)前,在裝備科技信息工作實際研究過程中,仍存在一系列阻礙因素和問題困難。
在大數(shù)據(jù)時代,數(shù)據(jù)成為了整個時代發(fā)展的核心,為加速裝備科技信息工作的進(jìn)步提供了前所未有的機(jī)遇[6]。數(shù)據(jù)急劇增多使得裝備科技信息工作擺脫了信息匱乏的局面,但涉及不同領(lǐng)域和平臺、分布廣泛的信息資源大大增加了信息采集、分析處理的難度。目前,裝備科技信息工作技術(shù)手段落后,科研工作人員人工處置應(yīng)接不暇,疲于奔命,無法全面搜集、深入處理信息,導(dǎo)致出現(xiàn)信息流失、低效、重復(fù)與失真等情況。然而,裝備科技信息工作追求快速、準(zhǔn)確和全面,迫切需要高效的信息技術(shù)手段提高工作效率和成果質(zhì)量。大數(shù)據(jù)、云計算、人工智能、自然語言處理等先進(jìn)的信息技術(shù)以其自動化、智能化的功能和高效性,當(dāng)仁不讓地成為可靠的中堅力量。
同時,由于裝備科技信息工作所使用的信息資源分布在不同的領(lǐng)域和平臺上,大量信息數(shù)據(jù)掌握在部門或個人內(nèi)部,形成諸多孤立的小型信息庫,信息孤島嚴(yán)重,數(shù)據(jù)利用率低,無法發(fā)揮信息資源共享共用的最大效能,使裝備科技信息工作成果缺乏準(zhǔn)確性和可信性。因此,加強(qiáng)裝備科技信息資源的溝通與合作,建立資源共享平臺,擴(kuò)展信息資源并實現(xiàn)信息資源共享共用與裝備科技信息工作協(xié)同發(fā)展至關(guān)重要。
大數(shù)據(jù)環(huán)境下的裝備科技信息工作建立在數(shù)據(jù)集中的基礎(chǔ)上,朝著數(shù)字化、智能化、平臺化方向邁進(jìn),如圖1所示。

圖1 大數(shù)據(jù)環(huán)境下的裝備科技信息工作全流程示意圖
為裝備科技創(chuàng)新發(fā)展提供準(zhǔn)確、可靠的決策服務(wù)需要大量、全面的數(shù)據(jù)支持。在裝備科技信息工作發(fā)展過程中,已積累了很多數(shù)據(jù),部分已形成數(shù)據(jù)庫,如裝備科技成果庫、裝備科技項目庫等結(jié)構(gòu)化數(shù)據(jù)集,但大部分為半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)集,如文本類數(shù)據(jù)、圖形圖像數(shù)據(jù)、音視頻數(shù)據(jù)等。這些數(shù)據(jù)資源規(guī)模越來越大,結(jié)構(gòu)多樣,存儲位置和形式不一致,但通過關(guān)聯(lián)與融合,呈現(xiàn)出巨大的分析挖掘與決策的參考價值。
大數(shù)據(jù)環(huán)境下的裝備科技信息工作,依托云存儲、分布式文件存儲等大數(shù)據(jù)存儲技術(shù),構(gòu)建裝備科技信息工作統(tǒng)一的存儲體系,將在傳統(tǒng)基礎(chǔ)設(shè)施中長期保存的分散、多樣的電子數(shù)據(jù)和紙質(zhì)文件數(shù)字化,并存儲在存儲設(shè)施中進(jìn)行統(tǒng)一管理,取代了傳統(tǒng)的存儲方式,實現(xiàn)對非結(jié)構(gòu)化數(shù)據(jù)的特征提取和半結(jié)構(gòu)化數(shù)據(jù)的內(nèi)容檢索,便于對裝備科技信息工作的各類數(shù)據(jù)進(jìn)行整理、交叉分析、對比和深度挖掘。
裝備科技信息工作歷來以信息收集、處理、分析與提供決策服務(wù)為主。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)來源激增給裝備科技信息工作帶來了豐富的信息資源,使信息多元化、廣泛化,但規(guī)模巨量的數(shù)據(jù)、多樣的數(shù)據(jù)類型、復(fù)雜的數(shù)據(jù)來源以及數(shù)據(jù)價值密度的降低也給裝備科技信息工作帶來了新的挑戰(zhàn)[7,8]。傳統(tǒng)的分析處理手段已無法處理海量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),大數(shù)據(jù)時代開啟了裝備科技信息工作新范式,人工智能、機(jī)器學(xué)習(xí)等新興信息技術(shù)使得研究范式向著以數(shù)據(jù)分析為主導(dǎo)的方向轉(zhuǎn)移。從傳統(tǒng)的提出問題、搜集相關(guān)信息、分析并生成研究成果轉(zhuǎn)變?yōu)橹鲃硬杉瘮?shù)據(jù)、根據(jù)規(guī)劃進(jìn)行數(shù)據(jù)挖掘分析、生成研究成果。
依托大數(shù)據(jù)技術(shù),裝備科技信息工作可以更好地構(gòu)建服務(wù)系統(tǒng),借助先進(jìn)的信息技術(shù)和方法工具,在大量采集裝備科技信息數(shù)據(jù)的基礎(chǔ)上,對裝備科技信息數(shù)據(jù)進(jìn)行科學(xué)有效地組織、存儲、數(shù)據(jù)分析挖掘、成果展示等,從而發(fā)現(xiàn)國內(nèi)外武器裝備建設(shè)、軍事技術(shù)發(fā)展可能出現(xiàn)的變化,對國防科技和武器裝備發(fā)展建設(shè)規(guī)劃提供有力的決策支持,從而促進(jìn)裝備科技信息工作創(chuàng)新發(fā)展。
大數(shù)據(jù)環(huán)境下,利用大數(shù)據(jù)技術(shù)開展裝備科技信息工作,建立數(shù)據(jù)驅(qū)動型智能裝備科技信息服務(wù)系統(tǒng),通過知識庫、采集和處理系統(tǒng)精確滿足用戶需求[9]。基于大數(shù)據(jù)技術(shù)的裝備科技信息服務(wù)系統(tǒng)的架構(gòu)如圖2所示,主要為信息采集、信息共享共用、信息智能搜索、信息智能分析和成果展示提供統(tǒng)一管理和使用的平臺。該系統(tǒng)以裝備科技信息共享共用平臺為核心,依賴于巨量數(shù)據(jù)的分析挖掘獲得研究成果,利用了機(jī)器學(xué)習(xí)、自然語言處理等信息技術(shù),實現(xiàn)了裝備科技信息工作從信息采集到應(yīng)用的全流程各環(huán)節(jié)的智能化、規(guī)范化功能。整個系統(tǒng)綜合考慮了大數(shù)據(jù)的特性以及對接第三方應(yīng)用系統(tǒng),使得出的結(jié)果更加貼近實際,并符合科研工作人員的需求。

圖2 基于大數(shù)據(jù)技術(shù)的裝備科技信息服務(wù)系統(tǒng)架構(gòu)
裝備科技信息需求規(guī)劃平臺提供用戶個性化信息采集需求定制服務(wù)和海量站點(diǎn)統(tǒng)一管理服務(wù)。用戶個性化信息采集需求定制服務(wù):用戶統(tǒng)一規(guī)劃信息采集需求,系統(tǒng)根據(jù)用戶提供的信息采集對象、類型、范圍等需求進(jìn)行數(shù)據(jù)自動采集工作。海量站點(diǎn)統(tǒng)一管理服務(wù):實現(xiàn)對眾多信息采集渠道進(jìn)行統(tǒng)一管理的功能,構(gòu)建官方、社會、網(wǎng)絡(luò)等多維度信息采集對象,采用先進(jìn)的信息技術(shù)對海量站點(diǎn)進(jìn)行統(tǒng)一監(jiān)督和自動實時的信息采集,通過人工智能等信息技術(shù)對海量站點(diǎn)進(jìn)行訪問結(jié)果監(jiān)督和反饋,例如監(jiān)督站點(diǎn)的可用性,自動清理故障站點(diǎn);監(jiān)督站點(diǎn)關(guān)聯(lián)站點(diǎn),豐富資源獲取渠道;監(jiān)督站點(diǎn)的訪問和資源下載效率。
裝備科技信息共享共用平臺提供知識庫管理服務(wù)和權(quán)限管理服務(wù)。知識庫管理服務(wù):在基礎(chǔ)數(shù)據(jù)庫的基礎(chǔ)上,根據(jù)裝備科技信息資源的類別,利用深度學(xué)習(xí)算法完成關(guān)鍵詞匹配,將數(shù)據(jù)重新分類后形成知識庫。通過將所具有的信息資源以及成果按照統(tǒng)一的分類系統(tǒng),組織和存儲到統(tǒng)一的信息資源庫,并對同一事項形成的系統(tǒng)信息進(jìn)行統(tǒng)一存儲和管理,消滅信息孤島,實現(xiàn)信息的有效共享,為管理者和決策者提供全方位的信息,以便于其作出正確的決斷。權(quán)限管理服務(wù):考慮裝備科技信息的特殊性,提供精確的信息共享服務(wù),用戶可根據(jù)裝備科技信息資源和成果的屬性、分類、知悉范圍等要素,對裝備科技信息資源和成果進(jìn)行訪問控制設(shè)置,將操作權(quán)限細(xì)粒度化,實現(xiàn)信息共享的同時,保障知悉范圍可控和數(shù)據(jù)安全。
裝備科技信息智能搜索平臺提供用戶個性化檢索推薦服務(wù)。系統(tǒng)通過記錄用戶檢索信息的行為和習(xí)慣,將這些記錄進(jìn)行分類和排序,利用深度學(xué)習(xí)方法,給用戶塑造檢索行為畫像,從而根據(jù)用戶的興趣點(diǎn)提供檢索優(yōu)先排序,達(dá)到精準(zhǔn)推薦的目的。
裝備科技信息智能分析平臺提供在線數(shù)據(jù)加工服務(wù)。利用提供的機(jī)器學(xué)習(xí)算法,用戶自定義數(shù)據(jù)挖掘模型,對采集的數(shù)據(jù)進(jìn)行智能分類、統(tǒng)計,根據(jù)用戶目標(biāo)進(jìn)行綜合態(tài)勢、重點(diǎn)熱點(diǎn)等方向的關(guān)聯(lián)分析,從時間、人物、背景、項目動態(tài)、技術(shù)動態(tài)等多維度對資源進(jìn)行畫像,從而在海量數(shù)據(jù)資源中挖掘潛在信息,為科研工作人員提供內(nèi)容更深入、范圍更廣闊、聯(lián)系更清晰、分析更細(xì)致的智能分析服務(wù),從而獲得準(zhǔn)確、科學(xué)、可信的結(jié)果
裝備科技信息成果展示平臺提供可視化服務(wù)。根據(jù)用戶需要,運(yùn)用可視化技術(shù),將裝備科技信息研究成果以圖表、報告、畫像、知識圖譜等多種形式展現(xiàn),加快用戶對數(shù)據(jù)的理解,便于快捷、清晰的提供裝備科技信息服務(wù)。
信息采集是裝備科技信息工作流程中最重要的也是最基礎(chǔ)的環(huán)節(jié)。然而,目前裝備科技信息的采集由科研工作人員獨(dú)自組織管理,缺少系統(tǒng)規(guī)范的采集程序,在信息采集范圍、質(zhì)量、實用性以及時效性等方面沒有明確的要求。同時,由于科研工作人員技術(shù)水平高低不同,導(dǎo)致采集的信息的質(zhì)量、準(zhǔn)確度和實用性難以保證,不能客觀真實地反映出數(shù)據(jù)的結(jié)果。建立規(guī)范、統(tǒng)一的信息采集程序,有助于保證系統(tǒng)能夠收集到足夠全面的信息,大大提高信息的收集速度,以及保證信息的及時性和有效性。
大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的存儲和傳輸方面都存在著許多的安全問題,一旦觸發(fā)很有可能引發(fā)一系列嚴(yán)重問題,造成極大的經(jīng)濟(jì)損失,因此無論是政府機(jī)關(guān)還是企業(yè),都需要對信息安全問題加以重視[10]。裝備科技信息服務(wù)系統(tǒng)的開放性和共享性,會加大病毒感染、數(shù)據(jù)泄露、數(shù)據(jù)強(qiáng)行上傳下載、數(shù)據(jù)惡意刪除、黑客侵?jǐn)_等危害發(fā)生幾率,為此需加大安全技術(shù)投入力度,降低該系統(tǒng)安全故障發(fā)生幾率。目前常規(guī)的運(yùn)維管理方式已經(jīng)無法滿足大數(shù)據(jù)環(huán)境的快速變化,在實施信息安全防護(hù)工作的時候需要考慮到當(dāng)前的信息安全技術(shù)發(fā)展,利用跟蹤監(jiān)測技術(shù)、加密技術(shù)、數(shù)字簽名等先進(jìn)技術(shù)建立安全防范機(jī)制,對數(shù)據(jù)信息進(jìn)行保護(hù),從而確保信息系統(tǒng)的安全性,避免數(shù)據(jù)信息遭受到破壞和盜竊。
人才是信息化建設(shè)發(fā)展的根本,裝備科技信息服務(wù)系統(tǒng)的建立和維護(hù)必須要有一支集數(shù)據(jù)分析挖掘與裝備科技信息研究等方面的復(fù)合型人才隊伍。因此,要建立完善的培訓(xùn)機(jī)制和人才激勵機(jī)制,在引進(jìn)高技術(shù)人才的同時,積極培養(yǎng)能夠掌握信息化技術(shù)和裝備科技信息研究的學(xué)習(xí)型人才,使工作人員除擁有專業(yè)高效的裝備科技信息工作能力外,還善用互聯(lián)網(wǎng)技術(shù),為信息資源共享共用提供良好的技術(shù)環(huán)境,確保系統(tǒng)的穩(wěn)定、健康發(fā)展。
大數(shù)據(jù)環(huán)境下信息資源豐富,存在著巨大的價值,構(gòu)建基于大數(shù)據(jù)技術(shù)的裝備科技信息服務(wù)系統(tǒng),有助于高效、準(zhǔn)確的全面收集數(shù)據(jù),挖掘潛藏的信息,為用戶提供準(zhǔn)確科學(xué)的裝備科技信息服務(wù)。