韓全惜,曹蓉蓉,陳雪強
(國防大學政治學院,上海 200433)
情報作為信息處理占比很高的數據處理與分析工作,大多由情報信息系統負責。隨著移動網絡、社交網絡、云存儲、物聯網等信息技術的普及,網絡信息洶涌泛濫,傳感器材廣泛應用,情報人工處理和分析無以為繼。信息化為提升情報處理和分析的質量和效率提供了技術條件。當前,人工智能技術風起云涌,作為信息化的高級階段,情報智能化處理和分析邁開發展的腳步。
本文采用傳統的情報處理與分析流程模型,即情報處理和分析,包括搜集、處理、分析、生成和分發等環節。本文以各個環節作為研究對象,以智能化為途徑,以提升情報分析質量和效率為目標,討論各個環節的現狀和需求,闡述情報處理和分析的智能化應用。
當前,在人工智能技術支持下,已經有很多智能產品和應用場景,就情報處理和分析智能化而言,是充分應用人工智能技術的發展成果,將相對成熟的技術和產品運用到情報處理和分析工作中來;是按照人類實踐積累的經驗和做法,模擬數據處理的邏輯思維和推斷規則,借鑒并運用已有的、成熟的信息技術、信息設備和人工智能產品,部分替代情報人員進行情報處理和分析。上述的人工智能的應用模式被歸類為弱人工智能應用,屬于相對低級的應用階段。
網絡輿情的突發性要求隨時察言觀色,傳感數據的連續性必須時刻捕捉異常,人力情報的客觀性值得冒險獲取事實,競爭情報的斗爭性追求快速、準確和全面,情報人員人工處置應接不暇,疲于奔命,替代方案呼之欲出,信息技術、智能技術生逢其時,當仁不讓地成為可靠的中堅力量。
在信息網絡時代,由情報信息系統連接各類信息采集終端,代替情報人員承接信息采集任務。網絡爬蟲下載剛剛傳播的網頁資料,照相衛星拍攝地面情景,傳感設備測量信號信息,無人機巡視特定目標,情報信息系統接受各類異構情報數據,形成情報資料大數據,情報人員足不出戶、免動手、實時獲取來自全世界各地的數據信息。
情報搜集環節,情報信息系統模擬人類感官功能,模擬人類接受外界環境的刺激,從視覺、聽覺、味覺、溫度覺、重量覺、位置覺等方面吸收已有的人工智能的發展成果,根據情報搜集目標的需要,借鑒人類已經掌握的知識,類似機器人,克服工作時間無法持久、工作環境存在危險的缺陷,探測、接受客觀世界狀況,發揮其地域全覆蓋、時間全囊括、空間全搜索的態勢感知功能,盡可能地收集瞬息萬變的情報信息。
在各類業務系統中,情報或信息搜集是首先需要做的工作,使用網絡“爬蟲”替代情報人員有規則無休止自主地下載網頁資料搜集網絡信息,使用高分辨率光學衛星遠程拍攝地表圖像了解地面變化信息,使用由預警衛星、預警雷達和地基雷達等構筑的導彈防御系統的觀測子系統,時刻捕捉地球各地可能發射的導彈跡象,使用麥克風陣列隨時搜集交通違法鳴笛等,智能產品廣泛運用于信息搜集領域,降低了情報人員的勞動強度,提升了人們對情報獲取的質量和效率。
情報信息系統在搜集階段積聚了鋪天蓋地、蜂擁而至的龐大的數字情報,為縮小情報分析數據體量,降低情報分析復雜度,必須進行情報數據的預處理。
在情報分析之前,進行情報數據的預處理,有多方面的考慮:(1)大幅度壓縮情報素材的體量以減少情報分析的工作量。(2)多方面規范情報素材的形式以強化情報素材的可理解性。(3)盡可能地提純與研究對象的相關度以提高情報素材的可用度。為此,在情報處理階段,需要合并或消除重復冗余的數據,鑒別或糾正虛假錯誤的數據,拒收或拋棄無效無用的數據,識別或裁剪圖像視頻的數據,翻譯或理解外語方言資料,傾聽或轉換音頻語音的數據,破譯或解釋無線電技術偵察的數據等,這些數據體量龐大,處理工作繁瑣耗時。顯然,傳統人工情報處理方式無法應對海量的數據處理要求。
數字情報預處理工作大量是有規律的、事務性的數據處理,涉及許多其他專業技術,比如,圖像識別技術、視頻識別技術、語音識別技術、無線電技術、雷達技術等,這些技術大多已經成熟,能夠提供成型的解決方案或配套的處理設備,是情報信息系統智能化預處理數字情報的技術支撐和實現基礎。
多源情報信息數據智能化融合技術可以將多渠道來源的數字情報,以集大成的策略組合現有成熟技術,實現數字情報的預處理工作。
科大訊飛采用深度神經網絡機器翻譯技術智能處理語音情報或地方方言,達到語序順、語義明、辨認口語化表達準缺的標準[1-2];依據網頁底部網站備案信息、多個可信網站佐證、非網絡途徑獲取情報等策略,按照情報人員手工處理時采用的篩選、鑒定、分析、研究、整理等真假情報判斷經驗,借助神經網絡技術數據模式關聯、聚類、分類和預測能力,編制程序執行算法,制作數字情報甄別處理模塊,能夠自主過濾真假混合的數字情報。
當然,現有技術不能完全實現人們的設想,不能完全替代情報人員進行數字情報的預處理工作,不能完全依賴情報信息系統數字情報預處理的質量和能力,但是數字情報智能化自主處理大量規則的預處理工作,有效緩解情報人員的高強度工作壓力,采用由情報信息系統與情報人員構成的人機系統,是解決數字情報預處理較好的解決方案。
數字情報分析是指根據情報用戶需求,對搜集到的、經過預處理的情報資料進行匯總、統計、比較、推理、判斷、綜合等邏輯分析活動而形成情報結論的過程。數字情報的分析環節是情報處理和分析流程中核心的環節。
在人工情報分析過程中,面對龐大的數據,推演過程覆蓋數據有限,片面運用情報資料,分析結果自然無法做到嚴謹的要求;依賴分析人員長期積累的經驗,分析過程中存在分析人員的思維定式,分析結論與經驗值和分析思維方式相關性高,情報產品主觀性強,不能準確反映現實情況,不能滿足情報用戶決策需要;數字情報人工分析耗時漫長,情報價值隨時間急劇降低,無法達到情報用戶所希望的及時提供有效情報產品的要求。
數字情報智能分析是指數字情報的邏輯分析活動由人工智能技術完成或部分完成的過程。智能分析是信息設備或智能設備模擬情報分析人員的分析方法和規則,客觀地進行數字情報分析,可以有效克服先入為主等多種偏見,可以不分晝夜、不知疲倦地持續工作,更加高效、有效地協助情報分析人員共同承擔情報分析任務。
數字情報分析工作一般包括將資料轉換為知識、將知識整合到現有知識體系中和預測未來發展態勢等內容。人工智能技術現有成果能夠支持或部分支持數字情報分析的工作包括以下幾個方面。
3.2.1 將資料轉換為知識
在人工處理時,情報人員將零散的資料進行抽象概括,標注關鍵字,將帶有類似關鍵字的資料整合,確定相互關系,構筑相關資料群,形成知識。人工智能模擬人類的學習行為,可以將資料整理為知識,從而自動生成情報產品。2012年美國啟動文本深度發掘和過濾(Deep Exploration and Filtering of Text)項目,運用深度神經網絡技術獲取蘊藏在海量結構化文本中有價值的特征信息,運用自然語言處理技術進一步整合特征信息[3]。
3.2.2 將資料整合到現有知識體系中
數字情報工作是知識不斷積累的過程,把不同來源、不同格式、孤立的情報匯總整合到現有情報資料中,構筑起情報全景圖,揭示研究對象的本質。人工智能機器學習技術不斷探索并嘗試自主構筑知識體系的能力。2014年美國在“智能編撰整合”項目中開發了協助機器學習科技文章的技術,具備整合知識片段的能力[4]。
3.2.3 預測未來發展態勢
情報產品服務決策的一個特點就是情報產品能夠預測客觀事物可能發展的趨勢。其依據是利用已采集到數據描述事物特征,根據統計學原理發現事物運動規律來預見未來可能出現的狀況。大數據、大數據技術、人工智能技術為數據預測、技術預測、機器(信息系統)預測的實現提供了數據條件和技術條件。現實中,使用“風云一號”衛星數據,依據已經掌握的大氣變化規律來預測未來氣象變化。
通過機器學習模型,在零售、產品生產、保險、能源、大型設備模擬試驗、醫療保健等領域,預測用戶需求,提供用戶高品質個性化服務。
生活中,交通導航軟件以現有交通狀態數據為基礎,以數學模型為依據,經過數據統計和分析,得到從出發地到目的地的各條行駛路線耗時預測結果,能夠為駕駛員規劃最省時的駕車行進路線方案,而且能夠在行進過程中采集最新交通數據重新計算各條行駛路線耗時預測結果,隨時更新駕車行進路線方案。股票軟件大量使用過往股票交易數據,采用了各種統計理論,提供多種預測數據,使用股票軟件的股民參考其中一種或多種預測數據,按照自己的交易策略,以此作為買賣股票的依據。
數字情報的生成是指在情報分析的基礎上,根據情報用戶的需求,把情報分析成果以恰當的形式形成情報產品的過程。一般情況下,情報產品是以文本報告的形式表達,根據需要也可能以數字、語音或圖形等形式呈現。
數字情報產品手工生成模式存在效率低、效果差的問題。具有千萬、億級客戶群的銀行、淘寶、電信等企業不可能人工生成月度費用報表,衛生健康部門不可能人工制作即時全球性疫情報告,臨機應變的戰場指揮員不可能依賴按部就班的情報產品決策指揮。為應對窘況,應調整情報產品生成的模式。
情報信息系統根據實時數據驅動算法、模型自動運算推演,呈現即時態勢,提供給情報用戶意見建議。一般地,情報信息系統在智能分析數據后,直接將分析結果及其未來可能的趨勢以情報用戶可接受的方式顯示在輸出設備上,供情報用戶利用。
可視化技術支持將大量雜亂數字情報以可理解的直觀形象、動態變化的表現形式呈現給情報用戶。
一般地,金融市場軟件系統通過顯示數值自動報告實時價格,通過繪制圖形自動呈現動態變化,通過標記符號自動提示買賣建議。互聯網的輿情監測系統自動聚類分析網絡數據,自動描述輿情發生、發展、擴散到消亡的各個演變階段,自動生成輿情來龍去脈的文字、圖形報告。科大訊飛具備AI虛擬主播交互解決方案,在虛擬客服與情報用戶互動基礎上,可以實現虛擬的音視頻情報產品的輸出。
數字情報產品是服務于情報用戶的,必須實現有效傳遞。判斷情報產品分發是否合理的標準是,在合適的時間將適合的情報產品以適合的方式傳遞給適合的情報用戶。
在情報產品分發的過程中,存在信息過載和信息不足的現象。洶涌而來的龐大信息形成信息過載,讓情報用戶無所適從,“日理萬機”的高層公司領導拒絕閱讀行業態勢萬字言,災難現場的指揮員無法按部就班理解情報產品。信息過載和信息不足都影響決策質量的準確性和及時性。
人工智能技術將發揮其強大的、具有針對性的信息分享控制功能,實現情報產品的有效分發。可將情報產品設置包括戰略、戰役和戰術的情報產品的分辨率,可標注任務、地域、相關人員和時間等的情報產品屬性,情報信息系統根據規則和算法的約定,有針對性地精準推送情報產品。
例如,三星GALAXY NOTEⅡ智能手機作為穿戴式態勢感知系統的用戶終端,設置了情報智能分發算法,可以自主選擇適當信息傳遞給適當的用戶,具有實時分享位置、動態地圖等各類重要功能,極大地提升信息融合能力和態勢感知能力[5]。
數字情報處理和分析智能化過程是人工智能技術不斷發展的過程,是情報處理和分析運用人工智能技術的實踐過程。當前,大數據、大數據技術已經應用于包括情報處理和分析領域,大數據為機器學習、自然語言理解等強人工智能提供了可能性,也是情報處理和分析盼望的幫手。