漆世錢,孟春寧
(武警海警學院 情報偵察系,浙江 寧波 315801)
隨著網絡信息技術的發展與普及,人們的生活方式和信息渠道發生了重大的改變,開源情報也迎來了變革和快速發展的時期。在互聯網發展的初期,獲取開源情報的主要途徑是整理來源于電臺、報紙、政府文件中內容和網絡新聞門戶網站的信息,隨著互聯網尤其是移動互聯網的發展,開源情報的地位、源頭和價值發生了根本性的變革。以微信、新浪微博、Facebook、Twitter等為代表的網絡社交用戶范圍和數量急劇擴大,僅一天,Twitter博客中就大約發4億張帖子,而類似帖子僅僅是Facebook、谷歌、聊天室、公告板以及其他電子論壇等網絡社交中信息的一小部分[1]。網絡社交已是人們相互交流、傳遞信息的主要手段,成為日常生活不可或缺的一部分,同時也越來越被情報部門重視,成為各國情報工作人員取得有價值情報的重要情報源。美國的情報部門與其“五眼”同盟(包括澳大利亞、加拿大、新西蘭和英國)及其他政府機構也涉足網絡社交的監控業務[2]。2018年互聯網安全大會上,以色列情報與網絡安全專家羅伊津曼做了主題為“開源情報的第三次變革”的報告,他表示,網絡社交上的海量個人數據已成為開源情報的重要來源[3]。
所謂開源情報,是指通過規劃、收集、分析、分發的手段公開獲得組織或個體發布的信息。當然,獲取信息時也存在一些灰色地帶,比如盜取別人的密碼、使用假的網絡身份獲取信息等。目前各機構對開源情報的理解不盡相同,但從根本上是一致的,基本包括以下幾個方面:一是特定的服務對象;二是獲取情報目的性非常強;三是來源范圍明確為公開來源;四是確立了“采集—分析—分發”完整的情報活動過程[4]。
網絡社交是指人與人之間交流的網絡化,它是建立在Web3.0技術基礎上的一組互聯網應用程序,在多元價值觀念的激蕩中,用戶創造自己的用戶資料(profile)、可以創造內容,并保留一些通信的記錄、允許大眾通過某種權限瀏覽和訪問特定用戶發布的信息、可以通過某種方式尋找到新的社交對象,通過學習、交往和借鑒,達到溝通、理解或共識。隨著網絡社交慢慢地轉移到移動互聯網上,網絡社交上的數據無論是數量還是數據價值發生指數性的增長,各種網絡社交幾乎涵蓋了人們日常生活的各個領域。正因用戶在網絡社交平臺上能相互交流、自由表達觀點、分享自己的生活狀態等,使得從互聯網中獲取開源情報帶來了廣闊的空間和無限的潛能。
(1)用戶注冊信息
很多社交網絡應用在用戶注冊時需要填入電話號碼、電子郵箱、性別、興趣等個人信息。如果填寫的是單位郵箱,通過后綴可能推斷出用戶的年齡、工作單位等個人信息,例如某個用戶的電子郵箱名為wangwenjing19840203@whu.edu.cn,則可以大概推斷出這個人名叫wangwenjing,有可能是個女生,她的生日為1984年2月3日,在武漢大學學習或工作過。所以說注冊信息往往是一種隱性的社交網絡數據。
(2)用戶位置數據
在網頁上最容易拿到的用戶位置信息就是IP地址,對于手機等移動設備,我們可以拿到更詳細的GPS數據,用戶的位置數據也可能會間接反映出其社交關系的一些信息。例如很多人在微信中發微信朋友圈或微博時喜歡把自己此時的位置順帶上,情報分析人員通過給定的位置信息,可以查詢地圖了解用戶發信息時的地址,這些地址有的可能只顯示出到哪個城市或區,但大多數時候可以精確到那條路哪個單位,這個時候我們就可以推斷某個小區或者某個單位的用戶可能是好友關系,還可能經常活動在這一區域。
(3)論壇和討論組
比如天涯論壇有很多不同內容的版塊,如球迷一家、舞文弄墨、天涯詩會和股市論壇等,每個版塊都會聚集一些意氣相投的會員,假如某些會員同時加入了三個或者四個不同的版塊,就可以推斷出這些會員大概有相似的愛好,如果幾個會員經常在股市論壇中的帖子互動和交流,能進一步推斷出他們彼此的愛好和熟識程度非常接近。
(4)即時聊天工具
即時聊天工具是目前用戶數最多、應用最廣泛的網絡社交工具,比較常見的有Facebook、QQ、Twitter等聊天App,在國內社交App一騎絕塵的微信在2018年10月全球綜合的社交網絡App月活躍用戶數也才排名第五位,如圖1所示。除了用戶之間聊天內容廣泛,可用情報豐富外,軟件上面還有聯系人通訊錄,用戶根據需要還會給聯系人分成“同事”“親戚朋友”“相同愛好”等不同的類型,通過通訊錄分組和聯系人信息資料就可以推斷出用戶的網絡社交范圍,也可以通過用戶之間相互交流次數推斷出他們的熟悉程度。

圖1 2018年10月全球月活躍用戶數最多的社交網絡(以百萬人為單位)
(5)社交網站
在信息爆炸的當下,各種互聯網媒體承擔著大部分信息的傳播,而社交網站大大減少了信息過載的難題。不同類型的社交網站所表達的主題會有差異,選準合適的社交網站通過好友來過濾信息獲取自己需要的情報往往能事半功倍。例如在新浪微博中,只需要閱讀和關注與我們興趣愛好相同的用戶所發的信息,就能避免閱讀大量重復、無關緊要的信息。很多社交網站還有個性化的推送系統,通過大數據分析和利用用戶在社交網站中的行為數據,有目的的及時將用戶感興趣的信息主動發送給用戶,幫助用戶更好地過濾信息,更快更好地提高情報搜集效率[5]。
(1)網絡社交具有豐富的情報素材
網絡社交是以交友娛樂、互換資源、傳播為目的而在網絡上以真實社交關系或昵稱方式建立的虛擬社交平臺,用戶根據愛好在網絡社交平臺上進行視頻的觀看、圖片的欣賞和實時熱點事件的評論與點贊等行為,留下了自己的愛好、抉擇和觀點的活動記錄。大多數社交網站里的數據深入到了政治、經濟、科技、文化等生活的方方面面,包含從公共民生到個人不同層面的實時信息,數量和種類繁多,有圖片、文字、視頻,有宏觀的信息,也有微觀的數據,內容豐富,蘊藏著大量可利用情報,這些情報素材成為了社交網絡用戶的討論話題,種類繁多、數量巨大。例如通過分析下圖2中 95前和95后不同年紀網絡社交目的和訴求的數據,可以得到以下情報:除了溝通交流外,95后在社交網站中娛樂消遣、討論興趣話題、拓展交際圈等方面的訴求突出,而95前用戶在工作學習需要、獲取資訊方面訴求突出[6]。

圖2 社交產品的使用目的和訴求
(2)使開源情報的搜集更加風險低、效率高
網絡社交監控改變了以往市場研究技術和臥底、線人等危險的情報搜集方式。情報人員只需“聆聽”網絡社交,通過特殊工具和平臺查詢、檢索各種社交用戶的數據信息,避免繁瑣的市場調研,也可遠離危險環境,減少無人機偵查、衛星偵查和電磁偵查等成本高的技術方法。利用開源情報能解決問題的,就沒有必要動用風險性很高的人力情報手段,不但節約了情報獲取成本,也為人力情報提供了一個有力的補充,情報人員能夠投入更多精力在情報分析上,提高情報工作的效率。
(3)使開源情報的實時化程度更高
電報和電話允許我們以前所未有的速度從遠處親自連接,無線電和電視允許一個人向許多人廣播,網絡社交所做的是將兩者結合起來,允許前所未有的個人聯系,以及接觸整個世界的能力。隨著社交網絡功能日益強大,網絡社交平臺擴散的速度、更新的頻次、傳播的范圍較傳統信息媒體發生了巨大的變化,一些主流的網絡社交平臺已變成熱點事件的主要傳播途徑。普通網民可以隨時隨地方便的在知乎、微信、微博等移動互聯網交互軟件自由閱讀和發表觀點,利用網絡平臺共同參與討論。很多事件的現場經歷者喜歡在網絡社交平臺第一時間分享自己的所見所聞,并發表自己的觀點與意見,對各種消息的傳播達到了實時化的程度,尤其在突發事件中,社交網絡通常成為信息首發源。例如2012年一場5.9級地震襲擊美國華盛頓,造成包括國家大教堂與華盛頓紀念碑在內的眾多建筑受損,1分鐘后,紐約及其他東海岸城市也有震感,令人吃驚的是,許多紐約居民并非通過感官察覺華盛頓地震,他們的第一消息源是Twitter,換言之,網上消息傳播得比地震波還快。震后幾秒鐘,Twitter上就出現了“華盛頓地震”的消息并被大量轉發,最高峰時期,這類信息流量達到了創紀錄的每秒7500條[7]。
(1)采取主動的方式套取情報
情報人員確定情報搜集的目標后,在計劃的實施過程中通過社交平臺主動關注情報搜集的目標,利用各種手段套取所需情報[8]。2018年7月,位于加沙地區恐怖組織的情報人員就通過兩個在線交友網站在目標手機上安裝間諜軟件獲取情報。他們首先盜用現實世界中真實的女性Facebook個人資料中的照片和個人信息,通過在社交媒體上尋找以色列士兵并添加好友,然后引誘他們下載虛假的應用程序,最終情報人員啟用以色列士兵的手機攝像頭和麥克風,并訪問手機里面的內容,控制某些手機功能,獲取到某些軍事機密信息或者可用于勒索士兵的照片。
(2)對數據進行綜合分析
情報人員從繁雜多樣的網絡社交數據集當中搜集、處理、分析和提取有價值的情報。由于網絡社交平臺上的用戶數和信息類別繁多,美國政府一直積極組織Facebook、Twitter、YouTube等該國主要社交媒體網站創建一個共享數據庫,并建立網絡社交情報分析的邏輯過程,先后由界定目標—情報分解—組建目標模型—評估選擇—提煉—結構性預測的分析流程。特別是在反恐的作戰中,美英兩國情報部門專門建立了一種“社交式”的國際恐怖分子數據庫,通過在該大數據中輸入若干名可疑分子的信息,然后運用網絡社交分析工具理清與其有過聊天交流的嫌疑人,分析其關系網,最終挖掘出核心人物,以此推斷出恐怖分子的首領,對即將發生的恐怖主義襲擊進行預測與防范。雖然這種情報獲取的方式比較被動,需要守株待兔式的等待目標對象更新,且當關注目標對象數量多時,人工甄別耗時、耗力,但是美英在對伊斯蘭國和基地組織的反恐作戰中應用此方法獲取情報已屢試不爽。
(3)引導網絡社交用戶參與
通過事先的周密計劃和營銷活動吸引網絡社交上的會員參與并提供建議來獲取需要的情報。美國的通用電氣公司就使用這個“社交點子”的方法吸引社交平臺上近10萬用戶參與討論收集公司所需的信息,誰的建議被采納,就能獲公司提供的優惠機票。結果,半天時間不到,公司就征集到了上千條意見,有的建議為了倡導節能減排,應在所有公司航班上推出“綠色餐具”,用玉米淀粉等天然生物質降解材料制成的一次性水杯、刀叉用具、垃圾袋等取代耗能大、污染重的塑料或紙制餐盒、筷子;還有用戶建議飛機上應提供更多影音設施和美食預訂服務,那樣會讓乘客感覺沒有那么乏味,而且還可以品嘗到美食,即使吃不慣飛機餐也能事先預訂漢堡等食物。公司及時選用網絡用戶的合理建議,改善流程和服務體制,使客戶的滿意度有了大大提升[9]。
網絡社交情報就像一把雙刃劍,由于其內容豐富實時性強等特點,給新時期情報工作的發展、改革提供了便利與機遇,但同時也由于其自由度大、數量和種類繁多給情報工作人員帶來了挑戰,例如分析難度大、情報搜集與個人隱私之間的矛盾、信息泄露安全等多方面風險。
(1)分析難度大
面對呈指數級增長的網絡社交數據,情報人員正在開發“瘦身”技術來對數據進行研究和分析。目前研究領域正面臨包括對多種外語的分析以及特定類型網絡社交的獨特性等多個難題。一是外語的翻譯不準確,雖然可以使用像百度翻譯、谷歌翻譯和雅虎翻譯等工具讓情報分析者對網絡社交討論的內容有一個大致的了解,但卻無法傳達不同語種之間詞意的細微差別;二是拼寫和詞匯在不同媒體上的變化也帶來了巨大的挑戰,特別是在Twitter中,拼寫錯誤、縮寫和文體拼寫變化都使標準的規范化技術變得困難;三是個人或團體可以在博客、Twitter或其他網站上建立新的身份,根據安全設置隱藏他們的身份和位置,對任何人或話題無論對錯隨意發表看法,給開源情報的分析與甄別帶來難度[10];四是認知方面的挑戰,由于網絡社交是一個沒有對偏見、主觀意愿誤導等進行過濾的平臺,許多人可以通過自己的觀察角度和個人偏見來觀察事件和感知事物發表觀點,情報分析人員必須根據自己的經驗、理解和知識對這些信息做出價值判斷。因此,在網絡社交的海量數據中充分保證情報的準確性,要求情報分析人員對所搜集的每一則情報都要進行篩選、鑒別、刪除,對信息的分析能力提出了更高條件。
(2)情報搜集與隱私的矛盾
一方面,用戶的信息在網絡社交應用的侵蝕下,已經越來越像“皇帝的新衣”,個人隱私被使用甚至被濫用。隨著大數據在社交應用日益普及和深入,更多的搜集方式對社交應用數據和用戶隱私進行不知不覺、隨時隨地侵入。現在很多社交網站或App在用戶設置、隱私和安全、參與用戶體驗改進計劃,其中可以選擇“是”“否”或者“謝謝”,但是否存在拒絕參加用戶體驗改進計劃后后臺仍會收集信息就不得而知了。由于用戶的多元化,網絡社交上除了聊天交流的內容信息,還蘊藏著上網地點、時間、興趣愛好、使用習慣與個人需求等用戶的日常行為與數據,這些隱私信息可能被情報部門和執法機關使用,如果管理不善還可能為違法犯罪和恐怖分子利用。另一方面,個人數據隱私保護法令的不斷增加,這些法規的制約,再加上社交用戶自我保護意識的增強,使得情報獲取的過程越來越復雜,想要獲得有價值的情報更是難上加難。據英國《衛報》爆料稱,“9·11事件”之后,美國前總統布什在2002年秘密授權美國國家安全局可以對全美任何人進行監控,其中包括圖像、視頻、郵件、聊天記錄、登錄信息等網絡社交的用戶隱私活動與數據,監聽的深度與廣度都令人嘩然,事件一經“棱鏡門”曝光,很快就激起了眾怒[11]。
(3)信息安全風險
現在移動互聯網端的網絡社交平臺幾乎都帶定位功能,不但會泄露出涉密場所的位置,還能揭示有關的行跡信息;一些軍工或涉密崗位的用戶不經意上傳到社交平臺上的生活照片,很可能含有重要的情報價值,為間諜所利用,給國家安全帶來損失與威脅。以軍事實戰化作為出發點,敵對分子不僅能利用網絡社交平臺傳播謠言,采取“攻心術”進行蠱惑或欺騙,還可以通過隱瞞真實身份、木馬病毒攻擊等手段獲取情報、跟蹤目標的位置信息,滲透到對方內部。網絡社交平臺還為反情報能力提供了可乘之機,使社交信息毫無安全可言。近日一篇文章描述了美國空軍研究計劃可能會被用于“通過社交媒體操縱個人,像無人機一樣”。據說英國情報機關能夠篡改網絡民調結果、偽裝成Facebook的留言板以及操縱網站瀏覽。
網絡社交情報作為形式多樣、內容豐富的重要情報源之一,在情報工作中的價值越來越無可取代。隨著互聯網的普及和智能手機的廣泛應用,在線社交用戶規模將繼續保持增長態勢,對我國情報部門來說,這是一個極為誘人的情報源泉,但這又是一個巨大的信息安全陷阱。社交工具會被“壞人”利用,也為“好人”所用,圍繞網絡社交進行的情報獲取和反情報斗爭必將日趨激烈,網絡社交應用平臺勢必成為情報戰的下一個戰略高地。