蔡聞一 孫崢皓 唐塞麗 李東昊(中國運載火箭技術研究院研究發展中心)
大數據(Big Data)作為信息時代獲取、處理與利用信息的一項核心技術,正在影響國家安全、社會經濟發展乃至人類生活的各個方面,已經成為信息時代各國競爭的新領域。2014年在巴西舉行的世界杯足球決賽上,德國隊1:0戰勝阿根廷隊,奪得桂冠。而幫助德國隊獲勝的“秘密武器”之一,正是悄然影響綠蔭場上強弱較量的“大數據”,可以說“大數據”是德國足球隊在賽場上的“第十二個人”。
德國隊在本屆世界杯的巔峰對決中最終勝出,可以說是以大數據為代表的新技術發展帶來的勝利。德國足協與SAP公司合作,定制了一款名為“視野中的比賽”(Match in Sights)的足球解決方案,用以迅速收集、處理和分析球員和球隊的技術數據,基于“數字和事實”優化球隊配置,提升球隊整體作戰能力,并通過分析對手的技術數據,找到在比賽中的“制敵”方式。
這款數據分析系統首先通過攝像頭、傳感器等工具捕捉到球員跑動的速度、位置、控球時間、防御方位、動作細節等大量數據,并傳入數據庫。隨后,基于SAP公司研制的HANA數據處理平臺運行的分析工具迅速對這些數據進行后臺分析和處理。
2012年4月,SAP公司斥資近5億美元研制了HANA數據處理平臺,其設計目的是迅速分析海量的銷售和運營信息,以及對電子郵件和社交媒體等非結構化數據進行分析,依靠計算機存儲器而非磁盤驅動器來加速這一程序。據SAP公司介紹,10名球員用3個球進行訓練,在10min的時間內可產生超過700萬個可供分析的數據點,HANA數據處理平臺可以對所產生的數據進行實時處理和分析。
德國隊通過這一數據分析工具可以迅速了解和評估比賽狀況、每個球員的特點、表現情況、防守范圍、對方球隊的空擋區等信息,從而教練可以對球員的上場時間、位置、技戰術等方面進行優化配置;同時,可以對對方球隊的技術數據進行分析,以確定相應戰術,提升球隊進攻能力。

SAP公司大數據專家在中國介紹HANA數據處理平臺
近年來,隨著移動通信、互聯網、傳感器、物聯網等技術的迅速發展,數據源種類和數據量持續快速增加,全球數據正在呈現爆炸式增長,數據已經滲透到每一個行業和業務職能領域,并成為重要的生產因素。政治、經濟活動與數據的創造、采集、傳輸和使用緊密相關,數據與自然資源、人力資源一樣,成為一項重要的戰略資源,掌握和使用數據資源的能力是國家數字主權的體現。
讓全世界嘩然的“棱鏡”事件,深刻地暴露出一些大國利用信息技術領域的優勢,暗中采集他國的數據信息,對其國家安全造成威脅。大數據研究和應用將對未來的科技與經濟發展帶來深遠的影響,一個國家擁有數據的規模和運用數據的能力將成為綜合國力的重要組成部分和企業間新的爭奪焦點。
實際上,大數據描述的是隨著數據量和數據類型激增而逐漸衍生出來的一種現象,不僅包括大規模的體量、多樣化種類的數據集,還包括對這種數據集進行高速采集、處理與分析以提取價值的技術架構與技術過程。IDC指出大數據具備其特有的4個特點,即數據量巨大(Volume)、數據類型多(Variety)、價值密度低(Value)、處理速度快(Velocity),簡稱“4V”。
大數據產業的生產活動涵蓋數據的獲取、整理、存儲、處理、可視化、應用服務以及信息共享等,其業務模式包括網絡數據與信息服務、企業和政府智能化管理決策、企業流程改造與變革等,涉及到互聯網行業、制造業、農業、商業、金融、醫療、氣象、衛生、交通及社會的其他各個領域……大數據正深刻地影響每一個產業的發展,并逐漸成為推動一個國家企業創新及社會進步的重要支撐力量。據美國咨詢機構Gartner預測,從現在起至2015年,大數據將會在世界范圍內創造440萬個工作崗位。
“得大數據者得天下”,這是一些推崇大數據時代的變革者的判斷。不少業內專家認為,在大數據時代,誰能夠有效地使用并壟斷數據,誰就有可能成為世界霸主。世界上許多國家已經認識到了大數據所蘊含的重要戰略意義,紛紛開始在國家層面進行戰略部署。為爭奪高新技術的發展優勢,迎接和應對大數據時代的發展機遇與挑戰,美國、歐洲、日本等國家和地區高度重視推進本國的信息產業和信息技術,紛紛投入巨額資金,制定一系列發展計劃。
(1)大數據研究和發展計劃
2012年3月,美國奧巴馬政府宣布投資2億美元啟動“大數據研究和發展倡議”,將大數據定義為“未來的新石油”,全面開啟美國大數據研發工作,這是繼1993年美國宣布“信息高速公路”計劃后的又一次重大科技發展部署,由美國國防部、美國國防部高級研究計劃局、美國能源部、美國國家科學基金會、美國國家衛生研究院、美國地質勘探局共6個聯邦部門和機構共同投資。
該計劃旨在大力推進大數據的收集、訪問、組織、開發和利用等相關技術的發展,進而提高和改進從海量和復雜的數據集合中提煉和獲取知識的能力和水平。這意味著美國將大數據正式提升到“國家意志”的戰略層面,將深度挖掘大數據的潛在巨大價值,帶動產業的升級換代,加速美國在科學和工程領域發明的步伐。
(2)美國國防部大數據應用情況
隨著高新技術的迅猛發展和運用,軍事領域發生深刻變化,全世界范圍內形成了以加速發展信息化武器裝備為核心的競爭態勢,美國軍方越來越認識到戰場內外利用大數據能力的重要性。美國軍方認為大數據是指從信號情報、手機和電子戰中所截獲到的衛星圖像、視頻圖像等一切數據。最近的一份外交關系委員會報告顯示,美軍無人飛機的數量從2001年9月的50架激增到2012年4月的7500架,這期間帶來的數據量增長顯而易見。
美國奧巴馬政府在“大數據研究和發展倡議”中推出了“X數據”(XDATA)項目,計劃在4年里耗資2500萬美元用以開發計算技術和防護數據軟件。美國航空航天局(NASA)也公布了先進的信息系統技術(AIST)、地球科學數據和信息系統(ESDIS)、全球地球觀測系統(GEOSS)、太空行動協議、行星數據系統(PDS)、太空望遠鏡科學研究所(MAST)、地球系統電網聯邦公共檔案等多個大數據行動計劃。
我們經常看到的天文奇觀預測報告,其中很多來自于NASA海量數據的收集、管理和分析。NASA約翰遜航天中心(JSC)從1959年至今,已收集400多萬張靜態圖像,總長度約2.9×106m的16mm膠卷,85000卷錄像磁帶,以及總時長81616h的視頻模擬及數字檔案。JSC還開發了一項名為“IO”(在線影像)的應用,能夠將影像文件名與所有相關元數據連接。為了將資源向公眾開放,這些資源進行代碼轉換,使其占用空間更小、可利用率更高,NASA和美國IT界聯合開發了一種高度可擴展的分布式批量處理系統“Hadoop”,對大型數據集進行掃描,處理從太空中(如太空望遠鏡)中傳回的海量數據。據悉太空中傳輸的數據量可達到700Tbit/s。
NASA好奇號火星車于2011年11月從肯尼迪航天中心升空,并于2012年8月6日降落火星,用于探索火星是否存在生命。在1年多的時間里,好奇號以每小時5萬張高分辨率圖像的速度,向地球傳回了大量數據。科學家根據這些數據,制成了13億像素的360°火星高清全景圖,由此發現了火星遠古存在河流以及當時環境適合原始微生物生存的證據。
(1)歐盟—開放數據平臺
2004年,歐盟委員會發起歐洲數字化議程,致力于利用數字技術刺激歐洲經濟增長,幫助公眾和企業最大化地利用數字技術。全新的開放數據平臺(ODP)是歐洲數字化議程的重要組成部分,它不僅提供數據,還建立了數據的統一語法規則,以保證包括數據發布機構、公眾、應用開發者等在內的任何人都可以十分便捷地在這個平臺上下載數據,也可以利用相關數據開發新的應用。
ODP開放的是最原始的、粒度最小的、未經過加工的數據,保證數據的廣泛性和真實性。截至2013年1月12日,ODP已經開放5815個數據集,其中大部分來自歐盟統計局(Eurostat)。這些數據集包括地理、大氣、國際貿易、農業等各類信息,提供dft、sdmx和tsv三種標準格式供下載使用。
(2)日本—ICT戰略計劃
2012年5月,日本總務省信息通信政策審議會下設的ICT基本戰略委員會召開會議,認為美國在大數據技術上處于世界領先地位,日本需要在大數據方面制定綜合性的發展戰略,需新啟動之前已經擱置的ICT戰略研究,并重點關注大數據應用。
同年7月,日本文部科學省發布了以學術云為主題的討論會報告,指出為迎接大數據時代學術界面臨的挑戰,將重點推進大數據收集、存儲、分析、可視化、建模、信息綜合的各階段研究,構建大數據利用的模型。
(3)聯合國—大數據白皮書
2012年7月,聯合國在紐約發布了一份關于大數據政務的白皮書—《大數據促發展:機遇與挑戰》,代表著對大數據的關注在全世界范圍內達到了前所未有的熱度。
白皮書指出,大數據時代已經到來,大數據對于聯合國和各國政府都是一次歷史性的機遇。報告對世界各國政府如何利用大數據更好地服務和保護人民進行了總結,并討論了如何利用大量豐富的數據資源幫助政府更好地響應社會需求,指導經濟運行。
在聯合國的建議和指導下,由澳大利亞出資在印度尼西亞首都雅加達建立了“脈搏實驗室”(Pulse Labs),以挖掘大數據的潛在價值。此外,烏干達也在首都坎貝拉建立了“脈搏實驗室”。
此外,加拿大、新西蘭、英國、法國、德國和印度等國家也在大數據領域進行了研究部署,加大了在大數據領域的投資,支持發展大數據市場研發項目,并紛紛推出本國的公共數據開放網站,推廣大數據資源的使用并從中獲得利益。
當前,我國的大數據正處于快速起步階段。業內專家表示,中國將形成全球最具潛力的大數據市場。IDC在2012年發布研究報告《中國互聯網市場洞見:互聯網大數據技術創新研究,2012》,對中國互聯網行業圍繞大數據的技術創新進行了專題研究。報告指出,“大數據”概念正在引領中國互聯網行業新一輪的技術浪潮,到2015年中國互聯網行業持有的數據總量將增長到8.2EByte,大數據領域的市場規模將增長至169億美元,平均每年的成長率接近40%。

好奇號火星車傳回大量數據
大數據技術領域的競爭與國家安全和國防安全緊密相關。面對改革和機遇,我們應積極研討大數據在航天領域的應用模式和思路,充分利用信息技術快速發展帶來的改革紅利,抓住大數據帶來的時代變革,取其精華,充分挖掘大數據與航天產業的結合點,使大數據真正成為軍工企業改革的助推劑。
(1)加強產品故障預測分析,確保航天產品高可靠性
數據既是航天理論的基礎,又是航天實踐的基石。航天大數據不僅具有大數據的普遍特點,而且具有高可靠和高價值的要求。將大數據分析方法應用在航天產品故障預測,可以有效提高產品質量,避免產品出現低層次質量問題及故障。通過收集航天產品在生產、測試、使用過程中的全部數據,利用大數據分析能力,將異常情況與正常情況進行對比,就可以預先捕捉到產品不同狀態的“信號”,從而在發生故障之前更換零件或者修復問題。例如,通過收集加裝在火箭和導彈武器上的全部傳感器數據,建立大數據故障預測分析系統,充分利用大數據的預測能力,可以給出可能出現故障的先驗信息,提早防范,提前預警,從而可以降低航天產品的故障率,確保航天產品的高可靠性。
(2)加強戰場態勢數據分析,建立戰略預警監測系統
從最近的幾場局部戰爭來看,每次爆發戰爭前,敵方均會按需提前部署航母編隊、天基衛星資源,從而導致核心交戰區域的信息不對稱性。隨著體系作戰的概念逐漸深入,未來無論是局部戰爭還是核戰爭,我軍都需要準確高效的預警系統對敵方導彈武器發射的時機和方位進行預測,提早部署進攻武器和攔截武器,快速進入發射流程。例如,我軍可以根據相關情報信息和偵察信息,結合已有歷史數據,開發監測敵方態勢的預警模型,通過大數據分析對敵方航母編隊等典型目標的位置區域、敵方導彈武器的發射窗口等進行有效預測,給出我軍的進攻或防御策略,為戰場指揮員提供輔助決策信息,使大數據成為一種可用的戰場資源。
(3)加強軍貿產品需求分析,積極爭取市場競爭優勢
國外大型超市及在線購物網站最初曾利用大數據,對消費者喜好進行預測,以根據市場需求調整商業發展策略。在當前運載火箭和武器裝備系列化、型譜化的發展趨勢下,同樣可以利用大數據,對各種運載器對搭載載荷的要求以及各種導彈武器型號的最佳作戰應用等一系列問題進行分析。例如,通過對各個型號的運載和武器產品進行有針對性的模型建模,結合歷史試驗數據、發射數據等,建立一套面向用戶選擇的航天產品應用需求分析系統,通過大數據分析系統做出有針對性的解答。尤其在未來新型號和新產品的研制方面,可以提出產品的布局建議,使型號的系列化發展更加規范和合理。
(4)加強航天武器裝備智能化發展,全面提升戰場作戰能力
未來戰爭具有多維化、信息化以及快速化等特點,作戰范圍將由內空間擴展到外空間,打擊目標的種類也將繁雜多樣。同時,隨著人工智能技術、微電子技術和信息技術的快速發展,航天武器型號也向智能化方向發展。將大數據的發展和航天產品發展相結合,以大數據思維引領航天領域的智能化發展,使大數據成為航天產品智能化發展的有力工具,從而提升運載和導彈武器的自主性、決策性,為未來運載和武器型號具備在線自主決策能力、實時任務規劃能力、快速指揮控制能力、自我檢測與維護能力等多種能力,提供強有力的支撐。
在當今信息時代,隨著互聯網、物聯網、云計算等高新技術的快速發展,全球數據量呈現爆發式增長,大數據所蘊含的巨大價值正在逐步顯現,“大數據”勢必成為整個信息界乃至全社會的熱點,企業將朝著個性化、創新型、智能化方向轉變和發展。充分挖掘和利用大數據優勢,將大數據應用與我國航天領域發展相結合,對我國航天事業的創新發展將產生深遠影響。