孔祥芬,蔡峻青,張利寒,唐杰,侯晨光
1.中國民航大學 航空工程學院,天津 300300 2.中國航空綜合技術研究所,北京 100028
當今世界正在產生越來越多的數據,這些迅猛增長的數據已經遠遠超越常規軟件工具所能處理的范疇。作為大規模數據的有效處理手段[1],大數據技術自問世以來,就得到了廣泛關注[2-3]并已經在電力、水利、醫療、氣象[4-7]等領域獲得了迅猛的發展。美國政府、英國政府及歐盟委員會等[8-11]已紛紛將大數據提升至戰略高度,中國也相繼出臺大數據白皮書[12]與行動綱要[13]以引導和鼓勵各領域在大數據分析方法及關鍵應用技術等方面開展探索研究。
航空系統生來擁有大數據基因[14]。作為由眾多系統及零部件構成的復雜產品,現代化飛機裝載的傳感器能夠記錄數以千計的飛行參數,每次飛行,僅僅是發動機就能產生1 TB數據[15]。除了這些飛行數據,維修基地、庫存系統以及各種監管機構也產生大量的數據,這形成了航空系統的大數據爆炸。大數據技術為解決當前航空系統面臨的問題帶來了新的機遇,航空大數據可以集成多部門、多源、多尺度的結構化及非結構化數據,借助云計算、人工智能等新型分析手段,實現集成分析和信息挖掘,有助于提高飛行安全性、減少運行延誤、更好地管理備件、預測各種設備的維護情況以及提高機隊的燃油經濟性等,包括設計、開發、生產和運營在內的整個航空產業鏈都將從中獲利。此外由于信息化基礎、業內競爭和市場開放的要求,航空系統也必須與大數據分析結合[16]。
目前已有不少專家學者以及原始設備制造商(Original Equipment Manufacturer,OEM)、運營商(Maintenance, Repair & Operations,MRO)等企業對大數據在航空系統的應用進行了研究,并且實驗成果正逐步轉化為實際應用,但由于航空系統屬于保護性行業以及數據的保密性,整體的研究依舊以企業作為主導。本文將于第1節介紹學術界研究現狀,第2節分別介紹航空工業界在大數據采集、傳輸與存儲、分析平臺以及行業內應用的研究現狀,第3節指出當前面臨的挑戰與發展趨勢,第4節為結論。
從定義看,數據是對客觀世界進行量化和記錄的結果[17]。這種記錄的粒度越來越細、維度越來越多、頻度越來越密,形成了“大數據”。大數據一般被認為是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合[18]。要想讓大數據在面對規模龐大、高速增長和形態多樣的信息資產時具有更高的決策力、洞察力以及流程優化能力,必須開發新的處理模式[19]。
相對于傳統的數據集合,將大數據的特點概括為“5V特性”[20]:規模性(Volume)、高速性(Velocity)、多樣性(Variety)、價值性(Value)、真實性(Veracity)。規模性是指數據量龐大,數據洪流已經從GB、TB級上升到PB、EB、ZB級。高速性有兩層含義,一是數據量增長快,數據以數據流的形態快速、動態地產生;二是數據處理速度快[21]。多樣性是指數據類型繁多,并且包含結構化、半結構化和非結構化的數據。價值性一方面是說價值密度稀疏,另一方面是指潛在價值高,合理運用大數據,可以用低成本創造高價值。而真實性是對數據質量的要求[22]。
學術界對于新事物的出現一直保持著高度的敏感,大數據發展早期階段,《Nature》《Science》就已經推出專刊[23-24]深入討論了數據洪流所帶來的挑戰,并指出如果能夠更有效地組織和利用,這些海量數據將帶來巨大利益。
當前大數據發展較為迅猛的領域主要集中在計算機、醫療、電力、水利等領域。廖湘科等[25]針對大數據處理對計算機高性能計算設計帶來的挑戰,介紹了天河二號超級計算機系統所采用的多種優化措施,為大數據時代的超級計算機設計提供參考。薛付忠[26]創建了涵蓋健康/疾病檢測、風險評估與干預的“大數據驅動的健康/疾病管理學理論方法體系”,并以此大力推進健康醫療大數據產業化發展。Kalam等[27]采用大數據分析技術對過電壓、低電壓事件與環境溫度、事件發生時刻、電壓幅值等數據之間的關系進行研究,分析了住宅光伏發電裝置和氣溫變化等因素對配電網低壓供電點的影響。Li等[28]研究基于超閾值廣義帕累托(Peak Over Threshold/Generalized Pareto, POT/GP)模型的水流大數據分析方法,并利用該方法對丹江口水庫的洪水進行預測。
同時,相關的基礎設施建設也在逐步跟進。歐美等發達國家由于技術的領先地位,率先將大數據運用于醫療衛生等領域,并建立了專門的技術中心以及數據處理中心,以支持大數據的研究與應用[29-31]。國內許多高等院校和研究所也開始成立大數據的研究機構,同時有關大數據的學術組織和活動也紛紛成立和開展。從2012年起,中國機械工程學會、中國計算機學會以及中國通信學會等各大學會逐步組建專門的大數據委員會[32],并以論壇、大賽、會議等形式進行大數據的交流,教育部也開始對各高校大數據技術的研究進行了更多關注[33]。
為了有效地利用大數據,有必要開發和使用可視化方法和計算工具。Park等[34]表示,有必要利用航空領域的大數據以及各種數據分析與可視化技術來收集和積累系統數據。Qin[35]介紹了一種使用飛行記錄器數據的工業大數據可視化研究方法以發現影響飛機燃油效率的因素,并將數據處理和可視化的方法歸納為5個部分:靈活的數據準備、交互式探索、大數據可視化、統計驗證和報表自動化。然而整個數據可視化過程皆由R語言實現,尚無法得知該方法在Python等語言上的適用性及其與其他組件和語言的交互性。
相對而言,學術界在航空大數據可視化的研究主要集中于機場方面。Sang等[36]利用清州國際機場的大數據分析了創造需求的方式,但是可視化的內容不夠充分,分析工具沒有經過獨立驗證證明是可靠的。Hwang[37]利用社會網絡的大數據對襄陽國際機場用戶的服務趨勢進行定量和可視化分析,明確客戶對機場服務的不同意見所導致的影響,從而給供應商提出建議。該研究在大數據信息提取中采取的關鍵詞方法簡潔高效,但是可視化分析結果與關鍵詞的選取高度相關。Rehm等[38]討論了兩種最近的高維數據可視化技術,將航空數據和天氣數據可視化,從而進行運營優化,并展示了在歐洲主要機場的實際應用。兩種技術都可以很好地將歐洲機場的航空數據和天氣數據可視化,目前主要的局限性在于運算速度。此外,鑒于歐洲各國多為地中海氣候,而世界各國機場所處氣候帶不同,天氣狀況存在差異,在使用過程中需針對性調整。Rathod等[39]對機場等待時間進行了探索性分析,從美國最繁忙的前三名機場(亞特蘭大、芝加哥和洛杉磯)采集數據,應用了多種數據可視化技術,討論了這些機場在各種可視化方面的比較。該可視化分析結果將有助于預測旅客等待時間,可利用該方法結合各機場空間布局對等待時間進行優化。
大數據應用于航空系統,很大程度上將用來提升旅客滿意度以及自身的運營收益。通過了解機場乘客的動態流量,大數據分析有助于規劃機場系統的進度。隨著社交網絡的普及,航空系統正逐步利用網絡平臺進一步提升旅客服務和競爭力。意識到這種大數據分析的新趨勢,Chen等[40]提出了基于社交媒體平臺的乘客價值模型,并以新浪微博中的中國南方航空為例,表明大數據分析能夠幫助航空公司更好地了解乘客并改善客戶關系管理。Tom等[41]使用大數據來預測希思羅機場的乘客流量,以改善移民、安全系統滲透、登機和離境的情況。
對于航空大數據輔助運營,Clemons等[42]使用大數據技術來描述1998—2014年間的美國航空運輸系統,通過將這一層次上發生的變化與外部事件相關聯來分析行為驅動因素以及航空公司運營指標,并基于歷史數據構建了一個數據挖掘工具箱以指導對未來系統特征的預測。Kasturi等[43]基于多種啟發式方法對大規模航空數據執行大數據分析,提出航空公司航線盈利能力優化模型,實際效果證明該方法分析簡便,有助于優化決策過程。Kim等[44]將大數據分析中的文本挖掘方法應用于航空業,對每年潛在的主題文章內容進行分析,提取并確定航空業的趨勢和前景,但研究僅限于包含航空相關關鍵詞的文章。
此外,在健康管理領域,陳金等[45]基于現在可用的數據和可預見的未來,為民航飛機健康管理提供了一個大數據分析和應用平臺的設計。雖然并不完善,但可以滿足當前的需求。Li等[46]提出了一種飛機健康管理的大數據體系結構,為世界各地運營的飛機提供管理和分析服務,以此解決故障覆蓋率低、故障隔離率低、誤報率高以及維護效率低等問題。Li等[47]還提出了一個便于民航發展的民航飛機大數據平臺,從多種數據源收集數據,為民用飛機提供決策支持及應用系統。Xu和Kumar[48]介紹了基于機器學習的大數據分析框架,并將其用于提高輔助電源單元健康監測服務的質量和性能,目前已將準確度提高到60%。此外,文中指出:為互聯網公司以及網絡應用程序所開發和使用的許多機器學習算法不能直接應用于航空領域,并且大數據技術可能不易用于工業領域。這兩條意見需引起相關專家學者重視。
國內外學者在大數據分析領域也進行了有意義的探索。Singh和Kaushik[49]為了從大數據中獲取有價值的預測信息,定義大數據中間層體系結構來執行查詢分析和大數據評估。提出以元數據的形式存儲數據集的所有方面,以使用戶查詢將在選擇性數據集而不是整個數據集上執行,并提供一個優化的方法來執行數據清理以及數據關聯和分類,但該方法在效率上仍存在問題。Athan等[50]描述了一種新穎的分析系統,可以對大型航空數據流進行查詢處理和預測分析。然而該系統必須與航班數據進行關聯才能分析,且目前硬件僅由3臺物理服務器組成,若擴大使用需考慮兼容性問題。Anandavel等[51]介紹了開發和使用大數據基礎架構分析航空數據的方法,并利用大數據分析領域的最新工具和技術來改進維修決策。不過研究中使用案例較為簡單,還需要復雜航空數據對該大數據分析架構進行檢驗。
本節主要介紹航空系統中大數據采集、傳輸與存儲,航空大數據分析平臺基礎架構和大數據應用等方面的現狀,同時也對航空系統中典型的大數據分析平臺進行簡要闡述。
大數據技術的核心價值在于對數據進行深入挖掘分析,提取有意義的信息從而對數據進行增值。美國聯合航空公司[52]曾表示航空系統在數據收集上一直做得很好,而在數據利用上卻并不很擅長。C919總設計師吳光輝[53]也認為迄今為止航空大數據的潛能仍然沒有得到很好挖掘。國泰航空董事長John Slosar、印度尼西亞鷹航首席執行官Wiobowo以及澳洲航空首席執行官Alan都曾指出[54]:從數字經濟的發展趨勢看,航空公司必須不斷發展挖掘大數據的技術手段,建立強大的IT根基,未來市場將淘汰今天不肯在大數據挖掘和分析領域投入的航空公司。目前為止,所有發動機生產商,從普拉特·惠特尼公司(P&W,簡稱普惠)到GE以及CFM集團[55]都在通過應用大數據,改善提供給航空公司的產品,而各航空公司及維修基地也立足自己的數據資源進行大數據平臺的開發。
基于機載傳感器[56]的大數據獲取技術主要分為民航領域普遍應用的快速存儲記錄器(Quick Access Recorder, QAR),航空裝備制造商普遍使用的遠程診斷(Remote Diagnosis, RD)數據采集技術,以及軍用航空裝備領域普遍應用的基于飛行數據管理系統(Flight Data Management System, FDMS)的數據采集技術。QAR飛參數據獲取技術通過機載快速存取裝置,可同時采集包括飛機飛行姿態、機上設備運行狀態、燃油使用量在內的數百種數據。RD數據采集技術則通過飛機渦輪風扇發動機上的傳感器采集發動機在起飛和降落階段的各種關鍵參數。基于FDMS的數據采集技術則是通過軍用飛機內部的飛行數據管理系統收集數據,收集的數據類型涉及飛機的發動機、飛控、導航和供電等機載系統的各項信息。
現在,有不少制造商都在如何采集、傳輸和存儲飛機傳感器數據方面開展工作,提出相應的解決方案。霍尼韋爾公司[57]開發了JetWave高速通信系統,可以將飛機運行數據實時傳送到地面,提高飛行效率和安全。波音公司[58]研發出飛機狀況管理系統,不但可以采集并傳輸飛行數據,還可以進行數據分析預測故障,從而實現維修預測。ARINC公司[59]開發完成了飛機狀態分析和管理系統,該系統可以采集分析飛機上多個來源的數據信息,進行故障診斷,并評估故障部件對飛行的影響,使維修技術人員可以提前準備好航材備件及拆裝工具,降低航班延誤的風險。聯合技術航空系統(UTAS)公司開發出飛機接口裝置(Aircraft Interface Device, AID)用來收集和利用來自飛機的各種數據。該裝置作為預測飛機健康的數據中心,無論是在飛行過程中或是在地面都可以通過多種方法將數據傳送給飛行員或者工程技術人員,AID還可收集來自于飛機外場可更換件的數據并進行視情診斷。除了AID,UTAS公司還在開發新的系統用于飛機內部的傳感器、作動器和數據處理網點之間的無線通信,其中的一個目標是可以收集更多的數據進行故障診斷。
而普惠在航空大數據采集、傳輸與存儲上都已有相應成果。普惠推出了[60]用于在線收集各飛行階段發動機數據的先進診斷與發動機管理(Advanced Diagnostics and Engine Management, ADEM)工具,對在役的7 000多臺普惠發動機進行基于實時數據的專家分析。與此同時,為提高數據的存儲和計算能力,普惠與IBM、麻省理工全球運營領袖項目及聯合技術研究中心等[61]展開合作,將商務、工程和制造系統都通過IBM云進行管理,憑借IBM的支持以增強其對4 000多臺在役商用發動機的性能監控能力,為客戶提供更長的在翼時間、更強大的發動機機隊管理和健康解決方案。普惠加拿大公司的基于飛機聯通性的飛行數據采集、存儲、傳輸(Flight data Acquisition, Storage, Transmission, FAST)解決方案,是用無線方式采集和傳送飛行過程中的飛機和發動機數據。FAST將分析數百個與性能相關的數據,如速度、溫度、壓力,以提供接近實時的發動機健康、使用和性能趨勢的監控。
此外,羅爾斯·羅伊斯(簡稱羅羅)正收集和分析[62]發動機的設計、生產、機隊和運行方面的數據,以及了解天氣條件、機場設施、飛機滑行情況和周轉時間等方面的數據與微軟合作開發“智能發動機”。中國東方航空機務系統[63]也在全面整合與統一整個機隊數據,并進一步擴大對飛機各系統的數據采集與分析的覆蓋范圍,為后續利用大數據技術全面保障機隊的持續、穩定、高水平運行打下堅實基礎。澳洲航空公司、中國國際航空股份有限公司、深圳航空有限責任公司也都引入了數據采集系統并收集了大量的數據,為大數據技術的全面應用做出充分的準備[64]。
2.2.1 航空大數據平臺基礎架構
當前接納程度較高的航空大數據平臺基礎架構主要思想是利用分布式文件處理系統作為航空大數據的存儲框架,利用分布式計算技術作為航空大數據的處理框架。架構中包含數據采集及預處理、數據倉庫、大數據訪問框架等模塊,整體上可以分為數據層、分析層與應用層三大塊。其中航空大數據生成和采集是一切工作的前提,而航空大數據的安全存儲是完成工作的保障。
1) 采集和預處理。航空數據的采集,即指使用某種技術或者手段獲得原始數據的過程。數據采集不僅要考慮數據源的物理性質,還要考慮數據分析的目標。為使數據記錄做到全方位、全過程、全納和非干預的采集,不會造成結構性短缺,除結構化數據的采集,圖片、視頻、語音等非結構化的數據也屬于采集對象。
由于數據來源結構復雜,采集的原始數據中常常會存在與數據分析目標相關性不大的成分。再加上不同的系統擁有不同的標準,而這會導致數據的冗余和不完整,形成大量模糊信息,因此需要對采集后的數據進行預處理。數據的預處理以實現互操作為基礎。此外,傳統的數據預處理技術主要針對規模較小且語義清楚的結構化數據,而大數據的融合和質量控制仍然是一個需要深入研究的問題,需要結合大數據的異構性、冗余性和相關性等特性深入分析。總之,數據預處理過程是重要環節,通過數據預處理,為大數據分析的順利進行開辟了道路,也是高效率完成大數據分析的前提和基礎。
2) 存儲和共享。大數據存儲框架構建在通用的設備上,可以使該架構所需的硬件具有低成本和高擴展性的特點,標準的設備即可成為該架構的終端構成單元。目前Hadoop逐漸被互聯網企業廣泛接納,Hadoop分布式文件系統(Hadoop Distributed File System, HDFS)可以實現計算節點上的數據存儲,從而實現對數據的高吞吐率,其可以部署在大規模廉價硬件集群上的特點使其特別適合于大規模數據存儲。
航空相關企業已經收集了滿足自身的數據,但這些航空大數據分散存儲在不同的地方、不同的系統中,造成了服務目標單一、數據利用效率不高等問題,且大多無法處理和分析海量、多源、異構的信息資源。同時數據庫之間存在著缺乏統一、有效的數據管理和共享機制等問題,形成了諸多“信息孤島”。此外,航空數據分散存儲在各自系統中,容易造成數據的安全漏洞,因此需要研究如何實現分散存儲數據之間的融合及同步處理分析技術,對存儲的數據進行數據共享。首先,需要對已經存在的航空信息系統的原始數據進行分析,了解各類數據的數據結構和數據之間存在的邏輯關系。在此基礎上制定統一的數據存儲和共享標準,通過統一的技術架構和集成方法,有效降低數據交換和共享的復雜度,提高數據使用效率。繼而制定航空大數據的資源目錄,對數據接口、數據格式以及數據編碼進行統一定義。然后,需要定義數據整合規則及策略,并建立嚴格的數據校驗機制和數據共享機制。最后,開發分布式云平臺的數據存儲技術,實現基于云平臺的數據統一存儲和共享。
3) 大數據分析。大數據存儲框架之上是通過網絡層連接的大數據訪問框架與大數據調度框架,大數據調度框架實現了對大數據的組織與調度,為數據分析提供了必要條件。大數據分析是航空大數據平臺的核心,是指對海量類型多樣、增長快速、內容真實的數據進行分析,從而找出可以幫助決策的隱藏模式、未知的相關關系以及其他有用信息的過程。
大數據分析一般利用分布式計算集群對數據進行可視化分析、數據挖掘算法、預測性分析能力語義引擎等。可視化分析是對數據進行關聯分析并做出分析圖表,使數據直接展現在用戶面前。數據挖掘是從數據中提取隱含在其中、人們事先不知道、但又潛藏有用的信息和知識的過程。預測性分析能力是指應用統計學方法,根據可視化分析和數據挖掘的結果來對未來發展進行預測的手段。語義引擎指的是對用戶的查詢關鍵字進行處理,引申語義含義從而更加準確、全面實現用戶檢索。
航空大數據分析主要有批處理和流處理兩種方式。在批處理研究方面,MapReduce是常用的批處理引擎,然而MapReduce雖然能夠有效解決大數據處理中性能不足的難題,卻無法高效地支持算法邏輯運算。而類MapReduce的通用并行框架Spark具有更高的效率和數據獨立性,以及更高的執行效率。在流處理方面,Storm是較為常用的流式處理系統,其采用消息流的處理模型,消息一旦產生就開始傳遞和處理。
4) 其他。大數據調度框架之上是智能應用系統。在應用層面,需要針對航空相關技術領域,深入開展大數據技術應用需求分析、場景設計、分析模型、專業方法的研究,催生具體應用。航空系統是一種高維非線性的復雜系統,對其中的子信息源而言,一方面可以單獨應用大數據技術,提升其價值,另一方面可以融合不同的子信息源,在更高的層面上構建大數據平臺。此外,大數據的管理、安全和備份恢復框架用來幫助進行大數據的治理和保護。
2.2.2 典型航空大數據平臺
事實上,整個航空系統已有不少企業將其大數據分析技術綜合利用形成大數據分析平臺。較為出名的有GE推出的Predix平臺,波音推出的AnalytX平臺,普惠推出的Engine Wise平臺,空客Skywise平臺,法荷航Prognos平臺以及漢莎旗下的Condition Analytics與AVIATAR兩大平臺。
1) GE Predix平臺。早在2013年,GE便已經發現了大數據的廣闊前景,并開發出一個基于云計算的軟件平臺Predix。此后幾年,圍繞Predix平臺,GE進行了大量的動作。2014年,GE已經將各種工業設備的管理方案,整合成了四十余種數據與分析解決方案。2015年,GE成立了“GE Digital”,并宣布將Predix全面對外開放[65]。2016年初,Predix平臺正式開始運行,成為首個面向全球工業領域、專為工業數據分析開發的云服務平臺。
一開始的Predix只是一個GE飛機引擎的配套軟件服務,用來對飛機引擎進行預見性維護,借此避免設備停機。而后,Predix的應用擴大到GE旗下的其他工業業務。最后,基于戰略需要,Predix被GE重新定義為在工業應用中基于云的操作系統。Predix平臺以連接工業資產設備和合作供應商各類信息系統為基礎,提供端到端的安全連接、實時性的設備資產監控以及云端大數據分析,還能夠按行業客戶需要,按照Predix開發規則進行個性化、定制化的軟件開發和部署。Predix結合自身的層次化技術構架,包含3個層次的服務:包括“數字雙胞胎”、預集成的標準化工業數據挖掘和分析工具等在內的應用層;包括應用開發服務以及資產、分析、數據、安全、運營服務六大核心服務在內的工具庫;通過軟件和互聯網的方式,提供物聯網邊緣的設備接入、管理、應用服務的Predix邊緣服務。
作為全球第1個專為工業數據與分析而開發的操作系統,它能夠快速獲取、分析海量高速運行的工業數據,做到對機器的實時監測、調整和優化,提升運營效率。此外,相比于傳統大數據存儲技術,航空大數據存儲技術需要有專門的工業解析協議來解析收集的航空數據,GE開發的Predix工業互聯網平臺可支持7種工業通信協議,并具備相關工業設備運行數據的實時傳輸與解析能力,可以與各種云環境中的應用和服務進行無縫銜接,將其用于發動機狀態監控,幫助發動機監控團隊捕捉更多的數據,使數據分析變得更精確、更快捷。同時,結合GE自身在運營安全和信息安全領域數十年的經驗,大數據的安全存儲問題也將得到保證。
2) 波音AnalytX平臺。2017年第52屆巴黎航展期間,波音宣布啟動AnalytX,將全公司800多名分析專家匯聚在一起,將數據轉化為可執行的見解和客戶解決方案。直至MRO歐洲會議和展覽會結束,AnalytX解決方案已為波音公司帶來223份分析合同。
該平臺是將波音現有分析服務和產品聯合在一起的企業能力,提供量身定制的分析驅動產品和服務組合。AnalytX應用科學流程,通過先進的數據收集和處理能力,然后將其與航空專業知識相結合,提供智能解決方案,幫助客戶做出數據決策,從而在飛行任務優化、維護和工程優化、供應鏈和庫存優化、機隊性能和可靠性分析、降低燃油成本、降低風險、提高效率以及預測性維護等領域提供產品和服務,所有這些產品和服務都旨在加強數字化轉型和MRO價值提升。目前,AnalytX已開發出一系列新服務,這些新服務能以更快的流動時間,更低的運營成本和更高的端到端可靠性形式推動著創新生命周期,隨著這些工具的引入,AnalytX平臺將能更高效、更經濟地為客戶提供大量規定性、預測性和描述性解決方案。
3) 普惠Engine Wise平臺。2017年4月25日,普惠于弗羅里達州奧蘭多市宣布推出商用發動機服務平臺Engine Wise。Engine Wise依托大數據技術,采用尖端的數據分析、實時信息輔助決策、高速靈活的響應等,能夠提供智能解決方案,可以更好地代表普惠所提供的服務,展示其為客戶機隊的可預測性、可靠性及健康做出的不斷改進,同時還能夠不斷改善與客戶的溝通,推動與客戶之間更加透明、更加緊密聯系的工作方式。目前該數字化分析平臺的服務對象已從PW4000發動機擴展至V2500發動機,并已實現了關鍵過程的自動化[66]。通過Engine Wise,普惠正在統一其售后服務產品組合并將推出新的服務來支持客戶不斷發展的需求,該服務品牌旗下的主要服務包括機隊管理計劃、發動機大修服務以及材料解決方案等,同時普惠還與客戶合作開發整個生命周期的新產品。
在Engine Wise服務品牌下,普惠正在拓展電子飛行數據采集存儲與傳輸(eFAST)系統[67]的可用性。這套近實時的機載數據抓取與傳輸裝置能夠在整個飛行周期內捕捉幾萬個預定義的飛機及發動機數據,并自動傳輸至客戶網站進行分析以優化運營與維護。目前eFAST系統的服務范圍已從龐巴迪C系列飛機擴展至空客A320neo等機型,在這些飛機上應用eFAST的全面數據訪問和準確性,更快地識別和驗證根本原因和糾正措施,從而對事件做出更快、更好的響應,加快了技術解決方案并減少了發動機和部件的計劃外維護。普惠正在努力在不久的將來將Engine Wise平臺擴展到其他飛機型號。此外,普惠正大幅投資全新技術與資源以提升響應速度與靈活度,并結合運營商的需求及提出的建議開發數據獲取與預測分析工具以幫助運營商制定減少運營干擾并增加飛機使用的建議,運營商屆時可更好地了解有關其機隊與整體運營的情況。
4) 空客Skywise平臺。作為波音的老對手,第52屆巴黎航空展期間,空客與大數據集成和先進分析的先驅Palantir Technologies公司合作推出了Skywise航空數據平臺。Skywise旨在成為所有主要航空公司使用的參考平臺,以提高其運營績效和業務成果,并支持其自身的數字化轉型。Skywise可以為所有用戶提供一個單一入口,將來自各個渠道的豐富的航空數據以及運營方以前跟空客在獨立服務器上分享的數據資源整合到一個安全的云平臺上,幫助運營商通過全面的數據來進行他們自己的分析和決定。更重要的是,通過將運營、維護和飛機數據整合到一個安全并開放的平臺上,航空公司可以在無需更多設備投資的情況下儲存、提取、管理和分析選定的空客數據以及他們自己的數據并和全球基準數據作比較,這所創造的價值很快會給空客的用戶提供關于飛機、機隊、公司和全球航空業的更好的見解。
通過數據平臺的知識、全球數據和航空航天經驗的獨特組合,Skywise將在以下關鍵領域幫助用戶提供服務:減少飛行中斷、預測性維護、降低成本、運營優化、飛行操作優化、改造機艙和機坪運營以及針對突發情況的快速決策。此外,Skywise還提供分析業務、API和應用程序等延伸性服務,并可以根據客戶需求量身定制,從而確保整個數據鏈的連續性以及整個價值鏈的優勢。支持平臺的技術能夠與客戶現有的IT基礎架構無縫協作,并提供超越標準開源軟件所能實現的功能,而其核心技術能幫助用戶更好管理復雜的大數據,同時還可以讓用戶在商業成果中獲得更多數據。
5) 法荷航Prognos平臺。自2015年起,法荷航維修工程公司(AFI KLM E&M)就擁有了自己內部的大數據平臺[68]。2016年,法荷航通過連接到所有客戶數據源信息,獲得了客戶的全方位了解,并依此開發了許多個性化的服務。2017年,法荷航推出Prognos平臺,該平臺是由一系列從飛機各系統挖掘數據的軟件解決方案組成的一整套完善的預測性維修數據分析工具。Prognos中包括發動機監控軟件,可為該公司保障范圍內的所有發動機進行數據監控,并通過利用大數據技術提前識別出即將發生故障的部件,為運營商降低成本。當前,法荷航正在測試Prognos中關于發動機健康監控的產品,以及針對A380飛機的Prognos應用,其中A380飛機的數據來源于空客的大數據系統。此外,法荷航維修工程公司還表示目前正在開發用于波音747和787的非發動機部件的分析平臺以成為OEM支持服務的有益補充,新服務將集中在可能引起大部分航班取消和延誤、且已擁有大部分數據的監控系統。
6) 漢莎Condition Analytics及AVIATAR平臺。德國漢莎技術公司意識到,主要的發動機制造商都在研究大數據分析平臺,以加強預測性維護,因此,2017年第一季度,漢莎發布了一款將狀態監控與維修預測兩項功能合二為一的狀態分析平臺——Condition Analytics。該平臺引入了航空公司的運營數據和專業工程知識,而且結合實際案例進行大數據分析,使零部件的維護修理更具預測性。漢莎力圖通過這一工具,逐漸以預測性維修工作替代原來以故障排除和狀態監控為主導的維修方式。更為重要的是,漢莎可以依據各家航空公司的要求配置定制化的Condition Analytics平臺,短期可預見的是這一工具能夠幫助航空公司降低成本、提高飛機可靠性和安全性。
針對航空業務的技術和運營,2017年初,漢莎還推出了一個獨立、開放且模塊化的數字平臺——AVIATAR,該平臺的出現為不同數字化機隊管理的應用軟件提供了一個綜合化的網絡平臺。AVIATAR的開放和模塊化架構不僅可以安全地存儲航空公司的運營數據,而且可以將數據用于預測維護方案、狀態監測和故障分析。此外,航空業的運營商和其他參與者可以通過AVIATAR降低后續成本,實現航空公司運營優化以及更安全、更可靠的機隊管理,為世界各地的乘客提供更優質的服務。AVIATAR提供各種應用程序供用戶選擇并可以根據用戶的技術要求進行調整,同時,漢莎還將該平臺作為應用程序的中央連接樞紐,允許合作伙伴、客戶、開發商的應用程序連接到AVIATAR,共同為航空業提供數字產品和服務。目前,AVIATAR平臺已經加載了交互式世界地圖,以提供更為細致、實時的服務,并實現更為簡便、高效的人機交互。
相比于國外知名航空大數據分析平臺,中國部分航空企業也已建立了大數據分析平臺,但目前僅限于自身內部使用。南航的大數據平臺分為兩個部分,分別是大數據服務平臺和大數據處理平臺,其中大數據處理平臺基于Hadoop建立,已成功解決南航的大數據存儲問題。隨著空客A380、波音787等機型的遠程診斷系統模塊的正式完成,2016年,“飛機遠程診斷實時跟蹤系統”第4代原型面世,這標志著南航對于飛行大數據的研究全面進入工程應用階段。中國航空Ameco工程部憑借廣泛的合作研究以及多年飛機維修的管理經驗和監控技術的開發經驗,已建立了具有自主知識產權的飛機狀態預測和維修作業管理平臺。該平臺已經在國航的數百架飛機上累計完成了500多萬飛行小時的試驗驗證,未來將會在國航全機隊中逐步推廣和應用。海航建立了飛機健康管理大數據應用平臺,該平臺通過對飛機狀態的實時監控和健康管理,及時發現隱性故障、運行不正常事件,優化機隊維修和工程管理水平,能夠有效提升機隊安全運行品質和維修效率,為航空公司維修控制、工程管理、航線維護部門帶來極大的便利。海南航空也正在利用新的大數據分析工具Amadeus預訂分析系統,幫助公司掌握在更大市場范圍內的營運狀況,制定更切合實際的有效業務戰略。
相比于專家學者,航空系統相關企業對于大數據輔助決策、預測維修、輔助運營等方面的功能擁有更高的熱情以及更為現實的需求。相關航空企業早已將大數據分析技術應用于自身的生產運營實踐中。
2.3.1 航空大數據輔助決策
羅羅是首先使用發動機數據進行革新的原始設備制造商之一,在大數據被炒得火熱之前就已經采用大數據分析了。早在2006年,羅羅就已經通過衛星,實時監測3 000多個發動機數據并進行分析。特別是通過行業首創的發動機健康監測系統,羅羅早已成為航空制造業大數據采集和應用的領軍者。羅羅在飛機發動機的制造和維護過程中,也采用了大數據分析[69]。羅羅發動機中配備了大量傳感器用來采集發動機的各個部件及系統的數據,通過專門的算法導入引擎健康模塊的數據采集系統中進行數據分析,可以幫助羅羅提前發現故障并幫助客戶更及時有效地安排發動機檢測和維修,因此一些業內人士也將其發動機稱為“大數據引擎”。
由于現有的數據處理工具已經無法滿足航空業越來越極致精細準確的要求,空客公司2014年開始投入資金與Oracle共同建立基于Hadoop技術的大數據處理系統及飛行模擬數據分析軟件,空客公司內部隨之成立了“數據處理與試飛集成中心”收集并分析來自事先安裝在飛行樣機上的傳感器在試飛過程中產生的數據,并決定使用Google公司的MapReduce技術來提高數據訪問和處理的效率。一旦整個流程成熟固化后,很多真機飛行試驗可通過數據模擬預先進行甚至替代,同時可保證飛機的安全可靠性,這幫助空客公司大大降低了研發成本,也保證了交付周期。
2015年,波音與卡耐基梅隆大學的計算科學學院進行合作,利用其先進的人工智能與大數據技術對波音飛機進行全面升級[70],用數據來指導設計、制造、運營及維修預測等方面的工作,同時雙方組建了航空數據分析實驗室。2016年7月19日,波音與微軟公司簽署合作協議,把波音的航空分析應用轉移至微軟Azure云平臺,結合波音自身專業且豐富的航空數據資源以及微軟的云技術,加速實現維修預測以及優化飛行,使航空公司降低成本并提高運營效率[71]。2016年8月11日,波音宣布開設一個新的實驗室,專注于數據分析驅動的軟件解決方案,采用快速構思、構建和擴展解決方案的方式幫助航空公司和其他航空器運營商提高效率并降低其業務成本。在2016年法恩伯勒國際航空展上,波音宣布為6家客戶提供先進的分析解決方案,使航空公司能夠做出更好的決策并顯著提高地面和空中的性能。
NASA根據數據產生的環境,將其大數據的發展分為“大科學”與“大事業”兩個階段,而NASA對大數據的研究正處于過渡階段[72]。NASA現在已擁有專門的故障預測中心進行復雜航空航天裝備故障預測方面的研究,其中一項成果便是由數據驅動的設備剩余壽命預測技術。NASA在大數據技術領域的專長在于航空安全領域,利用先進的算法,NASA可以從飛機當中收集大量非結構化數據,提取相關信息以發現各類能夠幫助商業航空公司改進現有維護流程的安全隱患,同時預見并避免各類設備故障。同時,NASA的先進信息系統技術能夠采用成熟的大數據能力,以減少信息系統的風險和成本,從而提高科學數據的獲取和實用性。
GE曾通過故障數據的采集與分析發現中國發動機故障的主要原因并試圖利用新型材料與新型設計方案開發更適合于中國環境的發動機,這成為應用大數據為發動機優化設計提供決策的典型案例[73]。2014年4月,GE中國航空工程技術部新設立航空大數據分析和數字化解決方案部專門解決運用大數據來預測飛機的發動機在何時需要檢修的問題。2017年,GE部署數字雙胞胎模型,其本質上是一種基于噴氣發動機傳感數據、數字化發動機物理模型以及虛擬現實技術的綜合大數據分析技術,GE據此可以使得維護計劃更有針對性[74]。目前,GE正在建立分析模型,綜合考慮發動機運行數據、歷史數據、客戶期望以及技術目標等相關影響因素,對維修維護工作進行優化。
除了進行自主研究,GE還在大數據領域開展了廣泛的合作。2014年3月,GE與中國東方航空簽署了一份戰略合作協議以分享各自掌握的大數據,GE將利用這些信息對中國東方航空使用的飛機發動機進行分析,讓飛機進行遠程體檢[75],從而預測飛機的發動機在何時需要維修。目前預測的準確率達到了80%以上,而GE的團隊正在對現有分析模型的準確性進一步驗證,融入趨勢性分析程序開發新一代的遠程診斷平臺。2016年11月,GE宣布與Teledyne技術公司的子公司Teledyne控制建立戰略合作伙伴關系,用Teledyne的無線數據采集和管理技術加上GE的Predix云平臺,對發動機健康監控的數據進行持續的分析,幫助開展維修預測,提升運營效率。同月,GE還與Capgemini以及凱捷管理顧問公司合作,分別推出用于解決平臺和格式差異的“構型數據交換”計劃以及跨軟件數據傳輸平臺。
中國東方航空機務系統開展了基于自身運行特點的大數據技術分析與應用,依托Airman、AHM等系統的支持,以自身運行數據為基礎,通過加強與空客、波音、GE等重要廠商的合作,對諸多監控數據的閥值參數進行了本地化修正。隨著對大數據技術應用的不斷深入,中國東方航空開始自行開發軟件程序,以實現對飛機重要系統進行參數監控和數據分析。
2017年10月18日,在“數字護航,比翼未來”數字科技高峰論壇上,中國南方航空展示了基于大數據的飛行大數據應用、飛機遠程診斷系統、集合海量數據分析的最新一代機務應用平臺等最新科技成果,并表示將與GE合作進一步推進數字化領域的深度交流與合作,在飛行大數據平臺功能提升等方面,創建大數據時代下的機務維修新模式,共建互利共贏的數字化維修智能生態圈。同時,中國南方航空與中國民航大學合作成立了南航工程技術中心,將在飛行大數據應用等方向長期開展工程化研究。
海南航空集團歷經25年的發展,已從單一的地方航空運輸企業發展成為以航空旅游、現代物流、現代金融服務為核心主業的大型企業集團,作為在航旅市場上擁有強大線下資源以及豐富運營經驗的大型運營商,海南航空正將大數據用于高效整合線上線下資源。同時,海南航空試圖通過收購擴張的方式,加強在大數據領域的技術儲備,為打造數據開放平臺、數據產業鏈與生態圈提供助力。
2.3.2 航空大數據輔助運營
在航空大數據輔助運營領域,2016年,羅羅與微軟展開合作,建立全新的數字化功能應用到微軟Azure云平臺上,實現對海量航空運行數據的匯總、整合,之后利用微軟Cortana智能套件對這些數據進行分析研究,提出個性化的解決方案,進一步降低航空公司能源消耗,全面提升運營效率。2017年,羅羅成立了一個數字化部門R2數據實驗室,以加快旗下航空發動機產品的設計、制造和操控效率。中國東方航空借著自身管理信息系統整合與工程維修信息管理系統建設的契機,將大數據的應用擴展至航材管理、工程管理、維修管理、質量管理、培訓管理、供應商選擇等業務上。同時,中國東方航空利用西雅圖Tableau軟件公司的系統進行市場研究、優化航線,以期增加收入。
中小型航企由于自身資金周轉等問題,對于航空大數據輔助運營擁有更為迫切的需要。亞洲航空作為一家低成本航空公司,對于大數據技術的需求在于利用先進的數據捕捉和分析技術來保持低票價并盡可能的節省燃油消耗,公司正在使用GE的航班效率服務系統實施精準導航服務、航班數據分析和燃油管理服務。這一建立在數據基礎上的服務系統降低了成本,提高了飛機利用率。澳洲航空還利用大數據分析,對運營不正常狀況做出快速反應,降低航班延誤數量,并已將航班延誤數量降低了60%。新加坡航空于2015年與羅羅簽訂了一個為期5年的合同,使用羅羅大數據分析系統以降低公司燃油消耗。2017年初,新加坡航空又與Amadeus合作,使用其Altea網絡收益管理系統、動態定價系統和Altea集團管理人員解決方案系統加強其運營能力。
2.3.3 航空大數據旅客分析
除此之外,旅客分析也是航空大數據輔助服務的一項重點內容。法荷航集團開發了一款適用于移動設備的免費應用,使用公司追蹤獲取的數據為旅客提供行李追蹤服務,以減少行李遺失等旅行中不必要的困擾。日本航空公司認為對于航空公司而言,分析大數據以保持旅客忠誠度是大數據所提供的重要機會之一,于2017年首次對其進行改造,投入8.28億美元建設新的云服務系統以提升客戶體驗。日本航空還計劃通過對旅客數據的處理,來確定具體航線和航班上旅客的餐食偏好,從而有針對性地制定菜單,滿足旅客需求。在中國,中國南方航空也在對客戶信息做大量分析,用于精準營銷和產品設計。
作為新興領域且實際應用迫切需求,航空大數據的應用前景非常廣闊。大數據技術在航空系統的發展已經走過了早期階段,并且航空公司和維修企業已切身感受到大數據技術所帶來的可靠性增長以及維修成本的降低,但想讓大數據在航空系統發揮出更多的價值依然存在重重挑戰。這其中有理念上不夠重視導致的,有方法不當引起的,還有技術及人員不足帶來的挑戰,但這些挑戰中又隱含了航空大數據未來的發展趨勢,故本節對這些挑戰與趨勢進行梳理。
民用航空是一個保護性行業。而保護性產業在接受新事物時具有沉穩性。2016年,中國南方航空是首個加入國家綜合交通運輸出行大數據開放云平臺的航空企業。打造“互聯網+航空”領域的新型“粉絲經濟”。同時,中國南方航空在公司內部深度利用大數據挖掘企業流程再造,實現“提質增效”。這在一定程度上利用大數據實現跨越式增長。但同時,也相應發現大數據的局限性。
雖然航空企業高層思想上比較重視大數據的推廣及應用,但是在龐大的航空企業內部實施還具有一定阻力。目前某些公司的工作重心仍放在對傳統IT系統的升級以及基礎設施的建設上。此外,在開發階段,大數據軟件、系統與平臺的開發都需要投入大量的人力、物力、財力。在數據存儲與管理階段,分布式云平臺的建立與維護以及整個系統運行時的能源消耗也需要大量的資金成本。在航空企業內部阻力以及沉穩性的影響下,由此引發的資金不足問題很容易成為大數據研究發展的制肘。
因此,為使數據的力量有效地轉化為生產力,航空公司必須首先從思想層面接納大數據,并實現由大數據帶來的思維方式的轉變。然后由公司首席數據官作為發起者,結合大數據研發團隊建立一個專門的大數據規劃、建設和運營組織,以這個上行下效、溝通流暢的組織作為大數據研究的堅強后盾。繼而在廣泛調研的基礎上制定出符合自身目前所處狀態的簡潔、全面、明確、現實的大數據發展戰略,為公司大數據研究指明方向。
當前大數據處理方法主要分為批處理模式和流處理模式。其中批處理主要用于處理大容量靜態數據,但處理速度相對較慢,較為偏向于大數據“5V特性”中的規模性。而流處理方式無需針對整個數據集執行操作,而是對通過系統傳輸的每個數據項執行操作,可以做到近實時處理,偏重于高速性。兩種處理方式各有所長,而航空大數據的特點決定了其兩方面皆有需求,既需要對大量歷史數據進行分析,又需要對不斷產生的航空數據進行處理。此外,航空大數據中復雜的圖表、音頻、視頻等非結構化數據也對當前的大數據處理方法提出了嚴重的挑戰。
因此,將批處理和流處理混合,以相同或相關組件為紐帶,在同一處理框架中同時實現批處理和流處理將是大勢所趨。不僅能夠滿足具體數據集的處理需求,還能夠成為航空大數據處理的通用解決方法。當前已有Apache Spark以及Apache Flink在這種混合化方面做出了嘗試,但都在兼容性方面陷入瓶頸。因此處理模式混合化依然有一段長路需要走,而實現這樣的功能重點在于兩種不同處理模式如何和諧統一,以及對固定和不固定數據集之間的關系進行何種假設。
盡管數據采集、數據傳輸、數據存儲、數據分析等技術一向是航空系統關注的重點,但技術問題依然是限制大數據在航空系統發展的重大難題。在數據傳輸上,目前主流的做法是在飛機降落后統一采集,雖然也有技術實現了航空數據的實時采集,但現階段傳輸成本較高,性價比較低。降低實時傳輸成本以及實時傳輸與事后獲取之間的平衡問題將是航空工業界亟需解決的問題。而隨著航空市場的發展,機隊規模的增加,當前大數據分布式存儲的技術能否應對持續增長的航空大數據也是各大企業需面對的挑戰。此外,對航空大數據復雜性內在機理及物理意義了解不足,對航空大數據相互作用規律缺乏認識,缺少面向航空大數據的新型高效算法等一系列問題都在技術上向大數據在航空系統的應用發出了挑戰。
因此,分析平臺柔性化將成為之后航空大數據平臺的發展趨勢。雖說已有不少航空企業研發了自己的大數據系統或平臺,并且能夠很好地服務于現在產生的數據,但目前的航空大數據,在不久的將來還只會是小數據。隨著數據增長率不斷增加,航空大數據分析平臺應該能夠支持現在以及將來產生的巨大的數據集,系統必須不斷演化,組件也要能擴展以適應日益變化的需求。柔性化的平臺能夠支持不斷發展的配套組件,能夠使系統動態自適應地進行預測并確保模型的準確性,將成為航空大數據分析平臺未來發展的方向。
從用戶的角度講,航空大數據平臺不是個性平臺,而是一種與電力系統等行業的大數據平臺有諸多共同之處,但更偏重于航空應用的平臺。美國產業研究中心支持的研究機構就為全球包括航空業在內提供了諸多成功案例。成功的平臺來自于第三方的專業技術人員和航空領域工作人員的協同與配合。
從航空企業內部角度講,由于大數據發展本身時間尚短以及企業專業人才儲備不足等因素,航空企業自己研發包含大數據分析、機器學習和云計算等先進技術的解決方案頗為困難。而第三方企業缺乏航空專業知識,盡管具備廣義上的大數據處理手段,但在航空大數據這種具體行業,具體需求的問題上缺乏針對性。自身能力不足與外界協助困難正是廣大航空企業面臨的一大困境。
因此,進行資源整合是必然選擇。當前已有部分企業采用企業間合作、收購數字化分析企業、成立新部門、建立實驗室等方案進行大數據開發,如羅羅與微軟之間的合作,普惠與IBM建立合作關系,Flight Global航空數據集團收購航班時刻數據商Innovata,GE成立航空大數據分析和數字化解決方案部,空客建立A3實驗室。為應對未來更加復雜、更為龐大的數據,航空業必將進行更高層次的資源整合。在這種大趨勢下,缺乏大數據競爭力的小型航空企業將在航空大數據研究領域慢慢邊緣化,只能使用其他航空企業成熟的技術與分析平臺。
美國工程院院士史建軍指出,大數據是方法,不是目的。本文簡述了學術界對航空大數據的理論研究,介紹了航空工業界在航空大數據采集存儲、分析平臺以及應用方面的實踐情況,同時指出目前面臨的挑戰以及可能的發展趨勢。盡管面臨種種難題,但大數據方法已在航空系統生根發芽。隨著國產大飛機的成功研制、“兩機專項”的提出以及“中國制造2025”的逐步實施,大數據這種方法在具有優秀基因的航空系統擁有旺盛的生命力,期待這種生命力能綻放出美麗的青春。