李富強
(中國航空工業集團公司成都飛機設計研究所 四川成都 610091)
目前,數據科學正在對工程實踐中的前沿技術進行大范圍重構,而且這一重構很可能是跨科學、技術和工業領域的。數據科學與20 世紀60年代的科學計算革命十分相似,后者造就了革命性的工程范式,實現了對復雜工程系統的精確仿真。實際上,科學計算通過基于物理的模擬器實現了飛機的原型設計,為航空制造業節約了大量成本[1]。
通過近年在數據收集和存儲能力上的大幅提升,工程領域應用數據已不再新鮮,很多領域已經進入了數據密集型分析的新時代。作為高新技術產業的航空制造業,是典型的數據密集型領域,通過科學地應用這些數據,可在很多方面進行數據驅動型分析,幫助實現技術優化,便于進一步應用機器學習技術和數字孿生技術。
對于數據科學和航空制造業的融合發展來說,能夠產生巨大影響的因素主要包括:(1)正在不斷增長的海量數據;(2)高性能計算的進步;(3)傳感技術、數據存儲和數據傳輸的進步;(4)統計學和應用數學領域中可擴展性算法的進步;(5)對開源軟件和基礎研究的大量投入[2]。相較于其他領域,航空制造業更具有實現數據驅動進步的機會,因為航空制造業不僅積累有大量數據而且工程實踐往往已經建立在有約束的多目標優化框架上,非常適合基于數據驅動的分析。現代航空制造的每個階段都是數據密集型的,包括制造、測試和服務。
通常,數據驅動的發現模式被稱為第四范式,第四范式并非要扮演取代者的角色,它實際上是對所建立的理論、試驗和數值研究模式進行補充。在過去的半個世紀里,第四范式同計算科學的出現有著顯著的平行關系,不是取代,而是對理論和試驗的增強。就像現在實現的計算能力水平一樣,將來數據科學也會達到預期的水平。航空制造業的數據密集型轉型可以從過去數十年的數字化轉型中吸取經驗[3]。在轉型過程中,可能最明顯的變化就是研究人員和工程師團隊會形成專業知識和基本的數據科學能力。與此同時,航空制造業研究和開發周期也將發生改變。
隨著數據科學的不斷發展,尤其是在端到端數據庫管理和操作上的不斷改進,在設計、制造和測試整個過程中創建數字線程就成為可能,進而可能顯著優化航空設計和制造流程。國外已經在飛機設計和預測性裝配等方面進行了有益探索,有的已經取得了相當大的成功。
2.1.1 飛機設計與測試
V-22是一種多用途傾旋翼作戰飛機,設計初衷是能像直升機一樣起降,同時又具有固定翼飛機的航程和速度。要實現這些能力會有相當大的工程挑戰,如傾轉旋翼的工作機制、空氣動力學和控制系統。V-22的研發和測試一度因工程延誤、成本超支和安全事故而陷入困境。為此,有研究嘗試使用數據科學和數字孿生來幫助V-22的設計和測試。研究的結論是,數字孿生技術不但有助于安全問題的解決,而且有助于按計劃進行設計。
V-22的評審組在2001年建議“擴展高下降率測試和編隊試飛,目的是在所有適當的飛行條件下充分確定和了解飛行包線的高風險部分”。評審組進一步建議使用高風險、高下降率的測試結果來更新飛機的限制邊界并將其應用于飛行模擬器。此外,由于2004年4月發生了一起涉及高下降率和編隊飛行的事故,按要求進行了額外的高下降率測試。調查的結果是,事故由一種被稱作渦環狀態的氣動條件引起。渦環狀態是旋翼飛機在低速前進和高速下降時發生的一種非定常氣動條件,在這種氣動條件下,由于旋翼飛機無法飛離旋翼尾流,導致了高度不穩定氣流的產生。對于直升機來說,這種情況通常會導致高下降率;而對于傾旋翼飛機而言,則通常會導致滾降。這兩種情況都很危險,尤其是在離地面很近的地方。所以,渦環狀態仍然是一個非常重要的研究領域。
數字孿生的目標是架起一座溝通物理世界和虛擬世界的橋梁。相較于傳統的建模而言,數字孿生有兩大不同點:(1)通過實際數據不斷學習并更新內部模型;(2)跨系統集成一個或多個物理模型的數據[4]。為了讓數字孿生不斷學習,需要進行測試、更新和再測試。以V-22為例,數字孿生可以從渦環狀態的建模開始,然后加入試飛數據。離散建模可以作為一種數據驅動方法來解釋和更新模型的散度。在編隊飛行期間,V-22的飛行員至少經歷了兩次嚴重的非指令性滾轉。鑒于此,V-22進行了大量的編隊飛行和高下降率試飛。對于跨系統綜合多模型來說,將渦環狀態模型和編隊飛行模型結合起來是一種較為理想的做法。在有數據可用的情況下,綜合的目標就是模型收斂,或是連接物理和虛擬狀態,使數字模型可以精確表示物理環境。集成非定常、非線性、多物理模型并非易事,使用實時降階模型有助于發現和探索試飛中有顯著模型差異的部分。當將兩個模型合并形成一個數字孿生體時,在機器學習優化中,使用物理知識學習和自定義正則化有助于維持物理約束條件[5]。利用這種增強模型,從大量的模擬中學習是有好處的,飛行測試可以被減少至幾個關鍵的試驗條件:安全、關鍵任務和模型確認。
2.1.2 預測性裝配與填隙
在飛機制造中,由于飛機組件來自全球各地,因此公差會很高。即使零件是按照規范生產的,但是由于制造公差會疊加在大型結構上,所以組裝時結構件之間很可能會有明顯的間隙。在零件與零件組裝中,其中一項最費時、費力的工作就是按照飛機的工程標稱形狀進行填隙。現代飛機可能需要數以千計的定制墊片來填充飛機結構件之間的間隙。在飛機制造中,為了獲得最佳氣動效率,需要嚴格按照工程標稱構型來進行生產。工程標稱構型要求不僅要消除間隙,同時,還要保持結構性能和最小化下拉力,而這些都需要用到墊片。
以前,需要人工測量間隙,制造并塞入定制墊片,通常還會涉及拆卸和重新組裝。近年來,三維掃描技術的進步使組裝前進行表面測量成為現實,也就是預測性填隙。間隙填充是一個很耗時的過程,需要成本很高的人工檢測,而且隨著計量設備越來越復雜,產生了海量數據需要進行計算。這兩種情況,無論是哪一種,都會造成工期大幅延誤。
針對預測性裝配與填隙,有研究者提出了一種基于數據科學的預測性填隙策略,目的是從歷史數據中學習間隙分布,然后設計出優化后的稀疏感知策略,從而簡化數據收集和處理。新的方法基于以下假設,即飛機上的墊片分布存在一定的模式,而這些模式可以從歷史生產數據中挖掘出來,并可以用于減輕未來飛機的數據收集和處理負擔。具體而言,就是利用魯棒性主成分分析法(RPCA)來抽取間隙測量中的低維模式,同時,將離群值排除掉。魯棒性主成分分析法基于計算有效的奇異值分解(SVD),能夠在飛機測量中生成絕大多數相關的空間結構,識別出不同飛機的高方差區域[6]。接下來,就是獲得優化后的稀疏傳感器。這種方法在波音公司內部被稱作“在傳感器存在不確定性情況下的像素識別技術”(PIXI-DUST)。該方法通過54 架典型的波音商用飛機的歷史生產數據進行了成功的演示驗證,驗證中,僅使用通常所需激光掃描點的3%,就成功預測了在期望測量公差范圍內99%的墊片間隙,而且所有結果都經過了嚴格的交叉驗證。
這一方法在對填隙的預測上結合了魯棒性降維和稀疏傳感器優化算法,大大減少了對飛機進行填隙所需的測量次數,尤其是使用魯棒性主成分分析法從飛機的歷史生產數據中提取到了相干模式。因此,魯棒性主成分分析法被用于生成高維飛機計量數據的低維表示。
隨著數據科學的發展,航空制造業將進一步實現同數據密集型分析技術和機器學習技術的融合,屆時,航空制造業將在方方面面感受到數據科學所帶來的變革性影響。
2.2.1 制造工廠
工藝設計、再利用與標準化、過程控制、安全性、生產能力、再生產能力、檢驗、自動化、鉆孔及填隙等。
2.2.2 測試與評估
流水線測試、認證、異常檢測及數據驅動建模等。
2.2.3 飛機
檢查、設計與性能、材料、維護、預研產品研發。
2.2.4 人機交互
高級設計界面、交互可視化、自然語言交互。
2.2.5 業務運營
供應鏈、銷售、人力資源及市場。
如圖1所示,除了這些工程實踐上的改進外,數據密集型分析的進步也正在推動航空關鍵領域基礎研究的發展,如流體力學和材料科學。尤為重要的是,通過將數據科學同現有方法和工作流程相結合,不僅可以實現預測性分析的重大變革,還能直接從數據中獲得設計見解。

圖1 數據驅動型的航空制造業
盡管在航空制造業中通過融合數據科學有著巨大的潛在收益,但同時也面臨著諸多挑戰。首先,安全在航空制造業中是十分重要的一個方面,因此,數據驅動模型必須是可認證和可驗證的,必須能夠基于訓練數據進行泛化,能夠進行解釋和說明。另外,收集海量數據可能會導致數據抵押,只是簡單地對這些數據進行收集和維護,其成本就高得令人卻步,更不要說這些數據對下游分析來說還非常麻煩。在航空領域,客戶多樣性極高,通常需要很多公司和機構來分別完成培訓與認證,其行業穩健程度遠高于其他行業。此外,工業部門和國防部門之間也存在著根本性的差異,限制了設計共享、技術轉讓和聯合測試。實際上,就拿波音公司來說,對商用和軍用飛行器的測試與評估也是近年才納入一個部門,而且很多工作仍然是分開來做。
數據科學的迅速發展已在很多前沿關鍵技術的突破上起到了積極作用。隨著機器學習技術的不斷發展,數據將會在越來越多的領域發展越來越大的作用,很有可能會發展成為未來工程領域的核心能力。在數據科學的垂直應用領域中,航空制造業有著得天獨厚的優勢。航空制造業本身就是一個數據密集型領域,在過去的發展中積累了大量的數據,尤其是在設計、制造、測試和產品支持方面,這方面的特點尤其明顯,可作為應用數據科學的優先發展領域。從美國在這方面的應用實踐來看,數據科學能夠通過技術優化來為航空制造業提質增效。未來,隨著機器學習技術的不斷發展,數據科學為航空制造業帶來的價值將會更加凸顯。