鄧 晨,陳 功,2,*,王文正,孔軼男
(1. 中國空氣動力研究與發展中心,綿陽 621000;2. 國防科技大學 空天科學學院,長沙 410072)
飛行器氣動數據的來源主要有三種方式:風洞試驗、數值計算和飛行試驗[1]。三種方式各有優缺點:風洞試驗可以模擬飛行狀態和飛行環境,但是存在支架干擾、雷諾數影響、洞壁干擾等限制,不能完全模擬真實飛行狀態[1];數值計算方法靈活,成本低,提供的數據多,但是因為物理模型不夠完善,使得復雜狀態的計算精度較低;飛行試驗可以完全模擬真實飛行狀態,但是試驗代價昂貴,大氣數據和傳感器誤差影響大,氣動參數辨識困難,得到的有效飛行試驗數據有限[1-2]。
為了彌補各種數據的“缺陷”,綜合利用各種方式的優勢,在降低試驗代價的同時,提高氣動數據精度,國內外很多專家學者提出了基于數據融合的方法并做了大量的研究。Alexandrov等[3]對復雜的模型進行設計和優化時,利用低精度數據進行迭代,并用高精度數據監控設計優化的進展,最終在三維問題的結果精度提高的同時,成本節約了三倍;Eldred等[4]采用了二階加法、乘法和組合修正的數據融合算法,有效地克服了工程設計過程中的非光滑性和計算成本高的問題;Keane[5]在機翼的優化設計中,利用Kriging模型建立了基于試驗的預測模型和基于CFD數據的響應面模型的融合模型,氣動數據的預測精度有了較大的提高。國內,中國空氣動力研究與發展中心的王文正等[6]創造性地提出了基于數學模型的氣動數據融合,建立了反映氣動力隨著氣動滾轉角變化的數學模型;傅建明等[7]采用Chebyshev-Taylor-Fourier混合級數來平衡不同精度數據之間的不確定度,并采用最小二乘原理來求解級數參數,該方法高效實用,工程應用前景良好。
根據國內外的研究可以發現,氣動數據融合算法可以分為基于不確定度和基于氣動模型的數據融合算法[1]。目前兩種算法的研究都有一些,但是缺少了對比分析,而有關于融合算法的適用性的研究幾乎沒有。鑒于此,本文首先提出并實現了兩種數據融合算法:一種是基于不確定度的多保真度氣動數據加權融合算法,通過建立各數據源的高斯回歸模型來量化數據的不確定度,并利用專家經驗等先驗信息來對數據的不確定度進行修正,最后通過加權融合進行數據融合;另一種是基于建模的CoKriging模型算法,在Kriging模型的基礎上考慮了不同數據之間的相關性,直接建立融合代理模型。然后以某型飛行器氣動數據為例,對比分析得到了兩種算法的優缺點。
基于不確定度的加權融合算法,主要利用了高斯過程回歸來量化每一種數據源的不確定度,并利用不確定度作為權值進行加權融合。下面簡單介紹高斯過程回歸算法和基于不確定度的加權融合算法。
1.1.1 高斯過程回歸算法
高斯過程是一個隨機過程,對處理小樣本、非線性、高維數等復雜問題具有良好的適用性[8-9]。其本質是一種基于貝葉斯優化的回歸算法。給定一個數據集在集合D中,定義具有聯合高斯分布的變量集合f(x),由均值函數和協方差函數組成:

考慮到噪聲,則高斯過程回歸的一般模型為:

式中,ε為獨立的高斯白噪聲。
根據貝葉斯原理,高斯過程回歸在數據集D建立了y的先驗函數,則樣本點和新的數據點f?的聯合高斯分布為:

式中,K、K?和K??的定義如下:

根據高斯過程的性質,f?的后驗概率分布f?|X,y,x同樣符合高斯分布:

式中:

μ?(x)即 新的數據點x?預 測的輸出值, Σ?為預測輸出的方差,這樣便求得預測值的分布特征。即獲得了數據集的不確定度。有關于高斯回歸過程中的協方差函數的選擇和超參數的優化參閱文獻[10]。
1.1.2 加權融合算法
針對多來源的氣動數據,采用高斯過程回歸進行回歸處理,得到每一種數據源的均值 μGPRi和方差接著采用基于不確定度的加權融合算法進行數據融合,具體流程圖如圖1所示。

圖1 基于不確定度的氣動數據融合算法Fig. 1 Aerodynamic data fusion algorithm based on uncertainly
由圖1可知,首先采用了高斯過程回歸對不同來源的氣動數據樣本進行回歸處理,得到模型的不確定度。接著因為每一種數據都來自計算或者測量,與真實值存在偏差,所以需要根據專家經驗等先驗信息,確定每一種數據的保真度。保真度反映了氣動數據樣本和真值間的不確定度,保真度越高,則數據越精確,并定義數據源i的保真度函數為。然后將模型的不確定度和數據的不確定度結合起來得到每一種數據源的總的不確定度 μTi和,如式(10)和式(11)所示。最后根據加權融合算法對每一種數據總的不確定度進行融合估計。

對于高精度數據,因為樣本點過少,所以它的模型不確定度高,而高精度數據本身的不確定度低;而對于低精度數據,因為樣本點很多,所以它的模型不確定度低,而低精度數據本身的不確定高。通過加權融合的方式,可以得到精度更高、不確定度更低的數據。加權融合算法即對每一種數據源分配不同的權重系數w,再進行相加處理。假定各數據源是相互獨立的,則權重系數和數據的不確定度方差成反比,即方差越高,說明數據精度越低,權重系數就小。具體表達式如下:


CoKriging模型是20世紀70年代發展起來的一種更有效的地質統計學插值模型[11-12]。目前國際上對CoKriging模型的研究主要集中于地質統計學和數學統計學等領域,在航空航天等工程科學領域的研究也正逐漸得到重視[13]。
CoKriging模型的原理如下[14]:假設一個具有m個設計變量的優化問題,高、低可信度分析程序的抽樣位置為:

式中:下標“1”和“2”分別代表了高、低可信度,n1和n2分別代表高、低可信度樣本點數。相應的目標或約束函數的值為:

CoKriging代理模型的預估值為:

式 中: λ1和 λ2為 對 應的 加 權系 數。假 如 存在 分 別 與y1和y2對應的兩個靜態隨機過程:

式中: β為全局趨勢模型,代表Y(x)的數學期望值;Z(x) 為均值為零、方差為 σ2的靜態隨機過程。在設計空間不同位置處,隨機變量之間的協方差和交叉協方差定義為:

式中R為相關函數,只與空間距離有關,并滿足距離為零時等于1,距離無窮大時等于0。
經過推導[13],得到CoKriging模型預估值和預估值的均方差如下:

式中:

且有:

CoKriging模型預估值的均方差為:


剩余參數θ(11)、θ(12)、θ(22)沒有解析最優解,可以通過數值優化算法求解下式的最大值得到:

在算法實現過程中,需要注意如下幾個關鍵點:
(1)樣本點歸一化。將樣本數據歸一化后再建立CoKriging模型,可以提高模型的精度和魯棒性。
(2)模型參數優化。合理的模型參數,可以顯著提高CoKriging模型精度。
(3)相關矩陣R保持正定。采用“正則化”方法,讓R保持正定。
(4)合理的矩陣分解方法。采用Cholesky分解,可以有效提高計算效率。
本節中,利用已有的典型飛行器高精度數據和低精度的數據來建立飛行器氣動模型。首先使用Kriging模型對高、低精度數據分別建立代理模型,接著使用基于不確定度和CoKriging代理模型來建立融合模型,最后進行比較分析。
選擇馬赫數Ma和迎角α作為設計變量,軸向力系數CA作為函數響應值。采用現代試驗方法進行試驗方法設計[15-16],一共得到高精度數據樣本點11個,低精度數據樣本點24個。并將高精度樣本點分為兩部分,一部分用來進行訓練,另一部分作為驗證。如表1~表3所示。

表1 用來訓練的高精度數據樣本點Table 1 High-precision samples for training

表2 用來驗證的高精度數據樣本點Table 2 High-precision samples for validation

表3 部分低精度數據樣本點Table 3 Part of low-precision samples
利用樣本數據建立了四個軸向力系數模型,分別是高高精度數據Kriging模型、低高精度數據Kriging模型、不確定度融合模型和CoKriging融合模型,具體結果如下。
2.2.1 高高精度數據Kriging軸向力系數模型
圖2給出了高高精度數據Kriging模型對軸向力系數的預測值。由圖可見,高馬赫數時模型預測精度較差,與理論分析結果相差較遠,這是因為缺少了高馬赫樣本點,而低馬赫數時預測結果較好。

圖2 高精度數據Kriging模型預測值Fig. 2 Predictions of the Kriging model using high-precision samples
2.2.2 低高精度數據Kriging軸向力系數模型
圖3給出了低高精度數據Kriging模型對軸向力系數的預測值。由圖可見,因為低精度數據樣本點多且廣,建立的模型在變量全設計空間預測情況較好,與樣本點接近。但是因為低精度數據本身精度低,所以預測結果只是接近樣本點,與真實情況的誤差未知。

圖3 低精度數據Kriging模型預測值Fig. 3 Predictions of the Kriging model using low-precision samples
2.2.3 融合模型—基于不確定度的加權融合模型
利用高斯過程回歸量化了不同精度數據的不確定度之后,采用加權融合算法得到結果如圖4所示。根據不確定度進行加權融合,這種融合方式沒有考慮到不同精度數據之間的相關性,所以在高馬赫數時的預測值與低精度數據樣本值幾乎一樣,和真實值也有所差異。

圖4 基于不確定度的加權融合模型預測值Fig. 4 Predictions of the weighted fusion model based on uncertainly
2.2.4 融合模型—基于建模的CoKriging融合代理模型
CoKriging融合代理模型就是在Kriging模型的基礎上,考慮了不同數據之間的協相關性,所以結果更符合真實情況。本節中,由于高、低精度數據具有相似的函數變化趨勢,只是存在小幅度的平移或旋轉現象,為簡便,假設其具有如下的相關性:

式中:h為空間距離;ρ為兩種不同數據的相關系數,一般作為超參數進行優化尋優獲得,可以表示兩種數據之間相關性,這種相關性只是代表了數據數值上的相關,沒有具體的物理含義。本文將 ρ 當成超參數,通過最大似然估計方法尋優求得值為0.930。得到CoKriging融合代理模型預測結果如圖5所示。

圖5 CoKriging融合代理模型預測值Fig. 5 Predictions of the CoKriging fusion model
與不考慮數據相關性的直接加權融合相比,CoKriging模型的結果更符合真實情況:在低馬赫數時,預測結果更接近高精度數據結果;在高馬赫數時,高、低精度數據相互修正,得到了一個更加符合理論分析和真實情況的結果。
訓練得到兩個單精度數據模型和兩個融合模型。為了比較不同模型的預測結果,定義誤差值Err:

式中,yi為 用于驗證的高精度樣本值,y?i為各模型對應的預測值。誤差值Err越小,則越接近真實值。計算得到四個模型的誤差值如表4、表5所示。對表4和表5進行橫向和縱向對比分析,總結得到以下結論:

表4 不同單數據模型的預測誤差值Table 4 Prediction errors of single-data models

表5 不同融合模型的預測誤差值Table 5 Prediction errors of fusion models
1)單源數據建模時,用相同數量的數據點建模,高精度數據建立的模型精度比低精度模型高;
2)數據點越多,建立的模型越精確,數據點覆蓋的設計變量空間越廣,得到的模型越精確;
3)與單源數據的建模結果相比,兩種融合模型的預測結果的精度都有較大的提升;
4)相比于基于不確定度的直接加權算法,CoKriging融合模型的精度更高。
本文用于訓練和驗證的高精度數據來自風洞試驗,因為試驗條件限制,沒有高馬赫數時的氣動數據。為了獲得參數空間更廣的融合數據,所以對建立的預測模型進行了大范圍的外插,這種方法雖然在工程上不適定,但是對于定性分析具有一定的參考價值。在高精度數據參數變量空間內,融合數據內填了高精度數據,精度也得到了提高,而在外推的變量空間內,融合數據也為數據的變化趨勢提供了參考。后續研究方向可以為通過補充其他手段得到的高精度數據進行補充完善,讓涵蓋所需要的建模空間且相對均勻,這樣能得到準確度、可信度更高的結果。
本文研究了兩種氣動數據融合算法:一種是基于不確定度的直接加權融合算法,另一種是基于模型的CoKriging融合代理模型算法。并以典型飛行器氣動數據為例進行了對比分析,得到以下結論:
1)與使用單精度數據的建模結果相比,兩種融合算法預測結果的精度都有較大的提高。
2)對于融合算法,數據樣本點對預測精度影響很大,數據點越多,覆蓋范圍越廣,結果越精確;
3)和基于不確定度的加權融合算法相比,考慮了數據之間相關性的CoKriging算法建模得到的結果精度更高。
4)融合數據主要有兩個作用:一是對高精度數據進行內填,補充參數空間內的數據;二是通過外推,對參數空間外的數據變化趨勢進行預測。后續研究方向可以為通過補充其它手段得到的高精度數據進行補充完善,讓高精度數據涵蓋所需要的建模空間且相對均勻,這樣能得到準確度、可信度更高的結果。