魏士鵬,王 寧,袁 喆
(航空工業成都飛機工業(集團)有限責任公司,成都 610092)
復合材料是一種適用于飛行器的理想材料,在航空航天領域用量比例逐漸增多[1–3]。目前,熱壓罐固化工藝是生產復合材料構件的主要方法[4]。熱壓罐固化過程涉及復雜的熱交換、熱化學反應[5],以及熱壓罐內工裝、復合材料構件、復合材料構件和罐體之間的流場、溫度場的耦合效應[6],而且每次進罐的零件類型、零件個數、工裝尺寸等因素不同,使得熱壓罐固化周期難以預測。但是熱壓罐固化作為整個制造流程中的一個重要環節,其固化周期將會影響整個復合材料制造周期。每次熱壓罐固化的周期波動較大,導致計劃人員無法準確地對熱壓罐進行連續排罐和有效控制熱壓罐的空罐時長。因此,熱壓罐固化周期預測不僅可以提高連續排罐的準確率,為計劃人員制定更精細的排產計劃提供重要的數據依據,還可以縮短熱壓罐空罐時長,提高熱壓罐設備利用率,對確保完成生產任務具有重要的意義。
熱壓罐固化過程復雜,影響因素較多,如工裝大小、工裝數量、工裝擺放位置、零件類型等。朱雪初等[7]提出采用仿真方法模擬實際制造過程,以此來推算工件的加工周期。但是該方法需要建立和維護一個復雜的仿真系統[8]。在實際生產過程中,每次進罐的零件及其擺放位置不盡相同。每次模擬固化過程時需要重新建立固化數模,此過程需要較長的時間。目前,還沒有用數據挖掘算法根據歷史固化數據對熱壓罐周期進行預測的研究。本文選用了支持向量回歸(Support vector regression,SVR)和KNN(K–nearest neighbor)預測兩種預測方法,從數據挖掘角度對熱壓罐固化周期進行預測,并對這兩種方法進行對比分析。
熱壓罐固化過程主要經歷升溫、恒溫、降溫3個階段。在固化過程中,恒溫時長為定值,因此,零件固化周期主要受升溫階段和降溫階段的影響。在升溫階段,零件主要通過工裝傳熱升溫;在降溫階段,熱壓罐通過循環冷卻水對熱壓罐罐內空氣進行降溫來降低零件的溫度。每次固化的零件個數不同,零件類型組合不同及零件的擺放位置不同。不同的進罐組合影響零件的升溫速率,導致零件固化時長不同。因此,在預測熱壓罐固化周期時,將工裝的長度、寬度、高度、重量、占地面積,工裝擺放位置,罐內零件類型總數,零件自身類型,零件個數作為影響熱壓罐固化周期的因素。
本文選用支持向量回歸與KNN預測兩種數據挖掘方法對每個零件的固化時長進行預測。
支持向量回歸是支持向量機的推廣應用,同樣具有支持向量機對于處理小樣本、非線性及高維數據的優勢。支持向量回歸[9–12]算法的思想是:(1)利用非線性映射將樣本點從原始數據空間映射到高維特征空間;(2)尋找擬合函數;(3)通過f(x)計算出待預測樣本點x所對應的實數值。SVR中f(x)的值可以為任意的實數[14]。
支持向量回歸算法的目標是尋找最佳擬合函數f(x),使得所有樣本點的目標值與f(x)擬合得到的值之間的差別小于e,同時引入松弛變量ζi和ζ*i,模型轉化為[15]:

式(1)中,w是決策邊界的參數,φ是從原始數據空間映射到高維特征空間的非線性變換,m為樣本點個數,懲罰參數C>0。懲罰參數C是為了對差值超出e的樣本點進行懲罰。當C值越大時,表示對樣本點的懲罰越大。利用拉格朗日乘子將約束條件代入目標函數中進行求解,得到的最終優化目標為:

式(2)中,αi,αi*為拉格朗乘子,K(xi,xj)為核函數,部分參數的αi-α*i的值不為零的樣本點被稱為支持向量。最終得到f(x):

支持向量回歸中e、懲罰函數C、核函數及其參數的優化選擇對模型的學習精度和推廣能力起著決定性作用[13,16–17]。對于核函數,一般選擇高斯核函數。SVR模型需要事先給出e、C及核函數中的參數k的值。
k最近鄰[18–20](K –nearest neighbor,KNN)在最初提出時是為了用于處理分類問題。KNN被廣泛用于模式識別和基于內容相似性的信息檢索,而回歸問題相關的研究較少。KNN回歸是基于實例學習的非參數預測法,通過檢索歷史數據集中與待預測樣本的特征向量最相似的k條數據來進行預測。該方法認為,在預測問題中所有因素之間的內在聯系包含在歷史數據中,可以直接在歷史數據中得到信息,不需要根據歷史數據建立一個近似的模型[21]。KNN回歸的思想是:(1)找到離待預測樣本最近的k個訓練樣本點;(2)將這k個訓練樣本點的均值作為待預測樣本的值。設x1,x2,…,xk分別是待預測樣本x的k個最近鄰樣本,它們的值分別為y1,y2,…,yk,則待預測樣本的值是:

為了確保完成生產任務,在實際生產過程中,計劃人員會安排多個零件同時進罐。假設第j個熱壓罐Lj中有n個零件,有m個影響熱壓罐固化周期的因素,Lj=(X1,X2,…Xn)。這里Xj=(Xi1,Xi2,…Xim),表示影響每個零件固化周期的因素(l=1,2,…m)。零件的完成固化的時長為yi,i=1,2,…n。第j個熱壓罐Lj的熱壓罐固化周期是指Lj罐內所有零件X1,X2,…Xn均達到工藝文件固化要求的最長固化時間。即第j個熱壓罐Lj的固化周期為:

熱壓罐固化周期預測模型:
Step1:選用支持向量回歸與KNN預測兩種方法對每個進罐零件的固化時長進行預測。

Step2:兩種預測方法得到第j個熱壓罐Lj的固化周期:分別為:

支持向量回歸方法預測時,e設置為0.1,C設置為1,核函數,其中參數σ是自適應的,KNN預測時,用歐式距離計算距離矩陣,且近鄰的個數設置k為1。
利用Matlab2014a平臺構建支持向量回歸模型和KNN預測模型,分別對熱壓罐固化周期進行預測,并開展對比試驗。
本文共選取60罐,540條熱壓罐固化數據作為試驗樣本,分別采用支持向量回歸模型和KNN預測模型進行預測(表1)。每次試驗任意選取1罐的固化數據作為測試集,其他熱壓罐中所有零件的固化數據作為訓練集,通過熱壓罐固化周期預測模型分別計算出每一罐的預測固化時長。
由表1可見,只有第6罐的KNN預測結果比SVR的預測結果差,其他罐次KNN預測結果均優于SVR的預測結果。在第7罐中,SVR的預測結果與實際固化周期相差1.6h,而KNN預測結果與實際固化周期相差0.324h。
KNN預測結果中,與實際固化周期的誤差小于0.15h的有50%,誤差小于0.5h的有90%。而SVR預測結果中,與實際固化周期的誤差小于0.15h的為0罐,誤差小于0.5h的只有60%,見表2。通過本次試驗可以看出,KNN預測模型的預測結果更接近熱壓罐實際固化周期,能夠更加準確地預測熱壓罐固化周期。
熱壓罐固化周期的影響因素較多且相互關系復雜,同時利用數據挖掘算法對熱壓罐固化周期進行預測是一項全新的工作,對影響因素無法做到全面的數據表征,因此難以建立準確的參數模型。支持向量回歸模型雖然在處理非線性及小樣本數據上具有明顯的優勢,但由于目前的影響因素不能很好地表征熱壓罐固化周期與各影響因素之間的數學關系,使得支持向量回歸模型的預測結果未能達到理想效果。熱壓罐固化的零件本身具有重復性,如同一類型的零件多次進罐固化,過去的固化信息可作為未來事件分析的參考依據。同時KNN預測模型的優點在于不需要明確研究對象及其影響因素之間的數學關系[22–23]。KNN預測用于預測的關鍵是找到一組與預測對象相似的歷史樣本。因此,KNN預測模型更適合熱壓罐周期預測問題。

表1 KNN預測模型與支持向量回歸模型的預測結果對比Table 1 Comparison of prediction results between KNN prediction model and support vector regression model

表2 KNN預測模型與支持向量回歸模型的誤差對比Table 2 Deviation comparison between KNN prediction model and support vector regression model
現階段,熱壓罐固化成型作為復合材料制造過程中的一個重要環節,對提高熱壓罐設備利用率,確保完成生產任務具有重要的意義。目前,生產任務日益加重,如何提高連續排罐的準確率,縮短熱壓罐空罐時長尤為重要。本文采用了支持向量回歸模型和KNN預測模型對熱壓罐固化周期進行預測,通過試驗的對比分析,提出KNN預測模型能夠更加精確地預測熱壓罐固化周期,為計劃人員制定精確的計劃提供重要的數據支撐。今后將進一步優化預測模型,并繼續研究熱壓罐周期的影響因素探究各因素如何影響熱壓罐固化周期,提高預測熱壓罐固化周期的精度。