楊建新,蘭小平,姚志強,趙 振,馮亞東
(中國兵器工業信息中心,北京 100089)
隨著國家智能制造戰略的實施,制造企業生產過程數字化能力得到大幅提升,實現了制造過程人、機、料、法、環的數字化管理。然而,零件制造是一個多工序加工過程,各個工序之間存在著相互干擾與耦合的作用[1]。如何借助生產過程工序自動采集的質量數據對產品制造進行預測,進而為改進工藝、優化工序和控制產品最終質量提供依據成了亟待解決的問題。
近年來,國內外學者圍繞產品生產過程質量控制開展了大量研究工作,并提出了很多有價值的理論和技術方案。林峰等[2]采用貝葉斯網絡構建了工件平面磨削狀態監測模型,實現了對機加零件表面粗糙度有效預測;劉銀華等[3]通過利用檢測數據構建偏最小二乘回歸模型,實現了車身裝配質量在線預測與質量控制;江平宇等[4]通過構建加工特征、加工節點組成的多工序加工質量誤差傳遞網絡,實現了機加零件工序質量波動的計算和關鍵工序的優化;李先飛等[5]通過構建改進遺傳蜂群算法優化的支持向量機質量預測模型,以切削速度、進給量、切削深度、振動量為輸入實現了零件加工粗糙度的預測;鄭小云等[6]基于復雜零件加工過程誤差的產生與傳遞機理,構建了自適應加權偏差傳遞網絡,有效識別了加工過程的關鍵節點和誤差源;陳鑫等[7]針對工序質量控制問題,提出了一種基于貝葉斯的動態質量控制方法,實現了基于生產過程數據對控制圖的實時計算,使得工序質量得以提升;宋承軒等[8]利用BP神經網絡構建控制圖模式識別模型,實現了電梯零部件加工過程質量在線預測;于勇等[9]提出基于機器學習算法的質量預測與工藝參數優化方法,利用多種機器學習分類器構建基于工藝參數與質量分類標簽的質量預測模型,實現了機加零件的質量預測和工藝參數優化。
本文在上述研究的基礎上,提出一種采用改進郊狼算法和最小二乘法支持向量機的多工序質量預測方法,解決機械加工過程關鍵質量特性的質量預測與控制問題。最小二乘支持向量機LSSVM(Least Squares Support Vector Machine,LSSVM)[10]是通過對支持向量機進行改進,加快了支持向量機的訓練速度,降低了計算的復雜度,具有全局最優、適應性強等優點。同時,利用提出的改進郊狼算法(Coyote Optimization Algorithm,COA)[11]對最小二乘支持向量機的參數進行搜索和優化,得到了預測模型的最佳性能參數,進一步改善和提高了質量預測模型的可靠性和預測精度。最后以汽車發動機某關鍵零件作為對象,驗證了本文方法的有效性。
本文將群智能算法中的郊狼算法(COA)及機器學習算法中的最小二乘支持向量機(LSSVM)相結合,建立一個基于COA-LSSVM的多工序質量預測框架,其模型結構如圖1所示。首先,通過分析復雜零件多工序加工工藝方法,確定工序間誤差傳遞關系;其次,引入反向學習策略對傳統COA算法進行改進,并通過使用改進后的COA算法對LSSVM中懲罰影響因子及核函數參數進行了優化;然后,將生產過程采集到的加工質量數據作為樣本數據,采用優化后的LSSVM模型進行訓練,得到多工序質量預測模型;最后,基于實際案例對模型的準確性進行驗證。

圖1 復雜產品多工序質量預測框架

滿足等式約束

其中,φ(·)為輸入空間到高維空間的映射函數,w為權值向量,γ是可調參數,b是偏差變量。
通過引入Lagrange函數,可表達為:

其中,ak為Lagrange乘子,k=1,…,l。最優解的條件為

上式可寫成如下的線性方程組:

其中的K(·,·)代表核函數,根據Mercer定理,核函數滿足:

最后得到LSSVM估計函數為:

本文采用最常見的徑向基和函數(RBF):

從而使LSSVM算法中包含兩個敏感參數:正則參數γ和核函數參數σ,通過合理的選擇γ和σ,可使LSSVM的泛化能力得到提高。
郊狼算法是一種受郊狼社會生活以及其行為啟發的新型群體智能算法[12]。該算法主要由初始化和隨機分組、組內郊狼成長、郊狼的出生與死亡、群體變遷四個步驟組成,具有獨特的搜索結構和優化能力。
1)初始化并隨機分組
郊狼種群的初始化主要包括設置組數Np、分組郊狼個數Nc以及種群數量N。根據式(9)在搜索空間內對第p個分組第c個郊狼在第j維上的社會因子進行隨機初始化。

其中,lbj和ubj分別表示在第j維上郊狼個體社會因子的下限、上限,r在[0,1]范圍內服從均勻分布,j=(1,…,D),D為搜索空間維數。
隨后,按照式(10)檢驗每個郊狼的社會適應度值。

2)組內郊狼成長
組內郊狼成長因素主要包括組內最優郊狼alpha和組內文化趨勢cult兩個方面。其中,組內最優郊狼alpha可表示為:

組內文化趨勢cult可表示為:

組內隨機選擇兩個郊狼個體cr1、cr2與alpha、cult的差值可表示為1δ和2δ,組內郊狼在其作用下成長,可表示為:

其中,r1和r2為[0,1]范圍內均勻分布的隨機數。當郊狼成長后,按式(14)更新郊狼社會適應度。

利用貪心策略保留適應能力強的郊狼個體,如式(15)所示:

3)郊狼的出生與死亡
新郊狼的出生公式如式(16)所示:

其中,m1和m2為第p組的兩個隨機父郊狼;j1和j2為優化問題的兩個隨機維度,確保兩個父郊狼的基因一定可以遺傳給幼狼;Rj是決策變量第j維社會因子隨機數;rndj是在[0,1]內的隨機數,滿足均勻分布;離散概率Ps和關聯概率Pa表示新出生郊狼受父代影響和變異情況,如式(17)所示:

新郊狼出生后,組內郊狼的生存與死亡規則如下:設新生郊狼的年齡為0,若組內所有郊狼都比新生郊狼強時,新生郊狼死亡;若組內存在郊狼比新生郊狼差時,這些郊狼中年齡最大的郊狼死亡;若這些郊狼的年齡相同,最差的郊狼死亡,新生郊狼存活。
4)群體變遷
起初,郊狼被隨機分配到某個郊狼群體中,但成長過程中郊狼會有一定概率被群體驅離,進入其它組群,如式(18)所示。郊狼群體變遷完成后,所有郊狼年齡加1,一次迭代結束。

COA雖然擁有獨特的搜索模型和較好的尋優能力,但是由于自然界中每一個郊狼的成長不會只受到組內最優個體和文化趨勢的影響,群體內的每一個郊狼都可能對其他個體產生影響。在COA迭代過程中,充分利用每一個郊狼的每一代信息,就可能使得算法效率得到進一步提升?;诖?,本文在郊狼優化算法中引入反向學習機制,提出了一種基于反向學習的改進郊狼優化算法。
在種群迭代的過程中,如果在一定的迭代次數內檢測到郊狼的個體最優位置沒有更新,則可以判斷該郊狼陷入了停滯狀態,此時對其使用反向學習,讓該郊狼向其個體歷史最差位置進行學習,快速引導該郊狼逃離當前位置,其他郊狼學習方式不變。郊狼的個體歷史最差位置表示為beta,δ3表示郊狼與beta的差值,用式(19)表示:

則郊狼的成長公式更新為:

其中,r3是3δ的隨機權值,r3為[0,1]范圍內均勻分布的隨機數。
COA-LSSVM多工序質量預測模型建模詳細步驟如下:
步驟1:在零件質量總體平穩、可控的狀態下,對零件加工過程質量數據進行采集,并按照3∶1比例將樣本劃分為訓練集和測試集;
步驟2:初始化郊狼算法的各項參數,設定種群分組數Np、每組個數Nc、各維度搜索空間[lb,ub]等公共參數,并將郊狼群按照式(9)進行隨機初始化并隨機分組;
步驟3:將初始的郊狼個體分別帶入LSSVM,并計算各自的適應度值,根據適應度值選出最優郊狼alpha和組內文化趨勢cult;
步驟4:將各組內郊狼按照式(13)的方式進行成長,若郊狼個體陷入停滯狀態,則按照式(20)的方式進行成長;在所有郊狼成長完畢后,利用貪心策略保留適應能力強的郊狼個體;
步驟5:更新組內最優郊狼位置,并更新種群最優郊狼位置;
步驟6:在郊狼群各組內,按照式(16)產生幼狼,設置新出生的幼狼年齡為0,并與老郊狼比較,優勝劣汰;
步驟7:在郊狼各組間,按照一定概率隨機驅逐部分郊狼,同時以相同概率接納其他組驅逐的郊狼,實現組間交流;
步驟8:判斷是否達到最大迭代次數,若否,則轉至步驟3繼續訓練;若是,則轉至步驟9;
步驟9:輸出最優郊狼的位置,得到最佳工序質量預測模型,算法結束。
基于上述思想,以某制造企業的數字化生產線為背景進行了實例驗證。汽車發動機某關鍵零件工程圖如圖2所示,零件外圓尺寸φ950.236-0.123是關鍵質量特性,由粗加工、半精加工和精加工三個工序加工完成,加工要求分別是φ950-0.8mm、φ950-0.14mm和φ950.236-0.123mm。通過分析其加工要求可知,影響外圓φ950.236-0.123加工精度的因素主要有四個:1)外圓半精加工尺寸φ95.60-0.14mm;2)精加工裝夾基準位置一φ87.5±0.2mm;3)精加工裝夾基準位置二φ24.50-0.36mm;4)精加工裝夾基準位置三φ14.50.24-0.16mm。從車間MES系統中取該零件加工過程的80組工序質量歷史數據作為樣本數據,按照3∶1的比例劃分為訓練數據和測試數據,如表1和表2所示。

表1 訓練樣本集

表2 測試樣本集

圖2 某汽車發動機關鍵零件工程圖
針對LSSVM超參數難以有效確定的問題,借助COA較好的全局搜索能力,以MatlabR2018軟件為試驗平臺搭建COA-LSSVM算法模型。該模型的適應度函數為最小均方差[13],函數定義為:

其中:f為最小均方差函數;i=1,2,…,n為訓練樣本總個數;yi為模型的預測值;Yi為樣本真實值。
為評價所建模型的預測性能,使用該模型對20組測試數據進行預測。同時,將COA-LSSVM模型與LSSVM模型、粒子群優化的LSSVM模型(PSO-LSSVM)的預測結果進行對比,如圖3所示。
從圖3可以看出,對于這20個測試樣本,LSSVM模型、PSO-LSSVM模型和COA-LSSVM模型的預測結果大體上都是圍繞真實值附近波動,這說明本文所選模型是有效的。同時,從圖3可以明顯看出,COA-LSSVM模型的預測結果與真實值更接近,且波動范圍更小,這說明COA-LSSVM模型比其他兩種模型預測精度更高,且更穩定。

圖3 測試樣本預測結果圖
將LSSVM、PSO-LSSVM和COA-LSSVM三種模型對20組樣本的預測值和誤差值統計匯總,如下表3所示。可以看出,除個別樣本外,COA-LSSVM模型的預測結果誤差都基本在±0.2mm以內,而LSSVM和PSO-LSSVM兩種模型的預測結果誤差相對較大,其中,LSSVM模型的預測結果誤差最大超過0.6mm。綜合來看,COA-LSSVM模型的預測結果精度更高,尋優能力更好。

表3 算法預測結果對比
為了更直觀、全面地評估各模型的的穩定性,統計并計算LSSVM模型、PSO-LSSVM模型和COA-LSSVM模型對測試樣本預測結果的相對誤差,如圖4所示??梢悦黠@看出,COA-LSSVM模型相對誤差的曲線波動范圍較小,基本處于0.3%以內,且大部分處于0.15%以內,而LSSVM模型和PSO-LSSVM模型的相對誤差曲線波動范圍明顯較大,其中,PSO-LSSVM模型相對誤差基本處于0.15%以上,LSSVM模型相對誤差基本處于0.3%以上,且其最大相對誤差接近于1%,預測結果誤差較大。綜上結果表明,COA-LSSVM模型具有良好的泛化能力和較強的魯棒性。

圖4 相對誤差對比圖
為了檢驗C O A-L S S V M 模型的運行速度,將LSSVM、PSO-LSSVM和COA-LSSVM模型的收斂代數和測試運行結果進行對比,如圖5、圖6所示。從圖5中可以看出,經過3653次迭代,COA-LSSVM模型已經趨于收斂,遠小于LSSVM和PSO-LSSVM模型的7612次和6118次。從圖6可以看出,COA-LSSVM模型對的預測結果不但相對誤差均值更小,且用時更短。這表明在相同情況下,COA-LSSVM模型的運行速度更快,這主要是由于COA算法采用了靜態貪心算法,加快了運行速度;同時COA算法采用組內和組間,即局部和整體共同進化的方式提高了模型的穩定性。

圖5 訓練過程中各模型最小收斂代數

圖6 各模型對測試樣本的預測結果
為了提高企業制造質量加工的精度,本文以復雜零件關鍵質量特性為研究對象,利用最小二乘支持向量機和郊狼優化算法構建多工序質量預測模型,為復雜零件多工序質量預測提供一定借鑒意義。
1)針對最小二乘支持向量機超參數難以有效確定的問題,引入郊狼優化算法,借助其較強的搜索和尋優能力,通過郊狼種群組內和組間個體的不間斷進化,實現超參數組合的持續優化;
2)提出了基于COA-LSSVM的多工序質量預測模型,以某汽車發動機關鍵零件為研究對象,現場采集多工序質量數據構建學習樣本,對COA-LSSVM模型的有效性進行驗證。試驗結果表明,與LSSVM、PSO-LSSVM模型相比,本文提出的COA-LSSVM模型不但預測精度高、預測速度快,且泛化能力和魯棒性強,能夠較好地實現機加零件多工序加工過程質量預測。