周越,田威,廖文和,張霖,李波
(南京航空航天大學 機電學院,江蘇 南京 210016)
近年來,隨著材料輕量化的發展,輕質合金(鈦合金、鋁合金等)和碳纖維增強復合材料(CFRP)等在制造領域被更多地使用。隨之而來的難題是:大量的復合材料、鈦合金及鋁合金零部件等需要通過制孔鉚接的方式連接裝配在一起。在航空領域內的失效形式主要為疲勞失效,75%以上的疲勞失效發生在裝配連接件上[1],而航空裝配中70%以上的裝配結構連接由鉚接和螺接形式完成,連接制孔的數量十分龐大[2]。由于加工誤差、壁板變形等多種因素影響,不能保證裝配連接的穩定性,裝配連接孔的加工無法在零件加工時一次成型[3]。因此,航空制造單位通常將具有裝配關系的零件預先裝夾在一起,一次性鉆削連接孔,其裝配制孔的質量是保證飛機構件連接可靠性和壽命的關鍵。圖1為航空鉚接裝配試樣。

圖1 航空鉚接裝配試樣
與此同時,卷積神經網絡的相關研究發展十分迅速,早已在深度學習技術領域得到較為廣泛的應用。早期的神經網絡在建模、機器學習、模糊控制等方面取得了良好的效果,但受深層網絡模型的技術瓶頸限制,很長時間以來沒有獲得可觀的發展[4]。伴隨近十幾年來深度學習理論的不斷進步,深層網絡模型的技術難點得以攻破,它提取抽象深層關聯特征的能力被不斷挖掘,在音頻、文字和圖像處理等諸多領域取得巨大成功[5]。
本文受此啟發,使用卷積神經網絡針對航空裝配制孔工藝過程進行分析學習,以不同的工藝參數和對應的制孔過程主軸電流信號圖為輸入,實驗設備、材料與刀具型號固定不變,對制孔工藝結果進行預測,并設計實驗驗證預測結果的準確性與方法的有效性。
卷積神經網絡是當下應用最為廣泛的幾種深度網絡之一,與以往的神經網絡結構有著較大的不同,它由多個卷積層與亞采樣層組成。其中,由神經元矩陣組成的特征平面構成一個卷積層。而亞采樣層使得輸入維數大幅降低,提高了整個網絡的魯棒性。在這種網絡中,單個神經元不會與全部神經元產生連接關系,而只會與部分神經元產生連接[6]。卷積神經網絡區別于傳統神經網絡的兩大特點為共享權值和亞采樣,降低了網絡維數和復雜度,減少了網絡各層間的連接,以盡可能消除網絡過擬合的情況。圖2所示為一個常規的卷積神經網絡結構。因其良好的魯棒性以及可以降低網絡復雜度、削弱過擬合的特點,本文選擇卷積神經網絡進行制孔出口毛刺的預測研究。目前能夠建立卷積神經網絡的平臺很多,本文使用Google的Tensorflow平臺完成模型的建立和算法的實現。

圖2 常規卷積神經網絡結構
本文數據來源于所在課題組實驗中獲取的相關制孔實驗數據。樣本數據量:共采集了符合要求的數據2 462條。數據輸入包括制孔過程中從第1層鉆入到第1層鉆出,再到第2層鉆入,最后到第2層完全鉆出的分階段制孔主軸電流信號圖,以及各階段制孔工藝參數中的主軸轉速、主軸實際進給速度、主軸每轉進給速度。數據輸出包括對制孔的后續鉚接工藝影響較大的出口毛刺高度。表1列出了所有輸入、輸出數據的取值范圍,其中主軸電流信號包括所有符合標準制孔樣本的電流信號,不在表內列出。圖3為未歸一化處理前的制孔樣本電流信號。

表1 輸入輸出數據范圍表

圖3 未經歸一化處理的部分典型電流信號圖
數據清洗采用了下述幾種策略進行:遇到超出表1數據范圍的奇異值時,移除該項數據;同工藝參數的多組實驗中,出現偏差較大單個數據時,移除該項數據;同參數組數據過于不一致時,移除整組數據。在上述過程清洗后,對移除數據進行部分補充采樣。
數據歸一化對模型訓練至關重要,影響著模型收斂至最優解的能力,歸一化中采用了下述幾種策略:對每一維的數據量綱和數量級進行調整;對制孔過程階段進行標準劃分;對數據集本身進行Z-SCORE標準化;使用濾波和去噪算法對電流信號進行處理后作為輸入。
首先為建立模型必須要確定一種模型可靠性評估方法,目前針對預測問題常用的評估方法有平均絕對百分比誤差(MAPE)、均方誤差(MSE)、絕對平均誤差(MAE)和預測精度(ACC)等。以上方法的評價均為指標越趨近于0,模型預測效果越好[7]。本文經過分析,采用MSE作為預測模型的評估標準。MSE定義如下,其中predicted為預測值,label為實際值:
卷積神經網絡模型的建立主要分為以下幾個部分:激活函數選擇;目標優化算法選擇;卷積核個數的設置;卷積層層數的設置;卷積神經網絡的網絡窗口大小設置;學習率的設置。為單獨確定每個部分的設置,利用所獲取的數據設計了4組實驗,其中每組實驗的超參數只有待測試項為變數,其余超參數均為可用范圍內的固定值。非待測試項超參數設置如表2所示。

表2 非待測試項超參數實驗設置表
在激活函數的選擇上,本文通過對比分析常用的Relu、Tanh、Sigmoid等幾種激活函數,選用了較為簡單的Relu函數,以提高收斂能力[8]。在目標優化算法的選擇上,選用了經過改良的隨機梯度下降算法(adaptive moment estimation, Adam),以簡化學習率的調節[9-10]。為簡化超參數的設置調整,本文還加入了批量標準化算法(Batch Normalization)[11]。
卷積核核數、卷積層層數、窗口大小和學習率通過多組對比實驗,獲得MSE變化趨勢的方式進行確定。
卷積神經網絡的特征識別提取能力很大程度上取決于卷積核個數。本文設置了卷積核個數從8個到128個,間隔8的多組對比實驗。實驗過程數據如圖4所示。

圖4 卷積核個數對預測模型的影響
通過分析圖4可知,在卷積核<64前MSE呈下降趨勢,>64后呈上升趨勢。分析原因可能是,卷積核數量在一定程度上是對數據特征提取的角度數量,過多的卷積核可能導致訓練提取到對宏觀影響很小的特征,而使預測效果下降。
卷積層層數通過設置層數1到層數6的對比實驗確定。實驗過程數據如圖5所示。

圖5 卷積層層數對預測模型的影響
通過分析圖5可知,在卷積層層數<3前MSE呈下降趨勢,>3后呈上升趨勢。分析原因可能是,工藝參數、主軸電流信號與最終毛刺有著較為緊密的內在聯系,更深層次的模型對內在聯系的特征提取更加準確,但本文使用的模型輸入域輸出相對較少,過多的隱層可能導致訓練擬合不充分,影響預測結果。
卷積窗口大小通過設置窗口大小2到大小6的對比實驗進行確定。實驗過程數據如圖6所示。

圖6 卷積窗口大小對預測模型的影響
通過分析圖6可知,在卷積窗口大小<4前MSE呈下降趨勢,>4后呈上升趨勢。分析原因可能是,卷積過程實際上就是模型學習卷積窗口特征的過程,合適的窗口大小可以在獲得足夠感受的情況過濾掉非特征因素。
學習率通過設置學習率0.000 01~0.2的10組對比實驗進行確定。實驗過程數據如圖7所示。

圖7 學習率對預測模型的影響
通過分析圖7可知,學習率與MSE呈正相關關系,過大的學習率會使模型無法訓練到最優。較小的學習率會使得訓練結果更優,但訓練效率降低,而過小的學習率并不能使訓練結果顯著改變。
在超參數的影響趨勢確定之后,本文引入了Dropout技術優化測試集的測試表現[12-13],設置了隨機概率0.1~0.9的多組對比試驗,測試過程與測試數據如圖8所示。

圖8 隨機概率取值對預測模型的影響
通過分析圖8,設置了0.90的隨機概率取值,在眾多常見應用Dropout技術的論文與研究中,通常取0.4~0.6范圍內的隨機概率,即采用相對較大的神經元丟棄概率時,測試集表現改善更加明顯。本文取較小的丟棄概率時表現更好,分析原因是本文所采用預測模型復雜程度相對較低,丟棄比率較小就足夠達到避免過擬合的優化目標,而丟棄比率較大時會影響訓練的擬合。
在以上模型影響因素的影響趨勢確定后,采用啟發式設置的方法確定最終模型使用的超參數。比較通用的啟發式算法一般有模擬退火算法(SA)、遺傳算法(GA)、蟻群算法(ACO)、人工神經網絡(ANN)。本文采用一種應用較為廣泛的基于蟻群算法(ACO)的啟發式算法,對超參數進行整體優化調整。通過上述影響因素分析縮小了超參數選取區間,將超參數選取范圍選定在各自獨立的較優區間內,區間如表3所示。

表3 超參數選取區間
在表3區間內經過啟發式設置最終建立的模型設置如表4所示。

表4 卷積神經網絡設置表
經過優化的最終測試集效果如表5所示。

表5 最終實驗效果
實驗設備與材料如表6所示。

表6 實驗設備
模型性能評估的測試集表現并不能十分直觀地表現預測的準確性和有效性,因此本文設計了一組預測值和真實值效果的對比實驗集。使用相同的實驗設備、材料以及同型刀具進行。實驗結果如圖9所示,其中橫坐標為實測值,縱坐標為預測值,上、下4條線內分別10%和15%預測相對誤差的誤差帶。

圖9 真實值與預測值效果對比
經過統計,本文卷積神經網絡的預測誤差分布如圖10所示。

圖10 毛刺預測相對誤差分布圖
通過圖9和圖10可以清楚地看出,本文所建立的卷積神經網絡對制孔質量的預測誤差主要集中在5%~10%之間,且均<15%,而清華大學所采用的“鋁合金疊層板鉆削層間毛刺高度預測模型”的預測誤差在30%以內[14],與其相比可以證明卷積神經網絡具備較好的預測制孔相關性能指標的能力。
1) 本文所建立的基于卷積神經網絡的制孔出口毛刺預測模型,以工藝參數(制孔轉速、進給、每轉進給)與主軸電流信號特征矩陣為輸入,預測制孔出口毛刺高度,預測平均相對誤差9.34%。實驗集測試中,預測相對誤差均<15%,優于傳統理論建模30%左右的相對誤差的預測準確度。
2) 以波音公司125 μm的出口毛刺高度合格標準為例,本文的預測模型預測結果為毛刺高度<106.25 μm的制孔結果,其15%相對誤差帶完全落在合格標準指標內,能夠以>95%的準確率滿足合格標準。證明本文預測方法具備在一定環境下的工程應用能力。