古洪亮,丁建明
基于卷積神經網絡的擰緊曲線異形識別方法研究
古洪亮,丁建明
(西南交通大學 牽引動力國家重點實驗室,四川 成都 610031)
針對現有擰緊曲線異形識別方法依賴人工提取特征和專業知識的問題,提出了一種基于卷積神經網絡的擰緊曲線異形識別方法。首先,針對擰緊曲線數據匱乏、數據長度不均的問題,通過隨機裁剪來進行數據增強,通過回歸決策樹重構曲線實現曲線對齊;然后,基于傳統CNN模型,建立了擰緊曲線異形識別模型;最后,通過研究各項超參數與模型識別結果的關系,給出了最終的參數組合方案,并且通過分析訓練過程中各個階段的混淆矩陣,展示了模型的學習過程,通過與傳統機器學習方法SVM等對比,驗證了本文所提出方法的有效性。實驗結果表明:該方法能夠有效地識別出螺栓連接擰緊曲線的異常數據,識別正確率可以達到99%,為基于深度學習的螺栓連接件智能診斷提供了方法指導。
卷積神經網絡;螺栓連接;擰緊曲線;故障診斷
螺栓連接結構廣泛應用于軌道車輛中,單個車輛中的螺栓數量動輒上萬,螺栓連接結構的質量及可靠性極大影響車輛的功能,甚至行車安全。目前國內軌道車輛主機廠最常用的螺栓連接質量控制方法是扭矩法和扭矩轉角控制法[1],這兩種方法都是利用擰緊工具識別擰緊扭矩是否達到目標值或目標區間來判別螺栓連接是否合格,缺乏對過程數據的分析,也無法反應螺栓連接擰緊過程中產生的問題。
隨著擰緊設備水平的提高,擰緊曲線的獲取成為了可能[2],為精進工藝水平,越來越多的學者和工程人員對擰緊曲線展開了研究,陳福森等[3]基于企業實測數據,羅列了螺栓連接擰緊曲線的故障類別,闡述了螺栓連接幾種主要缺陷的擰緊曲線特性,并分析了缺陷產生的原因。還有學者對螺栓連接擰緊曲線與螺栓連接結構質量之間的關系進行了探究,如王磊[4]建立了基于擰緊過程與擰緊結果的螺栓連接結構質量評價方法;張春雨[5]對螺栓異常曲線進行了降維處理,之后采用半監督學習對螺栓連接異常做出了分類;Meiners Moritz等[6-7]將機器學習引入到了擰緊曲線的異常監測中,展示了如何通過分析擰緊曲線來監測螺栓緊固件的故障。這些研究證明了從螺栓連接擰緊曲線中獲取螺栓質量信息的有效性與實用性,但這些方法主要基于傳統機器學習,存在擰緊曲線特征提取依賴人工設計的缺點,難以保障算法的通用性。
近年來,深度學習中的卷積神經網絡(Convolutional Neural Network,CNN)憑借著獨特的卷積結構,具有自動提取特征、特征具有平移不變性等優勢,在計算機視覺、自然語言處理等領域成功應用[8-12]。本文基于卷積神經網絡結構,建立螺栓連接擰緊曲線異形識別模型,將數據預處理之后的曲線作為模型輸入,不再需要人工提取特征,實現了擰緊曲線的精準分類。
螺栓連接是用螺栓將多個部件聯結成整體的連接方式,螺栓連接的夾緊力是否達到要求直接反應了螺栓連接結構的性能優劣。但夾緊力不容易直接進行測量,常利用扭矩來計算得到夾緊力,二者的關系為:

式中:為夾緊力;為扭矩;為扭矩系數;為螺紋公稱直徑。
但僅僅監測扭矩并不能保證螺栓連接件滿足性能要求,如螺紋損壞、粘滑等故障發生時,最終扭矩也可能在合格區間以內。在這種情況下,擰緊曲線就派上了用場。擰緊曲線反應了扭矩隨螺栓旋入角度的增大而變化的情況,包含擰緊全過程的信息,通過識別擰緊曲線的特征,可以對故障進行甄別。
理想的擰緊曲線可分為三個階段,以M12鍍鋅螺栓壓板試驗擰緊曲線為例進行說明,如圖1所示。在預擰緊階段,扭矩主要克服螺紋副之間的摩擦力,此時扭矩較小;擰至貼合后,進入彈性擰緊階段,扭矩逐漸增大,穩定后曲線幾乎呈直線形,在這個階段拆卸螺栓,螺栓會回到原始狀態;扭到屈服點后,螺栓發生塑性變形,這個階段擰緊曲線斜率下降,甚至變為負數,直至螺栓被拉斷。

圖1 擰緊曲線
本文所使用的螺栓連接擰緊曲線數據是采用德國Kistler公司的螺栓緊固分析設備在實驗室中取得。為達到擰緊曲線異形識別的目的,設計不同的試驗條件,得到四種不同的曲線,包括正常、裝錯件、螺紋損壞、粘滑四種類別,獲得的各類數據如圖2所示。

圖2 各類擰緊曲線
數據樣本量的大小對神經網絡模型的訓練效果有很大的影響,一般而言,樣本量越大,模型的泛化能力越強。因此,在模型訓練之前,常常會使用數據增強的技術來擴沖數據樣本,常用的數據增強方式有隨機裁剪、幾何變換、顏色變換等??紤]到擰緊曲線的特殊性,本文采用隨機裁剪的方式進行數據增強。
從擰緊設備上采集的擰緊曲線長度不一,為使每條擰緊曲線都能適應統一的神經網絡,需要進行曲線對齊,使每條擰緊曲線的點數保持一致。本文采用回歸決策樹來學習每條曲線的特征,對曲線進行重構,從而達到曲線對齊的目的。首先,利用決策樹學習曲線,使用均方誤差作為決策樹劃分標準,將決策樹的最大深度設為100,使決策樹過擬合,從而記住曲線的細節特征;其次,以曲線最大角度的千分之一作為步長,預測每個角度對應的扭矩,以此得到新的曲線。重構的每條曲線角度步長不同,但點數相同,達到了曲線對齊的目的。
圖3為某條擰緊曲線某一區間重構前后的對比圖,其中,原始曲線有9030個數據點,重構之后有1000個數據點??梢钥闯觯€重構后,曲線點數減少了,但是曲線的走勢基本沒變,保留了原始曲線的細微特征。

圖3 某一段曲線重構前后對比圖
為排除特征量綱的影響,加速模型收斂,提高模型精度,本文對數據進行線性歸一化處理,公式為:

式中:x為歸一化后的數據;為原始的角度(扭矩)數據;min為每列角度(扭矩)數據的最小值;max為每列角度(扭矩)數據的最大值。
本文模型采用二維卷積與一維卷積結合的神經網絡結構,如圖4所示,其中包括1個輸入層、一個2維卷積層、1個一維卷積層、2個一維池化層、3個全連接層,圖中的藍色方框代表卷積核的大小、紅色方框代表池化窗口的大小。螺栓連接擰緊數據的復雜度不高,因此較低層數的神經網絡模型已經能很好的解決問題,在網絡層數過高時,反而會導致過擬合使得識別準確率降低。

圖4 擰緊曲線異形識別模型
擰緊曲線異形識別流程如圖5所示。輸入擰緊數據后,隨機將85%的數據劃分為訓練集、剩下的15%作為測試集,之后的流程可分為模型訓練與模型測試兩個環節。在模型訓練階段,首先對神經網絡模型的參數進行初始化,然后網絡向前傳播計算出預測值,根據預測值計算出損失,之后反向傳播更新模型參數,循環多次達到訓練要求后,結束訓練。在模型測試階段,利用已經訓練好的卷積神經網絡模型對測試集中的數據進行識別,根據識別結果與真實標簽的匹配程度,判斷模型的優劣程度。

圖5 算法流程圖
數據集取自第2章預處理后的數據,在數據集中隨機抽取85%作為訓練集、剩下的15%作為測試集,數據分布如表1所示。

表1 數據樣本組成
對于神經網絡模型,選取合適的模型參數能極大提升模型性能,包括優化器類型、批處理樣本量、學習率、卷積層數、卷積核大小等。本文模型的卷積層數、卷積核大小、池化窗口大小等結構參數已經確定,如圖4所示。因此,本文著重針對優化器類型、批處理樣本量和學習率進行試驗,選取相對較優的參數組合,提高模型性能。
優化器用于計算和更新神經網絡參數,使得損失函數達到最小值。不同的優化器有不同的特點,如SGD具有很好的泛化性能,但容易收斂到局部最優;Adagrad可以自適應學習率,但迭代后期收斂緩慢;Adadelta在Adagrad的基礎上進行改進,能夠減弱Adagrad學習率過激地單調遞減的現象,使得訓練過程更加順暢,但訓練前期的收斂速度會變慢;Adam是上述方法的集大成者,具有很強的普適性,但在某些情況下可能不收斂。本文將SGD、Adagrad、Adadelta、Adam進行對比分析,不同優化器的表現如圖6所示,SGD、Adadelta陷入了局部最小值且在訓練后期收斂較慢,而Adam的準確率最高、收斂速度最快,因此本文選取Adam作為優化器。

圖6 不同優化器對模型識別結果的影響
批量大小是模型單次訓練所使用樣本的數量,設置過小則模型不容易收斂,設置過大則容易陷入局部最優。本文將批量大小分別設置為4、8、16、32、64、128,計算結果如圖7所示,可以看出:批量大小為4時準確率最低,未能收斂;批量大小分別為8、16、32時,準確率都接近了100%,訓練至收斂的時間依次遞減;批量大小提高到64與128后,訓練至收斂的時間變長。綜合來看,在批量大小為32時,準確率高和訓練時間短,因此本文選取批量大小為32。

圖7 批量大小對訓練結果的影響
學習率表示每次神經網絡更新參數的步幅大小,設置的大則前期學習速度快但模型可能不能收斂,學習率設置的小則更容易收斂、但學習速度慢、而且也可能陷入局部最優。為了選取相對合適的學習率,本文設置了不同的學習率,每個工況試驗10次,計算結果如表2所示,可以看出,隨著學習率的降低,準確率得到了提高,但訓練至收斂的時間在增加。綜合來看,學習率為0.001時,準確率高、訓練時間相對較短,因此本文選取學習率為0.001。

表2 不同學習率對訓練結果的影響
依照4.2節的模型參數設置,模型訓練結果如圖8所示,可以看出:模型的損失函數值和準確率在訓練集和測試集上的表現基本一致;當訓練次數為30時,模型的準確率已經接近了99%,此時損失函數值也降到了較小值;當訓練次數為50時,模型準確率穩定在了99%以上,損失函數值進一步降低。由此可見,本文模型的訓練結果較好,能滿足螺栓連接擰緊曲線異形識別的要求。

為了展示模型學習過程,本文引入混淆矩陣對各個階段的模型進行量化分析,如圖9所示,可以看出:訓練5次后,正常數據(標簽為0)與粘滑數據(標簽為3)不能區分,裝錯件數據(標簽為1)與螺紋損壞數據(標簽為2)有混淆;訓練15次后,裝錯件數據與螺栓損壞數據被區分開了,不過粘滑數據還是不能與正常數據區分開;訓練20次后,開始能夠區分出一些粘滑數據與正常數據;訓練50次后,實現了所有類別的精準區分。
為說明本文方法的有效性,將本文方法與傳統機器學習方法SVM、KNN、Logistic進行對比分析,如表3所示,可知,本文所用的方法在測試集上的表現顯著好于其他方法,說明本文方法有優秀的特征提取和分類能力。

圖9 不同訓練次數模型的混淆矩陣

表3 本文方法與傳統機器學習方法的對比
本文針對現有擰緊曲線異形識別方法依賴人工提取特征的問題,提出了一種基于卷積神經網絡的擰緊曲線異形識別方法。考慮到實際生產環境數據長度參差不齊的特點,本文建立了數據預處理流程來保證模型輸入端的規范性。本文所建立的模型的優勢是無需人工提取特征、計算速度快、準確率高,因此具有良好的通用性,有利于實現擰緊過程的在線智能評價。但本文所應用的數據量較少,類別不夠多,后續將積累更多數量、更多種類的擰緊曲線來進行試驗,并進一步優化網絡結構,保證準確率,降低計算時間。
[1]張赫. 汽車螺栓打緊質量大數據分析[D]. 沈陽:沈陽工業大學,2019.
[2]陳平. 汽車行業螺栓擰緊質量監控[J]. 中國計量,2022(1):40-41,58.
[3]陳福森,馬貝方. 擰緊曲線在螺紋連接質量分析中的應用研究[J]. 制造技術與機床,2021(9):9-12.
[4]王磊. 基于大數據分析的螺栓擰緊工藝質量評價方法研究[D]. 濟南:山東大學,2018.
[5]張春雨. 導師:朱習軍. 基于機器學習的螺栓異常檢測[D]. 青島:青島科技大學,2021.
[6]MEINERS M,MAYR A,FRANKE J. Process curve analysis with machine learning on the example of screw fastening and press-in processes[J]. Procedia CIRP,2021,97(8):166-171.
[7]MEINERS M,KUHN M,FRANKE J. Manufacturing process curve monitoring with deep learning[J]. MANUFACTURING LETTERS,2021(30):15-18.
[8]STANISAW HOY?. Convolutional Neural Networks for Classifying Electronic Components in Industrial Applications[J]. Energies,2023,16(2):887.
[9]HOWARD A G,SANDLER M,CHEN L C,et al. Highly Efficient Convolutional Neural Networks: EP3933707A4[P]. 2019-05-16.
[10]GHALEB M,EBIED H,SHEDEED H,et al. Content-based Image Retrieval based on Convolutional Neural Networks[J]. IEEE,2022(10):149-153.
[11]曹亞利,李振雷,劉旭東,等. 基于卷積神經網絡的沖擊地壓預警方法研究[J]. 中國安全生產科學技術,2022,18(10):101-108.
[12]艾霖嬪,楊錦濤,徐權峰,等. 基于一維卷積神經網絡的恒星光譜分類研究[J]. 云南民族大學學報(自然科學版),2021,30(3):258-263.
Recognition Method of Abnormal Shape of Tightening Curve Based on Convolutional Neural Network
GU Hongliang,DING Jianming
( State Key Laboratory of Traction Power, Southwest Jiaotong University, Chengdu 610031, China )
To address the problem that the existing methods largely depend on artificial feature extraction and professional knowledge, this paper proposes a method for identifying the abnormal shape of tightening curve based on convolutional neural network. Firstly, in view of the lack of data and uneven data length of tightening curve, the paper uses random clipping to enhance the data, and uses regression decision tree to reconstruct the curve to keep the same length. Secondly, based on the traditional CNN model, the identification model of tightening curve abnormity is established. Finally, by studying the influence of super parameters on diagnosis results, the final parameter combination scheme is given. By analyzing the confusion matrix in each stage of the training process, the model learning process is demonstrated. By comparing with the traditional machine learning method, such as SVM, the effectiveness of the method proposed is verified. The experimental results show that the method can effectively identify the abnormal data of the bolt connection tightening curve, and the recognition accuracy is close to 99%, which provides a guidance for the intelligent diagnosis method of bolt connection based on deep learning.
convolutional neural networks;bolted connections;process curve;fault diagnosis
U270.6+7
A
10.3969/j.issn.1006-0316.2023.07.003
1006-0316 (2023) 07-0019-07
2022-12-27
國家重點研發計劃(2020YFA0710902)
古洪亮(1998-),男,四川瀘州人,碩士研究生,主要研究方向為緊固件缺陷智能檢測,E-mail:1312331780@qq.com;丁建明(1981-),男,四川平昌人,博士,副研究員,主要研究方向為機電設備的智能控制與大數據可視化研究。