楊國葳, 李宏坤, 張明亮, 黃剛勁
(大連理工大學 機械工程學院,遼寧 大連 116024)
近年來,高速銑削加工領域已經成為先進加工制造業的重要組成部分,其優勢在于極高的加工精度、極快的加工效率和極好的加工表面質量[1]。在實際的加工生產過程中,刀具作為直接與被加工件接觸的切削工具會不可避免的產生磨損現象。研究表明,由于刀具磨損和破損而導致的計劃外停機是造成加工效率降低和生產成本提高的主要原因[2]。因此,在加工過程中,對刀具狀態進行實時監測具有重要意義。
刀具的狀態監測主要分為直接監測法和間接監測法。直接監測法對刀具進行直接測量,主要包括光學圖像法,接觸式電阻測量法和放射性元素法。直接測量法測量精度高,但是必須進行離線監測,會造成切削過程不連續,產生延長加工時間的問題,不利于實際應用。間接監測法主要是基于信號分析和機器學習算法,也是傳統的刀具磨損狀態監測方法。通常首先采集加工過程中的切削力信號,振動信號,電機電流與功率信號等,然后人為的對原始信號進行特征提取,最后采用機器學習算法,實現刀具磨損狀態識別。如趙帥等[3]對主軸電流信號的時域、頻域、時頻域進行特征提取,通過主成分分析(principal component analysis,PCA)對提取的特征進行降維處理,最后利用隨機森林得到刀具磨損的分級評估結果;程燦等[4]通過遺傳算法合理選擇特征參數,利用支持向量機(support vector machine,SVM)實現了刀具磨損量的預測;呂震宇[5]通過散布矩陣分析特征參數對刀具不同磨損狀態的敏感程度并對高度敏感特征進行降維處理,最后利用隱馬爾科夫模型(hidden Markov model,HMM)識別刀具磨損狀態。上述基于機器學習的方法雖然實現了刀具磨損狀態的識別,但仍然存在兩個弊端:① 算法模型的識別準確率很大程度上依賴于對信號的特征提取和特征選擇的手段,十分依賴專業知識。并且,為了提高識別精度,需要研究更深層次的特征提取方法,極大增加了算法模型的復雜程度;② 人工提取特征可能會由于領域知識的限制而導致原始信號中與刀具磨損相關性很高的特征信息丟失。
近幾年來,深度學習由于其強大的自適應提取特征的能力而受到了很大的關注。在刀具狀態監測領域也得到了廣泛的應用。相比于機器學習,深度學習最大的優勢在于其可以通過多層神經網絡充分學習信號的本征信息,不需要大量的人力和知識來進行人工特征提取與篩選[6]。李宏坤等[7]通過壓縮感知技術對電流信號有效值的頻域數據進行降維壓縮處理,然后使用堆棧稀疏自編碼器對刀具狀態進行分類。王麗華等[8]提出了一種基于堆疊降噪自編碼器(stacked denoising autoencoder,SDAE)的刀具狀態識別方法,將時域原始AE信號經過快速傅里葉變換到頻域,利用頻域信息作為模型輸入,有效地提取出了反映刀具磨損的特征信息,并在實際應用中取得了100%的識別準確率。Huang等[9]融合三向銑削力信號和加速度信號的時域、頻域和時頻域的特征信息,利用卷積神經網絡(convolutional neural network,CNN)實現了刀具剩余壽命的預測。Martinez-Arellano等[10]利用格蘭姆角求和域(Gramian angular summation fields,GASF)將力信號轉換為二維圖像,利用卷積神經網絡實現刀具磨損狀態識別,識別率達90%以上;Zheng等[11]利用小波包變換和短時傅里葉變換提取銑刀銑削力信號的時頻特征,以此訓練卷積神經網絡實現高速銑刀的狀態監測,識別率達99.40%。雖然上述模型在刀具狀態監測上已經取得了較好的識別效果,但是依賴于對數據進行的預處理手段,當利用原始時域信號作為模型輸入時,模型的識別效果并不理想。
為了解決上述問題,本文提出一種基于一維深度卷積自動編碼器(1-D deep convolution autoencoder,ODCAE)的刀具磨損狀態監測方法。不需要繁瑣的預處理手段,而是直接對原始電流有效值信號進行分類。以主軸電流有效值作為模型的輸入,首先對網絡進行無監督預訓練。然后保留編碼部分以保存最優權值,為初始化用于模式識別的有監督網絡提供更好的起點。最后利用樣本標簽進行有監督微調,實現刀具磨損狀態的識別。
卷積神經網絡屬于多級前饋神經網絡,主要包含卷積層、池化層和全連接層。其中,卷積層和池化層的主要作用是特征提取,全連接層主要是根據提取的特征實現分類或者回歸。
1.1.1 卷積層運算
卷積層主要是利用卷積核與輸入信號的局部區域進行卷積運算,提取輸入信號的局部區域特征。不同于全連接神經網絡,卷積層由于具有局部連接和權值共享的特點,因此可以利用更少的參數獲得更加豐富的特征。卷積層的計算公式為
Yi=F(Yi-1?Wi+bi)
(1)
式中:Yi表示第i層卷積層輸出特征;?表示卷積操作;Wi表示連接第i層和第i-1層的權值向量;bi表示第i層的偏置向量;F表示非線性激活函數。
1.1.2 池化層運算
池化處理也叫做降采樣處理,所以池化層又叫做降采樣層,是對不同位置的特征進行聚合統計。在卷積神經網絡中,池化層可以有效地簡化網絡計算的復雜度,避免過度擬合。常用的池化處理有均值池化和最大值池化,均值池化是以池化層輸入的平均值作為輸出,最大值池化是以池化層輸入的最大值作為輸出。二者的數學描述為
Pi=maxYi-1
(2)
(3)
式中,Pi表示第i層池化層輸出特征。
傳統的用于模式識別的卷積神經網絡由于權值的初始化是隨機的,所以很容易使模型陷入局部最優解,從而導致模型的識別精度下降[12]。自動編碼器[13]可以通過無監督訓練的方式提取基于輸入信號本身的固有特征,使網絡的權值信息只源于信號本身。基于此,本文將一維卷積神經網絡與自動編碼器相結合,構建一維深度卷積自動編碼器。通過無監督預訓練的方式為實現模式識別的有監督網絡提供更好的起點,避免從0開始訓練網絡。模型結構框圖如圖1所示。網絡參數更新采用傳統的誤差反向傳播算法。

圖1 ODCAE網絡結構
在無監督預訓練過程中,最大池化操作是編碼部分的最終輸出。在解碼部分,可以通過反卷積操作得到與原始輸入信號相同的數據維度。但是,由于反卷積操作容易出現矩陣塊重疊的問題[14]。因此在本模型中,采用上采樣和卷積操作還原輸入信息,達到預訓練有監督網絡的初始權重的目的。在上采樣操作中常采用合適的內插值算法來進行輸出維度的擴張,在本文中,采用復制插值的方法進行原始輸入信號的維度復原。即將上采樣層的每一輸入特征元素重復4次,賦值給待插入的序列位置,得到4倍于輸入維度的特征維度。通過逐層疊加,得到與原始輸入信號維度相同的輸出特征。在預訓練階段,損失函數為均方誤差函數(MSE),具體公式如下
(4)

在二次有監督訓練過程中,利用全局平均池化層代替傳統卷積神經網絡中的全連接層,減少模型的訓練參數。通過Dropout方法防止深度網絡產生過擬合現象。模型的輸出層為Softmax分類層,Softmax函數可以將一個具有任意實數的k維向量壓縮成另一個k維實向量,每個元素的范圍在0~1之間,所有元素的總和為1,因此它通常用于估計不同類別的概率。具體公式如下
(5)
式中:C表示輸出層神經元個數,即所分類別的個數(本文中C=6);a表示Softmax層的C維輸入向量;yi是一個常數,用于表示第i個類別的概率。
通常以Softmax為輸出層激活函數的多類神經網絡的損失函數設定為交叉熵,具體公式為
(6)

ODCAE監測模型包括無監督預訓練和有監督微調。具體診斷流程如圖2所示,具體步驟如下:
步驟1采集機床主軸三相電流信號,將其融合成電流有效值信號,將電流有效值歸一化至[0,1]之間,作為ODCAE模型的輸入。
步驟2利用CAE進行無監督預訓練,保留由提取的短序列向量組成的編碼部分,用來保存最優的權值信息。
步驟3以無監督訓練階段獲得的權值作為有監督網絡的初始權重,利用樣本標簽和Softmax分類器再次對網絡進行有監督微調,實現對刀具不同磨損狀態的模式識別。
步驟4將測試樣本輸入訓練好的網絡模型中,得到分類識別結果。
試驗所用機床為臺灣東昱精機公司生產的CMV-850A型立式加工中心,主軸電機為FANUC公司生產的β12/8000i型三相異步電動機,主軸傳動方式為同步帶傳動。銑削電流信號采用瑞士LEM公司生產的LT 108-S7型閉環霍爾效應電流傳感器獲得,采樣頻率設為4 096 Hz。刀具為臺灣Di牌2刃硬質合金平頭立銑刀,試驗所用數量為1把,直徑12 mm,螺旋角30°。工件材料為40Cr。試驗所用設備及采集、加工工件如圖3~圖6所示。

圖2 刀具磨損狀態識別流程圖Fig.2 Flow chart of tool wear state recognition


為了測試模型在變工況條件下對刀具不同磨損狀態的識別能力,在表1中設置9種不同的工況,進行循環重復加工并采集主軸電流信號。同時,為了加快刀具磨損,在銑削過程中不使用切削液,通過干銑的方式人為的將刀具磨損至不同的磨損狀態。通過測量每組工況下,每次走刀后刀具后刀面的磨損量,對數據進行標記。將采集到的三相電流信號Iu,Iv,Iw根據式(7)融合為三相電流有效值Irms,根據式(8)將融合后的Irms值歸一化至[0,1]區間,以此作為網絡模型的輸入樣本。
(7)
(8)
式中:Imax為電流有效值的最大值;Imin為電流有效值的最小值。

表1 加工參數
根據刀具后刀面磨損量的不同,將刀具磨損劃分為6種不同的磨損狀態。每種磨損狀態樣本數量均為200個,共獲得1 200個樣本,每個樣本大小為2 048個點。樣本標簽根據刀具的不同磨損狀態設定為1~6并轉化為獨熱編碼形式。取數據集的50%,即600個樣本作為訓練集,用于訓練神經網絡。300個樣本作為驗證集,用于調整網絡的超參數。剩余300個樣本作為測試集,用來最終測試模型識別精度。具體數據集劃分情況如表2所示。

表2 數據集劃分
3.3.1 優化算法的選擇
梯度下降算法是一種常用的神經網絡優化算法。然而,由于難以從理論上解釋它們的優缺點,該算法通常被認為是黑盒優化器。為此,對以下常用的梯度下降優化算法(Adam、AdaGrad、RMSprop、SGD)進行實驗比較,選擇合適的優化算法。不同優化算法下,訓練集損失值和驗證集平均識別準確率如圖7所示。

(a) 訓練集下無監督學習損失值變化曲線

(c) 驗證集下有監督學習準確率變化曲線圖7 不同優化算法損失值與準確率變化曲線Fig.7 Loss and accuracy curves under different optimization algorithms
由圖7可知,在無監督學習和有監督學習過程中,AdaGrad和SGD算法不僅收斂速度慢,而且訓練誤差較大,在有監督學習過程中尤為明顯。Adam和RMSprop算法在訓練過程中都獲得了較小的損失函數值和極大的識別準確率,但Adam算法相對來說比較穩定,算法的魯棒性優于RMSprop。因此,選擇Adam算法來訓練模型。
3.3.2 批處理大小的選擇
在神經網絡的迭代訓練過程中,批處理大小的選擇會直接影響網絡的收斂方向和準確率[15]。因此,在實驗中對不同批量大小進行對比分析,選擇使訓練結果最優的批處理大小。不同批處理大小的訓練集損失函數,驗證集上整體平均識別結果如圖8所示。
由圖8可知,當批處理尺寸為5、10、20時,模型在訓練過程中收斂速度較快,訓練集上的損失函數值很小且相差不大。但是只有批處理大小為20時,模型在驗證集上的識別率最高,網絡也比較穩定,因此數據集批處理大小選擇20。
3.3.3 卷積核尺寸大小的選擇
通過研究發現,不同的卷積核尺寸會對神經網絡的準確率產生不同的影響,對于非常小和非常大的核尺寸,模型的識別精度是非常不穩定的[16]。因此,在實驗中設計不同的卷積核尺寸進行對比分析,選擇合理的卷積核尺寸大小,使模型達到最優。不同卷積核尺寸的訓練集損失值和驗證集平均識別準確率變化如圖9所示。
由圖9可知,不同卷積核尺寸對無監督學習階段的影響較小。但是當卷積核尺寸為3和5時,模型在有監督訓練過程中收斂速度十分緩慢而且訓練集上損失值很大。當卷積核尺寸大于7時,模型的收斂速度明顯提高,訓練集上的損失值很小,特別是卷積核尺寸為10和13時,模型的收斂速度最快。但是通過驗證集上識別準確率對比曲線可以看出,只有卷積核尺寸等于13時,模型在在驗證集上的識別精度最高。因此,網絡的卷積核尺寸最終選定為13。

(a) 訓練集下無監督學習損失值變化曲線

(c) 驗證集下有監督學習準確率變化曲線圖8 不同批處理大小損失值與準確率變化曲線Fig.8 Loss and accuracy curves under different batch sizes

(a) 訓練集下無監督學習損失值變化曲線

(c) 驗證集下有監督學習準確率變化曲線圖9 不同卷積核尺寸損失值與準確率變化曲線Fig.9 Loss and accuracy curves under different kernel sizes
3.3.4 網絡層數集單元數選擇
為了提高模型的識別精度,增加網絡模型的深度和各特征提取層單元數是有效措施之一。但是,過度增加網絡深度和單元數也會使網絡精度停滯甚至下降,同樣也會增加模型復雜度[17]。因此,在模型建立過程中,從平均識別準確率和訓練時間兩個方面,選擇最優的網絡層數和各特征層單元數,對比結果如表3所示。

表3 不同網絡結構下ODCAE識別結果
由表3的對比結果可知,隨著網絡特征提取層數量的增加,對提高網絡識別準確率是有幫助的,但準確率卻并不是隨著網絡層數的增加而提高。另一方面,網絡層數和各層單元數的增加,還會增加模型的復雜程度和訓練時間。因此,選擇平均識別準確率最高,訓練時間較少的模型3作為刀具狀態監測的網絡結構。
通過上述對比分析,確定模型優化算法為Adam,批處理大小為20,卷積核尺寸為13,網絡結構為模型3。關于模型的具體參數細節如表4和表5所示。

表4 無監督學習網絡參數

表5 有監督學習網絡參數
為了深入了解網絡的特征提取能力,將無監督學習階段對不同磨損狀態的重構信號提取出來并做可視化分析,結果如圖10所示。

(a) 磨損狀態1

(c) 磨損狀態3

(e) 磨損狀態5
由圖10可知,在網絡無監督預訓練階段,重構信號中的噪音相比于歸一化后的原始時域信號有明顯的減少,這說明網絡在進行預訓練的過程中具有一定的抑制噪音的作用。另一方面,由于銑削加工為斷續加工,刀具在旋轉過程中,切削刃每次切入和切出工件都會產生明顯的沖擊信號。通過對比可以發現,重構信號中的沖擊信號明顯比原始時域信號平滑了很多并且更加顯著,這說明網絡的預訓練還具有特征增強的作用。
為了進一步衡量模型的識別質量,在評判準則中引入卡帕系數。具體公式如下
(9)
(10)
式中:po表示總的識別精度;pe用式(10)表示;C表示類別;n表示樣本總數;ai表示第i類真實樣本個數;bi表示第i類預測樣本個數。K值越大,模型識別效果越好。
當通過訓練集和驗證集調整網絡超參數結束以后,利用訓練好的網絡模型在測試集上測試模型的識別精度。用于表示模型識別結果的混淆矩陣如圖11所示。圖11中0~5對應6種不同的磨損狀態,坐標縱軸表示實際的磨損狀態,橫坐標表示網絡預測的磨損狀態。具體識別結果如表6所示。

圖11 測試集混淆矩陣Fig.11 Confusion matrix in the test set
由測試結果可知,ODCAE模型對不同的磨損程度的識別準確率最高可達100%,最低為95%,平均識別率達99%,卡帕系數0.984 0,充分說明本文提出的模型能夠穩定且高精度的識別不同的刀具磨損狀態。
為了突出ODCAE網絡的識別能力,將SVM、文獻7中堆疊降噪自編碼器(SDAE)、傳統一維卷積神經網絡(1-DCNN)[18]與本文提出的模型作對比分析。SVM模型采用高斯核函數,人工提取原始信號中時域,頻域,時頻域的共19個特征,其中,時域特征包括:均值、峰峰值、方差、有效值、偏斜度、峭度值、波形因數;頻域特征包括:重心頻率、頻率方差、均方頻率、平均能量;時頻域特征為通過3層小波包分解得到的8組小波包能量。傳統一維卷積神經網絡和堆疊降噪自編碼器的參數是根據參考文獻設置的。

表6 測試結果
不同模型在測試集上測試結果如表6所示。由表1中識別結果可知,本文提出的基于ODCAE的算法模型在測試集上的識別效果和模型穩定性最佳,進一步表明了ODCAE在刀具磨損狀態識別上的優越性能。

表7 不同模型測試結果
為更加直觀的驗證本文提出方法具有優越的特征提取能力,利用t-SNE降維技術對人工提取的特征、SDAE最后一層隱含層、1-DCNN和本文方法最后一層卷積層提取得到的特征進一步降維成二維并可視化,結果如圖12所示。

(a) 人工提取特征

(c) 1DCNN最后一層卷積層提取特征
由圖12可知,本文提出的方法可以將每類磨損狀態都聚合到一起,不同磨損狀態之間邊界分明,充分體現了ODCAE對時域信號特征信息的深度挖掘能力。
本文提出了一種基于一維深度卷積自動編碼器的刀具磨損狀態監測方法,合理選擇網絡超參數,避免了傳統算法模型在模式識別前需要進行的繁瑣的預處理過程,能夠自適應的提取原始信號中表征刀具不同磨損狀態的特征信息,實現了高精度的刀具磨損狀態識別。在無監督預訓練階段,ODCAE能夠很大程度的抑制原始信號中的噪音信息,具有一定的特征增強的作用。與傳統的機器學習算法、一維卷積神經網絡(1-DCNN)和堆疊降噪自編碼器(SDAE)相比,ODCAE模型識別準確率可達99%,卡帕系數為0.984 0,表明利用ODCAE提取得到的特征信息與刀具不同磨損狀態之間的相關性更強,能夠準確且高效的實現刀具磨損狀態識別。
在實際加工生產中,特別是在高精度復雜型面的加工過程中,除了多樣的切削條件以外,加工過程本身的復雜性、走刀路徑的多樣性、切削液和系統噪聲的干擾性以及刀具在實際加工生產中磨損的隨機性都會給刀具的狀態監測帶來模糊性和不確定性。因此,在今后的研究中,考慮將深度學習與多傳感信息融合技術相結合,多方面捕捉實際生產過程中刀具磨損的動態信息,進一步研究傳感器信息與刀具狀態之間的映射關系。