王明微,高靜,李智昂,周競濤,蔡聞峰,龔菊賢
(1.西北工業大學 機電學院,陜西 西安 710072;2.上海航天設備制造總廠有限公司,上海 200245)
在切削加工過程中,刀具不可避免地會發生磨損甚至破損的現象,刀具狀態的變化會直接導致切削力增大、切削溫度升高、工件表面粗糙度上升、工件尺寸超出公差要求以及切削顫振等問題的產生[1]。因此,在加工過程中對刀具狀態進行監控十分必要。隨著傳感技術的發展,通過采集加工過程中與刀具磨損相關的傳感器信號,如切削力信號、聲發射信號、電流(功率)信號燈等[2],利用這些信號與刀具磨損之間的強耦合性,通過提取與刀具磨損狀態相關的信號特征間接判斷刀具狀態,成為加工過程中實時監測刀具的有效手段。
由于從傳感器上采集到的信號無法直接使用,必須先對預處理后的信號進行特征提取。傳統的刀具磨損特征提取方法,如信號處理中的時頻域特征提取方法,是從高維、多源的加工信號、加工工藝等因素中提取刀具磨損特征,其效果一般,且還未完全擺脫對人工經驗的依賴。WU等[3]提取了噪聲信號和電流信號的均值、方根幅值、標準差、均方根值、峭度、最大值等,并進行特征篩選,實現對刀具剩余壽命預測。YU等[4]對力信號進行時域特征篩選,從中選擇標準差作為磨損特征,建立了刀具狀態識別模型。王曉強等[5]采用傅里葉變換提取振動信號和聲發射信號的頻率幅值,融合統計特征和能量特征,采用隱馬爾科夫建立磨損量預測模型。盡管當前多數方法可以檢測刀具的磨損情況,但其預測的準確性與切削信號的預處理方法和特征提取有很大關系,而信號的預處理以及特征的提取都是人為選擇或人為手動構建的,耗時長且效果不理想,無法自適應提取對磨損敏感的特征信息。因此,迫切需要一種方法以解決加工中海量切削數據的特征提取問題,從而對刀具磨損進行精準預測。
近年來,深度學習方法已成為提取非平穩、動態變化數據的有效手段,越來越多地被應用在信號特征提取中。趙光全等[6]提出一種通用性較強的基于深度置信網絡的故障特征提取及診斷方法。FU等[7]建立基于深度置信網絡(Deep Belief Networks,DBN)的切削狀態監測的特征空間,將此方法與梅爾頻率倒譜系數、小波方法相比,結果表明,DBN具有更好地表征切割狀態監測信號的能力。林楊等[8]采用小波變換對力信號進行特征提取,得到不同頻段上的能量,采用堆棧自編碼網絡(Stacked Auto-Encoder,SAE)建立刀具磨損狀態預測模型。孫慧斌[9]采用希爾伯特-黃變換(Hilbert-Huang Transform,HHT)提取監測信號的特征信息,得到固有模態函數的振幅均值和邊際譜的最大幅值點。曹大理等[10]利用卷積神經網絡自適應的提取特征,通過加深網絡進一步挖掘信號中隱藏的微小特征。石國強等[11]利用特征描述符網絡實現對圖像特征點的特征提取。上述深度學習模型雖然降低了特征提取對人工經驗的依賴,但仍存在著由于初始化不合理導致的局部最優問題,以及網絡層數過深帶來的過擬合現象。因此,本文利用SAE 無監督和有監督學習相結合的特點,自適應地挖掘出切削數據內部的隱藏特征,此方法可以有效避免特征提取時由于初始化不合理導致的局部最優化問題以及網絡過擬合問題。
自動編碼器(Auto-Encoder,AE)是一種無監督學習神經網絡模型,即原始數據不需要添加標簽,其本質為一個2 層的神經網絡結構,分別為編碼層和解碼層,網絡結構如圖1 所示。編碼層主要負責提取原始數據中的特征,解碼層負責將特征信息恢復成原始輸入數據。

圖1 自動編碼器結構Fig.1 AE structure
圖中:X=[X1,X2,…,Xn]T為網絡的輸入;n為網絡輸入層節點的個數,表示每個樣本的數據維度,則原始數據X經過編碼可以得到的特征數據h為

式中:h為經過編碼層提取出的特征參數;f為編碼過程使用的激活函數,一般使用Sigmoid 函數;W、b分別為編碼階段使用的權重和偏置,W的維數是s×n,s為特征參數的維度。
解碼過程是原始輸入數據的重構過程,對特征數據h經過解碼層可得到重構數據X'為

式中:Y=[Y1,Y2,…,Yn]T為重構出的原始數據;U為解碼過程使用的激活函數,一般使用Sigmoid函數;W'和b'分別為編碼階段使用的權重和偏置,其中W'=WT。
針對給定的輸入樣本X,AE 的訓練目標為尋找參數集θ={W,b,W',b'},使得原始輸入數據和重構數據之間的誤差最小化。在解決回歸問題上,一般將均方誤差函數作為損失函數,其定義為

式中:m為訓練總 樣本數;X(i)、X'(i)分別 為第i個樣本的原始數據和重構數據。
AE 網絡采用反向傳播(Back Propagation,BP)訓練方法,采用隨機梯度下降算法求解式(3)的極小值問題。網絡每訓練一次,AE 模型的參數更新一次,更新方程為

式中:η∈[0,1]為學習率;α為動量因子;αΔW(t)為動量項,可以改善算法的收斂性能。
自編碼器本質上屬于淺層神經網絡模型,處理復雜問題的能力有限,為了克服這一缺點,提出了SAE。SAE 是將一系列AE 模型依次堆疊,前一個AE 的輸出是后一個AE 的輸入,SAE 增加了隱藏層的個數,每一個隱藏層都是前一層輸出的非線性映射表示,每增加一個隱藏層,網絡就可計算出更加復雜的非線性映射關系,能夠獲取到原始數據更加深層低維的特征,這種標準的SAE 模型具有強大的特征挖掘及表達能力。
具有3 個隱藏層的SAE 模型的構建過程,如圖2 所示。首先將原始數據X作為輸入,采用無監督的學習方式預訓練第一個AE(AE-1)模型,得到隱藏層特征h1,然后將隱藏層特征h1作為下一個AE(AE-2)模型的輸入,采用無監督學習方式訓練得到新的隱藏層特征h2,以此類推,最終得到下一個AE(AE-3)模型的隱藏層特征數據h3,在此基礎上,對整個網絡進行有監督微調可以得到更優的特征表達。

圖2 SAE 模型的構建過程Fig.2 Construction process of the SAE model
為了從原始切削加工數據中獲取深層次的非線性特征,本文將SAE 作為特征學習器,借助SAE在無監督特征提取方面的優勢,增強網絡自身學習能力,同時減小網絡過擬合現象。基于此,提出一種基于SAE 的切削信號數據特征提取網絡,其本質是一系列特征自主學習的過程,將原始高維數據中的主體信息映射到低維空間。
在對原始切削信號進行分割、預處理和壓縮感知處理后,從中選擇分割后的壓縮數據片段4 096×3 維切削信號數據進行特征提取,具體的SAE 網絡結構設置如圖3 所示。壓縮后的切削信號通過采用SAE 網絡進行特征提取得到的低維刀具磨損特征向量的具體流程見表1。

表1 刀具磨損特征提取流程Tab.1 Cutter wear feature extraction process

圖3 基于SAE 的刀具磨損特征提取網絡Fig.3 Cutter wear feature extraction network based on SAE
在上述刀具磨損特征提取的過程中,每一個AE 都是為了挖掘隱藏在數據內部的磨損特征,每經歷一個隱藏層,都是對數據進行一次非線性映射,即是對數據的抽象特征提取過程。在刀具磨損特征提取網絡中,隱藏層節點數依次被設置為:4 096、2 048、1 024、512、128、60。一方面,可以提取到原始切削數據內部的刀具磨損特征,去除冗余特征;另一方面,可以實現原始數據降維,為后續刀具磨損預測網絡的輸入做準備。
為了評估基于SAE 提取的切削信號特征,本文從SAE 本身對數據的重構性能和提取到的切削信號特征2個方面評估基于SAE 提取到的切削信號特征。
由第1 章對SAE 的理論介紹可知,SAE 由多個AE 堆疊而成,經過壓縮感知(Compressed Sensing,CS)壓縮后的監測信號作為輸入經過編碼單元激活函數被映射到隱藏層,再通過解碼單元重構出原始切削信號,以最小化重構信號和原始信號的差異為優化目標,得到隱藏層最優解,將此信號作為下一個編碼器的輸入重復上述過程,最終學習得到深層次的抽象特征。本文采用SAE 對特征數據的重構能力來研究其特征提取性能,數據重構網絡如圖4 所示。
SAE 數據重構的步驟如下:
步驟1根據表1 所示的刀具磨損特征提取流程逐個對深度自編碼網絡進行訓練,得到經過SAE網絡提取到的特征向量;
步驟2在完成SAE 的訓練之后,將最終得到的特征參數進行逐層反向重構,建立1 個SAE 重構網絡;
步驟3利用原始數據對重構SAE 網絡進行微調,得到微調后的網絡各層之間的權重和偏置;
步驟4向訓練好的重構網絡中輸入測試數據,得到與原始數據相對應的重構數據。
為了進一步探究SAE 的特征提取能力,對經過SAE 重構得到的數據,準確、有效地評估重構數據質量是非常重要的,本文采用定性分析和定量分析相結合的方法對其能力進行評價。定性分析是指通過可視化輸入數據曲線和重構數據曲線來初步評價SAE 的特征提取能力;定量分析是采用均方根誤差(RMSE)和失真度(K)來精確、有效評價輸入數據和重構數據之間的差異性,RMSE、K的值越小,則輸入數據和重構數據的差異性越小,說明SAE 從輸入數據提取特征能力越強。RMSE、K可通過式(6)和式(7)進行計算:


式中:x為原始輸入數據;y為重構數據;m為樣本維數;n為樣本總數。
主成分分析(Principal Component Analysis,PCA)是提取特征中主成分的一種方法,通過計算樣本數據協方差矩陣的特征向量,將原始特征矩陣線性映射到低維特征空間中。研究表明:相同工況下,經PCA 降維得到的特征與刀具磨損量的變化趨勢越相近,則原始特征中包含的刀具磨損信息越多,即原始特征越優[12]。因此,本文采用PCA 評估SAE 提取特征的優劣,主要步驟如下:
步驟1將經SAE 提取的特征值矩陣T(n為樣本數,m為特征數)進行歸一化處理得到特征值矩陣T1,對矩陣T1按列(特征種類)進行去均值處理得到特征值矩陣T0;
步驟2計算矩陣的協方差矩陣C=T0·T'0,并求出C對應的特征值λi和相應的特征向量μi;
步驟3將特征值λi按照降序排列,前m個特征值λ1≥λ2≥…≥λm代表前m個主成分的方差,若m個主成分的方差貢獻率大于85%,則說明提取的主成分特征能夠反應原始特征信息,對應的特征向量μi按照λi的大小換位,得到新的向量P=[μ1,μ2,…,μm]T;
步驟4計算原始特征向量的主成分得分SC=X0·P,SC=[s1,s2,…,sm],其中s1,s2,…,sm為原始特征向量的第1主成分,第2主成分,…,第m主成分。
得到原始特征的主成分矩陣后,依據同種工況下主成分特征與刀具磨損量的相關性程度來判斷原始特征的優劣。
4.1.1 實驗裝置
本文采用美國故障診斷與健康管理(Prognostic and Health Management,PHM)協會在2010年刀具健康預測競賽中的公開數據集[13],對本文所提方法進行驗證。實驗平臺為高速數控銑床,實驗刀具為碳化鎢球頭銑刀,切削材料為不銹鋼(HRC 52)。
實驗采用了多傳感器收集銑削過程中的數據,包括力傳感器、加速度傳感器和聲發射傳感器。力傳感器選擇Kistler 壓電石英三向平臺測力儀,測力儀可直接安裝在工作臺上,并將工件裝夾在測力儀平臺上,經Kistler 電荷放大器轉化為電壓信號并輸出;選擇壓電式加速度傳感器(3 個)采集工件振動信號,將其分別安裝在工件3 個不同方向的表面上,測量出X、Y、Z3 個方向的振動;選擇Kistler 聲發射傳感器采集銑削過程中的高頻壓力波信號,將其安裝在工件上。
上述傳感器收集的信號經過電荷放大后,通過NI DAQ PCI 1200 采集卡(采樣頻率為50 KHz)轉化為數字信號,并將其存入PC 機。PHM 實驗裝置[14]如圖5 所示。

圖5 PHM 實驗裝置Fig.5 PHM experimental facilities
銑削方式為端銑,每次沿著X方向走刀切削108 mm,將它記為一個切削行程,每把刀具切削315 個行程,每次走刀完成,記錄銑刀每個切削刃的后刀面磨損量值,切削參數見表2。

表2 銑削參數設置Tab.2 Milling parameter setting
4.1.2 實驗數據
共采用3 把刀具進行切削,分別標記為1 號、2 號和3 號,記作C1、C2、C3。每把刀經歷315 個切削行程,共945 個切削行程,即945 個樣本。每把刀包括315 個傳感器數據采集表和1 個刀具磨損量采集表。
傳感器數據采集表格式為:csv。表格共7 列,分別為:X、Y、Z方向的銑削力,X、Y、Z方向的振動,聲發射信號的均方根。刀具磨損量采集表格式為:csv,共315 行3 列,315 行為315 個樣本,3 列為每個樣本對應的銑刀3 個刃的磨損量。刀具C1、C2 和C3 分別有315 個切削行程,即為315 個工步,針對每一個工步,將切削力信號數據和振動信號數據以時間片段328 ms 分割,三向切削力共分為10 個片段,三向振動信號數據共分為10 個片段。
下面利用4.1 節銑削加工中的振動信號,從SAE 自身角度出發,通過重構信號與原始信號的均方誤差和失真度來說明SAE 特征提取的有效性。
SAE 的特征提取通過堆疊AE 來實現,為探討SAE 的特征提取能力,實驗采用上述壓縮信號進行研究,從時域信號中取12 288 個數據點,實驗中將SAE 的個數設置為3,第1 個AE 節點數為:12 288、4 096、2 048、4 096、12 288;第2 個AE 的節點數為2 048、1 024、512、1 024、2 048。保持前2 個AE 節點個數不變,第3 個AE 保持前2 個節點數設置為512 128,分別設置AE 最后一層的節點數為512、128、60、30,這4種不同的節點代表4個不同的目標特征維數,分別以這4種網絡結構討論SAE 的數據重構能力。
對原始輸入數據進行歸一化處理,按照第3 章步驟對樣本數據按照4 種結構進行重構,為方便觀察,取前100 個數據點得到原始數據曲線和重構數據曲線對比如圖6 所示。從圖6 可知,當目標維數為512維和30 維時,即相對前一層網絡維數偏多或過少時,網絡的重構效果相對較差,當目標節點個數為60,即維數相對接近上一層節點數時,效果相對最好。

圖6 原始曲線和重構曲線Fig.6 Original curve and reconstructed curve
以上定性分析不易得到可靠、直觀的結論,為進一步定量分析經SAE 網絡重構過程得到的重構數據與原始樣本數據之間的差異,本文采用式(6)和式(7)分別計算在每種目標維數下的RMSE值和K值,結果見表3。
由表3 可得,目標層維數為60時RMSE值和K值最小,分別為0.076 5 和0.654 0。該定量分析結果與定性分析結果一致,當目標維數與上一層節點數相差過大時,在對原始數據進行學習的過程中會有較多的信息丟失,導致前向堆疊AE 提取到的特征數據難以重構原始輸入數據,這表明:與上一層節點數相比,目標維數過少時,SAE 網絡的特征提取能力相對較弱;目標維數過多時,在AE 網絡最后一個隱藏層的學習過程中,會引入無用的不相關的信息,因此對數據的重構能力相對較差。

表3 不同目標維數下的RMSE值和S值Tab.3 RMSE and K values in different target dimensions
下面利用銑削加工中的振動信號,將SAE 特征提取方法與其他種類信號特征提取方法進行對比,以PCA 降維后的主成分與磨損量的相關性為指標闡述SAE 特征提取的優勢。
將基于SAE 的特征提取方法與傳統特征提取方法進行對比,包括信號統計特征(21 種)和基于小波包分解的特征提取(24 種)2 種方法,原始數據的統計特征包括壓縮數據的最大值、平均值、均方根值、峭度因子、裕度因子、重心頻率、均方頻率等[15]。基于小波包分解的特征提取過程為:將原始壓縮數據樣本進行3 層小波包分解(db2 小波基),提取最高能量頻帶的特征參數(24 個),公式詳見文獻[16]。
本文將SAE 方法學習到的深度特征與傳統的統計特征以及小波包分解提取到的特征進行可視化對比,采用PCA 分別提取統計特征、小波特征以及深度特征的前2 個主成分,為了避免基于SAE 特征提取的偶然性,按照第1 節所提方法重復運行10次,隨機選擇其中2 次的特征數據做測試(可視化其中一次結果)。
數據集C3 中3 種特征的主成分1、主成分2 和刀具磨損量的變化趨勢,如圖7 所示。其中,統計特征的第1、第2 主成分貢獻率分別為84.482%、9.377%;小波特征的第1、第2 主成分貢獻率分別為85.336%、7.052%;深度特征的第1、第2 主成分貢獻率分別為89.909%、5.820%。

圖7 二維特征可視化Fig.7 Two-dimensional feature visualization
由圖7 可知,同種工況下,3 種特征中主成分特征2 與刀具磨損量的相關度都較低,這可能是由于主成分2 的方差貢獻率較小造成的,主成分特征1與刀具磨損量的變化趨勢大致相同,其中,深度特征的主成分1 與刀具磨損量的相關程度最高,小波特征次之,統計特征最差。
綜上對比,相較于手工提取的特征,采用SAE提取壓縮數據的深層特征包含了更多的刀具磨損信息。主要原因是SAE 能夠自適應地從壓縮數據中學習到最能夠表征刀具磨損的代表性特征信息,而人工提取的特征具有一定的盲目性,并不是輸入數據最客觀的轉換,難以得到準確有效的刀具磨損特征信息。
本文主要采用SAE 特征提取方法,設計了堆棧自編碼網絡結構,利用其無監督學習和有監督學習相結合的優勢,自適應地從原始數據中挖掘刀具磨損的特征信號。通過與統計特征和小波特征進行對比可以發現:SAE 能從原始數據中有效提取出加工信號特征,且特征提取效果優于統計特征和小波特征。本文所提方法在壓縮信號的特征提取方面表現出明顯的優勢,進一步說明了SAE 特征提取的有效性。