蘇史博,畢 果,鄭守紅,劉 杉
(廈門(mén)大學(xué)航空航天學(xué)院,福建 廈門(mén) 361102)
在光學(xué)元件的超精密磨削加工中,砂輪磨損狀態(tài)關(guān)乎砂輪的磨削性能,影響加工精度和加工效率。為了保證元件的正常加工,需要及時(shí)地更換修整磨損過(guò)度的砂輪。而在車(chē)間的生產(chǎn)過(guò)程中,由于無(wú)法準(zhǔn)確地判斷砂輪的磨損狀態(tài),只能憑借經(jīng)驗(yàn)將剩余壽命還有較大余量的砂輪替換修整。另一方面,加工過(guò)程中的各種突發(fā)因素都可能使砂輪磨損狀態(tài)發(fā)生意外突變。因此,在線準(zhǔn)確識(shí)別砂輪的磨損狀態(tài)從而判斷是否需要修整,既能夠保證加工的精度和安全,又能充分利用砂輪的使用壽命,具有較大的經(jīng)濟(jì)價(jià)值。
磨削加工過(guò)程中砂輪與加工材料的相互作用使材料發(fā)生形變時(shí)會(huì)產(chǎn)生大量的彈性應(yīng)力波,這就是聲發(fā)射現(xiàn)象。自從上世紀(jì)五十年代Kaiser首次發(fā)現(xiàn)聲發(fā)射現(xiàn)象[1]以來(lái),聲發(fā)射被廣泛應(yīng)用到很多監(jiān)測(cè)和診斷上的諸多領(lǐng)域。伯克利大學(xué)較早地將聲發(fā)射運(yùn)用于砂輪磨損狀態(tài)監(jiān)測(cè)[2],Mokbel A A等發(fā)現(xiàn)砂輪的磨損會(huì)造成聲發(fā)射信號(hào)幅值的提升[3]。
但是上述方法常常依賴于各種精巧的閾值設(shè)置和時(shí)域特征選擇,實(shí)際應(yīng)用和推廣困難,基于數(shù)據(jù)驅(qū)動(dòng)的診斷方法受到了更多的關(guān)注。Ghosh N等開(kāi)發(fā)了基于神經(jīng)網(wǎng)絡(luò)的刀具狀態(tài)監(jiān)測(cè)傳感器融合模型[4];劉然結(jié)合前饋神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network, BPNN)和自回歸移動(dòng)平均模型(Autoregression and moving average, ARMA)構(gòu)建了刀具磨損量評(píng)估模型[5]。砂輪磨損是一個(gè)歷經(jīng)初期磨損、穩(wěn)定磨損、急劇磨損三個(gè)階段的緩慢變化過(guò)程,從聲發(fā)射樣本預(yù)測(cè)砂輪的磨損狀態(tài)本質(zhì)上是一個(gè)時(shí)間相關(guān)序列的模式識(shí)別問(wèn)題。傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)處理時(shí)間相關(guān)序列上存在較大的局限性。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network,RNN)是一種用于時(shí)序列識(shí)別的模型,但在砂輪磨損狀態(tài)識(shí)別問(wèn)題上卻較少有研究。傳統(tǒng)RNN難以實(shí)現(xiàn)對(duì)長(zhǎng)時(shí)間依賴的建模[6-7],不適用于從緩慢變化到急劇變化的砂輪磨損過(guò)程。Hochreiter S等提出長(zhǎng)短時(shí)記憶模型(LSTM),將隱含層的節(jié)點(diǎn)替換為一個(gè)特殊的復(fù)合存儲(chǔ)單元,獲得建模長(zhǎng)時(shí)間依賴序列的能力[9]。
針對(duì)砂輪磨損狀態(tài)識(shí)別的問(wèn)題,本文建立了一個(gè)長(zhǎng)短時(shí)記憶(LSTM)循環(huán)神經(jīng)網(wǎng)絡(luò)模型,通過(guò)小波包能量系數(shù)法獲取砂輪磨損的敏感頻段特征,并使用主成分分析對(duì)特征進(jìn)行降維,使用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)識(shí)別砂輪的磨損狀態(tài)。在實(shí)驗(yàn)的基礎(chǔ)上,通過(guò)與頻域分析、BP神經(jīng)網(wǎng)絡(luò)的對(duì)比,證明LSTM構(gòu)建的網(wǎng)絡(luò)具有識(shí)別精度高、收斂速度快、離群值較少等優(yōu)點(diǎn),驗(yàn)證了方法的有效性。
為了克服傳統(tǒng)BPNN神經(jīng)網(wǎng)絡(luò)在處理時(shí)間相關(guān)序列上的局限性,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在不同層間節(jié)點(diǎn)連接的基礎(chǔ)上添加了隱含層節(jié)點(diǎn)與節(jié)點(diǎn)間的連接,使得網(wǎng)絡(luò)保留了過(guò)往輸入節(jié)點(diǎn)的信息,從而獲得了建模時(shí)間相關(guān)序列的能力[7],其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。砂輪聲發(fā)射信息樣本隨時(shí)間的變化中蘊(yùn)含著識(shí)別砂輪磨損狀態(tài)的必要特征,在穩(wěn)定磨損階段砂輪磨損狀態(tài)變化較為平緩,聲發(fā)射信號(hào)相鄰幀之間的差異較小;而當(dāng)砂輪處于急劇磨損階段時(shí),磨損狀態(tài)變化劇烈,聲發(fā)射信號(hào)相鄰幀之間的差異較大[10]。上述過(guò)程是一個(gè)緩慢變化的過(guò)程,這就要求識(shí)別模型具備建模長(zhǎng)時(shí)間依賴的能力。RNN由于其網(wǎng)絡(luò)特點(diǎn),如果節(jié)點(diǎn)循環(huán)邊的權(quán)重小于1,那么第一個(gè)時(shí)間步的輸入對(duì)最后一個(gè)時(shí)間步的輸出的貢獻(xiàn)將會(huì)隨時(shí)間間隔而指數(shù)衰減,如圖2所示,這就限制了網(wǎng)絡(luò)建模長(zhǎng)距離時(shí)間依賴的能力。長(zhǎng)短時(shí)記憶模型LSTM將隱含層的節(jié)點(diǎn)替換為一個(gè)特殊的復(fù)合存儲(chǔ)單元。這個(gè)特殊單元通過(guò)選擇性地保留或丟棄過(guò)往時(shí)間節(jié)點(diǎn)的輸入,從而獲得建模長(zhǎng)時(shí)間依賴序列的能力,更適合用來(lái)建模砂輪的磨損過(guò)程。

圖1 RNN網(wǎng)絡(luò)結(jié)構(gòu)圖

圖2 RNN網(wǎng)絡(luò)梯度消失可視化

(1)
本時(shí)刻單元的狀態(tài)ct計(jì)算表達(dá)式如式(2)~式(4)所示,其中Wi為輸入權(quán)重矩陣,Wc為狀態(tài)權(quán)重矩陣。

(2)
(3)
(4)
本時(shí)刻單元輸出ht的計(jì)算表達(dá)式如式(5)、式(6)所示,其中Wo為輸出權(quán)重矩陣。
ht=ot·tanh(ct)
(5)
(6)

圖3 LSTM單元基本結(jié)構(gòu)
對(duì)模型而言輸入特征對(duì)模型精度和運(yùn)算速度等尤為重要,本文使用小波包分析獲取聲發(fā)射信號(hào)各個(gè)頻段的能量系數(shù),并計(jì)算各頻段能量系數(shù)隨砂輪磨損狀態(tài)的變化程度以確定砂輪磨損的敏感頻段,從而提取用于訓(xùn)練網(wǎng)絡(luò)的頻域特征。

雖然小波包分析確定了聲發(fā)射信號(hào)對(duì)于砂輪磨損的敏感頻段,但是對(duì)應(yīng)頻段的頻域特征數(shù)量還是很大,存在較大數(shù)量的冗余特征。如果直接將對(duì)應(yīng)頻段的頻域特征作為神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn),會(huì)造成網(wǎng)絡(luò)規(guī)模和層數(shù)過(guò)大,對(duì)網(wǎng)絡(luò)的訓(xùn)練和部署造成不必要的麻煩。因此本文使用主成分分析(PCA)對(duì)敏感頻段頻域特征進(jìn)行降維,設(shè)定累計(jì)貢獻(xiàn)率為95%,將特征維度降為15維。
本文以廈門(mén)大學(xué)研發(fā)的三軸超精密成型磨床為基礎(chǔ)實(shí)驗(yàn)平臺(tái),金剛石砂輪安裝于機(jī)床主軸,磨削加工材料為熔融石英。聲發(fā)射傳感器通過(guò)耦合劑與工作臺(tái)接觸,熔石英玻璃置于工作臺(tái)上,四周由吸附于工作臺(tái)上的擋鐵固定。聲發(fā)射信號(hào)采集系統(tǒng)使用美國(guó)物理聲學(xué)所生產(chǎn)的PCI-2高性能聲發(fā)射采集卡,采樣頻率為1 MHz。如圖4所示。

圖4 砂輪全壽命磨削實(shí)驗(yàn)平臺(tái)
使用剛修正過(guò)的砂輪進(jìn)行磨削實(shí)驗(yàn),實(shí)驗(yàn)中根據(jù)材料去除量設(shè)置不同的觀測(cè)節(jié)點(diǎn),采集聲發(fā)射信號(hào)和砂輪表面形貌,如圖5所示。考慮到砂輪初期變化較為顯著,第1個(gè)節(jié)點(diǎn)對(duì)應(yīng)的材料去除量為4 cm3,之后以20 cm3為間隔設(shè)置采集節(jié)點(diǎn),當(dāng)完成第16個(gè)節(jié)點(diǎn)采集后,工件表面出現(xiàn)明顯損壞,停止實(shí)驗(yàn)。主要實(shí)驗(yàn)參數(shù)如表1所示。

圖5 砂輪表面顯微形貌圖

表1 磨削加工參數(shù)
為便于分析數(shù)據(jù)的時(shí)頻域特征,將聲發(fā)射信號(hào)進(jìn)行分幀處理,每幀時(shí)長(zhǎng)為10 ms,幀間沒(méi)有重疊,對(duì)應(yīng)的采樣點(diǎn)數(shù)為10 000點(diǎn),從而構(gòu)建一個(gè)砂輪磨削聲發(fā)射信號(hào)數(shù)據(jù)集。
把采集到的第1節(jié)點(diǎn)的數(shù)據(jù)和第16個(gè)節(jié)點(diǎn)的數(shù)據(jù)分別做頻域分析,如圖6所示。從圖6上可以看出,聲發(fā)射信號(hào)時(shí)域信號(hào)隨機(jī)性很強(qiáng)無(wú)法分辨,而頻域上頻帶很寬,分布隨機(jī)。從頻帶內(nèi)雖然可以看出頻率信息發(fā)生了變化,但很難從頻率域上準(zhǔn)確識(shí)別砂輪的磨損狀態(tài)信息。

圖6 聲發(fā)射信號(hào)頻域分析
對(duì)實(shí)驗(yàn)采集到的聲發(fā)射信號(hào)進(jìn)行小波包分析。對(duì)采樣頻率為1 MHz的聲發(fā)射信號(hào)進(jìn)行4次分解,將信號(hào)的頻帶等分為0~500 kHz的16個(gè)部分。計(jì)算各頻段內(nèi)小波包能量系數(shù)的方差,如圖7所示,可以看出,低頻段內(nèi)小波能量系數(shù)的方差最大,說(shuō)明此頻段為砂輪磨損狀態(tài)變化的敏感頻段,因此將低頻段的500個(gè)特征作為模型的輸入。

圖7 小波能量系數(shù)方差
對(duì)低頻段的特征使用主成分分析進(jìn)行降維得到15維特征,作為神經(jīng)網(wǎng)絡(luò)的輸入。為了驗(yàn)證神經(jīng)網(wǎng)絡(luò)是否能從聲發(fā)射信號(hào)的降維特征信息中獲取到砂輪的狀態(tài),將處于初期磨損的第1組樣本標(biāo)記為0,而將已經(jīng)嚴(yán)重磨損的第16組樣本標(biāo)記為1,以降維得到的15維特征為輸入,對(duì)3層的LSTM網(wǎng)絡(luò)進(jìn)行簡(jiǎn)單二分類(lèi)訓(xùn)練。收斂后的模型在測(cè)試集的ROC曲線如圖8所示,其AUC可達(dá)0.920 4,具有較為優(yōu)秀的分類(lèi)性能,這證明了前述特征提取和特征降維操作的有效性。

圖8 模型二分類(lèi)ROC曲線
為了更準(zhǔn)確的判斷砂輪的磨損狀態(tài),使用LSTM來(lái)構(gòu)建循環(huán)神經(jīng)網(wǎng)絡(luò)以提取樣本間差異等特征。將樣本數(shù)據(jù)集分為訓(xùn)練集(70%)和測(cè)試集(30%),以樣本對(duì)應(yīng)節(jié)點(diǎn)為標(biāo)簽,以降維得到的特征為輸入對(duì)LSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練損失函數(shù)選擇均方誤差(Mean Suqare Error,MSE),訓(xùn)練的優(yōu)化器選擇運(yùn)行速度較快的SGD,學(xué)習(xí)率設(shè)為0.001。LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)中網(wǎng)絡(luò)參數(shù)、時(shí)間步長(zhǎng)等超參數(shù)選取將影響網(wǎng)絡(luò)的識(shí)別能力,設(shè)置不同超參數(shù)以訓(xùn)練LSTM網(wǎng)絡(luò)并計(jì)算各超參數(shù)設(shè)置下的模型預(yù)測(cè)誤差(MSE)以尋找最佳超參數(shù)組合。最終選定的誤差最小的模型由4層構(gòu)成:輸入層,兩層LSTM隱含層,一層輸出層,隱含層由40個(gè)LSTM單元構(gòu)成。
前面選定的LSTM網(wǎng)絡(luò)模型經(jīng)過(guò)25步訓(xùn)練后,訓(xùn)練集均方根誤差收斂于0.53,均方誤差收斂于0.47,在測(cè)試集上的結(jié)果如圖9所示,均方根誤差為0.62,均方誤差為0.61。對(duì)應(yīng)的最優(yōu)傳統(tǒng)BPNN網(wǎng)絡(luò)經(jīng)過(guò)1000步訓(xùn)練后在測(cè)試集的結(jié)果如圖10所示,均方根誤差為1.07,均方誤差為2.30。二者的分節(jié)點(diǎn)測(cè)試誤差如圖11所示,可以看出LSTM網(wǎng)絡(luò)模型相比BPNN模型均方誤差降低了73.1%,均方根誤差降低了33.6%,而且數(shù)據(jù)波動(dòng)較小,結(jié)果更加穩(wěn)定。在節(jié)點(diǎn)10 以后的砂輪磨損后期過(guò)程中,相鄰幀之間的變化蘊(yùn)含著更多信息,而傳統(tǒng)神經(jīng)網(wǎng)絡(luò)由于其局限性難以對(duì)幀間差異進(jìn)行特征提取。LSTM網(wǎng)絡(luò)由于其單元特性,能夠記憶相鄰幀見(jiàn)的信息,從而對(duì)砂輪的狀態(tài)做出更準(zhǔn)確的判斷。

圖9 LSTM網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果

圖10 BPNN網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果

圖11 模型誤差比較
本文提出了一種基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)識(shí)別金剛石砂輪磨損狀態(tài)的方法。對(duì)于從實(shí)驗(yàn)平臺(tái)金剛石砂輪磨削熔石英實(shí)驗(yàn)中采集到的聲發(fā)射數(shù)據(jù),首先通過(guò)小波包分析提取了聲發(fā)射信號(hào)中關(guān)于砂輪磨損狀態(tài)的敏感頻段特征并通過(guò)進(jìn)行降維處理,從而訓(xùn)練LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)并測(cè)試。測(cè)試結(jié)果表明,LSTM網(wǎng)絡(luò)可以比較準(zhǔn)確地判斷砂輪的磨損狀態(tài),在16個(gè)節(jié)點(diǎn)的判斷中MAE誤差可以達(dá)到0.72,證明了LSTM模型在砂輪磨損狀態(tài)識(shí)別上具有比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)更好的效果。本文驗(yàn)證了自然語(yǔ)言處理領(lǐng)域廣泛應(yīng)用的LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)在砂輪磨損狀態(tài)識(shí)別的實(shí)用性和有效性。本文的處理過(guò)程中沒(méi)有涉及閾值選擇等處理,因此較容易地推廣到其他類(lèi)型砂輪和刀具的狀態(tài)識(shí)別應(yīng)用中。