呂中秋,魏 波
(鄭州工業(yè)應(yīng)用技術(shù)學(xué)院 信息工程學(xué)院,新鄭 451150)
現(xiàn)代工業(yè)過(guò)程趨于復(fù)雜化,規(guī)模逐漸擴(kuò)大,自動(dòng)化程度日益增加。在該背景下,企業(yè)的機(jī)械化程度也在增加,但是其中的機(jī)械故障頻發(fā),其導(dǎo)致企業(yè)整體的產(chǎn)品質(zhì)量和工作效率下降,同時(shí)減少設(shè)備的使用壽命。因此,檢測(cè)機(jī)械加工過(guò)程中的設(shè)備故障十分必要[1,2]。國(guó)內(nèi)相關(guān)專家針對(duì)機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè)方面的內(nèi)容進(jìn)行了大量的研究,例如任世錦等人[3]將集成局部均值分解以及改進(jìn)的稀疏多尺度支持向量機(jī)相結(jié)合的方式進(jìn)行機(jī)械故障檢測(cè),但是該方法的誤報(bào)率較高。彭聰?shù)热薣4]根據(jù)盲源信號(hào)分離方法以及超定視覺(jué)盲源分離方法獲取高速視頻,獲取多源振動(dòng)信號(hào)的分離和定位,進(jìn)而達(dá)到機(jī)械故障檢測(cè)的目的,但是該方法在去噪處理后的重構(gòu)誤差率大。在上述兩種方法的基礎(chǔ)上,提出一種基于隨機(jī)森林算法的機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè)方法。實(shí)驗(yàn)測(cè)試證明,本文方法能夠以更高的精度完成設(shè)備疊加振動(dòng)檢測(cè)。
EMD分解主要是將非平穩(wěn)信號(hào)k(t)分解成n個(gè)內(nèi)蘊(yùn)模態(tài)函數(shù),如式(1)所示:

式(1)中,a(i)(t)代表信號(hào)總數(shù);b(t)代表趨勢(shì)預(yù)項(xiàng)。
IMF分解需要經(jīng)過(guò)迭代,即分解過(guò)程為“篩選”過(guò)程,具體的計(jì)算式為:

式(2)中,c(i)(t)代表原始信號(hào)的單分量信號(hào)。
在以轉(zhuǎn)子為主要部件的大型旋轉(zhuǎn)機(jī)械,其在冶金以及機(jī)械制造方面均發(fā)揮著重要的作用。但是,由于設(shè)備運(yùn)行過(guò)程采集到含有大量噪聲的信號(hào),影響設(shè)備的運(yùn)行效果,因此,降噪處理噪聲信號(hào),將機(jī)械加工過(guò)程設(shè)備振動(dòng)信號(hào)z(t)表示為式(3)的形式:

式(3)中,d(t)代表信號(hào)受到的噪聲干擾。
當(dāng)z(t)經(jīng)過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解后,得到有限個(gè)頻率由大到小分布的固有模態(tài)分量,具體計(jì)算式如下:

式(4)中,E(i)代表不同層次對(duì)應(yīng)的I M F 分量;代表余量。
引入小波閾值到EMD分解后,雖然去噪處理了振動(dòng)信號(hào),但是去噪效果并不理想。即使是在無(wú)噪聲的情況下,在隨機(jī)時(shí)間段的振幅絕對(duì)值也下降到設(shè)定閾值范圍內(nèi)。因此,進(jìn)一步去噪處理,其中,EMD進(jìn)行去噪的主要操作步驟為:
在機(jī)械設(shè)備加工過(guò)程,設(shè)備被污染的噪聲主要集中在低頻位置,越到高頻位置,信號(hào)的含量越低,為了有效剔除多余的噪聲,同時(shí)有效保持信號(hào)的細(xì)節(jié)部分,選取最佳的分解尺度較為重要。以下引入自相關(guān)函數(shù)對(duì)白噪聲進(jìn)行特性檢驗(yàn),根據(jù)設(shè)定的序列xu獲取對(duì)應(yīng)的自相關(guān)函數(shù)估計(jì)式:

式(5)中,z(k)代表自相關(guān)函數(shù)的估計(jì)值;zi代表第i個(gè)自相關(guān)函數(shù);k代表常數(shù)。
通過(guò)以上分析,劃分IMF分量,該劃分通過(guò)連續(xù)均方誤差準(zhǔn)則區(qū)分設(shè)備中的信號(hào)和噪聲,獲取全新的索引值,同時(shí)從初始階段對(duì)IMF分量進(jìn)行重構(gòu),確保重構(gòu)的誤差取值達(dá)到最低:

式(6)中,cmse(i,j)代表重構(gòu)誤差的最小值;zi(i,j)代表第i個(gè)信號(hào)對(duì)應(yīng)的重構(gòu)誤差。
固有模態(tài)在振動(dòng)信號(hào)去噪過(guò)程中占據(jù)主導(dǎo)地位,其需要選取較大的閾值,確保有效去除信號(hào)中的噪聲,達(dá)到去噪的目的。
結(jié)合以上分析,設(shè)定閾值yu,計(jì)算式為:

通過(guò)圖1給出機(jī)械加工過(guò)程設(shè)備振動(dòng)信號(hào)去噪的詳細(xì)操作步驟:

圖1 機(jī)械加工過(guò)程設(shè)備振動(dòng)信號(hào)去噪流程圖
1)對(duì)機(jī)械加工過(guò)程中設(shè)備振動(dòng)信號(hào)進(jìn)行EMD分解;
2)采用閾值降噪降噪處理除了第一個(gè)以外的IMF分量,即信號(hào)重構(gòu);
3)調(diào)整第一個(gè)IMF分量的采樣位置;
4)重構(gòu)構(gòu)建一個(gè)含有噪聲的原始信號(hào);
5)對(duì)步驟4)中獲取的噪聲信號(hào)進(jìn)行EMD分解;
6)獲取經(jīng)過(guò)降噪處理后的信號(hào);
7)多次重復(fù)步驟3)~步驟6),獲取k個(gè)降噪后的信號(hào);
7)計(jì)算降噪后的信號(hào)平均值;
8)信號(hào)重構(gòu),實(shí)現(xiàn)信號(hào)去噪[5]。
隨機(jī)森林算法是一種集成學(xué)習(xí)算法,可以有效提升故障檢測(cè)精度。構(gòu)建隨機(jī)森林主要包含以下內(nèi)容:
1)抽取決策樹(shù)訓(xùn)練集
在隨機(jī)森林算法中,各個(gè)決策樹(shù)的訓(xùn)練集均是在原始訓(xùn)練集的基礎(chǔ)上隨機(jī)抽取,增加各個(gè)決策樹(shù)之間的差異性。在抽取樣本過(guò)程中,主要采用無(wú)權(quán)重的方式增加訓(xùn)練精度。
2)組建CART決策樹(shù)
在原始訓(xùn)練集中,主要通過(guò)bagging方法為多棵決策樹(shù)抽取訓(xùn)練子集,進(jìn)而形成隨機(jī)森林。
利用圖2給出隨機(jī)森林算法的示意圖:

圖2 隨機(jī)森林算法操作示意圖
RF采用不同的訓(xùn)練集可以有效降低各個(gè)決策樹(shù)之間的相關(guān)性,獲取對(duì)應(yīng)的決策樹(shù) {j1(x),j2(x),… ,jn(x)}達(dá)到提升檢測(cè)結(jié)果準(zhǔn)確性的目的。同時(shí),組建多分類模型系統(tǒng),該系統(tǒng)根據(jù)投票的方式獲取系統(tǒng)最終的決策結(jié)果,如式(8)所示:

式(8)中,J(x)代表集成器對(duì)應(yīng)的分類模型;ji代表決策樹(shù);L代表系統(tǒng)的輸出函數(shù)。
通過(guò)隨機(jī)采用的方式得到模型對(duì)應(yīng)的訓(xùn)練集,進(jìn)而獲取余量函數(shù)mf(i,j),如式(9)所示:

式(9)中,ab(i,j)代表錯(cuò)誤數(shù)據(jù)的平均程度。
單類分類器只要含有足夠的離群點(diǎn),則可以獲取理想的分類性能,但是離群點(diǎn)需要覆蓋全部特征空間,才能將目標(biāo)數(shù)據(jù)和離群點(diǎn)分離。
當(dāng)確定離群點(diǎn)的分布情況后,通過(guò)特征空間維度判定離群點(diǎn)數(shù)據(jù)。如果異常數(shù)據(jù)均勻分布在矩形空間內(nèi),則離群點(diǎn)對(duì)應(yīng)的離群系數(shù)可以表示為式(10)所示:

式(10)中,Khypercube(f)代表離群系數(shù);m代表特征角的維度。
其中,離群點(diǎn)的數(shù)量通過(guò)式(11)計(jì)算:

式(11)中,Voutliers(i,j)代表離群點(diǎn)總數(shù);Koutliers代表超立方體的數(shù)量;10-p代表胞元的數(shù)量。
通過(guò)上述分析,通過(guò)隨機(jī)森林算法檢測(cè)機(jī)械加工過(guò)程設(shè)備疊加振動(dòng),詳細(xì)的操作步驟如下所示:
1)先驗(yàn)信息提取:
(1)計(jì)算目標(biāo)函數(shù)的歸一化直方圖p,如式(12)所示:

(2)通過(guò)式(12)獲取的計(jì)算結(jié)果,可以和離群點(diǎn)對(duì)應(yīng)的歸一化直方圖進(jìn)行互補(bǔ)。
2)離群點(diǎn)形成意見(jiàn)隨機(jī)森林訓(xùn)練:
(1)在訓(xùn)練數(shù)據(jù)集中通過(guò)bagging抽樣,獲取對(duì)應(yīng)的訓(xùn)練樣本。
(2)將訓(xùn)練樣本映射到對(duì)應(yīng)的k維隨機(jī)子空中。
(3)在設(shè)定的閾值范圍,通過(guò)歸一化直方圖形成多個(gè)離群點(diǎn)。
(4)通過(guò)形成的離群點(diǎn)和目標(biāo)數(shù)據(jù)訓(xùn)練決策樹(shù)分類器。
(5)重復(fù)上述操作步驟,直至完成機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)特征提取。同時(shí)構(gòu)建DOCRF模型,通過(guò)模型求解樣本相似度,最終完成機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè)。
為了驗(yàn)證本文的基于隨機(jī)森林算法的機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè)方法的有效性,進(jìn)行仿真實(shí)驗(yàn)測(cè)試。利用Simulink工具完成測(cè)試,其屬于MATLAB軟件平臺(tái)。處理器為intel i5,硬盤(pán)容量為1TB HDD,內(nèi)存容量為8GB,Windows10系統(tǒng)。模態(tài)激振器(接觸式)DH40100進(jìn)行接觸式振動(dòng),通過(guò)配套功放DH5872對(duì)激振信號(hào)進(jìn)行調(diào)節(jié)。實(shí)驗(yàn)過(guò)程通過(guò)調(diào)節(jié)功放DH5872改變振動(dòng)信號(hào)的頻率和加速度等。
將機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè)的重構(gòu)誤差率和誤報(bào)警率作為測(cè)試指標(biāo),計(jì)算公式如下:

式(13)中,Trate代表重構(gòu)誤差率;Crate代表誤報(bào)警率;Xerr代表自己樣本被錯(cuò)誤檢測(cè)的數(shù)量;Xnum代表參與測(cè)試的自己樣本總數(shù)。
實(shí)驗(yàn)以對(duì)比分析的形式進(jìn)行驗(yàn)證,對(duì)比方法分別為文獻(xiàn)[3]方法和文獻(xiàn)[4]方法,在相同環(huán)境下,使用三種方法驗(yàn)證機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè)效果,檢測(cè)結(jié)果和實(shí)際信號(hào)一致性越高,表明方法的檢測(cè)效果越好,實(shí)驗(yàn)結(jié)果如圖3所示。

圖3 不同方法振動(dòng)信號(hào)的檢測(cè)效果分析
由圖3中的實(shí)驗(yàn)數(shù)據(jù)可知,所提方法檢測(cè)的振動(dòng)信號(hào)和實(shí)際信號(hào)一致,文獻(xiàn)[3]方法檢測(cè)的振動(dòng)信號(hào)在6s到7s之間的檢測(cè)結(jié)果和實(shí)際信號(hào)誤差較大,其曲線明顯偏離實(shí)際信號(hào)曲線,文獻(xiàn)[4]方法檢測(cè)信號(hào)雖然多數(shù)和實(shí)際信號(hào)一致,但是在6s以后其檢測(cè)效果出現(xiàn)較大誤差,并且持續(xù)出現(xiàn)誤差,因此,所提方法可以有效檢測(cè)振動(dòng)信號(hào),提高了檢測(cè)性能。
為了進(jìn)一步分析所提方法的性能,在相同環(huán)境下,使用三種方法驗(yàn)證機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè)的重構(gòu)誤差率,誤差率越小,表明方法檢測(cè)性能越好,實(shí)驗(yàn)結(jié)果如圖4所示。

圖4 不同方法檢測(cè)振動(dòng)檢測(cè)的重構(gòu)誤差率
根據(jù)圖4可知,所提方法的振動(dòng)檢測(cè)重構(gòu)誤差率在1.0%左右,未高于1.2%,文獻(xiàn)[3]方法的重構(gòu)誤差率最低為4.0%,文獻(xiàn)[4]方法的最低重構(gòu)誤差率為3.7%,文獻(xiàn)方法的重構(gòu)誤差率分別高出所提方法的最高值2.8%和2.5%,因此,所提方法振動(dòng)檢測(cè)的重構(gòu)誤差率最低,有效降低了誤差率,提高了提高了機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)的檢測(cè)率。
驗(yàn)證三種方法的機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)的誤報(bào)警率,該實(shí)驗(yàn)指標(biāo)有效反映方法的性能,其誤報(bào)警率越低,表明方法的性能越好,實(shí)驗(yàn)結(jié)果如圖5所示。

圖5 不同方法檢測(cè)振動(dòng)信號(hào)的誤報(bào)警率
分析圖5可知,誤報(bào)警率隨著樣本數(shù)量的的增加而增加,但是所提方法的增加程度較低,并且其在樣本數(shù)量500個(gè)時(shí),誤報(bào)警率僅為0.9%,但是文獻(xiàn)[3]方法的誤報(bào)警率達(dá)到了4.9%,文獻(xiàn)[4]方法的誤報(bào)警率達(dá)到了3.2%,相比于所提方法的誤報(bào)警率均高出2%以上,并且其是所提方法的三倍以上,遠(yuǎn)遠(yuǎn)高于所提方法,因此,所提方法因?yàn)樵跈z測(cè)前期,對(duì)設(shè)備運(yùn)行過(guò)程中的振動(dòng)信號(hào)進(jìn)行去噪處理,降低了設(shè)備疊加振動(dòng)的誤報(bào)警率,提高了檢測(cè)效率和性能。
針對(duì)傳統(tǒng)的機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè)方法存在的重構(gòu)誤差大、誤報(bào)警率高的問(wèn)題,設(shè)計(jì)并提出了一種基于隨機(jī)森林算法的機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè)方法,該方法有機(jī)結(jié)合了隨機(jī)森林算法。實(shí)驗(yàn)結(jié)果表明,所提方法的重構(gòu)誤差率低于1.2%,誤報(bào)警率均在0.18%以下,并且受轉(zhuǎn)速影響較小,可以以更高的精度完成機(jī)械加工過(guò)程設(shè)備疊加振動(dòng)檢測(cè),全面提升了檢測(cè)結(jié)果的準(zhǔn)確性。