999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進(jìn)自編碼網(wǎng)絡(luò)的軸承振動(dòng)異常檢測

2022-01-18 11:39:00李貝貝
計(jì)算機(jī)與生活 2022年1期
關(guān)鍵詞:實(shí)驗(yàn)檢測

李貝貝,彭 力

江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無錫214122

軸承作為各種工業(yè)現(xiàn)場機(jī)械設(shè)備的重要零部件之一,對(duì)工業(yè)流程的順利進(jìn)行和設(shè)備運(yùn)行安全有著重要意義。但在長期的高強(qiáng)度、大載荷的復(fù)雜工況下,軸承極易出現(xiàn)異常狀況,導(dǎo)致故障發(fā)生。若能準(zhǔn)確、及時(shí)地檢測到異常數(shù)據(jù),則有助于設(shè)備及時(shí)維護(hù),避免嚴(yán)重事故的發(fā)生。在大數(shù)據(jù)時(shí)代,隨著傳感器和機(jī)器學(xué)習(xí)技術(shù)的飛速發(fā)展,通過先進(jìn)理論和方法使用歷史采集的狀態(tài)監(jiān)控?cái)?shù)據(jù)提取特征,構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的軸承異常檢測模型,并保證異常檢測的準(zhǔn)確性和穩(wěn)定性,成為了當(dāng)前研究的熱點(diǎn)并具有明確學(xué)術(shù)價(jià)值與應(yīng)用意義。

軸承的振動(dòng)監(jiān)測數(shù)據(jù)是最直觀最方便判斷軸承是否出現(xiàn)異常的數(shù)據(jù),通過加速度傳感器可以方便快速地采集數(shù)據(jù)并實(shí)時(shí)檢測。振動(dòng)數(shù)據(jù)的采集通常需要在多個(gè)位置放置多個(gè)采集傳感器,因此振動(dòng)數(shù)據(jù)的特點(diǎn)主要包括:數(shù)據(jù)量大、維度較低、各維度之間具有一定相關(guān)性。

軸承振動(dòng)異常的檢測主要使用許多異常點(diǎn)檢測方法。檢測方法主要包括:(1)基于統(tǒng)計(jì)學(xué)的方法,假定大部分正常數(shù)據(jù)服從相同的數(shù)據(jù)分布,異常數(shù)據(jù)則不屬于該分布,但此類方法確定數(shù)據(jù)的概率分布模型以及參數(shù)比較困難。(2)基于鄰域的異常檢測方法,如近鄰算法(-nearest neighbor,NN)和局部異常因子算法(local outlier factor,LOF)。NN算法易于實(shí)現(xiàn),但對(duì)于異常數(shù)據(jù)占比較少、樣本不平衡的軸承振動(dòng)數(shù)據(jù)表現(xiàn)較差。LOF 算法通過局部可達(dá)密度彌補(bǔ)NN 算法對(duì)于樣本不平衡的數(shù)據(jù)集表現(xiàn)較差的缺點(diǎn),但是LOF 算法對(duì)于參數(shù)的確定極為敏感,且算法復(fù)雜度高,時(shí)間成本高。(3)支持向量機(jī)(support vector machine,SVM),通過訓(xùn)練數(shù)據(jù)對(duì)象的邊界或特征來確定異常數(shù)據(jù)。此方法需要大量能用于訓(xùn)練的正常數(shù)據(jù),并確定相應(yīng)參數(shù),且參數(shù)的設(shè)置對(duì)于檢測效果影響較大。(4)孤立森林(isolation forest,iForest)算法,通過構(gòu)建隔離樹檢測異常數(shù)據(jù),具有線性時(shí)間復(fù)雜度。但其采用無監(jiān)督的方式,忽略數(shù)據(jù)特征之間的相關(guān)性進(jìn)行隨機(jī)選取特征構(gòu)建隔離樹,因此檢測準(zhǔn)確度較低。

近年來,深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)已在特征的自動(dòng)提取和識(shí)別上成功應(yīng)用,可自適應(yīng)地提取信息豐富的重要特征,簡化繁重且有挑戰(zhàn)性的特征提取過程,具有較好的普適性。自編碼器(autoencoder,AE)最早由Rumelhart 等人提出,并將其用于復(fù)雜數(shù)據(jù)處理。隨后,Hinton 等人提出了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),由此產(chǎn)生了深度自編碼器。在深度自編碼器的基礎(chǔ)上,Ng提出高維而稀疏的隱層,對(duì)隱層加入稀疏性限制提高自編碼器特征學(xué)習(xí)能力,提出了稀疏自編碼器。如今,自編碼器和深度神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于故障診斷、圖像識(shí)別、異常檢測等領(lǐng)域中。自編碼器和神經(jīng)網(wǎng)絡(luò)也被研究應(yīng)用于軸承振動(dòng)等工業(yè)數(shù)據(jù)的異常檢測問題上,自編碼器因其優(yōu)越的特征提取能力得到了大量研究與應(yīng)用。

由于傳感器技術(shù)的發(fā)展,軸承振動(dòng)數(shù)據(jù)的采集更加方便快速,但導(dǎo)致數(shù)據(jù)量龐大,在自編碼器和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,過大的數(shù)據(jù)量使得訓(xùn)練效率較低并且檢測準(zhǔn)確度無法得到有效提升。為了減少自編碼器和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量,本研究通過正常振動(dòng)數(shù)據(jù)樣本的馬氏距離(Mahalanobis distance)得到判定閾值,計(jì)算數(shù)據(jù)與正常數(shù)據(jù)均值的馬氏距離,將沒有超過判定閾值的數(shù)據(jù)記為不確定數(shù)據(jù)并將該部分?jǐn)?shù)據(jù)用于自編碼器和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。

對(duì)于神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題,傳統(tǒng)的權(quán)值隨機(jī)初始化方法依然會(huì)有陷入局部最優(yōu)的風(fēng)險(xiǎn)。本研究結(jié)合自編碼器和Sigmoid 分類器構(gòu)建自編碼網(wǎng)絡(luò)(autoencoder network,AN)解決了神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題,并且減少了網(wǎng)絡(luò)訓(xùn)練次數(shù)和時(shí)間,提高了訓(xùn)練效率。本研究將訓(xùn)練完成的自編碼器中編碼層輸出作為分類器輸入,利用自編碼器獲得的編碼層權(quán)值和偏差解決神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題,最后使用標(biāo)簽化數(shù)據(jù)進(jìn)行有監(jiān)督的微調(diào)以完成整個(gè)自編碼網(wǎng)絡(luò)的訓(xùn)練。

軸承振動(dòng)數(shù)據(jù)各特征之間具有相關(guān)性,馬氏距離可用作判斷數(shù)據(jù)異常與否的重要特征,因此本研究將數(shù)據(jù)的馬氏距離作為特征添加到數(shù)據(jù)的特征中用于自編碼網(wǎng)絡(luò)的訓(xùn)練過程,有效提高了自編碼網(wǎng)絡(luò)對(duì)軸承振動(dòng)數(shù)據(jù)的異常檢測準(zhǔn)確度。

自編碼器常被用在高維數(shù)據(jù)的特征提取和降維過程中,而對(duì)于特征較少的低維軸承振動(dòng)數(shù)據(jù),自編碼器的特征提取和降維作用并不顯著。為了增強(qiáng)自編碼器的特征提取能力以獲得更好的編碼層參數(shù),提高整個(gè)自編碼網(wǎng)絡(luò)的異常檢測效果,本研究加入了稀疏約束條件并構(gòu)建先升維再編碼的改進(jìn)自編碼器結(jié)構(gòu),提高了自編碼器特征提取能力,并通過實(shí)驗(yàn)證明了該結(jié)構(gòu)具有更好的收斂性和異常檢測效果。

本研究的主要貢獻(xiàn)如下:通過馬氏距離快速判別出一部分異常數(shù)據(jù)以減少自編碼網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量;將自編碼器和分類器結(jié)合解決了神經(jīng)網(wǎng)絡(luò)的參數(shù)初始化問題,減少了網(wǎng)絡(luò)訓(xùn)練時(shí)間;通過數(shù)據(jù)加入馬氏距離特征、先升維再編碼的自編碼器結(jié)構(gòu)、稀疏約束條件,構(gòu)建了一種改進(jìn)自編碼網(wǎng)絡(luò)用于軸承振動(dòng)異常檢測;通過實(shí)驗(yàn)證明了該方法對(duì)于低維軸承振動(dòng)數(shù)據(jù)具有較好的異常檢測效果。

1 基本概念

1.1 馬氏距離

印度統(tǒng)計(jì)學(xué)家Mahalanobis 提出了一種考慮到各變量之間相關(guān)性的廣義距離,稱為馬氏距離(Mahalanobis distance),其主要思想是利用向量間的協(xié)方差矩陣來表示其馬氏距離。

對(duì)于包含個(gè)數(shù)據(jù)、每個(gè)數(shù)據(jù)維度為的數(shù)據(jù)集=(,,…,X),其中均值為=(,,…,μ),協(xié)方差矩陣為,其中一數(shù)據(jù)為=(,,…,x),則其馬氏距離如下所示:

其中,為協(xié)方差矩陣的逆矩陣,馬氏距離可看作數(shù)據(jù)與總體數(shù)據(jù)均值的距離。

由于馬氏距離的計(jì)算需要使用數(shù)據(jù)集的協(xié)方差矩陣,較歐式距離等其他距離的最大優(yōu)勢為馬氏距離考慮數(shù)據(jù)特征之間的相關(guān)性。在數(shù)據(jù)集中,如果一個(gè)數(shù)據(jù)的馬氏距離越小,則說明其與數(shù)據(jù)集中均值數(shù)據(jù)的相似度越大。在軸承振動(dòng)數(shù)據(jù)等低維工業(yè)數(shù)據(jù)中,由于工藝流程和采集設(shè)備等緣故,數(shù)據(jù)的每個(gè)特征之間有著不可忽視的相關(guān)性,馬氏距離更適合用于軸承振動(dòng)數(shù)據(jù)的距離表達(dá)。

考慮在軸承振動(dòng)異常檢測中,假設(shè)某數(shù)據(jù)為正常數(shù)據(jù),使用正常數(shù)據(jù)集的均值和協(xié)方差矩陣根據(jù)式(1)計(jì)算其馬氏距離。若該數(shù)據(jù)馬氏距離與正常數(shù)據(jù)馬氏距離接近,說明該數(shù)據(jù)與正常數(shù)據(jù)相似度較大,該數(shù)據(jù)大概率為正常數(shù)據(jù);若該數(shù)據(jù)馬氏距離與正常數(shù)據(jù)馬氏距離相差較遠(yuǎn),說明該數(shù)據(jù)與正常數(shù)據(jù)相似度較小,則該數(shù)據(jù)大概率為異常數(shù)據(jù)。因此能夠使用軸承振動(dòng)數(shù)據(jù)的馬氏距離來判斷數(shù)據(jù)為異常數(shù)據(jù)的可能性,該思想在2.1 節(jié)中詳細(xì)說明。

如上所述,軸承振動(dòng)數(shù)據(jù)的馬氏距離可以用來判斷該數(shù)據(jù)為異常數(shù)據(jù)的可能性,故考慮將數(shù)據(jù)的馬氏距離作為軸承振動(dòng)數(shù)據(jù)的一個(gè)特征。由于正常數(shù)據(jù)和異常數(shù)據(jù)的馬氏距離有較大的差別,在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,加入的馬氏距離特征將作為重要特征,有利于提升神經(jīng)網(wǎng)絡(luò)的異常檢測效果。因此在本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)訓(xùn)練和檢測過程中,將數(shù)據(jù)的馬氏距離加入數(shù)據(jù)特征中,5.1 節(jié)中通過對(duì)比實(shí)驗(yàn)證明了該思想的優(yōu)越性。

1.2 自編碼器

自編碼器主要包括編碼和解碼階段,且結(jié)構(gòu)對(duì)稱,即若存在多個(gè)隱層時(shí),編碼和解碼階段的隱層數(shù)量及結(jié)構(gòu)相同。主要結(jié)構(gòu)由輸入層、隱層和輸出層組成,如圖1 所示。隱層對(duì)輸入層數(shù)據(jù)進(jìn)行編碼,輸出層對(duì)隱層表達(dá)進(jìn)行解碼重構(gòu)原始數(shù)據(jù),最小化重構(gòu)誤差以獲得最佳的隱層表達(dá)。其目標(biāo)是擬合一個(gè)恒等函數(shù),使得每個(gè)輸出值盡可能等于相對(duì)應(yīng)的輸入值。

圖1 自編碼器結(jié)構(gòu)Fig.1 Structure of AE

對(duì)于數(shù)據(jù)集=(,,…,X),為數(shù)據(jù)個(gè)數(shù),每個(gè)數(shù)據(jù)維度為,即X∈R(=1,2,…,)。每一個(gè)數(shù)據(jù)X經(jīng)過編碼過程得到隱層表達(dá),編碼過程可描述為:

其中,和為編碼權(quán)重和偏置,σ為編碼層激活函數(shù),目前比較常用的有Sigmoid、Tanh、ReLU 等。然后隱層表達(dá)經(jīng)解碼過程得到重構(gòu)數(shù)據(jù)X′,解碼過程可描述為:

其中,′和′為解碼權(quán)重和偏置,取′=,σ為解碼層激活函數(shù)。

其中,為單個(gè)數(shù)據(jù)的損失函數(shù),在式(4)中為均方誤差損失函數(shù)。同時(shí)為了防止出現(xiàn)過擬合,給代價(jià)函數(shù)添加一個(gè)L2 正則化權(quán)重衰減項(xiàng),為懲罰因子,控制正則化項(xiàng)影響權(quán)重衰減的程度,得到最終的損失函數(shù)為:

文獻(xiàn)[17]證明,使用Sigmoid 激活函數(shù)時(shí),交叉熵?fù)p失函數(shù)要優(yōu)于均方誤差損失函數(shù),由于本研究構(gòu)建的自編碼網(wǎng)絡(luò)最終輸出為二分類,且通過實(shí)驗(yàn)得到,無論是自編碼器的訓(xùn)練階段還是編碼層結(jié)合分類器階段,Sigmoid 作為輸出層激活函數(shù)效果最理想,因此本研究采用交叉熵代價(jià)函數(shù)為:

在自編碼器的訓(xùn)練過程中,通過編碼和解碼過程使代價(jià)函數(shù)最小來學(xué)習(xí)并提取數(shù)據(jù)重要的特征,即獲得最佳的隱層表達(dá)。

2 結(jié)合馬氏距離和自編碼網(wǎng)絡(luò)的異常檢測

2.1 使用馬氏距離快速檢測異常數(shù)據(jù)

假設(shè)采集到的軸承振動(dòng)數(shù)據(jù)集記為=(,,…,X),數(shù)據(jù)維度為。其中正常數(shù)據(jù)集記為X=(,,…,X),正常數(shù)據(jù)均值為μ=(,,…,μ),協(xié)方差矩陣為Σ,根據(jù)式(1)計(jì)算得到正常數(shù)據(jù)集中每個(gè)數(shù)據(jù)的馬氏距離記為:

其中,M表示在正常數(shù)據(jù)集中第個(gè)正常數(shù)據(jù)的馬氏距離。

接下來根據(jù)式(1)計(jì)算整個(gè)數(shù)據(jù)集中所有數(shù)據(jù)的馬氏距離。由于某一數(shù)據(jù)的變化會(huì)影響到數(shù)據(jù)集均值的變化,馬氏距離夸大了微小變化向量的作用,從而影響其他數(shù)據(jù)的馬氏距離計(jì)算。為了改善上述馬氏距離的缺點(diǎn),在計(jì)算所有數(shù)據(jù)的馬氏距離時(shí)使用的均值和協(xié)方差矩陣仍然為正常數(shù)據(jù)集中的μΣ,顯然獨(dú)立的μΣ不受向量變化影響;根據(jù)1.1節(jié),得到的某個(gè)數(shù)據(jù)的馬氏距離可看作該數(shù)據(jù)與正常數(shù)據(jù)集均值的距離。則數(shù)據(jù)X的馬氏距離記為:

根據(jù)統(tǒng)計(jì)學(xué)相關(guān)知識(shí)以及后續(xù)對(duì)軸承振動(dòng)數(shù)據(jù)的實(shí)驗(yàn)分析可知:如果數(shù)據(jù)X為正常數(shù)據(jù),則其馬氏距離D(X)應(yīng)符合正常數(shù)據(jù)馬氏距離數(shù)據(jù)集即M的統(tǒng)計(jì)分布;如果X為異常數(shù)據(jù),則D(X)不符合M的統(tǒng)計(jì)分布。

通過實(shí)驗(yàn)驗(yàn)證,馬氏距離不在(,)區(qū)間內(nèi)的數(shù)據(jù)均為異常數(shù)據(jù)。將馬氏距離在(,)區(qū)間內(nèi)的數(shù)據(jù)判定為不確定數(shù)據(jù),記為X,然后使用不確定數(shù)據(jù)集X訓(xùn)練自編碼網(wǎng)絡(luò)以完成模型構(gòu)建。同時(shí)將數(shù)據(jù)的馬氏距離加入到數(shù)據(jù)特征中,用于自編碼網(wǎng)絡(luò)的訓(xùn)練。

于是,通過馬氏距離檢測出了一部分異常數(shù)據(jù),將剩余的不確定數(shù)據(jù)輸入自編碼網(wǎng)絡(luò)中。對(duì)于數(shù)據(jù)量大的軸承振動(dòng)數(shù)據(jù)而言,減少了用于自編碼網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù),并且能夠根據(jù)馬氏距離判別閾值快速判別出一部分異常數(shù)據(jù),提高了檢測效率。

2.2 自編碼器的構(gòu)建

為了提高自編碼器學(xué)習(xí)數(shù)據(jù)特征的能力,在自編碼器基礎(chǔ)上添加約束條件,在其代價(jià)函數(shù)上加入稀疏懲罰項(xiàng),使其形成稀疏自編碼器。稀疏自編碼器代價(jià)函數(shù)為:

本研究使用自編碼器的主要目的是利用其學(xué)習(xí)并提取數(shù)據(jù)特征的能力提取數(shù)據(jù)更有用的特征,得到更好的隱層表達(dá)用于結(jié)合分類器。而對(duì)于低維軸承振動(dòng)數(shù)據(jù),由于其維度較低、特征較少,不利于自編碼器提取其特征,導(dǎo)致自編碼器的收斂性較差。在實(shí)際應(yīng)用中已證明了自編碼器對(duì)高維數(shù)據(jù)優(yōu)秀的特征提取能力,因此考慮將數(shù)據(jù)先升維再編碼的自編碼器結(jié)構(gòu),通過升維結(jié)構(gòu)提高了數(shù)據(jù)的維度,類似于增加了數(shù)據(jù)的特征。增加了升維層必然增加自編碼器訓(xùn)練的運(yùn)算復(fù)雜度,也相應(yīng)地增加了自編碼器單次訓(xùn)練的時(shí)間,但是自編碼器通過較少的訓(xùn)練次數(shù)便可以得到最佳的隱層表達(dá),其收斂速度增大。就總體時(shí)間而言,先升維再編碼的自編碼器能夠用較少的時(shí)間完成訓(xùn)練,得到最佳隱層表達(dá)。因此不同于一般自編碼器直接降維編碼的結(jié)構(gòu),本研究基于稀疏自編碼器,構(gòu)建先升維再編碼的網(wǎng)絡(luò)結(jié)構(gòu)以提升對(duì)軸承振動(dòng)數(shù)據(jù)的特征提取能力,同時(shí)在解碼階段保持與編碼階段的對(duì)稱結(jié)構(gòu)。5.2 節(jié)中通過實(shí)驗(yàn)證明了先升維再編碼的自編碼器結(jié)構(gòu)收斂性更好,訓(xùn)練時(shí)間更短,提升了自編碼器對(duì)低維數(shù)據(jù)的特征提取能力。

本研究構(gòu)建的改進(jìn)自編碼器結(jié)構(gòu)如圖2 所示,X為輸入數(shù)據(jù),數(shù)據(jù)維度為維,通過升維過程得到隱層表達(dá)U,其中>,維度升為維,同時(shí)解碼過程保持對(duì)稱結(jié)構(gòu)。 h為編碼層輸出,為編碼之后的維度,使用訓(xùn)練數(shù)據(jù)通過無監(jiān)督貪婪算法使代價(jià)函數(shù)最小,從而完成自編碼器的訓(xùn)練以得到最終編碼層輸出h作為分類器的輸入。

圖2 改進(jìn)自編碼器結(jié)構(gòu)Fig.2 Improved structure of AE

2.3 自編碼器與分類器結(jié)合構(gòu)建自編碼網(wǎng)絡(luò)

通過自編碼器的訓(xùn)練,得到了最優(yōu)的權(quán)值和偏差,將h作為分類器的輸入,把最優(yōu)的和作為網(wǎng)絡(luò)的初始化參數(shù),解決了神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題。如圖3 所示,S為使用Sigmoid 激活函數(shù)的分類層,h作為其輸入,X為一維輸出結(jié)果,表示正?;虍惓?shù)據(jù),通過輸入標(biāo)簽化訓(xùn)練數(shù)據(jù),結(jié)合誤差反向傳播算法和隨機(jī)梯度下降進(jìn)行有監(jiān)督的參數(shù)微調(diào),最終完成整個(gè)自編碼網(wǎng)絡(luò)的構(gòu)建。

圖3 有監(jiān)督的微調(diào)Fig.3 Supervised fine-tuning

通過自編碼器的訓(xùn)練得到了較為合適的網(wǎng)絡(luò)初始化參數(shù),因此在自編碼網(wǎng)絡(luò)有監(jiān)督的微調(diào)階段,能夠減少所需訓(xùn)練次數(shù),提高整個(gè)網(wǎng)絡(luò)的訓(xùn)練效率。在5.3 節(jié)中,通過與普通DNN 的對(duì)比證明了將自編碼器與分類器結(jié)合的方法能顯著減少網(wǎng)絡(luò)的訓(xùn)練時(shí)間。

文獻(xiàn)[19]指出,神經(jīng)網(wǎng)絡(luò)的隱層數(shù)量比學(xué)習(xí)算法和自編碼器結(jié)構(gòu)對(duì)性能的影響更加重要,本研究主要關(guān)注自編碼器用于軸承振動(dòng)異常檢測,因此在此只使用單層的神經(jīng)網(wǎng)絡(luò)分類器結(jié)構(gòu),由于是二分類任務(wù),故單層使用Sigmoid 激活函數(shù),輸出分類結(jié)果。

2.4 整個(gè)異常檢測模型構(gòu)建過程

首先對(duì)所有振動(dòng)數(shù)據(jù)歸一化處理,并從中提取出部分正常數(shù)據(jù),計(jì)算正常數(shù)據(jù)的馬氏距離,根據(jù)式(9)、式(10)得到馬氏距離判別閾值。

根據(jù)式(8)得到所有數(shù)據(jù)的馬氏距離,將馬氏距離超過閾值的數(shù)據(jù)判定為異常數(shù)據(jù),沒有超過閾值的數(shù)據(jù)記為不確定數(shù)據(jù),并將數(shù)據(jù)的馬氏距離加入數(shù)據(jù)特征中。

將加入馬氏距離特征的不確定數(shù)據(jù)集作為圖2 所示的改進(jìn)自編碼器的輸入,以無監(jiān)督的方式訓(xùn)練自編碼器,得到最優(yōu)的編碼層輸出h以及最優(yōu)的權(quán)值和偏差參數(shù)。

h作為Sigmoid 分類器的輸入,使用帶標(biāo)簽的不確定數(shù)據(jù)作為圖3 所示的結(jié)構(gòu)中的輸入,進(jìn)行有監(jiān)督的微調(diào)以得到整個(gè)網(wǎng)絡(luò)的最優(yōu)參數(shù),完成自編碼網(wǎng)絡(luò)的構(gòu)建。

隨機(jī)選取全部振動(dòng)數(shù)據(jù)的一部分作為測試數(shù)據(jù),根據(jù)式(8)得到其馬氏距離,將超過馬氏距離判別閾值的數(shù)據(jù)判定為異常數(shù)據(jù),將沒有超過閾值的數(shù)據(jù)加入馬氏距離特征后放入訓(xùn)練好的自編碼網(wǎng)絡(luò)中,得到最終檢測結(jié)果。從而測試整個(gè)異常檢測模型的異常檢測效果。

3 實(shí)驗(yàn)準(zhǔn)備

實(shí)驗(yàn)環(huán)境為CPU Intel Core i5-6500 3.20 GHz、12 GB RAM 和Windows10 操作系統(tǒng),使用python3.6下Keras框架實(shí)現(xiàn)。

3.1 實(shí)驗(yàn)數(shù)據(jù)

實(shí)驗(yàn)過程所用數(shù)據(jù)集為美國國家航空航天局(National Aeronautics and Space Administration,NASA)提供的智能維護(hù)系統(tǒng)(intelligent maintenance system,IMS)采集的軸承振動(dòng)數(shù)據(jù)集,記作IMS Bearing data。該數(shù)據(jù)集通過加速度傳感器按照一定頻率采集機(jī)械設(shè)備的軸承振動(dòng)數(shù)據(jù),每隔10 s 能夠采集到20 480 條數(shù)據(jù);共包含3 個(gè)子數(shù)據(jù)集,每個(gè)數(shù)據(jù)集均經(jīng)過長時(shí)間數(shù)據(jù)采集,包含從正常到異常的振動(dòng)數(shù)據(jù)。本實(shí)驗(yàn)先選擇數(shù)據(jù)集1 描述實(shí)驗(yàn)過程,該數(shù)據(jù)集是通過4個(gè)加速度傳感器采集同一軸承的各部分振動(dòng)數(shù)據(jù)得到的,故該數(shù)據(jù)有4 個(gè)特征,由于傳感器分布于同一軸承設(shè)備,各特征具有一定相關(guān)性。之后,使用IMS Bearing data 剩余的數(shù)據(jù)集2、數(shù)據(jù)集3 以及XJTU-SY數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),進(jìn)一步觀察本研究提出方法的異常檢測效果。

3.2 具體實(shí)驗(yàn)流程

為了進(jìn)一步提高實(shí)驗(yàn)中異常檢測模型的構(gòu)建效率,更好地體現(xiàn)異常檢測效果,本實(shí)驗(yàn)需對(duì)數(shù)據(jù)集進(jìn)行一定的預(yù)處理。首先由于軸承振動(dòng)數(shù)據(jù)不具有突變性,為了提高實(shí)驗(yàn)效率,本實(shí)驗(yàn)將每10 s 的數(shù)據(jù)求平均值,將其歸并為1 條數(shù)據(jù),用該平均值表示。然后將數(shù)據(jù)歸一化到[0,1]區(qū)間,有利于更好地進(jìn)行自編碼網(wǎng)絡(luò)的訓(xùn)練。隨后,根據(jù)2.2 節(jié)中的模型構(gòu)建過程,經(jīng)過馬氏距離快速檢測異常數(shù)據(jù)并得到不確定數(shù)據(jù),隨后進(jìn)行自編碼器的訓(xùn)練,與Sigmoid 分類器結(jié)合,構(gòu)建自編碼網(wǎng)絡(luò)檢測模型。整個(gè)異常檢測模型如圖4 所示。

圖4 軸承振動(dòng)異常檢測模型Fig.4 Bearing vibration abnormal detection model

3.3 評(píng)價(jià)指標(biāo)

為了更易說明實(shí)驗(yàn)的評(píng)價(jià)指標(biāo),本實(shí)驗(yàn)定義異常數(shù)據(jù)為正類,正常數(shù)據(jù)為負(fù)類,因此評(píng)價(jià)指標(biāo)混淆矩陣如表1 所示。

表1 評(píng)價(jià)指標(biāo)混淆矩陣Table 1 Evaluation index confusion matrix

研究中使用準(zhǔn)確率(Accuracy,)、精確率(Precision,)、召回率(Recall,)、F1 值(1)這4個(gè)度量標(biāo)準(zhǔn)來評(píng)價(jià)異常檢測效果,這4 個(gè)指標(biāo)越接近1,則表明效果越好。

準(zhǔn)確率()為所有預(yù)測正確的數(shù)據(jù)量占總數(shù)據(jù)量的比重,表達(dá)式為:

精確率()也稱查準(zhǔn)率,即數(shù)據(jù)正確預(yù)測為異常數(shù)據(jù)的數(shù)據(jù)量占全部預(yù)測為異常數(shù)據(jù)的數(shù)據(jù)量的比重,表達(dá)式為:

召回率()也稱查全率,即數(shù)據(jù)正確預(yù)測為異常數(shù)據(jù)的數(shù)據(jù)量占全部實(shí)際為異常數(shù)據(jù)的數(shù)據(jù)量的比重,表達(dá)式為:

F1 值(1)為精確率和召回率的調(diào)和平均數(shù),在異常檢測中,1 值能更全面地說明檢測方法的效果,取值范圍從0 到1,越接近于1 表示算法效果越好,其表達(dá)式為:

4 實(shí)驗(yàn)過程

實(shí)驗(yàn)使用的數(shù)據(jù)集1包含4個(gè)特征,即通過加速度傳感器在4個(gè)位置采集到的振動(dòng)數(shù)據(jù),記為Bearing1、Bearing2、Bearing3、Bearing4。其變化如圖5 所示,在時(shí)間點(diǎn)“2004-02-16 4:02:39”開始出現(xiàn)異常數(shù)據(jù),由于軸承異常為不可逆的,該時(shí)間點(diǎn)之后采集到的數(shù)據(jù)均為異常數(shù)據(jù)。經(jīng)過預(yù)處理后的數(shù)據(jù)集1 樣本大小如表2 所示。

圖5 數(shù)據(jù)集1 的軸承振動(dòng)數(shù)據(jù)Fig.5 Bearing vibration data from dataset 1

表2 數(shù)據(jù)集1 樣本大小Table 2 Size of dataset 1

4.1 使用馬氏距離快速判別異常數(shù)據(jù)

實(shí)驗(yàn)中選擇正常數(shù)據(jù)中時(shí)間點(diǎn)“2004-02-13 11:02:39”到“2004-02-14 23:52:39”之間的數(shù)據(jù)用于計(jì)算馬氏距離判別閾值,該部分?jǐn)?shù)據(jù)如圖6 所示。

圖6 正常軸承振動(dòng)數(shù)據(jù)Fig.6 Normal bearing vibration data

將實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行預(yù)處理之后,根據(jù)式(1)計(jì)算上述正常數(shù)據(jù)的馬氏距離,結(jié)果如圖7 所示。同時(shí)根據(jù)式(9)、式(10)得到馬氏距離判別閾值為19.23,為-0.38。

圖7 正常數(shù)據(jù)的馬氏距離Fig.7 Mahalanobis distance for normal data

接下來根據(jù)式(8)得到所有數(shù)據(jù)的馬氏距離,如圖8 所示,并通過馬氏距離判別閾值快速判別異常數(shù)據(jù)與不確定數(shù)據(jù)。

圖8 所有數(shù)據(jù)馬氏距離Fig.8 Mahalanobis distance for all data

由圖8 可知,許多異常數(shù)據(jù)的馬氏距離明顯超過了,將馬氏距離超過的數(shù)據(jù)判定為異常數(shù)據(jù)。通過實(shí)驗(yàn),根據(jù)式(14)得此次異常檢測精確率為1,說明此次檢測結(jié)果為異常的數(shù)據(jù)均為真實(shí)異常數(shù)據(jù),所有正常數(shù)據(jù)的馬氏距離均未超過。將馬氏距離未超過的數(shù)據(jù)作為不確定數(shù)據(jù)集進(jìn)入自編碼網(wǎng)絡(luò)的訓(xùn)練階段,其中包含正常數(shù)據(jù)與異常數(shù)據(jù)。

判定為異常數(shù)據(jù)樣本個(gè)數(shù)為362,得到不確定數(shù)據(jù)樣本個(gè)數(shù)為622,不確定數(shù)據(jù)集如表3 所示。將超過閾值的異常數(shù)據(jù)快速檢測出來,提高了檢測速度,同時(shí)明顯減少了訓(xùn)練樣本數(shù)量,有利于提高自編碼網(wǎng)絡(luò)的訓(xùn)練效率。

表3 不確定數(shù)據(jù)集Table 3 Uncertain dataset

4.2 自編碼器的構(gòu)建及訓(xùn)練

在得到各數(shù)據(jù)的馬氏距離之后,將其馬氏距離也作為數(shù)據(jù)的一個(gè)特征,因此數(shù)據(jù)的特征即維度增加到5 個(gè),在后續(xù)的實(shí)驗(yàn)中,將證明加入馬氏距離作為數(shù)據(jù)特征可增強(qiáng)異常檢測的效果。

本實(shí)驗(yàn)構(gòu)建以式(11)為代價(jià)函數(shù)的稀疏自編碼器,首先構(gòu)建如圖2 所示的先升維再編碼的改進(jìn)自編碼器結(jié)構(gòu)。由于輸入數(shù)據(jù)為5 維,自編碼器的輸入層為5 維。升維層和編碼輸出層的維數(shù)需通過實(shí)驗(yàn)進(jìn)行確定,而這兩層的維數(shù)關(guān)系到自編碼器與分類器結(jié)合的自編碼網(wǎng)絡(luò)異常檢測效果,因此升維層和編碼輸出層的維數(shù)通過4.3 節(jié)中自編碼網(wǎng)絡(luò)異常檢測實(shí)驗(yàn)確定。在此,構(gòu)建結(jié)構(gòu)為5-10-2-10-5 的先升維再編碼的改進(jìn)自編碼器以調(diào)節(jié)其他參數(shù)。

由于在代價(jià)函數(shù)中加入了稀疏性限制,稀疏懲罰項(xiàng)權(quán)重系數(shù)和稀疏常數(shù)的設(shè)置尤為重要。為了更為明顯地觀察自編碼器重構(gòu)誤差隨參數(shù)的變化,將自編碼器的訓(xùn)練次數(shù)設(shè)置為10,進(jìn)行5 次實(shí)驗(yàn)取最后重構(gòu)誤差的平均值。圖9給出了稀疏懲罰項(xiàng)權(quán)重系數(shù)與自編碼器重構(gòu)誤差的關(guān)系,圖10 給出了稀疏常數(shù)與自編碼器重構(gòu)誤差的關(guān)系。由圖9、圖10可得稀疏懲罰項(xiàng)權(quán)重系數(shù)和稀疏常數(shù)的最佳值分別為0.20 和0.04。自編碼器的參數(shù)設(shè)置如表4 所示。

圖9 自編碼器訓(xùn)練誤差隨β 的變化Fig.9 Training loss changes with β

圖10 自編碼器訓(xùn)練誤差隨ρ 的變化Fig.10 Training loss changes with ρ

表4 自編碼器參數(shù)設(shè)置Table 4 Parameter setting of autoencoder

4.3 自編碼器結(jié)合分類器構(gòu)建自編碼網(wǎng)絡(luò)

將上述訓(xùn)練完成的自編碼器編碼(隱層)輸出層作為Sigmoid 分類器的輸入層以構(gòu)建如圖11 所示的改進(jìn)自編碼網(wǎng)絡(luò),將通過自編碼器得到的最優(yōu)和作為網(wǎng)絡(luò)的初始參數(shù)。通過輸入標(biāo)簽化的數(shù)據(jù)進(jìn)行如圖3 所示的有監(jiān)督的微調(diào),迭代訓(xùn)練次數(shù)為50。

圖11 改進(jìn)自編碼網(wǎng)絡(luò)Fig.11 Improved autoencoder network

對(duì)于本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)中的升維層和編碼輸出層的維數(shù),在此通過改進(jìn)自編碼網(wǎng)絡(luò)對(duì)不確定數(shù)據(jù)集的異常檢測實(shí)驗(yàn)來確定。為了增強(qiáng)實(shí)驗(yàn)的可靠性和準(zhǔn)確性,采用5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn),將不確定數(shù)據(jù)集隨機(jī)均勻分為5 份,輪流將其中1 份作為測試數(shù)據(jù),剩余4 份作為訓(xùn)練數(shù)據(jù)。將5 次實(shí)驗(yàn)結(jié)果數(shù)據(jù)的平均值作為實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)結(jié)果隨兩個(gè)層的維數(shù)的變化如圖12、圖13所示。從圖12可知,將升維層的維數(shù)設(shè)置為10 最合適;另外觀察到維度小于5 即沒有升維時(shí),異常檢測效果較差,而當(dāng)維度高于5 即升維時(shí),效果較好,進(jìn)一步證明了先升維再編碼的網(wǎng)絡(luò)結(jié)構(gòu)有利于提高自編碼網(wǎng)絡(luò)異常檢測效果。從圖13 可知,將編碼輸出層的維數(shù)設(shè)置為2 最合適,從自編碼器原理可知,由于輸入數(shù)據(jù)維度為5 維,編碼輸出層的維度必須小于5。

圖12 實(shí)驗(yàn)結(jié)果隨U 層維度變化圖Fig.12 Experimental result changes with dimension of U layer

圖13 實(shí)驗(yàn)結(jié)果隨h 層維度變化圖Fig.13 Experimental result changes with dimension of h layer

5 對(duì)比實(shí)驗(yàn)

為了從不同角度進(jìn)一步考察提出方法的有效性,設(shè)計(jì)4 組不同對(duì)比實(shí)驗(yàn):(1)數(shù)據(jù)是否加入馬氏距離特征進(jìn)行構(gòu)建自編碼網(wǎng)絡(luò)的異常檢測效果對(duì)比;(2)傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的對(duì)比;(3)本研究提出的異常檢測方法與其他傳統(tǒng)異常檢測方法的對(duì)比;(4)將本研究提出的方法用于IMS Bearing data 的另外兩個(gè)數(shù)據(jù)集以及XJTU-SY 數(shù)據(jù)集,觀察其檢測效果。

5.1 數(shù)據(jù)是否加入馬氏距離特征的對(duì)比

為了研究將數(shù)據(jù)的馬氏距離作為數(shù)據(jù)的特征放入改進(jìn)自編碼網(wǎng)絡(luò)中進(jìn)行訓(xùn)練對(duì)異常檢測效果的影響,將加入馬氏距離作為特征的不確定數(shù)據(jù)集和不加入馬氏距離作為特征的不確定數(shù)據(jù)集分為兩個(gè)數(shù)據(jù)集,分別訓(xùn)練本研究提出的改進(jìn)自編碼器和改進(jìn)自編碼網(wǎng)絡(luò)并測試。

不加入馬氏距離作為特征的不確定數(shù)據(jù)具有4個(gè)特征,因此輸入層維度改為4。將自編碼器的迭代訓(xùn)練次數(shù)設(shè)置為15,改進(jìn)自編碼網(wǎng)絡(luò)的訓(xùn)練次數(shù)設(shè)置為25,此時(shí)已經(jīng)得到較低的訓(xùn)練誤差。同樣采用4.3 節(jié)中提到的5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表5 所示。可證明,將數(shù)據(jù)的馬氏距離作為數(shù)據(jù)的一個(gè)特征,可有效提高本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)異常檢測效果。

表5 訓(xùn)練數(shù)據(jù)是否加入馬氏距離的對(duì)比Table 5 Comparison of training data with or without Mahalanobis distance

5.2 傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的對(duì)比

首先,需要構(gòu)建傳統(tǒng)自編碼器并結(jié)合分類器構(gòu)建傳統(tǒng)自編碼網(wǎng)絡(luò)。于是在本實(shí)驗(yàn)中,構(gòu)建結(jié)構(gòu)為5-2-5 的直接降維編碼的如圖1 所示的傳統(tǒng)自編碼器,除網(wǎng)絡(luò)結(jié)構(gòu)外的參數(shù)與4.2 節(jié)中構(gòu)建的改進(jìn)自編碼器相同。同4.2 節(jié)所述,將不確定數(shù)據(jù)集用于訓(xùn)練傳統(tǒng)自編碼器。同4.3 節(jié)所述,將訓(xùn)練完成的傳統(tǒng)自編碼器的二維編碼(隱層)輸出層作為Sigmoid 分類器的輸入層以構(gòu)建如圖14 所示的傳統(tǒng)自編碼網(wǎng)絡(luò),并通過輸入標(biāo)簽化的數(shù)據(jù)進(jìn)行有監(jiān)督的微調(diào),迭代訓(xùn)練次數(shù)仍然為50。

圖14 傳統(tǒng)自編碼網(wǎng)絡(luò)Fig.14 Traditional autoencoder network

首先進(jìn)行傳統(tǒng)自編碼器和改進(jìn)自編碼器的訓(xùn)練重構(gòu)誤差的比較,將不確定數(shù)據(jù)集作為兩種自編碼器的輸入進(jìn)行50 次迭代訓(xùn)練,兩者的訓(xùn)練重構(gòu)誤差曲線如圖15 所示。可知,在迭代訓(xùn)練次數(shù)到達(dá)15 次左右時(shí),改進(jìn)自編碼器的訓(xùn)練誤差基本達(dá)到了最小值,因此在后續(xù)對(duì)比實(shí)驗(yàn)中,將改進(jìn)自編碼器的迭代訓(xùn)練次數(shù)設(shè)置為15。

圖15 自編碼器誤差曲線比較Fig.15 Comparison of autoencoder loss

傳統(tǒng)自編碼器和改進(jìn)自編碼器的訓(xùn)練時(shí)間對(duì)比如表6 所示,為得到最佳的隱層表達(dá),傳統(tǒng)自編碼器需要50次迭代訓(xùn)練,而改進(jìn)自編碼器只需15次迭代訓(xùn)練。

如圖15 所示,先升維再編碼的改進(jìn)自編碼器通過更少的訓(xùn)練次數(shù)達(dá)到了最小的訓(xùn)練誤差即收斂速度更快,因此改進(jìn)自編碼器較傳統(tǒng)自編碼器具有更好的收斂性;如表6 所示,雖然先升維再編碼的結(jié)構(gòu)增加了單次迭代訓(xùn)練的時(shí)間,但是由于訓(xùn)練次數(shù)所需更少,改進(jìn)自編碼器的訓(xùn)練所需總時(shí)間更短。綜上,先升維再編碼的改進(jìn)自編碼器具有更好的低維數(shù)據(jù)特征學(xué)習(xí)能力。

表6 自編碼器訓(xùn)練時(shí)間的對(duì)比Table 6 Comparison of autoencoder training time

接下來進(jìn)行傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)在收斂性上的比較。將不確定數(shù)據(jù)集中的數(shù)據(jù)放入上述兩個(gè)自編碼網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練誤差曲線如圖16 所示,訓(xùn)練準(zhǔn)確率()曲線如圖17 所示??芍?,在迭代訓(xùn)練次數(shù)到達(dá)30 次左右時(shí),改進(jìn)自編碼網(wǎng)絡(luò)的訓(xùn)練誤差基本達(dá)到了最小值且訓(xùn)練準(zhǔn)確率也基本達(dá)到最大值,而傳統(tǒng)自編碼網(wǎng)絡(luò)需要50 次以上的迭代訓(xùn)練次數(shù)才能夠?qū)⒂?xùn)練誤差降低到最小值并得到最大的訓(xùn)練準(zhǔn)確率。因此在后續(xù)對(duì)比實(shí)驗(yàn)中,將改進(jìn)自編碼網(wǎng)絡(luò)的迭代訓(xùn)練次數(shù)設(shè)置為30。

圖16 自編碼網(wǎng)絡(luò)誤差曲線比較Fig.16 Comparison of autoencoder network loss

圖17 自編碼網(wǎng)絡(luò)準(zhǔn)確率曲線比較Fig.17 Comparison of autoencoder network accuracy

傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的訓(xùn)練時(shí)間對(duì)比如表7 所示,改進(jìn)自編碼網(wǎng)絡(luò)訓(xùn)練次數(shù)設(shè)置為30,而傳統(tǒng)自編碼網(wǎng)絡(luò)迭代訓(xùn)練次數(shù)為60 時(shí)才獲得與改進(jìn)自編碼網(wǎng)絡(luò)相同的訓(xùn)練誤差和準(zhǔn)確率。

表7 自編碼網(wǎng)絡(luò)訓(xùn)練時(shí)間的對(duì)比Table 7 Comparison of autoencoder network training time

如上所述,改進(jìn)自編碼網(wǎng)絡(luò)的收斂速度要明顯優(yōu)于傳統(tǒng)自編碼網(wǎng)絡(luò),前者能夠用更少的迭代訓(xùn)練次數(shù)得到不小于傳統(tǒng)自編碼網(wǎng)絡(luò)的收斂精度,故改進(jìn)自編碼網(wǎng)絡(luò)的收斂性更好;在訓(xùn)練時(shí)間方面,雖然改進(jìn)自編碼網(wǎng)絡(luò)的單次迭代訓(xùn)練時(shí)間較長,但其所需迭代訓(xùn)練次數(shù)較少,訓(xùn)練所需總時(shí)間更短。綜上,改進(jìn)自編碼網(wǎng)絡(luò)能達(dá)到更好的訓(xùn)練效果。

仍然采用5 折交叉驗(yàn)證方法進(jìn)行傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的異常檢測效果對(duì)比實(shí)驗(yàn),同樣將不確定數(shù)據(jù)集隨機(jī)均勻分為5 份,輪流將其中1份作為測試數(shù)據(jù),剩余4 份用于網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)。將5次實(shí)驗(yàn)結(jié)果數(shù)據(jù)的平均值作為實(shí)驗(yàn)結(jié)果,如表8 所示。由表8 及以上實(shí)驗(yàn)可知,對(duì)于低維軸承振動(dòng)數(shù)據(jù),本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)異常檢測效果要優(yōu)于傳統(tǒng)自編碼網(wǎng)絡(luò)。

表8 傳統(tǒng)自編碼網(wǎng)絡(luò)與改進(jìn)自編碼網(wǎng)絡(luò)的對(duì)比Table 8 Comparison between traditional autoencoder network and improved autoencoder network

為對(duì)比自編碼網(wǎng)絡(luò)的穩(wěn)定性,進(jìn)行在不同訓(xùn)練量的情況下傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的異常檢測效果對(duì)比。在網(wǎng)絡(luò)訓(xùn)練階段,分別選用20%、40%、60%、80%的不確定數(shù)據(jù)集進(jìn)行訓(xùn)練,其余數(shù)據(jù)用于測試。自編碼器迭代訓(xùn)練次數(shù)為15,自編碼網(wǎng)絡(luò)迭代訓(xùn)練次數(shù)為30,每個(gè)實(shí)驗(yàn)重復(fù)20 次取實(shí)驗(yàn)結(jié)果平均值,不同訓(xùn)練量下的實(shí)驗(yàn)結(jié)果對(duì)比如表9所示。

表9 不同訓(xùn)練數(shù)據(jù)量下的實(shí)驗(yàn)結(jié)果對(duì)比Table 9 Experimental results comparison under different amounts of training data

由表9 可知,改進(jìn)自編碼網(wǎng)絡(luò)在不同訓(xùn)練數(shù)量的情況下,異常檢測效果均比傳統(tǒng)自編碼網(wǎng)絡(luò)要好。如圖18 所示,隨著訓(xùn)練數(shù)據(jù)量的增加,改進(jìn)自編碼網(wǎng)絡(luò)檢測效果越來越好,具有一定的穩(wěn)定性。

圖18 實(shí)驗(yàn)結(jié)果隨訓(xùn)練數(shù)據(jù)量變化圖Fig.18 Experimental result changes with amount of training data

5.3 與其他異常檢測方法的對(duì)比

同樣采用5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn),使用IMS Bearing data 中的數(shù)據(jù)集1,將本研究提出的軸承振動(dòng)異常檢測方法與其他異常檢測方法進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表10 所示。

表10 異常檢測算法與所提方法的對(duì)比Table 10 Comparison of anomaly detection algorithms with proposed method

由表10 可知,本研究所提方法對(duì)低維軸承振動(dòng)數(shù)據(jù)的異常檢測要優(yōu)于其他異常檢測方法。

在表10 中,DNN 的結(jié)構(gòu)設(shè)計(jì)為5-10-2-1,并將馬氏距離添加進(jìn)特征,與改進(jìn)自編碼網(wǎng)絡(luò)結(jié)構(gòu)相同,但是沒有自編碼器的訓(xùn)練階段。實(shí)驗(yàn)中發(fā)現(xiàn),由于不恰當(dāng)?shù)某跏蓟萑刖植孔顑?yōu)的情形,DNN 需要更多的訓(xùn)練次數(shù)而且穩(wěn)定性差。實(shí)驗(yàn)中,DNN 平均需要80 次迭代訓(xùn)練才能達(dá)到最小的訓(xùn)練誤差,每次迭代訓(xùn)練時(shí)間平均為141 μs,因此DNN 所需訓(xùn)練總時(shí)間為11 280 μs;本研究所提網(wǎng)絡(luò)的訓(xùn)練時(shí)間包括自編碼器的訓(xùn)練時(shí)間和自編碼網(wǎng)絡(luò)的訓(xùn)練時(shí)間,通過5.2節(jié)可知訓(xùn)練總時(shí)間為6 990 μs??梢娡ㄟ^自編碼器訓(xùn)練后結(jié)合分類器構(gòu)建的自編碼網(wǎng)絡(luò)比同結(jié)構(gòu)的普通神經(jīng)網(wǎng)絡(luò)所需訓(xùn)練時(shí)間更少,訓(xùn)練效率更高。

綜上,本研究所提方法通過自編碼器訓(xùn)練得到的隱層參數(shù)用于初始化分類器網(wǎng)絡(luò),減少了網(wǎng)絡(luò)訓(xùn)練次數(shù),大幅提高了網(wǎng)絡(luò)的訓(xùn)練效率。

5.4 使用其他數(shù)據(jù)集的實(shí)驗(yàn)

IMS Bearing data 中的數(shù)據(jù)集2 通過8 個(gè)不同位置的加速度傳感器獲取數(shù)據(jù),因此數(shù)據(jù)集2 特征為8個(gè),在時(shí)間點(diǎn)“2003-11-21 12:08:36”開始出現(xiàn)異常數(shù)據(jù),其數(shù)據(jù)變化如圖19 所示。IMS Bearing data 中的數(shù)據(jù)集3 通過4 個(gè)不同位置的加速度傳感器獲取數(shù)據(jù),數(shù)據(jù)集3 特征為4 個(gè),在時(shí)間點(diǎn)“2004-04-15 10:21:53”開始出現(xiàn)異常數(shù)據(jù),數(shù)據(jù)集3 的數(shù)據(jù)變化如圖20所示。XJTU-SY數(shù)據(jù)集使用兩個(gè)加速度傳感器采集軸承水平和豎直方向上的振動(dòng)數(shù)據(jù),每分鐘采樣32 768個(gè)樣本,因此其數(shù)據(jù)特征為2 個(gè),數(shù)據(jù)預(yù)處理時(shí)將每秒鐘采集到的數(shù)據(jù)使用平均值歸為1 條數(shù)據(jù)。經(jīng)過預(yù)處理之后的3 個(gè)數(shù)據(jù)集樣本大小如表11 所示。

圖19 數(shù)據(jù)集2 的軸承振動(dòng)數(shù)據(jù)Fig.19 Bearing vibration data from dataset 2

圖20 數(shù)據(jù)集3 的軸承振動(dòng)數(shù)據(jù)Fig.20 Bearing vibration data from dataset 3

表11 3 個(gè)數(shù)據(jù)集樣本大小Table 11 Size of 3 datasets

同樣采取上文所提的5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表12 所示。可知本研究提出的方法在另外3 個(gè)數(shù)據(jù)集上保持了較好的檢測效果,因此對(duì)于低維軸承振動(dòng)數(shù)據(jù)具有一定的泛化能力。尤其數(shù)據(jù)集3 為異常數(shù)據(jù)占比較少的不平衡數(shù)據(jù)集,本研究提出的方法依然具有良好的檢測效果。

表12 在3 個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 12 Experimental results on 3 datasets

6 結(jié)束語

本研究針對(duì)軸承振動(dòng)數(shù)據(jù)維度低、數(shù)據(jù)量大、各特征之間具有一定相關(guān)性的特點(diǎn),提出了一種結(jié)合馬氏距離與自編碼網(wǎng)絡(luò)的異常檢測方法。通過正常數(shù)據(jù)的馬氏距離,得到判別閾值以快速檢測出部分異常數(shù)據(jù),減少了自編碼網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量;將自編碼器與分類器結(jié)合,解決了網(wǎng)絡(luò)參數(shù)初始化問題;提出先升維再編碼的自編碼器結(jié)構(gòu),而且將數(shù)據(jù)的馬氏距離作為特征加入到網(wǎng)絡(luò)訓(xùn)練中,有利于自編碼網(wǎng)絡(luò)的訓(xùn)練,提升了異常檢測效果。實(shí)驗(yàn)證明了本研究所提方法較其他異常檢測算法有著更好的檢測效果,并且具有一定的穩(wěn)定性和泛化能力。在未來的工作中,考慮引入時(shí)序深度學(xué)習(xí)模型研究如何實(shí)現(xiàn)快速在線檢測和分類。

猜你喜歡
實(shí)驗(yàn)檢測
記一次有趣的實(shí)驗(yàn)
微型實(shí)驗(yàn)里看“燃燒”
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
做個(gè)怪怪長實(shí)驗(yàn)
NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 热伊人99re久久精品最新地| 久久99热这里只有精品免费看| 特级做a爰片毛片免费69| 亚洲av中文无码乱人伦在线r| 亚洲成肉网| 亚洲性网站| 99精品在线视频观看| 欧美一级专区免费大片| 精品无码一区二区三区电影| 欧美亚洲第一页| 国产亚洲精品精品精品| 日韩毛片免费| 一级毛片网| 高清色本在线www| 亚洲美女一区| 婷婷午夜影院| 91福利片| 亚洲视频在线网| 欧美日韩在线成人| 国产成年女人特黄特色毛片免| 国产一区成人| 在线无码av一区二区三区| 国产在线无码av完整版在线观看| 18禁不卡免费网站| 国产丰满大乳无码免费播放 | 亚洲最黄视频| 亚洲AV无码乱码在线观看代蜜桃| 青青网在线国产| 亚洲欧洲日产国产无码AV| 国产在线视频欧美亚综合| 1769国产精品视频免费观看| 高清无码手机在线观看| 91久久夜色精品国产网站| 在线欧美a| 久久国产拍爱| 毛片在线播放网址| 四虎成人在线视频| 麻豆精品视频在线原创| 国产成a人片在线播放| 午夜性刺激在线观看免费| 五月激激激综合网色播免费| 精品国产美女福到在线直播| 国产v精品成人免费视频71pao | 伊人成色综合网| 日韩经典精品无码一区二区| 国产永久无码观看在线| 国产AV无码专区亚洲精品网站| 国产成人a毛片在线| 国产一级二级在线观看| 毛片在线区| 91人妻在线视频| aa级毛片毛片免费观看久| 三级国产在线观看| 中国美女**毛片录像在线| 亚洲天堂啪啪| 九色在线观看视频| 国产欧美日韩精品综合在线| a毛片在线播放| 色综合国产| 啪啪永久免费av| 婷婷亚洲视频| 亚洲综合第一页| 久久99这里精品8国产| 99久久国产自偷自偷免费一区| 亚洲欧洲自拍拍偷午夜色无码| 国产区91| 欧美一区二区三区欧美日韩亚洲| 亚洲精品综合一二三区在线| 91视频青青草| 亚洲第一区精品日韩在线播放| 久久综合色播五月男人的天堂| 亚洲成人手机在线| 成人av专区精品无码国产| 在线播放国产一区| 亚洲成人播放| 国产玖玖视频| 久久精品国产999大香线焦| 日本91视频| 无码福利日韩神码福利片| 99热这里只有免费国产精品 | 日韩a在线观看免费观看| 日韩AV手机在线观看蜜芽|