基于改進(jìn)自編碼網(wǎng)絡(luò)的軸承振動(dòng)異常檢測

2022-01-18 11:39:00李貝貝

計(jì)算機(jī)與生活 2022年1期

李貝貝，彭力

江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院，江蘇無錫214122

軸承作為各種工業(yè)現(xiàn)場機(jī)械設(shè)備的重要零部件之一，對(duì)工業(yè)流程的順利進(jìn)行和設(shè)備運(yùn)行安全有著重要意義。但在長期的高強(qiáng)度、大載荷的復(fù)雜工況下，軸承極易出現(xiàn)異常狀況，導(dǎo)致故障發(fā)生。若能準(zhǔn)確、及時(shí)地檢測到異常數(shù)據(jù)，則有助于設(shè)備及時(shí)維護(hù)，避免嚴(yán)重事故的發(fā)生。在大數(shù)據(jù)時(shí)代，隨著傳感器和機(jī)器學(xué)習(xí)技術(shù)的飛速發(fā)展，通過先進(jìn)理論和方法使用歷史采集的狀態(tài)監(jiān)控?cái)?shù)據(jù)提取特征，構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的軸承異常檢測模型，并保證異常檢測的準(zhǔn)確性和穩(wěn)定性，成為了當(dāng)前研究的熱點(diǎn)并具有明確學(xué)術(shù)價(jià)值與應(yīng)用意義。

軸承的振動(dòng)監(jiān)測數(shù)據(jù)是最直觀最方便判斷軸承是否出現(xiàn)異常的數(shù)據(jù)，通過加速度傳感器可以方便快速地采集數(shù)據(jù)并實(shí)時(shí)檢測。振動(dòng)數(shù)據(jù)的采集通常需要在多個(gè)位置放置多個(gè)采集傳感器，因此振動(dòng)數(shù)據(jù)的特點(diǎn)主要包括：數(shù)據(jù)量大、維度較低、各維度之間具有一定相關(guān)性。

軸承振動(dòng)異常的檢測主要使用許多異常點(diǎn)檢測方法。檢測方法主要包括：（1）基于統(tǒng)計(jì)學(xué)的方法，假定大部分正常數(shù)據(jù)服從相同的數(shù)據(jù)分布，異常數(shù)據(jù)則不屬于該分布，但此類方法確定數(shù)據(jù)的概率分布模型以及參數(shù)比較困難。（2）基于鄰域的異常檢測方法，如近鄰算法（-nearest neighbor，NN）和局部異常因子算法（local outlier factor，LOF）。NN算法易于實(shí)現(xiàn)，但對(duì)于異常數(shù)據(jù)占比較少、樣本不平衡的軸承振動(dòng)數(shù)據(jù)表現(xiàn)較差。LOF 算法通過局部可達(dá)密度彌補(bǔ)NN 算法對(duì)于樣本不平衡的數(shù)據(jù)集表現(xiàn)較差的缺點(diǎn)，但是LOF 算法對(duì)于參數(shù)的確定極為敏感，且算法復(fù)雜度高，時(shí)間成本高。（3）支持向量機(jī)（support vector machine，SVM），通過訓(xùn)練數(shù)據(jù)對(duì)象的邊界或特征來確定異常數(shù)據(jù)。此方法需要大量能用于訓(xùn)練的正常數(shù)據(jù)，并確定相應(yīng)參數(shù)，且參數(shù)的設(shè)置對(duì)于檢測效果影響較大。（4）孤立森林（isolation forest，iForest）算法，通過構(gòu)建隔離樹檢測異常數(shù)據(jù)，具有線性時(shí)間復(fù)雜度。但其采用無監(jiān)督的方式，忽略數(shù)據(jù)特征之間的相關(guān)性進(jìn)行隨機(jī)選取特征構(gòu)建隔離樹，因此檢測準(zhǔn)確度較低。

近年來，深度神經(jīng)網(wǎng)絡(luò)（deep neural network，DNN）已在特征的自動(dòng)提取和識(shí)別上成功應(yīng)用，可自適應(yīng)地提取信息豐富的重要特征，簡化繁重且有挑戰(zhàn)性的特征提取過程，具有較好的普適性。自編碼器（autoencoder，AE）最早由Rumelhart 等人提出，并將其用于復(fù)雜數(shù)據(jù)處理。隨后，Hinton 等人提出了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)，由此產(chǎn)生了深度自編碼器。在深度自編碼器的基礎(chǔ)上，Ng提出高維而稀疏的隱層，對(duì)隱層加入稀疏性限制提高自編碼器特征學(xué)習(xí)能力，提出了稀疏自編碼器。如今，自編碼器和深度神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于故障診斷、圖像識(shí)別、異常檢測等領(lǐng)域中。自編碼器和神經(jīng)網(wǎng)絡(luò)也被研究應(yīng)用于軸承振動(dòng)等工業(yè)數(shù)據(jù)的異常檢測問題上，自編碼器因其優(yōu)越的特征提取能力得到了大量研究與應(yīng)用。

由于傳感器技術(shù)的發(fā)展，軸承振動(dòng)數(shù)據(jù)的采集更加方便快速，但導(dǎo)致數(shù)據(jù)量龐大，在自編碼器和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中，過大的數(shù)據(jù)量使得訓(xùn)練效率較低并且檢測準(zhǔn)確度無法得到有效提升。為了減少自編碼器和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量，本研究通過正常振動(dòng)數(shù)據(jù)樣本的馬氏距離（Mahalanobis distance）得到判定閾值，計(jì)算數(shù)據(jù)與正常數(shù)據(jù)均值的馬氏距離，將沒有超過判定閾值的數(shù)據(jù)記為不確定數(shù)據(jù)并將該部分?jǐn)?shù)據(jù)用于自編碼器和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。

對(duì)于神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題，傳統(tǒng)的權(quán)值隨機(jī)初始化方法依然會(huì)有陷入局部最優(yōu)的風(fēng)險(xiǎn)。本研究結(jié)合自編碼器和Sigmoid 分類器構(gòu)建自編碼網(wǎng)絡(luò)（autoencoder network，AN）解決了神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題，并且減少了網(wǎng)絡(luò)訓(xùn)練次數(shù)和時(shí)間，提高了訓(xùn)練效率。本研究將訓(xùn)練完成的自編碼器中編碼層輸出作為分類器輸入，利用自編碼器獲得的編碼層權(quán)值和偏差解決神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題，最后使用標(biāo)簽化數(shù)據(jù)進(jìn)行有監(jiān)督的微調(diào)以完成整個(gè)自編碼網(wǎng)絡(luò)的訓(xùn)練。

軸承振動(dòng)數(shù)據(jù)各特征之間具有相關(guān)性，馬氏距離可用作判斷數(shù)據(jù)異常與否的重要特征，因此本研究將數(shù)據(jù)的馬氏距離作為特征添加到數(shù)據(jù)的特征中用于自編碼網(wǎng)絡(luò)的訓(xùn)練過程，有效提高了自編碼網(wǎng)絡(luò)對(duì)軸承振動(dòng)數(shù)據(jù)的異常檢測準(zhǔn)確度。

自編碼器常被用在高維數(shù)據(jù)的特征提取和降維過程中，而對(duì)于特征較少的低維軸承振動(dòng)數(shù)據(jù)，自編碼器的特征提取和降維作用并不顯著。為了增強(qiáng)自編碼器的特征提取能力以獲得更好的編碼層參數(shù)，提高整個(gè)自編碼網(wǎng)絡(luò)的異常檢測效果，本研究加入了稀疏約束條件并構(gòu)建先升維再編碼的改進(jìn)自編碼器結(jié)構(gòu)，提高了自編碼器特征提取能力，并通過實(shí)驗(yàn)證明了該結(jié)構(gòu)具有更好的收斂性和異常檢測效果。

本研究的主要貢獻(xiàn)如下：通過馬氏距離快速判別出一部分異常數(shù)據(jù)以減少自編碼網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量；將自編碼器和分類器結(jié)合解決了神經(jīng)網(wǎng)絡(luò)的參數(shù)初始化問題，減少了網(wǎng)絡(luò)訓(xùn)練時(shí)間；通過數(shù)據(jù)加入馬氏距離特征、先升維再編碼的自編碼器結(jié)構(gòu)、稀疏約束條件，構(gòu)建了一種改進(jìn)自編碼網(wǎng)絡(luò)用于軸承振動(dòng)異常檢測；通過實(shí)驗(yàn)證明了該方法對(duì)于低維軸承振動(dòng)數(shù)據(jù)具有較好的異常檢測效果。

1 基本概念

1.1 馬氏距離

印度統(tǒng)計(jì)學(xué)家Mahalanobis 提出了一種考慮到各變量之間相關(guān)性的廣義距離，稱為馬氏距離(Mahalanobis distance)，其主要思想是利用向量間的協(xié)方差矩陣來表示其馬氏距離。

對(duì)于包含個(gè)數(shù)據(jù)、每個(gè)數(shù)據(jù)維度為的數(shù)據(jù)集=(,,…,X)，其中均值為=(,,…,μ)，協(xié)方差矩陣為，其中一數(shù)據(jù)為=(,,…,x)，則其馬氏距離如下所示：

其中，為協(xié)方差矩陣的逆矩陣，馬氏距離可看作數(shù)據(jù)與總體數(shù)據(jù)均值的距離。

由于馬氏距離的計(jì)算需要使用數(shù)據(jù)集的協(xié)方差矩陣，較歐式距離等其他距離的最大優(yōu)勢為馬氏距離考慮數(shù)據(jù)特征之間的相關(guān)性。在數(shù)據(jù)集中，如果一個(gè)數(shù)據(jù)的馬氏距離越小，則說明其與數(shù)據(jù)集中均值數(shù)據(jù)的相似度越大。在軸承振動(dòng)數(shù)據(jù)等低維工業(yè)數(shù)據(jù)中，由于工藝流程和采集設(shè)備等緣故，數(shù)據(jù)的每個(gè)特征之間有著不可忽視的相關(guān)性，馬氏距離更適合用于軸承振動(dòng)數(shù)據(jù)的距離表達(dá)。

考慮在軸承振動(dòng)異常檢測中，假設(shè)某數(shù)據(jù)為正常數(shù)據(jù)，使用正常數(shù)據(jù)集的均值和協(xié)方差矩陣根據(jù)式（1）計(jì)算其馬氏距離。若該數(shù)據(jù)馬氏距離與正常數(shù)據(jù)馬氏距離接近，說明該數(shù)據(jù)與正常數(shù)據(jù)相似度較大，該數(shù)據(jù)大概率為正常數(shù)據(jù)；若該數(shù)據(jù)馬氏距離與正常數(shù)據(jù)馬氏距離相差較遠(yuǎn)，說明該數(shù)據(jù)與正常數(shù)據(jù)相似度較小，則該數(shù)據(jù)大概率為異常數(shù)據(jù)。因此能夠使用軸承振動(dòng)數(shù)據(jù)的馬氏距離來判斷數(shù)據(jù)為異常數(shù)據(jù)的可能性，該思想在2.1 節(jié)中詳細(xì)說明。

如上所述，軸承振動(dòng)數(shù)據(jù)的馬氏距離可以用來判斷該數(shù)據(jù)為異常數(shù)據(jù)的可能性，故考慮將數(shù)據(jù)的馬氏距離作為軸承振動(dòng)數(shù)據(jù)的一個(gè)特征。由于正常數(shù)據(jù)和異常數(shù)據(jù)的馬氏距離有較大的差別，在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中，加入的馬氏距離特征將作為重要特征，有利于提升神經(jīng)網(wǎng)絡(luò)的異常檢測效果。因此在本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)訓(xùn)練和檢測過程中，將數(shù)據(jù)的馬氏距離加入數(shù)據(jù)特征中，5.1 節(jié)中通過對(duì)比實(shí)驗(yàn)證明了該思想的優(yōu)越性。

1.2 自編碼器

自編碼器主要包括編碼和解碼階段，且結(jié)構(gòu)對(duì)稱，即若存在多個(gè)隱層時(shí)，編碼和解碼階段的隱層數(shù)量及結(jié)構(gòu)相同。主要結(jié)構(gòu)由輸入層、隱層和輸出層組成，如圖1 所示。隱層對(duì)輸入層數(shù)據(jù)進(jìn)行編碼，輸出層對(duì)隱層表達(dá)進(jìn)行解碼重構(gòu)原始數(shù)據(jù)，最小化重構(gòu)誤差以獲得最佳的隱層表達(dá)。其目標(biāo)是擬合一個(gè)恒等函數(shù)，使得每個(gè)輸出值盡可能等于相對(duì)應(yīng)的輸入值。

圖1 自編碼器結(jié)構(gòu)Fig.1 Structure of AE

對(duì)于數(shù)據(jù)集=(,,…,X)，為數(shù)據(jù)個(gè)數(shù)，每個(gè)數(shù)據(jù)維度為，即X∈R(=1,2,…,)。每一個(gè)數(shù)據(jù)X經(jīng)過編碼過程得到隱層表達(dá)，編碼過程可描述為：

其中，和為編碼權(quán)重和偏置，σ為編碼層激活函數(shù)，目前比較常用的有Sigmoid、Tanh、ReLU 等。然后隱層表達(dá)經(jīng)解碼過程得到重構(gòu)數(shù)據(jù)X′，解碼過程可描述為：

其中，′和′為解碼權(quán)重和偏置，取′=，σ為解碼層激活函數(shù)。

其中，為單個(gè)數(shù)據(jù)的損失函數(shù)，在式（4）中為均方誤差損失函數(shù)。同時(shí)為了防止出現(xiàn)過擬合，給代價(jià)函數(shù)添加一個(gè)L2 正則化權(quán)重衰減項(xiàng)，為懲罰因子，控制正則化項(xiàng)影響權(quán)重衰減的程度，得到最終的損失函數(shù)為：

文獻(xiàn)[17]證明，使用Sigmoid 激活函數(shù)時(shí)，交叉熵?fù)p失函數(shù)要優(yōu)于均方誤差損失函數(shù)，由于本研究構(gòu)建的自編碼網(wǎng)絡(luò)最終輸出為二分類，且通過實(shí)驗(yàn)得到，無論是自編碼器的訓(xùn)練階段還是編碼層結(jié)合分類器階段，Sigmoid 作為輸出層激活函數(shù)效果最理想，因此本研究采用交叉熵代價(jià)函數(shù)為：

在自編碼器的訓(xùn)練過程中，通過編碼和解碼過程使代價(jià)函數(shù)最小來學(xué)習(xí)并提取數(shù)據(jù)重要的特征，即獲得最佳的隱層表達(dá)。

2 結(jié)合馬氏距離和自編碼網(wǎng)絡(luò)的異常檢測

2.1 使用馬氏距離快速檢測異常數(shù)據(jù)

假設(shè)采集到的軸承振動(dòng)數(shù)據(jù)集記為=(,,…,X)，數(shù)據(jù)維度為。其中正常數(shù)據(jù)集記為X=(,,…,X)，正常數(shù)據(jù)均值為μ=(,,…,μ)，協(xié)方差矩陣為Σ，根據(jù)式（1）計(jì)算得到正常數(shù)據(jù)集中每個(gè)數(shù)據(jù)的馬氏距離記為：

其中，M表示在正常數(shù)據(jù)集中第個(gè)正常數(shù)據(jù)的馬氏距離。

接下來根據(jù)式（1）計(jì)算整個(gè)數(shù)據(jù)集中所有數(shù)據(jù)的馬氏距離。由于某一數(shù)據(jù)的變化會(huì)影響到數(shù)據(jù)集均值的變化，馬氏距離夸大了微小變化向量的作用，從而影響其他數(shù)據(jù)的馬氏距離計(jì)算。為了改善上述馬氏距離的缺點(diǎn)，在計(jì)算所有數(shù)據(jù)的馬氏距離時(shí)使用的均值和協(xié)方差矩陣仍然為正常數(shù)據(jù)集中的μ和Σ，顯然獨(dú)立的μ和Σ不受向量變化影響；根據(jù)1.1節(jié)，得到的某個(gè)數(shù)據(jù)的馬氏距離可看作該數(shù)據(jù)與正常數(shù)據(jù)集均值的距離。則數(shù)據(jù)X的馬氏距離記為：

根據(jù)統(tǒng)計(jì)學(xué)相關(guān)知識(shí)以及后續(xù)對(duì)軸承振動(dòng)數(shù)據(jù)的實(shí)驗(yàn)分析可知：如果數(shù)據(jù)X為正常數(shù)據(jù)，則其馬氏距離D(X)應(yīng)符合正常數(shù)據(jù)馬氏距離數(shù)據(jù)集即M的統(tǒng)計(jì)分布；如果X為異常數(shù)據(jù)，則D(X)不符合M的統(tǒng)計(jì)分布。

通過實(shí)驗(yàn)驗(yàn)證，馬氏距離不在(,)區(qū)間內(nèi)的數(shù)據(jù)均為異常數(shù)據(jù)。將馬氏距離在(,)區(qū)間內(nèi)的數(shù)據(jù)判定為不確定數(shù)據(jù)，記為X，然后使用不確定數(shù)據(jù)集X訓(xùn)練自編碼網(wǎng)絡(luò)以完成模型構(gòu)建。同時(shí)將數(shù)據(jù)的馬氏距離加入到數(shù)據(jù)特征中，用于自編碼網(wǎng)絡(luò)的訓(xùn)練。

于是，通過馬氏距離檢測出了一部分異常數(shù)據(jù)，將剩余的不確定數(shù)據(jù)輸入自編碼網(wǎng)絡(luò)中。對(duì)于數(shù)據(jù)量大的軸承振動(dòng)數(shù)據(jù)而言，減少了用于自編碼網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)，并且能夠根據(jù)馬氏距離判別閾值快速判別出一部分異常數(shù)據(jù)，提高了檢測效率。

2.2 自編碼器的構(gòu)建

為了提高自編碼器學(xué)習(xí)數(shù)據(jù)特征的能力，在自編碼器基礎(chǔ)上添加約束條件，在其代價(jià)函數(shù)上加入稀疏懲罰項(xiàng)，使其形成稀疏自編碼器。稀疏自編碼器代價(jià)函數(shù)為：

本研究使用自編碼器的主要目的是利用其學(xué)習(xí)并提取數(shù)據(jù)特征的能力提取數(shù)據(jù)更有用的特征，得到更好的隱層表達(dá)用于結(jié)合分類器。而對(duì)于低維軸承振動(dòng)數(shù)據(jù)，由于其維度較低、特征較少，不利于自編碼器提取其特征，導(dǎo)致自編碼器的收斂性較差。在實(shí)際應(yīng)用中已證明了自編碼器對(duì)高維數(shù)據(jù)優(yōu)秀的特征提取能力，因此考慮將數(shù)據(jù)先升維再編碼的自編碼器結(jié)構(gòu)，通過升維結(jié)構(gòu)提高了數(shù)據(jù)的維度，類似于增加了數(shù)據(jù)的特征。增加了升維層必然增加自編碼器訓(xùn)練的運(yùn)算復(fù)雜度，也相應(yīng)地增加了自編碼器單次訓(xùn)練的時(shí)間，但是自編碼器通過較少的訓(xùn)練次數(shù)便可以得到最佳的隱層表達(dá)，其收斂速度增大。就總體時(shí)間而言，先升維再編碼的自編碼器能夠用較少的時(shí)間完成訓(xùn)練，得到最佳隱層表達(dá)。因此不同于一般自編碼器直接降維編碼的結(jié)構(gòu)，本研究基于稀疏自編碼器，構(gòu)建先升維再編碼的網(wǎng)絡(luò)結(jié)構(gòu)以提升對(duì)軸承振動(dòng)數(shù)據(jù)的特征提取能力，同時(shí)在解碼階段保持與編碼階段的對(duì)稱結(jié)構(gòu)。5.2 節(jié)中通過實(shí)驗(yàn)證明了先升維再編碼的自編碼器結(jié)構(gòu)收斂性更好，訓(xùn)練時(shí)間更短，提升了自編碼器對(duì)低維數(shù)據(jù)的特征提取能力。

本研究構(gòu)建的改進(jìn)自編碼器結(jié)構(gòu)如圖2 所示，X為輸入數(shù)據(jù)，數(shù)據(jù)維度為維，通過升維過程得到隱層表達(dá)U，其中>，維度升為維，同時(shí)解碼過程保持對(duì)稱結(jié)構(gòu)。 h為編碼層輸出，為編碼之后的維度，使用訓(xùn)練數(shù)據(jù)通過無監(jiān)督貪婪算法使代價(jià)函數(shù)最小，從而完成自編碼器的訓(xùn)練以得到最終編碼層輸出h作為分類器的輸入。

圖2 改進(jìn)自編碼器結(jié)構(gòu)Fig.2 Improved structure of AE

2.3 自編碼器與分類器結(jié)合構(gòu)建自編碼網(wǎng)絡(luò)

通過自編碼器的訓(xùn)練，得到了最優(yōu)的權(quán)值和偏差，將h作為分類器的輸入，把最優(yōu)的和作為網(wǎng)絡(luò)的初始化參數(shù)，解決了神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題。如圖3 所示，S為使用Sigmoid 激活函數(shù)的分類層，h作為其輸入，X為一維輸出結(jié)果，表示正?；虍惓?shù)據(jù)，通過輸入標(biāo)簽化訓(xùn)練數(shù)據(jù)，結(jié)合誤差反向傳播算法和隨機(jī)梯度下降進(jìn)行有監(jiān)督的參數(shù)微調(diào)，最終完成整個(gè)自編碼網(wǎng)絡(luò)的構(gòu)建。

圖3 有監(jiān)督的微調(diào)Fig.3 Supervised fine-tuning

通過自編碼器的訓(xùn)練得到了較為合適的網(wǎng)絡(luò)初始化參數(shù)，因此在自編碼網(wǎng)絡(luò)有監(jiān)督的微調(diào)階段，能夠減少所需訓(xùn)練次數(shù)，提高整個(gè)網(wǎng)絡(luò)的訓(xùn)練效率。在5.3 節(jié)中，通過與普通DNN 的對(duì)比證明了將自編碼器與分類器結(jié)合的方法能顯著減少網(wǎng)絡(luò)的訓(xùn)練時(shí)間。

文獻(xiàn)[19]指出，神經(jīng)網(wǎng)絡(luò)的隱層數(shù)量比學(xué)習(xí)算法和自編碼器結(jié)構(gòu)對(duì)性能的影響更加重要，本研究主要關(guān)注自編碼器用于軸承振動(dòng)異常檢測，因此在此只使用單層的神經(jīng)網(wǎng)絡(luò)分類器結(jié)構(gòu)，由于是二分類任務(wù)，故單層使用Sigmoid 激活函數(shù)，輸出分類結(jié)果。

2.4 整個(gè)異常檢測模型構(gòu)建過程

首先對(duì)所有振動(dòng)數(shù)據(jù)歸一化處理，并從中提取出部分正常數(shù)據(jù)，計(jì)算正常數(shù)據(jù)的馬氏距離，根據(jù)式（9）、式（10）得到馬氏距離判別閾值。

根據(jù)式（8）得到所有數(shù)據(jù)的馬氏距離，將馬氏距離超過閾值的數(shù)據(jù)判定為異常數(shù)據(jù)，沒有超過閾值的數(shù)據(jù)記為不確定數(shù)據(jù)，并將數(shù)據(jù)的馬氏距離加入數(shù)據(jù)特征中。

將加入馬氏距離特征的不確定數(shù)據(jù)集作為圖2 所示的改進(jìn)自編碼器的輸入，以無監(jiān)督的方式訓(xùn)練自編碼器，得到最優(yōu)的編碼層輸出h以及最優(yōu)的權(quán)值和偏差參數(shù)。

將h作為Sigmoid 分類器的輸入，使用帶標(biāo)簽的不確定數(shù)據(jù)作為圖3 所示的結(jié)構(gòu)中的輸入，進(jìn)行有監(jiān)督的微調(diào)以得到整個(gè)網(wǎng)絡(luò)的最優(yōu)參數(shù)，完成自編碼網(wǎng)絡(luò)的構(gòu)建。

隨機(jī)選取全部振動(dòng)數(shù)據(jù)的一部分作為測試數(shù)據(jù)，根據(jù)式（8）得到其馬氏距離，將超過馬氏距離判別閾值的數(shù)據(jù)判定為異常數(shù)據(jù)，將沒有超過閾值的數(shù)據(jù)加入馬氏距離特征后放入訓(xùn)練好的自編碼網(wǎng)絡(luò)中，得到最終檢測結(jié)果。從而測試整個(gè)異常檢測模型的異常檢測效果。

3 實(shí)驗(yàn)準(zhǔn)備

實(shí)驗(yàn)環(huán)境為CPU Intel Core i5-6500 3.20 GHz、12 GB RAM 和Windows10 操作系統(tǒng)，使用python3.6下Keras框架實(shí)現(xiàn)。

3.1 實(shí)驗(yàn)數(shù)據(jù)

實(shí)驗(yàn)過程所用數(shù)據(jù)集為美國國家航空航天局（National Aeronautics and Space Administration，NASA）提供的智能維護(hù)系統(tǒng)（intelligent maintenance system，IMS）采集的軸承振動(dòng)數(shù)據(jù)集，記作IMS Bearing data。該數(shù)據(jù)集通過加速度傳感器按照一定頻率采集機(jī)械設(shè)備的軸承振動(dòng)數(shù)據(jù)，每隔10 s 能夠采集到20 480 條數(shù)據(jù)；共包含3 個(gè)子數(shù)據(jù)集，每個(gè)數(shù)據(jù)集均經(jīng)過長時(shí)間數(shù)據(jù)采集，包含從正常到異常的振動(dòng)數(shù)據(jù)。本實(shí)驗(yàn)先選擇數(shù)據(jù)集1 描述實(shí)驗(yàn)過程，該數(shù)據(jù)集是通過4個(gè)加速度傳感器采集同一軸承的各部分振動(dòng)數(shù)據(jù)得到的，故該數(shù)據(jù)有4 個(gè)特征，由于傳感器分布于同一軸承設(shè)備，各特征具有一定相關(guān)性。之后，使用IMS Bearing data 剩余的數(shù)據(jù)集2、數(shù)據(jù)集3 以及XJTU-SY數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)，進(jìn)一步觀察本研究提出方法的異常檢測效果。

3.2 具體實(shí)驗(yàn)流程

為了進(jìn)一步提高實(shí)驗(yàn)中異常檢測模型的構(gòu)建效率，更好地體現(xiàn)異常檢測效果，本實(shí)驗(yàn)需對(duì)數(shù)據(jù)集進(jìn)行一定的預(yù)處理。首先由于軸承振動(dòng)數(shù)據(jù)不具有突變性，為了提高實(shí)驗(yàn)效率，本實(shí)驗(yàn)將每10 s 的數(shù)據(jù)求平均值，將其歸并為1 條數(shù)據(jù)，用該平均值表示。然后將數(shù)據(jù)歸一化到[0,1]區(qū)間，有利于更好地進(jìn)行自編碼網(wǎng)絡(luò)的訓(xùn)練。隨后，根據(jù)2.2 節(jié)中的模型構(gòu)建過程，經(jīng)過馬氏距離快速檢測異常數(shù)據(jù)并得到不確定數(shù)據(jù)，隨后進(jìn)行自編碼器的訓(xùn)練，與Sigmoid 分類器結(jié)合，構(gòu)建自編碼網(wǎng)絡(luò)檢測模型。整個(gè)異常檢測模型如圖4 所示。

圖4 軸承振動(dòng)異常檢測模型Fig.4 Bearing vibration abnormal detection model

3.3 評(píng)價(jià)指標(biāo)

為了更易說明實(shí)驗(yàn)的評(píng)價(jià)指標(biāo)，本實(shí)驗(yàn)定義異常數(shù)據(jù)為正類，正常數(shù)據(jù)為負(fù)類，因此評(píng)價(jià)指標(biāo)混淆矩陣如表1 所示。

表1 評(píng)價(jià)指標(biāo)混淆矩陣Table 1 Evaluation index confusion matrix

研究中使用準(zhǔn)確率（Accuracy，）、精確率（Precision，）、召回率（Recall，）、F1 值（1）這4個(gè)度量標(biāo)準(zhǔn)來評(píng)價(jià)異常檢測效果，這4 個(gè)指標(biāo)越接近1，則表明效果越好。

準(zhǔn)確率（）為所有預(yù)測正確的數(shù)據(jù)量占總數(shù)據(jù)量的比重，表達(dá)式為：

精確率（）也稱查準(zhǔn)率，即數(shù)據(jù)正確預(yù)測為異常數(shù)據(jù)的數(shù)據(jù)量占全部預(yù)測為異常數(shù)據(jù)的數(shù)據(jù)量的比重，表達(dá)式為：

召回率（）也稱查全率，即數(shù)據(jù)正確預(yù)測為異常數(shù)據(jù)的數(shù)據(jù)量占全部實(shí)際為異常數(shù)據(jù)的數(shù)據(jù)量的比重，表達(dá)式為：

F1 值（1）為精確率和召回率的調(diào)和平均數(shù)，在異常檢測中，1 值能更全面地說明檢測方法的效果，取值范圍從0 到1，越接近于1 表示算法效果越好，其表達(dá)式為:

4 實(shí)驗(yàn)過程

實(shí)驗(yàn)使用的數(shù)據(jù)集1包含4個(gè)特征，即通過加速度傳感器在4個(gè)位置采集到的振動(dòng)數(shù)據(jù)，記為Bearing1、Bearing2、Bearing3、Bearing4。其變化如圖5 所示，在時(shí)間點(diǎn)“2004-02-16 4:02:39”開始出現(xiàn)異常數(shù)據(jù)，由于軸承異常為不可逆的，該時(shí)間點(diǎn)之后采集到的數(shù)據(jù)均為異常數(shù)據(jù)。經(jīng)過預(yù)處理后的數(shù)據(jù)集1 樣本大小如表2 所示。

圖5 數(shù)據(jù)集1 的軸承振動(dòng)數(shù)據(jù)Fig.5 Bearing vibration data from dataset 1

表2 數(shù)據(jù)集1 樣本大小Table 2 Size of dataset 1

4.1 使用馬氏距離快速判別異常數(shù)據(jù)

實(shí)驗(yàn)中選擇正常數(shù)據(jù)中時(shí)間點(diǎn)“2004-02-13 11:02:39”到“2004-02-14 23:52:39”之間的數(shù)據(jù)用于計(jì)算馬氏距離判別閾值，該部分?jǐn)?shù)據(jù)如圖6 所示。

圖6 正常軸承振動(dòng)數(shù)據(jù)Fig.6 Normal bearing vibration data

將實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行預(yù)處理之后，根據(jù)式（1）計(jì)算上述正常數(shù)據(jù)的馬氏距離，結(jié)果如圖7 所示。同時(shí)根據(jù)式（9）、式（10）得到馬氏距離判別閾值為19.23，為-0.38。

圖7 正常數(shù)據(jù)的馬氏距離Fig.7 Mahalanobis distance for normal data

接下來根據(jù)式（8）得到所有數(shù)據(jù)的馬氏距離，如圖8 所示，并通過馬氏距離判別閾值快速判別異常數(shù)據(jù)與不確定數(shù)據(jù)。

圖8 所有數(shù)據(jù)馬氏距離Fig.8 Mahalanobis distance for all data

由圖8 可知，許多異常數(shù)據(jù)的馬氏距離明顯超過了，將馬氏距離超過的數(shù)據(jù)判定為異常數(shù)據(jù)。通過實(shí)驗(yàn)，根據(jù)式（14）得此次異常檢測精確率為1，說明此次檢測結(jié)果為異常的數(shù)據(jù)均為真實(shí)異常數(shù)據(jù)，所有正常數(shù)據(jù)的馬氏距離均未超過。將馬氏距離未超過的數(shù)據(jù)作為不確定數(shù)據(jù)集進(jìn)入自編碼網(wǎng)絡(luò)的訓(xùn)練階段，其中包含正常數(shù)據(jù)與異常數(shù)據(jù)。

判定為異常數(shù)據(jù)樣本個(gè)數(shù)為362，得到不確定數(shù)據(jù)樣本個(gè)數(shù)為622，不確定數(shù)據(jù)集如表3 所示。將超過閾值的異常數(shù)據(jù)快速檢測出來，提高了檢測速度，同時(shí)明顯減少了訓(xùn)練樣本數(shù)量，有利于提高自編碼網(wǎng)絡(luò)的訓(xùn)練效率。

表3 不確定數(shù)據(jù)集Table 3 Uncertain dataset

4.2 自編碼器的構(gòu)建及訓(xùn)練

在得到各數(shù)據(jù)的馬氏距離之后，將其馬氏距離也作為數(shù)據(jù)的一個(gè)特征，因此數(shù)據(jù)的特征即維度增加到5 個(gè)，在后續(xù)的實(shí)驗(yàn)中，將證明加入馬氏距離作為數(shù)據(jù)特征可增強(qiáng)異常檢測的效果。

本實(shí)驗(yàn)構(gòu)建以式（11）為代價(jià)函數(shù)的稀疏自編碼器，首先構(gòu)建如圖2 所示的先升維再編碼的改進(jìn)自編碼器結(jié)構(gòu)。由于輸入數(shù)據(jù)為5 維，自編碼器的輸入層為5 維。升維層和編碼輸出層的維數(shù)需通過實(shí)驗(yàn)進(jìn)行確定，而這兩層的維數(shù)關(guān)系到自編碼器與分類器結(jié)合的自編碼網(wǎng)絡(luò)異常檢測效果，因此升維層和編碼輸出層的維數(shù)通過4.3 節(jié)中自編碼網(wǎng)絡(luò)異常檢測實(shí)驗(yàn)確定。在此，構(gòu)建結(jié)構(gòu)為5-10-2-10-5 的先升維再編碼的改進(jìn)自編碼器以調(diào)節(jié)其他參數(shù)。

由于在代價(jià)函數(shù)中加入了稀疏性限制，稀疏懲罰項(xiàng)權(quán)重系數(shù)和稀疏常數(shù)的設(shè)置尤為重要。為了更為明顯地觀察自編碼器重構(gòu)誤差隨參數(shù)的變化，將自編碼器的訓(xùn)練次數(shù)設(shè)置為10，進(jìn)行5 次實(shí)驗(yàn)取最后重構(gòu)誤差的平均值。圖9給出了稀疏懲罰項(xiàng)權(quán)重系數(shù)與自編碼器重構(gòu)誤差的關(guān)系，圖10 給出了稀疏常數(shù)與自編碼器重構(gòu)誤差的關(guān)系。由圖9、圖10可得稀疏懲罰項(xiàng)權(quán)重系數(shù)和稀疏常數(shù)的最佳值分別為0.20 和0.04。自編碼器的參數(shù)設(shè)置如表4 所示。

圖9 自編碼器訓(xùn)練誤差隨β 的變化Fig.9 Training loss changes with β

圖10 自編碼器訓(xùn)練誤差隨ρ 的變化Fig.10 Training loss changes with ρ

表4 自編碼器參數(shù)設(shè)置Table 4 Parameter setting of autoencoder

4.3 自編碼器結(jié)合分類器構(gòu)建自編碼網(wǎng)絡(luò)

將上述訓(xùn)練完成的自編碼器編碼（隱層）輸出層作為Sigmoid 分類器的輸入層以構(gòu)建如圖11 所示的改進(jìn)自編碼網(wǎng)絡(luò)，將通過自編碼器得到的最優(yōu)和作為網(wǎng)絡(luò)的初始參數(shù)。通過輸入標(biāo)簽化的數(shù)據(jù)進(jìn)行如圖3 所示的有監(jiān)督的微調(diào)，迭代訓(xùn)練次數(shù)為50。

圖11 改進(jìn)自編碼網(wǎng)絡(luò)Fig.11 Improved autoencoder network

對(duì)于本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)中的升維層和編碼輸出層的維數(shù)，在此通過改進(jìn)自編碼網(wǎng)絡(luò)對(duì)不確定數(shù)據(jù)集的異常檢測實(shí)驗(yàn)來確定。為了增強(qiáng)實(shí)驗(yàn)的可靠性和準(zhǔn)確性，采用5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn)，將不確定數(shù)據(jù)集隨機(jī)均勻分為5 份，輪流將其中1 份作為測試數(shù)據(jù)，剩余4 份作為訓(xùn)練數(shù)據(jù)。將5 次實(shí)驗(yàn)結(jié)果數(shù)據(jù)的平均值作為實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)結(jié)果隨兩個(gè)層的維數(shù)的變化如圖12、圖13所示。從圖12可知，將升維層的維數(shù)設(shè)置為10 最合適；另外觀察到維度小于5 即沒有升維時(shí)，異常檢測效果較差，而當(dāng)維度高于5 即升維時(shí)，效果較好，進(jìn)一步證明了先升維再編碼的網(wǎng)絡(luò)結(jié)構(gòu)有利于提高自編碼網(wǎng)絡(luò)異常檢測效果。從圖13 可知，將編碼輸出層的維數(shù)設(shè)置為2 最合適，從自編碼器原理可知，由于輸入數(shù)據(jù)維度為5 維，編碼輸出層的維度必須小于5。

圖12 實(shí)驗(yàn)結(jié)果隨U 層維度變化圖Fig.12 Experimental result changes with dimension of U layer

圖13 實(shí)驗(yàn)結(jié)果隨h 層維度變化圖Fig.13 Experimental result changes with dimension of h layer

5 對(duì)比實(shí)驗(yàn)

為了從不同角度進(jìn)一步考察提出方法的有效性，設(shè)計(jì)4 組不同對(duì)比實(shí)驗(yàn)：（1）數(shù)據(jù)是否加入馬氏距離特征進(jìn)行構(gòu)建自編碼網(wǎng)絡(luò)的異常檢測效果對(duì)比；（2）傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的對(duì)比；（3）本研究提出的異常檢測方法與其他傳統(tǒng)異常檢測方法的對(duì)比；（4）將本研究提出的方法用于IMS Bearing data 的另外兩個(gè)數(shù)據(jù)集以及XJTU-SY 數(shù)據(jù)集，觀察其檢測效果。

5.1 數(shù)據(jù)是否加入馬氏距離特征的對(duì)比

為了研究將數(shù)據(jù)的馬氏距離作為數(shù)據(jù)的特征放入改進(jìn)自編碼網(wǎng)絡(luò)中進(jìn)行訓(xùn)練對(duì)異常檢測效果的影響，將加入馬氏距離作為特征的不確定數(shù)據(jù)集和不加入馬氏距離作為特征的不確定數(shù)據(jù)集分為兩個(gè)數(shù)據(jù)集，分別訓(xùn)練本研究提出的改進(jìn)自編碼器和改進(jìn)自編碼網(wǎng)絡(luò)并測試。

不加入馬氏距離作為特征的不確定數(shù)據(jù)具有4個(gè)特征，因此輸入層維度改為4。將自編碼器的迭代訓(xùn)練次數(shù)設(shè)置為15，改進(jìn)自編碼網(wǎng)絡(luò)的訓(xùn)練次數(shù)設(shè)置為25，此時(shí)已經(jīng)得到較低的訓(xùn)練誤差。同樣采用4.3 節(jié)中提到的5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn)，實(shí)驗(yàn)結(jié)果如表5 所示。可證明，將數(shù)據(jù)的馬氏距離作為數(shù)據(jù)的一個(gè)特征，可有效提高本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)異常檢測效果。

表5 訓(xùn)練數(shù)據(jù)是否加入馬氏距離的對(duì)比Table 5 Comparison of training data with or without Mahalanobis distance

5.2 傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的對(duì)比

首先，需要構(gòu)建傳統(tǒng)自編碼器并結(jié)合分類器構(gòu)建傳統(tǒng)自編碼網(wǎng)絡(luò)。于是在本實(shí)驗(yàn)中，構(gòu)建結(jié)構(gòu)為5-2-5 的直接降維編碼的如圖1 所示的傳統(tǒng)自編碼器，除網(wǎng)絡(luò)結(jié)構(gòu)外的參數(shù)與4.2 節(jié)中構(gòu)建的改進(jìn)自編碼器相同。同4.2 節(jié)所述，將不確定數(shù)據(jù)集用于訓(xùn)練傳統(tǒng)自編碼器。同4.3 節(jié)所述，將訓(xùn)練完成的傳統(tǒng)自編碼器的二維編碼（隱層）輸出層作為Sigmoid 分類器的輸入層以構(gòu)建如圖14 所示的傳統(tǒng)自編碼網(wǎng)絡(luò)，并通過輸入標(biāo)簽化的數(shù)據(jù)進(jìn)行有監(jiān)督的微調(diào)，迭代訓(xùn)練次數(shù)仍然為50。

圖14 傳統(tǒng)自編碼網(wǎng)絡(luò)Fig.14 Traditional autoencoder network

首先進(jìn)行傳統(tǒng)自編碼器和改進(jìn)自編碼器的訓(xùn)練重構(gòu)誤差的比較，將不確定數(shù)據(jù)集作為兩種自編碼器的輸入進(jìn)行50 次迭代訓(xùn)練，兩者的訓(xùn)練重構(gòu)誤差曲線如圖15 所示。可知，在迭代訓(xùn)練次數(shù)到達(dá)15 次左右時(shí)，改進(jìn)自編碼器的訓(xùn)練誤差基本達(dá)到了最小值，因此在后續(xù)對(duì)比實(shí)驗(yàn)中，將改進(jìn)自編碼器的迭代訓(xùn)練次數(shù)設(shè)置為15。

圖15 自編碼器誤差曲線比較Fig.15 Comparison of autoencoder loss

傳統(tǒng)自編碼器和改進(jìn)自編碼器的訓(xùn)練時(shí)間對(duì)比如表6 所示，為得到最佳的隱層表達(dá)，傳統(tǒng)自編碼器需要50次迭代訓(xùn)練，而改進(jìn)自編碼器只需15次迭代訓(xùn)練。

如圖15 所示，先升維再編碼的改進(jìn)自編碼器通過更少的訓(xùn)練次數(shù)達(dá)到了最小的訓(xùn)練誤差即收斂速度更快，因此改進(jìn)自編碼器較傳統(tǒng)自編碼器具有更好的收斂性；如表6 所示，雖然先升維再編碼的結(jié)構(gòu)增加了單次迭代訓(xùn)練的時(shí)間，但是由于訓(xùn)練次數(shù)所需更少，改進(jìn)自編碼器的訓(xùn)練所需總時(shí)間更短。綜上，先升維再編碼的改進(jìn)自編碼器具有更好的低維數(shù)據(jù)特征學(xué)習(xí)能力。

表6 自編碼器訓(xùn)練時(shí)間的對(duì)比Table 6 Comparison of autoencoder training time

接下來進(jìn)行傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)在收斂性上的比較。將不確定數(shù)據(jù)集中的數(shù)據(jù)放入上述兩個(gè)自編碼網(wǎng)絡(luò)進(jìn)行訓(xùn)練，訓(xùn)練誤差曲線如圖16 所示，訓(xùn)練準(zhǔn)確率（）曲線如圖17 所示?？芍?，在迭代訓(xùn)練次數(shù)到達(dá)30 次左右時(shí)，改進(jìn)自編碼網(wǎng)絡(luò)的訓(xùn)練誤差基本達(dá)到了最小值且訓(xùn)練準(zhǔn)確率也基本達(dá)到最大值，而傳統(tǒng)自編碼網(wǎng)絡(luò)需要50 次以上的迭代訓(xùn)練次數(shù)才能夠?qū)⒂?xùn)練誤差降低到最小值并得到最大的訓(xùn)練準(zhǔn)確率。因此在后續(xù)對(duì)比實(shí)驗(yàn)中，將改進(jìn)自編碼網(wǎng)絡(luò)的迭代訓(xùn)練次數(shù)設(shè)置為30。

圖16 自編碼網(wǎng)絡(luò)誤差曲線比較Fig.16 Comparison of autoencoder network loss

圖17 自編碼網(wǎng)絡(luò)準(zhǔn)確率曲線比較Fig.17 Comparison of autoencoder network accuracy

傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的訓(xùn)練時(shí)間對(duì)比如表7 所示，改進(jìn)自編碼網(wǎng)絡(luò)訓(xùn)練次數(shù)設(shè)置為30，而傳統(tǒng)自編碼網(wǎng)絡(luò)迭代訓(xùn)練次數(shù)為60 時(shí)才獲得與改進(jìn)自編碼網(wǎng)絡(luò)相同的訓(xùn)練誤差和準(zhǔn)確率。

表7 自編碼網(wǎng)絡(luò)訓(xùn)練時(shí)間的對(duì)比Table 7 Comparison of autoencoder network training time

如上所述，改進(jìn)自編碼網(wǎng)絡(luò)的收斂速度要明顯優(yōu)于傳統(tǒng)自編碼網(wǎng)絡(luò)，前者能夠用更少的迭代訓(xùn)練次數(shù)得到不小于傳統(tǒng)自編碼網(wǎng)絡(luò)的收斂精度，故改進(jìn)自編碼網(wǎng)絡(luò)的收斂性更好；在訓(xùn)練時(shí)間方面，雖然改進(jìn)自編碼網(wǎng)絡(luò)的單次迭代訓(xùn)練時(shí)間較長，但其所需迭代訓(xùn)練次數(shù)較少，訓(xùn)練所需總時(shí)間更短。綜上，改進(jìn)自編碼網(wǎng)絡(luò)能達(dá)到更好的訓(xùn)練效果。

仍然采用5 折交叉驗(yàn)證方法進(jìn)行傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的異常檢測效果對(duì)比實(shí)驗(yàn)，同樣將不確定數(shù)據(jù)集隨機(jī)均勻分為5 份，輪流將其中1份作為測試數(shù)據(jù)，剩余4 份用于網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)。將5次實(shí)驗(yàn)結(jié)果數(shù)據(jù)的平均值作為實(shí)驗(yàn)結(jié)果，如表8 所示。由表8 及以上實(shí)驗(yàn)可知，對(duì)于低維軸承振動(dòng)數(shù)據(jù)，本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)異常檢測效果要優(yōu)于傳統(tǒng)自編碼網(wǎng)絡(luò)。

表8 傳統(tǒng)自編碼網(wǎng)絡(luò)與改進(jìn)自編碼網(wǎng)絡(luò)的對(duì)比Table 8 Comparison between traditional autoencoder network and improved autoencoder network

為對(duì)比自編碼網(wǎng)絡(luò)的穩(wěn)定性，進(jìn)行在不同訓(xùn)練量的情況下傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的異常檢測效果對(duì)比。在網(wǎng)絡(luò)訓(xùn)練階段，分別選用20%、40%、60%、80%的不確定數(shù)據(jù)集進(jìn)行訓(xùn)練，其余數(shù)據(jù)用于測試。自編碼器迭代訓(xùn)練次數(shù)為15，自編碼網(wǎng)絡(luò)迭代訓(xùn)練次數(shù)為30，每個(gè)實(shí)驗(yàn)重復(fù)20 次取實(shí)驗(yàn)結(jié)果平均值，不同訓(xùn)練量下的實(shí)驗(yàn)結(jié)果對(duì)比如表9所示。

表9 不同訓(xùn)練數(shù)據(jù)量下的實(shí)驗(yàn)結(jié)果對(duì)比Table 9 Experimental results comparison under different amounts of training data

由表9 可知，改進(jìn)自編碼網(wǎng)絡(luò)在不同訓(xùn)練數(shù)量的情況下，異常檢測效果均比傳統(tǒng)自編碼網(wǎng)絡(luò)要好。如圖18 所示，隨著訓(xùn)練數(shù)據(jù)量的增加，改進(jìn)自編碼網(wǎng)絡(luò)檢測效果越來越好，具有一定的穩(wěn)定性。

圖18 實(shí)驗(yàn)結(jié)果隨訓(xùn)練數(shù)據(jù)量變化圖Fig.18 Experimental result changes with amount of training data

5.3 與其他異常檢測方法的對(duì)比

同樣采用5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn)，使用IMS Bearing data 中的數(shù)據(jù)集1，將本研究提出的軸承振動(dòng)異常檢測方法與其他異常檢測方法進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表10 所示。

表10 異常檢測算法與所提方法的對(duì)比Table 10 Comparison of anomaly detection algorithms with proposed method

由表10 可知，本研究所提方法對(duì)低維軸承振動(dòng)數(shù)據(jù)的異常檢測要優(yōu)于其他異常檢測方法。

在表10 中，DNN 的結(jié)構(gòu)設(shè)計(jì)為5-10-2-1，并將馬氏距離添加進(jìn)特征，與改進(jìn)自編碼網(wǎng)絡(luò)結(jié)構(gòu)相同，但是沒有自編碼器的訓(xùn)練階段。實(shí)驗(yàn)中發(fā)現(xiàn)，由于不恰當(dāng)?shù)某跏蓟萑刖植孔顑?yōu)的情形，DNN 需要更多的訓(xùn)練次數(shù)而且穩(wěn)定性差。實(shí)驗(yàn)中，DNN 平均需要80 次迭代訓(xùn)練才能達(dá)到最小的訓(xùn)練誤差，每次迭代訓(xùn)練時(shí)間平均為141 μs，因此DNN 所需訓(xùn)練總時(shí)間為11 280 μs；本研究所提網(wǎng)絡(luò)的訓(xùn)練時(shí)間包括自編碼器的訓(xùn)練時(shí)間和自編碼網(wǎng)絡(luò)的訓(xùn)練時(shí)間，通過5.2節(jié)可知訓(xùn)練總時(shí)間為6 990 μs?？梢娡ㄟ^自編碼器訓(xùn)練后結(jié)合分類器構(gòu)建的自編碼網(wǎng)絡(luò)比同結(jié)構(gòu)的普通神經(jīng)網(wǎng)絡(luò)所需訓(xùn)練時(shí)間更少，訓(xùn)練效率更高。

綜上，本研究所提方法通過自編碼器訓(xùn)練得到的隱層參數(shù)用于初始化分類器網(wǎng)絡(luò)，減少了網(wǎng)絡(luò)訓(xùn)練次數(shù)，大幅提高了網(wǎng)絡(luò)的訓(xùn)練效率。

5.4 使用其他數(shù)據(jù)集的實(shí)驗(yàn)

IMS Bearing data 中的數(shù)據(jù)集2 通過8 個(gè)不同位置的加速度傳感器獲取數(shù)據(jù)，因此數(shù)據(jù)集2 特征為8個(gè)，在時(shí)間點(diǎn)“2003-11-21 12:08:36”開始出現(xiàn)異常數(shù)據(jù)，其數(shù)據(jù)變化如圖19 所示。IMS Bearing data 中的數(shù)據(jù)集3 通過4 個(gè)不同位置的加速度傳感器獲取數(shù)據(jù)，數(shù)據(jù)集3 特征為4 個(gè)，在時(shí)間點(diǎn)“2004-04-15 10:21:53”開始出現(xiàn)異常數(shù)據(jù)，數(shù)據(jù)集3 的數(shù)據(jù)變化如圖20所示。XJTU-SY數(shù)據(jù)集使用兩個(gè)加速度傳感器采集軸承水平和豎直方向上的振動(dòng)數(shù)據(jù)，每分鐘采樣32 768個(gè)樣本，因此其數(shù)據(jù)特征為2 個(gè)，數(shù)據(jù)預(yù)處理時(shí)將每秒鐘采集到的數(shù)據(jù)使用平均值歸為1 條數(shù)據(jù)。經(jīng)過預(yù)處理之后的3 個(gè)數(shù)據(jù)集樣本大小如表11 所示。

圖19 數(shù)據(jù)集2 的軸承振動(dòng)數(shù)據(jù)Fig.19 Bearing vibration data from dataset 2

圖20 數(shù)據(jù)集3 的軸承振動(dòng)數(shù)據(jù)Fig.20 Bearing vibration data from dataset 3

表11 3 個(gè)數(shù)據(jù)集樣本大小Table 11 Size of 3 datasets

同樣采取上文所提的5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn)，實(shí)驗(yàn)結(jié)果如表12 所示。可知本研究提出的方法在另外3 個(gè)數(shù)據(jù)集上保持了較好的檢測效果，因此對(duì)于低維軸承振動(dòng)數(shù)據(jù)具有一定的泛化能力。尤其數(shù)據(jù)集3 為異常數(shù)據(jù)占比較少的不平衡數(shù)據(jù)集，本研究提出的方法依然具有良好的檢測效果。

表12 在3 個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 12 Experimental results on 3 datasets

6 結(jié)束語

本研究針對(duì)軸承振動(dòng)數(shù)據(jù)維度低、數(shù)據(jù)量大、各特征之間具有一定相關(guān)性的特點(diǎn)，提出了一種結(jié)合馬氏距離與自編碼網(wǎng)絡(luò)的異常檢測方法。通過正常數(shù)據(jù)的馬氏距離，得到判別閾值以快速檢測出部分異常數(shù)據(jù)，減少了自編碼網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量；將自編碼器與分類器結(jié)合，解決了網(wǎng)絡(luò)參數(shù)初始化問題；提出先升維再編碼的自編碼器結(jié)構(gòu)，而且將數(shù)據(jù)的馬氏距離作為特征加入到網(wǎng)絡(luò)訓(xùn)練中，有利于自編碼網(wǎng)絡(luò)的訓(xùn)練，提升了異常檢測效果。實(shí)驗(yàn)證明了本研究所提方法較其他異常檢測算法有著更好的檢測效果，并且具有一定的穩(wěn)定性和泛化能力。在未來的工作中，考慮引入時(shí)序深度學(xué)習(xí)模型研究如何實(shí)現(xiàn)快速在線檢測和分類。