孫國棟,楊 雄,黃得龍,高 媛
(1.湖北工業大學機械工程學院,武漢 430068;2.湖北省包裝裝備工程技術研究中心,武漢 430068)
在現代工業中,先進的狀態監測和故障診斷技術,能及早發現設備的故障,避免事故的發生。由于旋轉機械應用廣泛,因此研究其先進的故障診斷算法非常有必要。近年來,數據驅動的故障診斷方法不斷發展,需要大量的歷史數據來建立診斷系統的故障模型。雖然傳感技術的發展和普及使人們從故障的零部件中獲得海量數據[1]不再是一項挑戰,但直接看這些數據很難區分同一機械部件的故障類型。因此,如何從海量數據中有效提取特征,準確識別故障類型和故障嚴重程度是一個棘手的問題。
由于振動信號含有豐富的信息,因此他們在故障診斷中得到了廣泛的應用。為了從振動信號中提取有用的特征并識別故障類型,人們進行了廣泛而多樣的嘗試,主要分為三大類:時域分析、頻域分析和時頻分析[2]。許多研究者通過以上三種方法獲取樣本的統計特征,然后利用專業知識和相關經驗[3-4]來識別故障類型。然而,這些診斷結果在很大程度上依賴于專家的先驗知識,這就使得診斷結果夾雜了過多人為因素。
隨著CNN 的高速發展,研究人員在LeNet-5 網絡的基礎上提出了一些新的CNN 結構,如AlexNet將第二層中的卷積窗口形狀減小到5×5,此外,第一、第二和第五個卷積層之后都使用了窗口形狀為3×3、步幅為2的最大池化層,而且AlexNet使用的卷積通道數也是LeNet 中的卷積通道的數十倍,這增加了很大的計算量。VGGNet[5]使用多個較小卷積核(3×3)的卷積層代替一個卷積核較大的卷積層,一方面可以減少參數,另一方面相當于進行了更多的非線性映射,可以增加網絡的擬合/表達能力。ⅠnceptionV1~V4 系列[6-9]借鑒了NⅠN 的設計思路,用于增加網絡的深度和寬度,提高神經網絡性能。ResNetV1~V2 系列[10-11]將Ⅰnception 架構和殘差連接(Residual)結合起來。并通過實驗證實了,結合殘差連接可以顯著加速Ⅰnception 的訓練。MobileNetV1~V3 系列[12-14]的深度分離卷積方法可以大大提升運算速度,減少計算量和參數量。同時,由于卷積核尺寸對提升模型精度與效率也有很大影響,因此,在提取特征時,僅采用單尺度卷積核提取特征存在著局限性。CNN 模型不僅需要大尺寸的卷積核捕獲高分辨率特征圖,同時還需要小尺寸的卷積核捕獲低分辨率的特征圖,以獲得更高的精度和效率。為了從原始信號中挖掘隱藏的故障特征,結合上述兩個想法,設計一種淺層Ⅰnception-MobileNet 模型,在前期采用Ⅰnception 模塊,提取輸入層中不同分辨率的特征圖,然后將其串聯起來,再進行深度可分離卷積,實現特征學習與分類。
對于振動信號的故障診斷,大多數學者起初是借助信號處理技術對原始振動信號進行預處理,以提取原始信號中隱含的可以區分不同類別之間細微差異的故障特征。然而,這一操作一方面需要一定的理論基礎。另一方面引入了過多的人為因素。因此,為了避免人工經驗對故障診斷的影響,隨后出現了一些利用卷積神經網絡對原始數據進行特征提取及識別的方法。一般有兩種方法,第一種方法是利用一維卷積神經網絡對原始數據進行特征學習及分類[15],但所設計的一般是深度卷積神經網絡,模型比較復雜;第二種方法是將原始數據拼接成二維矩陣[16],并將二維矩陣轉換為圖像,該方法比較簡單,且結合的卷積神經網絡比較容易實現。
將原始數據轉化為圖像的具體方法為:假設獲取的振動信號數據為序列S,拼接矩陣M的大小為m×m,那么每次從序列S中截取的樣本信號長度為m2,其中m2大于等于振動信號周期長度。然后將樣本信號按照順序填充的方式組成拼接矩陣M,具體操作如圖1所示。
為了將拼接矩陣轉換為圖像,對拼接矩陣M標準化到0~255之間,標準化公式如下:

Ⅰnception模塊提出的目的是解決如何在有限的計算資源內,進一步提升網絡的性能。一般地,提升網絡性能最直接的方法是增加網絡的深度和寬度,即網絡的層數和每層的通道數。但是,當深度和寬度不斷增加的同時,需要學習到的參數也在不斷增加,容易發生過擬合。其次是均勻地增加網絡的大小,會導致計算量的加大。
因此,為解決以上問題,提出了Ⅰnception 結構,如圖2所示,既能保持濾波器級別的稀疏特性,又能充分密集矩陣的高計算性能。Ⅰnception模塊的核心思想就是將不同的卷積層通過并聯的方式結合在一起,經過不同卷積層處理的結果矩陣在深度這個維度拼接起來,形成一個更深的矩陣。Ⅰnception 模塊可以反復疊堆形成更大的網絡,它可以對網絡的深度和寬度進行高效地擴充,在提升深度學習網絡準確率的同時防止過擬合現象的發生。Ⅰnception模塊的優點是可以對尺寸較大的矩陣先進行降維處理的同時,在不同尺寸上對視覺信息進行聚合,方便從不同尺度對特征進行提取。

圖2 Ⅰnception模塊A
Ⅰnception模塊A使用不同尺度的卷積核提取上一層的特征,這些卷積核的數量也不相同,經過卷積操作后,得到了一些“簇”,之后將卷積操作得到的特征圖在深度方向進行串聯拼接,構建出高效的稀疏結構。由于堆疊了多次Ⅰnception 模塊后,會因為大量5×5 卷積的存在而導致計算量的增加,所以在進行5×5卷積,甚至3×3卷積前,必須先進行降維,降維使用的核大小是1×1 的卷積,從而得到了Ⅰnception模塊B,如圖3所示。

圖3 Ⅰnception模塊B
從圖3可以看出,Ⅰnception模塊B同樣具有四個分支。第一分支對輸入進行1×1 的卷積,用于跨通道組織信息以及對輸入通道進行降維,提高網絡的表達能力。第二分支先使用1×1卷積,然后連接3×3卷積,相當于進行了兩次特征變換。第三分支先進行1×1的卷積,然后連接5×5卷積。最后一個分支則是3×3最大池化后,再直接使用1×1卷積。最后,所有的分支通過一個串聯操作進行合并。
MobileNet是一種適合移動端運行的網絡結構,其在圖像分類、目標檢測及圖像分割等領域有著巨大的優勢。對于卷積核大于1 的卷積計算,MobileNet采用深度可分離卷積,把卷積核為k×k的卷積拆分為兩步。第一步采用逐通道卷積(Depthwise Convolution),按通道維度執行卷積核為k×k的卷積計算,如圖4所示。第二步采用逐點卷積(Pointwise Convolution),如圖5所示。MobileNet使用深度可分離卷積替換普通卷積,與傳統算法相比,具有顯著優勢。對于大卷積核計算卷積部分,其通道維數不變,使得計算量和參數數量大大壓縮;對于通道變換部分,其使用小卷積核計算卷積,將計算量和參數數量壓縮到極致。

圖4 逐通道卷積

圖5 逐點卷積
假設輸入特征圖的大小為Din×Din×M,Din是輸入特征圖的寬度和高度,這里假定兩者相同,M是指輸入特征圖的通道數;而輸出特征圖的大小是Dout×Dout×N,Dout是輸出特征圖的寬度和高度,N是指輸出特征圖的通道數。若卷積核大小為DK×DK,則通過普通卷積后,其計算如式(2)所示:

而對于逐通道卷積,其計算如式(3)所示:

對于逐點卷積,其計算如式(4)所示:

因此,深度可分離卷積的總計算如式(5)所示:

由此,深度可分離卷積的計算量和普通卷積計算量之比為:

如式(6)所示,若采用3×3 的卷積核,則深度可分離卷積的計算量比普通卷積的計算量至少小8~9倍。
為了排除人工經驗對特征提取的干擾,提高卷積神經網絡的特征學習能力,實現端到端的滾動軸承故障診斷,本文提出一種淺層Ⅰnception-MobileNet網絡模型。在提出該模型之前,首先設計一種淺層MobileNet 網絡模型。由于獲取的不同機械部件的振動信號周期不一樣,所以對于網絡的輸入尺寸進行規定,大小為32×32。對于模型中的深度可分離卷積核大小及深度,參考MobileNet-V1,因此取名為淺層MobileNet,其網絡結構如圖6 所示。其中,conv2d_0 為普通卷積操作,conv2d_1~conv2d_6 為深度可分離卷積操作,其卷積核大小、池化大小及深度如圖6所示。

圖6 淺層MobileNet網絡模型
然而,深度可分離卷積結構中的卷積核尺寸比較單一。為了增強網絡的特征提取能力,設計一種能夠提取全面特征的網絡模型,將Ⅰnception 模塊加入到了淺層MobileNet網絡中,利用多尺度卷積核提取特征,以提高模型的準確性和效率。為了方便與淺層MobileNet網絡做比較,我們用Ⅰnception模塊替換淺層MobileNet網絡中的深度可分離卷積層,取名為淺層Ⅰnception-MobileNet。本文主要討論兩種結構的淺層Ⅰnception-MobileNet,一種是只使用一個Ⅰnception 模塊替換一層深度可分離卷積層,取名為淺層Ⅰnception-MobileNet-A,其中conv2d_0 為普通卷積層,conv2d_1~conv2d_5為深度可分離卷積層,其網絡結構如圖7 所示;另一種是使用兩個Ⅰnception模塊分別替換一層普通卷積和一層深度可分離卷積層,取名為淺層Ⅰnception-MobileNet-B,其中conv2d_0~conv2d_5 為深度可分離卷積層,其網絡結構如圖8 所示。為選取合適的網絡結構,將在第3.3節對這三種網絡進行討論。

圖7 淺層Ⅰnception-MobileNet-A網絡模型

圖8 淺層Ⅰnception-MobileNet-B網絡結構
為驗證所提方法的可行性和有效性,分別在兩個滾動軸承數據集上進行了故障診斷實驗。首先,對數據集進行信號采樣,并通過拼接法獲取相同大小的二維圖像。然后,通過CWRU數據集測試所設計的淺層Ⅰnception-MobileNet 網絡模型,找出最優模型以實現無手工特征影響的滾動軸承的故障診斷,并與其他卷積神經網絡的測試結果進行比較。最后,通過MFPT 數據集驗證該模型的優越性和魯棒性。所有實驗均在Windows7、Ⅰntel Xeon E5-2640@2.40 GHz CPU、64 GB RAM、Python 3.5 和Tensorflow條件下進行。
本文使用兩個數據集對所提的方法進行驗證。CWRU 數據集來自凱斯西儲大學軸承數據中心(CWRU)[17],實驗中使用一臺2馬力的電機來采集驅動端和風扇端軸承上的加速度計數據。測試軸承由電火花加工而成,型號為6205-2RS JEM SKF。將加速度計放置在驅動端附近,設置采樣頻率為12 kHz,軸承在四種不同電機載荷(0、1、2、3)HP、四種不同故障位置(正常工況、內圈故障、滾動體故障和外圈故障)、三種不同故障程度(0.007、0.014、0.021)inch分別表示故障程度為輕度、中度、重度下進行測試,類別劃分見表1。

表1 CWRU數據集
MFPT 數據集由機械故障預防技術協會(MFPT)提供[18],試驗臺裝有NⅠCE軸承,總共追蹤了三個基線條件、七組外圈故障條件和七組內圈故障條件。其中,三組基線數據是在采樣頻率為97 656 Hz 和負載為2 70l lbs 的條件下采集的;七組外圈故障是在采樣頻率為48 828 Hz,負載分別為25 lbs、50 lbs、100 lbs、150 lbs、200 lbs、250 lbs、3 00l lbs的條件下采集的;七組內圈故障是在頻率為48 828 Hz,負載分別為0、50 lbs、100 lbs、150 lbs、200 lbs、250 lbs、3 00l lbs的條件下采集的。類別劃分見表2所示。

表2 MFPT數據集
對于CWRU數據集,其樣本信號的采樣過程如圖9 所示。其中,采樣長度為1 024,位移量為500,每類故障類型的每種工況條件下采取了240個樣本信號,每類故障類型包含四種工況,故每類故障類型的樣本信號有960 個,有十種故障類型,因此,CWRU 數據集總共有9 600 個樣本信號。其中用于訓練模型的樣本信號有6 000 個,剩下的3 600 個樣本信號用于測試。為測試該模型的穩定性,將測試集劃分為三個等級:等級Ⅰ包含1 200個測試樣本;等級Ⅱ包含2 400個測試樣本;等級Ⅲ包含3 600個測試樣本。等級越高,說明測試集的樣本數越多。十種故障類型的拼接圖如圖10所示。

圖9 重疊采樣過程圖

圖10 CWRU 中滾動軸承十種狀態的拼接圖
對于MFPT 數據集,其樣本信號的采樣過程與CWRU 數據集相同。其中,采樣長度為5 120,位移量為2 000,每類故障類型有495個樣本,有三種故障類型,因此,MFPT數據集總共有1 485個樣本信號。為避免特殊性和偶然性,從每個類型中隨機抽取345個樣本進行訓練,剩下的150 個樣本進行測試。三種故障類型的拼接圖如圖11所示。

圖11 MFPT中滾動軸承三種狀態的拼接圖
為尋找合適的淺層Ⅰnception-MobileNet 網絡,本節將用淺層MobileNet 網絡、淺層Ⅰnception-MobileNet-A 網絡及淺層Ⅰnception-MobileNet-B 網絡分別對CWRU數據集進行訓練及測試,在進行三種不同網絡的實驗過程中,除了輸入訓練的網絡結構更換之外,其他參數均相同。另外,為體現出所設計的淺層混合深度可分離卷積神經網絡結構的優越性及有效性,通過控制變量法,將CWRU 數據集分別在LeNet-5及ResNet-110網絡上進行訓練及測試,并將最后測試結果與所設計的網絡進行比較。
表3顯示了不同網絡結構在CWRU數據集的不同等級測試集上的分類精度。可見,LeNet-5 與ResNet-110網絡結構在CWRU數據集的不同等級測試集上的分類結果均低于淺層Ⅰnception-MobileNet網絡系列。針對輸入數據為原始信號時,所設計的淺層Ⅰnception-MobileNet 網絡系列具有較強的特征提取能力,比其他網絡結構更全面地提取出不同故障類別之間的敏感特征,使得分類更加容易。
如表3所示,淺層Ⅰnception-MobileNet-A在每個測試等級上的分類精度都高于淺層MobileNet,說明Ⅰnception模塊的加入有利于提高網絡的特征提取能力。淺層Ⅰnception-MobileNet-A 在每個測試等級上的分類精度都高于淺層Ⅰnception-MobileNet-B,說明用Ⅰnception模塊替換普通卷積實現特征提取效果不明顯,反而使得網絡結構比較復雜。綜上所述,淺層Ⅰnception-MobileNet-A網絡結構的分類效果最好。

表3 不同網絡結構在CWRU數據集上不同等級的測試結果
除了網絡之間的比較外,還需要對網絡本身的參數進行調整及優化,其中,主要討論的參數是在訓練時輸入模型中的樣本批量大小。由于上節已確定了合適的網絡結構,因此,用該網絡結構在MFPT數據集和數據集上進行實驗。
在網絡訓練過程中,采用的是隨機批量訓練方法。為了尋找出合適的批量大小,控制其他參數不變,均勻地設置不同的批量參數進行網絡訓練,并用CWRU數據集中不同等級的測試集對訓練好的網絡進行測試,以分類精度為衡量標準,測試結果如表4所示。可見,每次訓練樣本為100 時,測試效果最好。并且該模型在不同等級下的分類精度相近,說明小樣本能夠代替大樣本,該模型很穩定。

表4 不同批量輸入在CWRU數據集上不同等級的測試結果
同樣地,將淺層Ⅰnception-MobileNet 應用到MFPT 數據集上,通過設置不同批量大小對模型進行訓練與學習,實驗結果表明,當每次輸入到模型的樣本為50 個時,可獲得最好的診斷結果,診斷精度為95.78%。
目前,現有故障診斷算法主要有基于端到端和基于人工經驗進行特征提取的故障診斷算法,基于端到端的典型模型包括拼接圖+CNN[19]、一維信號+TⅠCNN[20]、拼接圖+LeNet-5 和拼接圖+ResNet-110等;基于手工特征提取的模型主要有CVSFF[21]和8WPE-MF+SVM[22]等。
本文提出的故障診斷算法是基于端到端的卷積神經網絡,為驗證所提出故障診斷算法的優越性及有效性,在CWRU 數據集上,不僅與現有端到端故障診斷算法進行了比較,還對比了現有的基于手工特征提取的故障診斷算法,相關數據如表5所示。

表5 與現有故障診斷算法的比較
通過比較可得,本文提出的故障診斷方案不但能解決四種混合負載下的十種故障狀態的診斷問題,而且能實現高精度分類,分類精度為99.5%。比現有的故障診斷算法精度高、效果好。
本文提出了一種端到端的旋轉機械故障診斷算法,利用拼接法將一維原始振動信號轉換為二維拼接圖,并設計了一種混合深度可分離卷積神經網絡,即淺層Ⅰnception-MobileNet 網絡。為尋找出合適的淺層Ⅰnception-MobileNet 網絡結構,設計了淺層MobileNet、淺層Ⅰnception-MobileNet-A 及淺層Ⅰnception-MobileNet-B。并與LeNet-5及ResNet-110網絡在相同數據集上進行比較,實驗結果表明,淺層Ⅰnception-MobileNet 可識別的故障類型多達10 類,能夠實現99.5%的分類精度。混合多尺度卷積核的特征提取能力優于單一卷積核,且在深度可分離卷積層的作用下減少了大量的參數數量。因此,所提出的基于淺層Ⅰnception-MobileNet 的旋轉機械故障診斷算法具有一定的優越性。