劉 文,周智勇,蔡 巍
(海軍潛艇學院 動力操縱系,山東 青島 266000)
異步電機是一種的重要電氣設備,其用途非常廣泛。因此,確保其安全穩定運行具有重要的意義。異步電機的潛在故障隱患會造成設備損傷。而軸承故障是異步電機故障類型中最常見的種類,其占比可以達到50%左右。因此,對軸承故障進行診斷尤為重要。
目前,軸承故障診斷的經典方法是提取振動信號故障特征進行分析判斷。
陳宗祥等人[1]將小波包分解、方差貢獻率檢驗與經驗模態分解方法相融合,利用雙譜分析的方法提取了調制在高頻信號中的故障特征頻率,達到電機軸承故障診斷的目的;但該方法的準確性易受到電機固有特性的影響。宿文才等人[2]將極點對稱模態分解算法、信息熵與相關性篩選方法和Hilbert變換相結合,提取了軸承關鍵特征并進行了故障診斷;但軸承故障特征分量易淹沒于基波和噪聲,易造成誤診和誤判。針對此類問題,HOANG D T等人[3]提出了將深度學習和信息融合方法相結合,采用了決策級信息融合技術對所有卷積神經網絡的信息進行融合,達到了對軸承故障進行精確診斷的目的;但卷積神經網絡結構復雜,且需要大量訓練樣本才能達到較好的診斷精度。
此外,電機電流信號分析法(motor current signal analysis,MCSA)也被應用于軸承故障診斷。
楊江天等人[4]對定子電流進行了小波包分解,通過對比各節點系數的均方根值和峭度指標變化情況,判斷電機是否存在軸承故障;但該方法與振動信號分析方法類似,MCSA同樣易受到環境因素和電機固有特性等問題的干擾。為了解決這一問題,SAUCEDO-DORANTES J J等人[5]提出了將振動信號、電流信號和溫度信號相融合的方法,提取故障特征用于軸承故障診斷,能夠避免部分特征淹沒于噪聲的問題;但高特征維度會導致計算冗余或摻入無用特征,特征降維技術成為故障診斷方法十分重要的環節。
常用的特征降維方法有主成分分析法[6](principal component analysis,PCA)和核主元分析法[7](kernel principal component analysis,KPCA)等。但PCA方法可能存在篩除核心元素的問題,造成診斷準確率下降;而KPCA對非線性關系特征不敏感,需要人為調整核函數以取得較好的降維效果。
最大相關最小冗余特征選擇(mRMR)算法[8]是以互信息為計量準則的特征降維方法,能夠篩選出與標簽相關度最高,且特征間冗余度最低的特征,從而達到強化區分能力和提升精度的效果。
自組織映射神經網絡(SOM)[9]能夠將高維空間中相似的樣本點映射到網絡輸出層中的鄰近神經元,訓練速度快,具有良好的自組織性和魯棒性[10]。
基于此,筆者采用一種基于mRMR-SOM的異步電機軸承故障診斷方法,并在實驗室環境搭建異步電機故障診斷試驗平臺。
首先,筆者采集不同狀態下的電機振動、電流和電壓信號,對信號進行時域和頻域分析,提取統計特征量;然后,利用mRMR對特征重要性進行評估,以互信息為評價準則,在保證分類器準確率的前提下篩選強區分能力特征;最后,使用SOM對測試樣本進行分類,驗證該診斷方法的有效性和正確性。
筆者采用以互信息為基本背景的mRMR算法,對特征集進行降維處理。
互信息的概念脫胎于信息論,是變量間相互依賴程度的度量依據,表示兩個變量相同部分所占的比例[11]。
下面筆者對基于互信息的特征降維算法中涉及的基本概念分別進行介紹。
1)信息熵[12]。信息熵是使用統計學的方法,用于體現隨機變量所蘊含信息量大小的工具。
設隨機變量X={x1,x2,…,xn},其信息熵的表達式為:
(1)
式中:p(xi)為xi發生的概率。
p(xi)在極限情況下,當隨機變量X中的變量均為x時,p(xi)=1。此時信息熵H(X)=0,表明該樣本集包含的信息量為零,因為隨機變量X中僅含有變量x。
信息熵的引入能夠幫助人們更好地理解數據的不確定性,一般來說一件事情發生的可能性越高則代表信息熵越低,說明該事件包含的信息量越少。
2)聯合熵。與信息熵類似,聯合熵是信息熵的一種推廣。當有兩個隨機變量時,使用信息熵的公式就可以得到聯合熵,它表示兩個隨機變量包含的信息總和。
假設有兩個隨機變量X和Y,其分布滿足聯合概率分布函數P(X,Y),則其聯合熵的表達式為:
(2)
3)條件熵。條件熵H(X|Y)表示在給定Y變量的條件下X變量的不確定程度,定義如下:
(3)
4)互信息[13]?;バ畔⒖梢杂脕砗饬績勺兞块g的相關程度,假設有兩個隨機變量X={x1,x2,…,xn}和Y={y1,y2,…,yn},它們滿足聯合概率分布P(X,Y),則變量X和變量Y之間的互信息I(X;Y)表示為:
(4)
由互信息定義可知,當兩變量間的相關性越大,其互信息值也就越大;反之,當兩個變量之間完全無關時,互信息的值應當為0。因此,借由互信息值的大小即可判斷變量間相互依賴的程度。
此外,互信息還可以用熵進行表示,公式如下:
I(X;Y)=H(Y)-H(Y|X)
(5)
當互信息由熵值表達時可以看出,變量X和變量Y之間的互信息值的大小可以理解為變量Y在變量X已給定的情況下其未知程度的減少量。如果在X能夠完全確定Y,則H(Y|X)=0,此時兩變量的互信息I(X;Y)=H(Y),若X與Y互不相關,則H(Y|X)=H(Y),此時I(X;Y)的值為0。
可見,互信息可以理解為用于度量變量間獨立程度的衡量標準。
5)相關性。假設Xm為待選特征集合,C為類標簽集合。相關性用于表征特征集中的特征與標簽集中的標簽的關聯程度,采用互信息I(Xm;C)直觀體現。I(Xm;C)越大,則特征向量與類標簽關聯度越高。
6)冗余性[14]。假設S為已選擇的特征集合,則冗余性表示待選的特征向量與S的相關性,同樣以互信息為衡量標準[15]。若xm與S的互信息值越大,則表明待選特征xm與已選擇的特征集合S的冗余度越高。該方法可以用于對冗余特征的篩除。
mRMR算法計算特征與類標簽的互信息和特征與特征間的互信息,以達到對特征進行篩選降維的目的。其算法流程如下[16]:
步驟1。初始化特征集合。假設S為已選特征集,Xm為待選特征集,C為標簽集;
步驟2。對Xm中的特征,執行下列步驟:
1)計算最大相關度。遍歷Xm,尋找與C間的最大相關性,其評價準則為:
maxD(Xm,C),D=I({xi,i=1,…,m};c)
(6)
2)計算最小冗余度。遍歷S,尋找特征間的最小冗余度,其評價準則為:
(7)
3)獲取最大相關最小冗余特征:
maxΦ(D,R),Φ=D-R
(8)
4)將所得特征放入S中,并從Xm中刪除該特征。
步驟3。判斷S中的特征數量是否已滿足規定的終止條件,若滿足條件,則輸出S;否則,重復步驟2。
特征選擇的目的是在不降低原有特征集包含信息量的基礎上,選擇出能夠表征電機運行狀態的特征,降低原有特征集維度,提高運算效率。
筆者使用mRMR算法進行特征選擇,其具體步驟如下:
1)采用增量選擇的方法從原始特征集中選擇n個連續特征,得到n個連續特征集,S1?S2?…?Sn;
2)對比所有n個連續特征集S1,S2,…,Sk,…,Sn(1≤k≤n),并將所有待選特征集送入分類器中進行對比,選擇出能夠獲得高分類準確率的Sk,并將其納入一個備選集合Ω;
3)在Ω中,選擇分類準確率最高的那部分Sk,其中k值最小的待選集合即為特征選擇后的最優特征集。
SOM是由芬蘭學者KOHONEN T模擬人腦神經元自主學習的能力,開發出的一種無監督、自學習的神經網絡。它能夠在龐大的樣本空間中找到相似的部分并映射到低維空間中,形成聚類并記住這種邏輯關系,訓練后的網絡能夠對輸入樣本進行自動分類。
SOM具有將高維數據映射至低維空間,并保持原有數據拓撲結構不變的特點,網絡由輸入層和輸出層組成。與其他神經網絡不同,SOM不包含隱含層,其結構更為簡單,算法復雜程度低且有效。輸入層與輸出層間直接使用權值向量進行連接,輸出層中的每個神經元均與所有輸入向量連接,以保證輸入向量能夠在輸出層上進行良好的映射。
SOM網絡結構如圖1所示。

圖1 SOM網絡結構示意圖Fig.1 The structure of SOM
圖1中,下層為輸入層,上層為輸出層,通過權值連接后,相同類型的輸入向量能夠在輸出層中進行自動聚類。圖1輸出層中不同顏色的神經元即代表不同的數據類別。
SOM神經網絡屬于競爭型學習神經網絡。訓練開始后,輸入向量會計算與之連接的所有輸出層神經元之間的歐式距離,以距離的遠近作為神經元獲勝的依據,輸出層中與該輸入向量距離最小的神經元,即為獲勝神經元,其有權利會同鄰域范圍內的所有神經元進行權值的更新,使其與輸入向量間的距離進一步減小;不同的輸入向量可能在輸出層中對應不同的獲勝神經元,因此,輸出層中不同位置的神經元均有可能被激活。
其算法步驟如下[17-18]:
步驟1。設置輸出層神經元個數、初始權值向量、學習率、鄰域尺寸等參數以使網絡初始化;
步驟2。設數據樣本集X中的輸入向量x(t)為N維,t為迭代次數,每次迭代從X中隨機抽取x(t);
步驟3。計算輸出層中每一個神經元的權值和輸入向量的歐式距離,并找到輸入向量x(t)所對應的獲勝神經元:
c=argmini{‖x(t)-mi(t)‖}
(9)
式中:c為獲勝神經元;mi(t)為權值向量;
步驟4。同步更新獲勝神經元c及其鄰域范圍內的其他節點的權值:
mi(t+1)=mi(t)+hci(t)[x(t)-mi(t)]
(10)
式中:hci(t)為鄰域函數,鄰域內不同的節點根據距離的遠近,其權值更新的幅度不同;
步驟5。更新網絡參數:
hci(t)=α(t)exp(-sqdist(c,i)/2σ2(t))
(11)
式中:α(t)為學習率函數;σ(t)為鄰域尺寸函數,二者均是時間t(也即迭代的次數)的單調遞減函數,α(t)的取值范圍一般在(0,1)之間;sqdist(c,i)為獲勝神經元c與鄰域內節點i之間幾何距離的平方。
隨著迭代的不斷進行,鄰域函數也會不斷地更新,以使網絡逐漸趨于收斂;
步驟6。檢查結果是否滿足既定要求,不滿足則繼續迭代;滿足要求則循環結束,訓練完成。
U矩陣[19](unified distance matrix,U-Matrix)可對SOM的分類結果進行展示,它以距離作為度量標準,以二維網絡結構顯示結果。U-Matrix中的每個網格點表示該神經元與周圍神經元之間的距離。
由聚類的性質可知,聚類是利用數據的相似性對混亂的原始數據集進行聚合和分離,從而劃分出一定的類別。U-Matrix即是利用距離度量的方法使SOM分類結果可視化。U-Matrix可儲存SOM中每一個神經元與其鄰近神經元間的距離,數值的大小表示距離的遠近。
為了更形象地表征這種距離度量方式,筆者在U-Matrix中引入RGB顏色,并對不同的顏色賦予不同數據值:深色表示距離遠、數值大,淺色則代表距離近、數值小,根據顏色的深淺即可判斷距離的大小。相似性高(即距離小)的數據即屬于同一類數據,相似性小(即距離大)的數據即屬于不同類數據。
U-Matrix實際上只起到了存儲SOM中神經元相對距離的作用,并沒有改變神經元位置。因此,采用這種方法不但使SOM可視化,還保留了原始數據的拓撲結構。
筆者設計了一個異步電機軸承故障診斷試驗臺。該試驗臺主要包括異步電機、直流發電機、電阻負載箱、傳感器、數據采集儀和上位機等。
試驗臺總體布置圖如圖2所示。

圖2 故障診斷試驗平臺Fig.2 Fault diagnosis test platform
該次試驗中,筆者所用異步電機型號為Y132M-4,軸承型號為6308A。
為了模擬軸承外圈故障,筆者使用線切割機在軸承外圈處開貫穿型凹槽,其中,開槽寬度為2.0 mm,深度為1.5 mm,如圖3所示。

圖3 開貫穿型凹槽的故障軸承Fig.3 Faulty bearing
故障軸承安裝于異步電機輸出端。
試驗過程中,筆者設置健康和軸承故障兩種運行狀態,分別采集振動、電流和電壓信號。每種狀態分別采集100組數據,共計200組試驗樣本。
筆者按照1 ∶1的比例對訓練樣本與測試樣本進行分割,如表1所示。

表1 數據分組情況Table 1 Data grouping
判斷電機是否發生軸承故障需要選擇合適的特征,當出現軸承故障時,原有的穩定運行狀態被破壞,其振動特性和電流特性均會發生改變。
在不同運行狀態下,振動信號的時域波形對比圖如圖4所示。

圖4 振動信號故障前后時域對比圖Fig.4 Time domain comparison of vibration signal before and after fault
由圖4可以看出:軸承故障發生后,4路振動信號均呈現出不同程度的幅值變化,其中位于電機輸出端的兩路振動信號增幅明顯,位于電機上平面的振動信號增幅次之,而位于基腳處的振動信號幅值增長幅度最小;同時,不同位置處的振動加速度傳感器對于軸承故障的敏感度各不相同,因此依靠其進行故障檢測的可信度也不相同。
在不同運行狀態下,三相電流信號的時域波形對比圖如圖5所示。

圖5 三相電流故障前后時域對比圖 Fig.5 Time domain comparison of three-phase current before and after fault
由圖5可以看出:當異步電機出現軸承外圈故障后,三相定子電流幅值出現同步增長,且增加幅度基本一致。
振動信號和電流信號均能在一定程度上反映異步電機運行狀態。筆者分別對振動信號和電流信號進行時域、頻域處理,提取統計特征形成高維混合特征集。其中,時域特征包括最大值、平均值、方差、均方根、標準差、均方根形狀因子、方均根值、方均根形狀因子、偏度、峰度、波峰因子、緯度因子、脈沖因子;頻域特征包括平均頻率、頻率方差、偏態功率譜、峰度功率譜、頻率重心、頻率標準差、頻率峰度、頻率偏度。
此外,筆者將部分電流信號的常用特征一并納入特征集,包括正序電流、負序電流、三相電流基波分量、正序阻抗和負序阻抗,共得到154維特征。高維度特征集中可能含有部分冗余特征或無關性特征,且會增加訓練時間,降低使用效能;因此,需要進行降維處理。
筆者采用mRMR算法對原始特征集進行特征選擇。
不同特征集對應的分類準確率如表2所示。

表2 不同特征集尺寸對應分類準確率對照表Table 2 Classification accuracy comparison of different feature sets
表2中列舉了分類準確率高于95%的待選特征子集,其中當k=1 733 133時,分類準確率均可達到98%。因此,可以將特征集維度降低至17。
各特征所對應的互信息值如圖6所示。

圖6 mRMR得到的特征互信息Fig.6 Feature MI by mRMR
由圖6可以看出:互信息值各不相同,反映出特征與類標簽的相關性不同,不存在同等相關性的特征,即選出的特征間相關度較低。
筆者利用SOM對訓練樣本進行迭代訓練,將樣本特征映射到神經網絡的不同區域,再將測試樣本輸入并映射到已經訓練完成的SOM平面中,進行故障類型的判別。觀察映射區域間的距離可使故障診斷可視化。
以原始高維混合特征集作為輸入向量,由此得到的SOM映射結構如圖7所示。

圖7 原始特征在SOM上的映射與分布Fig.7 Mapping and distribution of original features on SOM
圖7分別表示兩種狀態下的100組訓練樣本的原始特征和對應的狀態標簽在SOM上的映射拓撲結構。其中,圖7(a)中的數字表示每個被激活的神經元所對應的樣本數量,對應于圖7(b)的狀態標簽分布情況。
經過篩選后得到的特征集在SOM上的映射結構如圖8所示。

圖8 篩選特征在SOM上的映射與分布Fig.8 Mapping and distribution of filtering features on SOM
由圖7和圖8對比可知:原始特征訓練樣本在SOM上的分布較為松散,相同狀態所代表的神經元之間的關聯性不強,電機兩種狀態間區分效果不明顯;經過篩選降維后,特征樣本在SOM上的映射更為均勻,且被激活的神經元之間聯系緊密,區分效果明顯。
筆者使用U-Matrix圖表現不同電機狀態樣本間的距離度量。U-Matrix中的每一個單元格均代表了一種距離度量,這種距離度量根據顏色的深淺進行直觀展現,單元格中的顏色越深,代表距離越大,也即兩個相鄰神經元之間的相似度越差;淺色區域即代表相鄰神經元具有高相似度。
筆者將原始特征和篩選后特征的訓練樣本分別在SOM中訓練,得到U-Matrix圖如圖9所示。

圖9 不同特征下的U-Matrix圖Fig.9 U-Matrix diagram with different characteristics
圖9中,白色區域代表相同狀態樣本聚集形成的子空間,深色區域則是不同狀態間因相對距離較遠而形成的分界線。
圖9(a)和圖9(b)中,兩側白色空間分別對應于圖7和圖8中對應標簽狀態的區域,但圖9(a)中左側白色區域中仍存在部分深色區域,影響最終分類效果;圖9(b)中左右兩側白色空間深色區域分界線明顯,且白色區域內部幾乎不存在深色區域,表明SOM在使用篩選得到的特征進行訓練后能夠獲得更好的分類能力,具備更強的狀態區分能力。
為了驗證測試樣本在SOM訓練集上的分類效果,筆者使用原始特征和篩選后強區分能力特征,分別對兩種電機狀態各50組測試樣本進行SOM分類。
分類精度和時間參數如表3所示。

表3 特征篩選前后SOM分類準確對比Table 3 SOM classification accuracy comparison before and after feature filtering
由表3可知:筆者使用強區分能力特征進行SOM分類的測試樣本明顯擁有更好的分類準確精度,且其網絡收斂時間縮短23.5%。
筆者將使用篩選后得到的強區分能力特征的測試樣本投射到SOM上,并觀察其分類情況,得到強區分能力特征測試集U-Matrix分類圖,如圖10所示。

圖10 強區分能力特征測試集U-Matrix分類圖Fig.10 U-Matrix classification diagram with strong distinguishing ability features
圖10中的“ο”和“×”對應圖8中的健康和軸承故障標簽,兩種狀態類別能夠從U-Matrix圖上進行直觀的區分,分類效果十分明顯。
圖10中,左側白色子空間即對應健康狀態,右側白色子空間則對應故障狀態,兩者間由一條深色分界帶分隔。但從圖10中仍可發現部分測試樣本落在深色分界帶附近。
為了比較SOM模型的分類性能,筆者分別建立支持向量機分類模型(support vector machine,SVM)和反向傳播(back propagation,BP)神經網絡分類模型,在相同的訓練樣本和測試樣本下進行識別分類比較,得到了3種網絡分類結果,如表4所示。

表4 3種網絡分類結果對比Table 4 Comparison of different network
由表4可知:與傳統的BP神經網絡和SVM相比,基于mRMR-SOM的網絡模型具有更高的分類準確精度。
筆者采用了mRMR算法對多信號提取的高維混合特征進行了篩選,并將其作為輸入向量,采用SOM進行了異步電機軸承故障診斷,最后根據試驗結果對mRMR-SOM方法的有效性進行了驗證。
研究結果表明:
1)對比原始特征集和經過篩選的強區分能力特征在SOM上的映射拓撲結構可知,mRMR能夠有效保留原始特征集包含的電機狀態信息,并可對兩種狀態進行有效區分;
2)從強區分能力特征的測試集的SOM分類結果看,分類準確率得到了顯著提升,達到98%,驗證了該方法的有效性;
3)觀察保留強區分能力特征的測試集的U-Matrix分類圖可以發現,該方法能夠明顯區分兩種狀態類別,且分類邊界清晰;
4)相比于傳統的BP神經網絡和支持向量機,SOM擁有更高的分類準確率。
目前,基于mRMR-SOM的診斷方法能夠有效解決異步電機軸承故障診斷問題。但異步電機還存在如匝間短路、軸不對中等故障情況,因此,筆者將在后續研究工作中考慮這些情況,以增強該方法的普適性。