張周磊 李垣江,2 李夢含 魏海峰,2
1(江蘇科技大學電子信息學院 江蘇 鎮江 212003)2(常熟瑞特電氣股份有限公司 江蘇 常熟 215500)
匝間短路及永磁體的失磁是典型的、破壞性極強的永磁同步電機(PMSM)故障。若輕微的匝間短路故障未加以關注,則短路環流持續上升產生高溫引起退磁現象,最終導致電機無法運行,甚至燒毀電機。因此,匝間短路和失磁故障特征的研究以及特征數據集的優化對于高效、準確、低耗、省時地進行故障檢測具有重要的意義。
現階段,永磁同步電機匝間短路及永磁體失磁故障的研究大多通過信號變換方法,將電機信號(輸出電流、反向電動勢等)精確分解成重要信息塊,并作為診斷故障的標準。常用的方法包括:小波變換(WT)[1]、傅里葉變換(FFT)[2]、經驗模態分解(EMD)[3]等。定子電流諧波頻譜分析[4]對于電機故障具有強相關聯性,因此對諧波的FFT頻域分析是目前研究較多的方法。該方法能夠有效診斷電機狀態,但是受環境因素的影響(轉速、溫度),諧波次數會不盡相同,所需表達的電機模型也會相對復雜。而電機參數辨識方法[5]通過識別各狀態參數(負序特征、振動、轉矩等)判斷其運行狀態,確認故障類型及劣化程度。該方法可以簡化操作過程,但由于各參數之間是相互獨立的,在分析多故障狀態時,已有的參數未能完整表示電機故障,因此診斷效率并不高。
深度神經網絡在圖像識別、數據挖掘領域取得了顯著成就。基于深度學習參數特征的數據挖掘可以大大提高電機故障診斷的準確性。文獻[6]基于定軸變速齒輪特征,在100組有限樣本數量條件下,利用粒子支持向量機實現齒輪智能故障診斷,效率能夠達到95%以上。文獻[7]基于振動信號特征,在400個有限樣本數量條件下,采用去噪稀疏自編碼網絡實現異步電機6類故障診斷,結果達到97%以上。然而多故障電機模型組件內部存在強相關聯,導致電機故障具有一定的隨機性、并發性。因此小樣本深度學習網絡特征提取對于結果意義較小,海量且有效的參數樣本數據是提升深度學習故障診斷準確率的關鍵。
本文結合信號處理(定子諧波電流)與參數識別(電磁轉矩、磁感應強度)方法,分析特征與故障的關聯性,建立特征組合樣本,從而改善效率低下的問題。通過變分自編碼網絡[8](Vriational Auto-Encoder Net,VAE)對數據樣本進行特征提取并將其作用于生成模塊進行偽樣本擴展,最終生成的樣本能夠高擬合原樣本數據,解決故障診斷深度網絡訓練數據集稀缺的問題,大大節約資源和時間。最后利用稀疏自編碼網絡(Sparse Auto-Encoder Net,SAE)學習優化后的數據集特征,將訓練好的網絡作為永磁同步電機故障診斷的標準。
神經網絡故障診斷主要以監督學習為主,因此海量的標簽數據是高效網絡診斷的關鍵。而人工生成標注樣本數據存在工作量大、消耗資源多、周期長等缺點,為了解決此類問題,本文利用深度生成變分自編碼網絡無監督學習已知樣本,并基于學到的數據概率分布生成偽樣本。
標準自編碼網絡目標僅僅是數據降維、特征提取,而變分自編碼網絡的區別之處在于能夠訓練出潛變量Z的概率分布,通過Z分布采樣生成新樣本。如圖1所示。
已知故障樣本數據X通過p(Z|X)推斷出Z:
(1)

(2)
由于X為高維的連續變量,p(X)處于復雜的分布,所以通過概率論方法很難計算Z。因此應用變分推斷(Varitational inference)方法利用分布q(Z)近似p(Z|X),通過KL散度[9]衡量兩者近似程度。

(3)
將式(3)進行貝葉斯公式變換得到:
logp(X)-KL(q(Z)‖p(Z|X))=

(4)
故障樣本X已知情況下p(X)為固定值,因此為了縮短q(Z)與p(Z|X)之間的距離,需要對式(4)等號右側進行處理:
(1) Decoder:等號右側第一項的log似然期望最大化;
(2) Encoder:等號右側第二項q(Z)與p(Z)KL散度最小化。
另一方面可以將隨機變量Z分為兩個部分:確定部分X;隨機部分ε。條件概率z=gφ(X,ε),gφ為組合函數。ε決定了z條件概率值的變化趨勢,則q(Z)=p(ε),處理式(4)得:
logp(X)-KL(q(X)‖p(Z|X))=
(5)

變分自編碼網絡可以劃分為編碼器和解碼器。為了簡化網絡求解過程,假設q(Z)服從多維高斯分布[10],p(Z)服從標準正態分布,則編碼階段q(Z)與p(Z)的KL散度即可表示為:
KL(p(ε)‖N(0,1))=
(6)
式中:d為隱變量的維度;Σε為方差矩陣。
將高斯分布分解為均值與方差形式:
KL(N(μ,σ2)‖N(0,1))=
(7)
從式(7)可以很清晰地看出KL散度與(μ,σ)的關系,通過不斷優化均值及方差參數使散度距離最小化實現p(Z|X)目標的近似。Encoder網絡模型如圖2所示。

圖2 VAE網絡Encoder模型
將上述由均值及方差組成的潛變量Z作為解碼階段(Decoder)的采樣輸入,這樣的采樣過程會遇到困難:Z~N(μ,σ2)參加采樣操作時均值和方差不可導從而導致網絡梯度下降訓練不可實行。為解決難題,引用重參數方法[11]來實現誤差反向傳播,原理如圖3所示。

圖3 重參數技巧
首先從標準正態分布中隨機采樣參量φ,再經過參數變換得到服從所需高斯分布的采樣變量Z,此時對線性變換后的結果進行求取偏導即可完成網絡梯度下降訓練過程。

(8)

變分自編碼網絡總的優化目標函數即為Encoder和Decoder階段損失函數的綜合:
Loss=min(J+KL)
(9)
網絡經過誤差反向傳播優化網絡參數使目標函數最小化,最終達到數據樣本擴展的目標。整體VAE網絡模型如圖4所示。

圖4 VAE數據擴張網絡流程
圖4中,真實故障集X的概率分布通過KL散度學習分布q(Z)(近似條件分布p(Z|X))編碼計算獲取輸入樣本的潛在表達μ、σ,并通過重參數技巧(引入標準正態分布)構成潛變量Z完成反向傳播算法。然后通過交叉熵函數最大化似然條件分布p(X|Z),使生成樣本與真實故障樣本相似達到最終故障集構建的目的。
本文采用稀疏自編碼網絡進行電機故障診斷,SAE與普通自編碼器(AE)相似,具有特征提取、數據降維功能,而它們的區別是實現泛化的方式不同。不同于AE直接懲罰模型參數實現泛化,SAE引入稀疏正則項以及稀疏連接提升網絡的表征能力,加強訓練,并且解決由于深程度泛化引起的過擬合問題[12]。
如圖5所示,稀疏自編碼網絡編碼階段分析多特征數據集提取重要特征,將復雜的數據分布簡單擬合,利用KL散度引入稀疏正則項懲罰網絡激活單元,實現局部連接,權值共享。
(10)


圖5 稀疏自編碼
解碼階段將特征進行數據恢復輸出預測結果,通過目標函數比較診斷結果與真實結果的可靠性,在不斷地迭代中經過隨機梯度下降算法按梯度方向修改權值,最終實現最小化目標函數,并記錄相應的網絡參數。

(11)
另一方面隱層引入稀疏連接的關鍵是為了避免各層神經元提取到重復的特征或額外的噪聲特征。此時雖然訓練階段的誤差較小但測試結果并不滿足要求,這樣的現象即為過擬合。Dropout能夠有效解決這種問題,通過伯努利離散分布隨機激活或停止輸入節點的狀態,并以整體概率為p作為響應,p也可以理解為Dropout率,其直接影響權值參數的個數。Dropout作用于SAE的編碼網絡和解碼網絡能夠提升隱層處理效率,增強特征提取以及故障診斷能力。
此時訓練好的深度神經網絡即可用于永磁同步電機故障診斷。最終深度神經網絡診斷流程如圖6所示。

圖6 深度神經網絡診斷流程
本文利用MAXWELL有限元仿真軟件構建三相永磁同步電機模型,電機參數設置如表1所示。

表1 三相永磁同步電機參數
通過設置電機并聯繞組工作匝數模擬匝間短路故障與失磁現象,從而獲取5 000組特征樣本數據集。特征樣本部分數據如表2所示。

表2 部分特征樣本數據集
表2中:A、B、C分別為A相、B相、C相3次諧波電流幅值;E為最低磁密值;F為磁密波動幅值;T為電磁轉矩。標簽值表示電機狀態,分配情況見表3。

表3 電機狀態
本文采用組合特征的方式,將不相關的特征項組成7維故障樣本集,這樣的優勢在于:(1) 避免由于某項特征的誤差導致診斷錯誤;(2) 數據集的豐富性以及多樣性能夠提升深度神經網絡學習能力,避免過擬合現象。
在VAE數據擴張實驗中,將5 000組電機故障真實樣本以3∶1的比例建立訓練集與測試集,每一批次采樣100組,連續訓練20 000次。為尋找最優的網絡模型,實驗中不斷修改網絡結構(學習率、學習算法),將測試的準確率作為衡量標準,結果如表4所示。

表4 VAE參數優化
相同網絡條件下,對比不同學習率所對應的準確率可知,學習率的高低對于結果有很大程度的影響,而學習率在0.01情況下訓練結果最優。同理,選取Adam(Adaptive Moment Estimation)學習算法作為網絡的最優算法。
為展示VAE網絡樣本擴展的有效性,實驗將VAE編碼器數據降維后映射到二維潛在空間上均值的分布可視化,判別隱變量是否具有良好的樣本重構特性。圖7(a)展示了真實樣本潛在分布變化情況,最終將電機樣本劃分為4個區域狀態。

圖7 數據擴展后潛在空間分布
圖7(a)中不同的顏色深度代表不同的狀態,很顯然訓練之后各狀態區域均勻分布,彼此之間有明顯的界限,則說明潛在空間可以重現輸入即存在最小化重構損失(KL散度)實現潛在分布與先驗分布近似。
圖7(b)采樣真實故障樣本,經過變分自編碼Encoder特征提取,Decoder合成作用,利用誤差函數反向傳播學習、優化生成結果,實現偽數據樣本的合成。與圖7(a)相比較,顯然擴展后的樣本潛在空間分布近似于真實數據分布趨勢,證實VAE生成模型的衍生能力。且擴展后的數據集豐富了原樣本,促進樣本的多樣性,另外由于誤差產生的噪聲樣本,能夠增強數據集,提升SAE網絡故障診斷的魯棒性。
同時,實驗為了實現合成結果的高效性,結合三種誤差函數對比分析采取最優方案,結果如表5所示。

表5 VAE損失函數結果對比
實驗基于相同的電機樣本數量,經過3層隱層網絡(全連接層)迭代500次對比不同誤差算法最終生成數據的準確性。從表5可知,均方誤差與絕對誤差算法整體的誤差偏差差距較小,而交叉熵函數對于處理真偽偏差問題具有較大的優勢,誤差值明顯低于另外兩種算法,因此本文采用交叉熵函數作為判別生成模型的準則。
為了展示SAE引入Dropout稀疏連接對最終結果泛化能力的影響,實驗在SAE的基礎上引入Dropout率為0.5的稀疏連接,以相同的真實樣本為數據源,分別將正常SAE以及處理后的SAE作為診斷模型,實驗結果如表6所示。
顯然稀疏連接的引入能夠更好地發揮深度網絡的表征能力以及強泛化能力。因此本文SAE診斷模型即為處理后的SAE網絡。
為了進一步展示特征分析的合理性以及數據擴展的高效性,實驗將真實樣本以及擴展樣本分別作為訓練網絡輸入,稀疏化節點提取樣本重要特征并進行反復學習,將訓練完成的網絡用作判斷故障診斷的標準,并用測試數據檢驗診斷效率。實驗基于相同SAE網絡對比不同數據集下的故障診斷結果如圖8所示。

圖8 不同訓練集條件下診斷偏差對比
兩組實驗分別經過相同參數(隱藏層:3;隱層節點:10;批處理量:100;步數20 000)的SAE網絡,比較不同特征樣本集故障診斷的優劣程度。
(1) 實驗1將合成的5 000組本文特征分析故障數據集(A,B,C,E,F,T)作為網絡輸入,顯然樣本的數量直接影響診斷效率的高低,且隨著樣本數量的升高準確率趨于緩和,達到最優結果,最終診斷效率達到96.6%。
(2) 在實驗2的基礎上增加本文提出的VAE數據擴張,增加2 500組額外樣本集。由于擴張的數據是從無到有的過程,生成的偽數據通常會攜帶非相關噪聲元素,而這樣的樣本作為訓練數據反而能夠提高網絡的泛化能力,防止過擬合現象。因此從圖8中可以看出,5 000組相同樣本數下擴展后特征集準確率會略微高于組合特征集情況。另外樣本數過少網絡訓練無法達到最終狀態且診斷效率無法處于最優目標,從額外的樣本集診斷結果能夠觀察到,隨著樣本數的增多準確率也漸漸趨向于穩定達到99.3%,證明VAE擴展組合特征對于永磁同步電機匝間短路及永磁體失磁故障診斷的高效性。
不同診斷方法對比結果如表7所示。

表7 不同診斷方法結果對比分析
(1) 小波變換以及經驗模態分解作為傳統信號處理方法,與SVM分類器相結合用作電機故障診斷。診斷結果展示了這兩種方法的實用性,且相對深度神經網絡其結構簡單,計算方便,但效率不及另外幾種方法。
(2) BP神經網絡作為回歸、分類問題的常客,其良好的監督學習以及泛化能力在電機故障診斷領域也有較好的深入,且結果也比較讓人滿意。從表7中看出,BP診斷效率為88.7%足以證明BP的可行性,但整體效率還需大幅提升。
(3) 模糊邏輯與BP神經網絡的結合,既繼承了知識的模糊性,又兼顧了網絡學習能力強的特點,其核心是利用閾值向量判別方法。這樣的診斷策略從最終的診斷效率可以看出它的可靠性以及靈活性。
(4) 最后兩種方法的共同點在于它們都是基于深度學習網絡來實現電機故障診斷。DSAE是在稀疏自編碼網絡的基礎上增加噪聲的方法來提高訓練的魯棒性,其診斷效率達到98.6%,證實深度學習在故障診斷的高效性。而本文提出VAE+SAE的方法,通過深度學習數據擴張模型一方面增加樣本數量提升數據集多樣性,另一方面由于誤差產生的噪聲數據可以達到增強數據集的作用,其優勢在于減少人工工作量,減少計算機資源消耗,并能夠獲得精確的診斷結果。
組合特征融合深度學習變分自編碼網絡可以有效分析永磁同步電機匝間短路及失磁故障,彌補深度網絡大數據背景下樣本不足等問題。本文主要結論如下:
(1) 頻域電流、磁通密度、電磁轉矩特征分析可以結合相關因素,減少由于數據采集失誤引起的巨大偏差。相比于單一特征項數據,本文組合特征細化故障元素,從不同角度綜合分析故障優劣程度,展示其對于匝間短路和失磁故障的合理性。
(2) 引入變分自編碼網絡高效擴展特征,一方面增加數據集數量,另一方面增強了數據集。與人工采集數據集相比,優勢在于:節約時間、減少成本。另外生成的偽數據能夠提高訓練網絡的抗干擾能力,從而實現高效故障診斷。
(3) 故障診斷模型引入稀疏性原理提升了自編碼網絡的泛化能力,避免過擬合現象,并優化了整體的故障診斷效率。