龍 慧,馬家慶,吳欽木,何志琴,陳昌盛,覃 濤
(貴州大學 電氣工程學院,貴陽 550025)
電機作為重要的機械設備,在生產和生活中被廣泛應用,電機在運行過程中一般會伴隨著溫升的產生,發生故障,從而影響到設備的正常運行。為了保障設備的安全運行,及時對電機進行故障識別是一項很重要的技術[1]。隨著計算機技術的快速發展,卷積神經網絡(Convolution Neural Network,CNN)被廣泛應用于電機的故障識別。
CNN 在數據圖像特征提取方面有著顯著的優勢,目前已經被廣泛應用于圖像識別、人臉識別、特征分類等方面。特征提取是CNN 模型對電機運行狀態識別的關鍵部分,已經被廣泛研究。小波變換(Discrete Wavelet Transform,DWT)有非冗余性,能很好的對數據進行分解與去噪,并能將信號中的時頻特征表現出來[2]。DWT 在圖像降噪處理領域被廣泛應用,文獻[3]先利用離散傅里葉變換,將時域信息特征映射到頻域,再使用CNN 學習數據特征,從而實現故障診斷;文獻[4]提出一種基于CNN 和離散小波變換的滾動軸承故障診斷方法,對不同情況下的滾動軸承進行故障診斷;文獻[5]結合DWT、Lorenz 混沌系統和CNN 對電力電纜的絕緣故障進行識別;文獻[6]提出了一種基于小波時頻圖和卷積神經網絡的斷路器故障診斷方法,實現對操動機構故障狀態的辨識診斷;文獻[7]利用DWT 從原始信號中提取高維器具特征,提出了主動深度學習對負載進行識別的方法;文獻[8]提出了一種CNN 的狀態監測特征學習模型,對圖像數據進行分類。
本文基于小波變換(Discrete Wavelet Transform,DWT)的改進卷積神經網絡(Improved Convolutional Neural Network,ICNN)電機運行狀態識別方法,將小波變換和卷積神經網絡相結合,解決電機故障識別的問題。該方法先構建電機運行狀態的數據集,小波變換將采集的數據圖像轉換為小波系數矩陣并進行系數增強,將處理后的圖像輸入到網絡模型中,對變換后的圖像進行特征提取,來提高電機運行狀態識別的準確率。
小波變換是由傅里葉變換發展而來的,小波變換對于復雜信號有著較好的時頻分辨率,被廣泛應用于復雜單尺度信號的時頻分析,通過不同的變換方法從不同的角度獲得信號的特征,從而來實現信號的分析和處理。小波變換是一種以時頻為特征的時頻分析技術,是對不同分辨率信號進行分析的方法。
小波變換分為連續小波變換和離散小波變換。小波變換常用來抑制信號的噪聲,本文采用離散小波變換來對數據圖像信號進行小波系數變換。
離散小波函數ψm,k(t)可以表示為式(1):
其中,m和k分別為伸縮和平移參數;t是時間;ψ(t)是小波基。
輸入信號由低頻(LF)和高頻(HF)組成,通過DWT 將其分解成頻帶,通過下采樣得到第一級小波變換。
根據離散小波的特點,低頻系數cAi和高頻系數cDi的頻帶分別表示為式(2)和式(3):
其中,i為分解層數,fs為信號的采樣頻率。
由于信號已被下采樣,因此在重新配置時需要對其進行上采樣。小波變換是一種有效的定時信號壓縮降噪方法,具有多分辨率和時頻局部化等特點。
本文的網絡模型由輸入層、卷積層、池化層、全連接層和輸出層所組成。卷積層是將輸入層接收到經過DWT 預處理的特征利用卷積核對數據特征進行提取,增強原始圖像的特征信息。卷積操作的一般形式為式(4):
其中,?為卷積運算符;b為偏差;ωij為卷積核;x為輸入特征圖;f(·)為激活函數。
池化層采用平均池化操作將卷積層提取的特征再次提取,使得其有更低的維度,減少計算量和過擬合的產生。池化層的一般形式為式(5):
其中,β為偏置系數,down(·)為下采樣函數。
選用Tanh 激活函數,其取值范圍為-1~1,輸出均值是0,Tanh 函數表示為式(6):
全連接層的特征是每一個神經元都與上一層的所有神經元相連。全連接層的輸出為式(7):
其中,x為全連接層的輸入,ω為權值系數。
輸出層一般是分類器層(Softmax 層),對識別目標進行分類。Softmax 層的輸入是上一層全連接層的數據,輸出的數據的每個值范圍為0~1,輸出值表示的是樣本屬于這一類別的概率。
對于本文基于DWT 的ICNN 電機運行狀態識別方法,將電機原始數據通過小波變換轉化為小波系數矩陣,再通過ICNN 進行無監督的學習時頻圖的圖像特征,識別出電機故障的特征信息,最后由Softmax 分類層將識別出的特征信息與相應故障類型做出對比,實現了電機的運行狀態識別診斷。
基于DWT 的CNN 的電機運行狀態識別的具體步驟:
(1)通過熱像儀采集電機圖像數據集,將數據集預處理后劃分為訓練集和測試集;
(2)將數據集通過DWT 處理數據圖像,對數據圖像進行小波系數矩陣的轉換;
(3)將處理后的數據圖像輸入到CNN 模型中,初始化網絡模型,根據實驗需求,確定適合本實驗模型的學習率和迭代次數等網絡參數;
(4)通過網絡模型運行得到輸出誤差,判斷輸出是否收斂;若不收斂執行步驟(5),若收斂直接進行識別;
(5)通過模型輸出的誤差進行反向傳播,進行權值的修改;
(6)重復執行步驟(4)、步驟(5),直到模型的精度和損失函數等滿足實驗要求,輸出網絡模型,識別電機的運行狀態。
實驗平臺主要由電力電子技術及電機控制實驗裝置、電機、熱像儀和計算機組成。通過熱像儀采集電機運行狀態的圖像,將采集到的電機數據分為正常運行、停止和故障3 種狀態,每種狀態采集200 個樣本,從總樣本中隨機選取20%構成測試樣本,剩余的數據作為訓練樣本。對這3 種狀態的圖像預處理,然后進行離散小波變換得系數矩陣,再輸入到CNN 網絡模型。
3.2.1 損失函數(Loss)
用損失函數評估模型的預測值與真實值之間的不一致程度,式(8):
其中,p(x)為真實的概率,q(x)為模型通過計算之后的概率估計。
3.2.2 結構相似函數(SSIM)
結構相似函數用于評估模型運算后電機識別圖片的失真程度,識別前后兩張圖像的結構相似函數SIMM,如式(9):
其中,μ為平均像素值;σ為標準差;C為常數。
迭代50 次、權值調整步進值為0.03 時所得到的實驗結果見表1。通過對不同小波變換(Haar 小波、Daubechies(db)小波、ReverseBior(rbio)小波、Coiflet(Coif)小波和Fejer-Korovkin(fk)小波)的故障識別的性能比較,可以看出本文使用的小波變換表現出最好的性能。

表1 不同小波變換在迭代50 次下運行狀態識別的性能比較Tab.1 Performance comparison of different wavelet transforms in running state recognition under 50 iterations
權值調整為0.03 時數據圖像在不同迭代次數下的結果如圖1 所示,可以看出隨著迭代次數的增加,準確率逐漸升高、損失值逐漸減小;當迭代次數大于40 時,迭代次數的增加,準確率和損失函數幾乎都趨于穩定,準確率在97%及以上,損失函數的值在0.2 附近波動。但隨著迭代次數的增加,模型運行所需要的時間也在不斷增加,為了節省時間且保證有好的準確率和損失值,本文所選擇的迭代次數為50,模型不僅能達到實驗所需的實驗精度,而且收斂速度比較快,穩定性較好。

圖1 數據圖像在不同迭代次數下的比較Fig.1 Comparison of data images under different iterations
為了進一步驗證本文所提方法的穩定性和可行性,在不同權值調整下對電機進行故障識別,結果如圖2 所示??梢钥闯?,權值過大或過小都會使準確率相對過低、損失函數值過大;當權值調整為0.05時,本文所提出的方法的損失值和準確率都達到很好的效果,達到98%。

圖2 數據圖像在不同權值下的比較Fig.2 Comparison of data images under different weight adjustment
本文基于DWT 的CNN 實現了電機運行狀態識別。該方法將小波變換和卷積神經網絡結合在一起,很好的避免了傳統方法對于經驗的依賴,利用DWT 小波系數的特點,對數據圖像進行轉換,提取數據的重要特征,提高了電機運行狀態識別的準確率。實驗結果表明,迭代次數不斷增加,準確率不斷增大,最后趨于一個穩定狀態,準確率達到最高的時候,損失函數值也達到最低,說明該方法有效。