謝澤文, 陳裕成, 柴琴琴, 林瓊斌, 王武
(1. 福州大學電氣工程與自動化學院, 福建 福州 350108; 2. 漳州職業技術學院 電子信息學院, 福建 漳州 363000)
三相電壓源逆變電路作為控制設備的核心電源, 廣泛應用于電機驅動和各種電力系統[1-2]. 統計數據表明, 三相電壓源逆變電路的開關管器件故障高發, 主要有開路故障和短路故障. 其中開路故障來源于電路工作溫度過高引起的導線斷裂或柵極信號丟失, 值得注意的是三相電壓源逆變器電路的短路故障發生時, 配置的短路保護裝置會自動切換開關管, 也會將短路故障轉換為開路故障[3]. 逆變器發生開路故障時, 由于功率轉換器中的功率電子元件數量較多, 逐個診斷功率電子元件耗費大量時間. 因此, 實現智能故障診斷是提升診斷速度、 容錯性和可靠性迫切需要解決的問題, 以減少停機時間、 實現預測性維護、 節省人力和資源.
三相電壓源逆變電路故障診斷技術是電路測試領域的研究熱點. 傳統的故障診斷方法一般步驟是信號獲取→特征提取→故障識別[4], 其中特征提取在一定程度上決定了故障診斷的準確率[5]. 傳統方法的診斷特征處理步驟較為復雜、 依賴人工經驗知識、 可遷移性差, 不利于早期電氣故障的快速診斷[6-7].
鑒于故障診斷的數據多為一維時序信號、 卷積神經網絡的強大特征自提取能力, 一維卷積神經網絡(1-D convolutional neural network, 1-D CNN)逐漸成為故障診斷的一種主流方法. 文獻[8]采用1-D CNN 來實現模塊化多電平轉換器的故障診斷, 省去特征提取等預處理環節. 文獻[9]驗證1-D_CNN用于傳輸故障診斷任務的有效性. 文獻[10]提出緊湊式結構的卷積神經網絡直接對一維信號數據進行診斷. 文獻[11]提出一種優化改進堆疊降噪自編碼器的故障診斷模型, 并利用學生心理優化算法對模型參數進行求解. 上述方法有針對性地解決了一些電力電子器件的故障診斷問題, 但一維卷積層進行特征提取時容易丟失時序特征, 導致模型在訓練過程中容易出現過擬合. 此外, 目前最前沿的卷積神經網絡結構并不能直接適用于一維時間序列信號, 需要輸入二維圖像才能充分發揮網絡的性能.
鑒于此, 本研究提出一種基于改進ResNet18網絡的三相電壓源開路故障診斷方法. 該方法選取包含故障信息的相電壓為檢測量, 引入一種新的數據預處理方法, 把原始時間序列信號經過馬爾可夫變換轉換為二維圖像, 盡可能地保留更多的數據時空信息. 然后將ResNet網絡與改進注意力機制相結合, 實現診斷結果和誤分類信息自動輸出. 該方法無需任何人工特征提取操作, 為三相電壓源逆變器開路故障診斷提供了一種具有更高的診斷準確率和魯棒性的故障診斷模型.
三相電壓源逆變電路的拓撲結構如圖1所示. 圖1中L為濾波電感, R為負載, C1為濾波電容, S1~S6為功率管,Udc為直流側電壓. 在直流電源輸出端并聯大電容以穩定直流側電壓, 所有開關器件采用帶反并聯二極管的全控型開關器件. 驅動模塊提供驅動信號控制功率管開通和關斷, 當門極信號為1時, 功率管開通; 當門極信號為0時, 功率管關閉. 正常情況下任意時段內各橋臂僅存在一個開關管導通. 然而逆變器由于實際工作環境惡劣、 工作時間久等原因出現單管或兩管同時發生故障的情況.

圖1 三相電壓源逆變電路Fig.1 Three-phase voltage source inverter circuits
逆變器的故障可分為開路和短路故障. 由于短路故障時間一般在10 μs以內, 現有條件難以檢測, 且通常開關器件是與熔斷器串聯的, 在故障發生時, 熔斷器斷開將短路故障轉化成開路故障, 因此本研究以開路故障類型作為研究對象. 在實際運行過程中, 最常見的三相電壓型逆變器開路故障可分為 5類 22種類型, 如表 1 所示, 包含單管開路、 兩管開路故障等.
三相逆變器功率管發生開路故障時將影響輸出相電壓, 導致相電壓Ua、Ub、Uc發生畸變或波形缺失, 不同故障類型所產生的故障波形也不相同. 經分析和統計, 若只取其中某一相相電壓作為故障信號時, 會出現故障電壓波形重復的情況, 進而導致誤診. 比如, 當S5開路故障時, 正常和故障情況下Ua電壓波形相同. 為了準確區分不同故障類型, 本研究采集三相相電壓作為故障特征, 實現故障診斷.
本研究搭建如圖2所示的故障數據采集平臺, 主要由直流電源、 三相逆變器、 反激輔助電源、 驅動電路、 數據采集卡(PCI-6229)、 采樣電路和PC機組成. 驅動電路采用MS320F28069芯片產生控制信號組成. 其中, PC制信號用于控制三相功率管模擬開路故障, 采樣頻率為50 Hz. 采集得到的不同故障類型電壓波形如圖3、 4所示. 受篇幅所限, 表1中各大類故障僅列兩小類作為對比.

表1 三相逆變器開路故障類型

圖2 實驗平臺Fig.2 Experimental platform

圖3 單管和同橋臂兩管故障時電壓波形Fig.3 Voltage waveform when single tube and two tubes of the same bridge arm fail
模式1. 發生單管開路故障時, 以S1和S5功率管單管開路故障為例, 由于上橋臂斷開, 只有下橋臂正常開通關斷, 相電壓缺失一半波形, 如圖3(a)所示.
模式2. 發生同橋臂兩只功率管故障時, 以S1S2或S3S4故障為例, A相或B相對應的橋臂上下兩管都是斷開狀態, 沒有電流流過, 導致A相或B相相電壓為0的情況, 如圖3(b)所示.
模式3. 發生不同橋臂異側兩管故障時, 以S1S5或S3S5故障為例, 在任意時刻各橋臂均只有1個功率管導通, 而同側的橋臂開路導致電流不能經過正常相對側的功率管. 在這樣的情況下, 每一相的相電壓波形都出現半波丟失和電壓波形畸變, 如圖4(a)所示.

圖4 不同橋臂兩管故障時電壓波形Fig.4 Voltage waveforms when two tubes of different bridge arms fail
模式4. 發生不同橋臂同側兩管故障時, 以S1S6或S4S5為例,發生功率管故障的橋臂都處于斷開狀態, 正半周沒有電流流過, 導致功率管輸出出現半波缺失, 剩余半波波形產生畸變. 另一相電壓同時發生電壓畸變, 如圖4(b)所示.
由以上故障波形圖可看出, 不同故障類型波形十分相似. 如, S1S5與S3S5故障、 S1S2與S3S4故障, 使用常規的機器學習方法難以準確地判斷三相電壓型逆變器的故障類型. 因此, 本研究提出一種改進的深度學習算法實現故障高精度診斷.
ResNet18[12]通過深層的特征提取網絡將數據映射到更加離散的高維空間, 保障種類數量較多的分類任務的分類精度, 在所有ResNet網絡中具有參數量最少、 訓練速度快的特點. 考慮到實際應用環境下模型部署的條件限制, 本研究選擇ResNet18作為模型基本架構. 然而ResNet18是針對二維數據設計的, 且由于殘差塊對冗余信息采用非線性激活進行信息提取, 模型易受噪聲影響, 很難直接用于逆變器實際故障數據的學習. 為此, 本研究提出一種基于馬爾可夫轉移場(Markov transition fields, MTF)轉換和帶并行注意力機制的ResNet18網絡模型(parallel-convolutional block-attention module-ResNet18, P-CBAM-ResNet18)的故障診斷模型. 該模型的自動特征提取層可以充分挖掘圖像中時間和空間關系, 這在一維的信號中是無法實現的, 因為一維 CNN 在檢測信號局部相關性存在不足[13], 其結構框圖如圖5所示.

圖5 改進的P-CBAM-ResNet18網絡結構圖Fig.5 Improved P-CBAM-ResNet18 network structure
本研究利用MTF可以保留原始信號在不同時間間隔內的時間相關性的特點, 把原始電壓信號轉換成二維的圖像. 然后, 依次經過ResNet18的1個普通卷積層、 4個帶殘差塊的卷積層將特征圖像映射到高維特征空間, 再利用改進的并行注意力機制實現高維特征的雙通道篩選和融合. 接著, 用ResNet18的全連接層來整合融合后的特征中具有故障類型區分性的局部信息. 最后, 在ResNet18的輸出層采用Softmax分類器進行故障分類. 該方法以文獻[12]中ResNet18為基本框架, 這里只對MTF轉換原理和改進的注意力機制進行詳細介紹, 詳見下面小節.
直接將一維信號或者將其平鋪成二維信號作為故障診斷模型的輸入時, 只能學習到不同特征維度上特征之間的空間關系, 忽略了狀態的時間轉移特性. 而馬爾可夫轉移場變換可呈現時域之間的信息關系[14], 采用MTF變換更能表征逆變器故障信息, 保留更多有效信息.
馬爾可夫轉移場通過表示馬爾可夫轉移概率來對一段信號進行求和, 把局域不明顯的特征提取出來. 首先, 將電壓序列數據X=[x1,x2, …,xn]平均劃分為Q個區域, 序列中每個數據點xi可以映射到qi(i∈ {1, 2, …,Q}).然后, 通過跟隨矩陣得到馬爾可夫變遷場概率矩陣M.即

(1)

得到矩陣M后, 將矩陣中的元素作為像素, 從而完成MTF轉換的全程. 為了驗證MTF算法的唯一性, 使用MTF轉換原理對原始電壓信號進行二維映射, 結果如圖6所示.

圖6 MTF映射說明Fig.6 MTF mapping instructions
從圖中可以看出, 完整波形的一維信號對應的是完整的十字形圖像(圖中方框標注). 波形缺失的部分(圖中圓圈標注)對應的MTF是模糊不清. 以上結果表明, 電壓信號通過在MTF圖中能夠進行完整映射.
ResNet18網絡中殘差塊可以解決由于網絡層數較多而出現的退化問題, 但是對冗余信息采用非線性激活信息提取時, 易受噪聲影響. 而注意力機制(convolutional block attention module, CBAM)[15]可以有效提升殘差塊對關鍵特征的提取, 抑制冗余信息對模型訓練的影響.
傳統CBAM模塊采用串行連接方式. 首先是將特征圖(F)經過通道注意力機制(channel attention module, CAM)加權得到特征圖(F1), 再經過空間注意力機制(spatial attention module, SAM)加權得到輸出特征圖(F2), 使網絡先關注圖像中對分類結果起決定作用的特征通道, 再考慮圖像特征中重要的位置. 然而由于CAM和SAM先后順序關系導致接在通道注意力機制所學習到的是篩選過的特征圖, 影響空間注意力模塊所學習到的特征, 甚至由于“串行連接”產生的干擾, 會使注意力模塊的效果變得不穩定.
為此, 本研究提出采用“并行連接”的方式構造注意力機制, 使兩個注意力模塊都直接從原始的特征輸入進行學習, 再將通道和空間輸出特征的雙線性池化結果作為輸出. 與原始串行連接相比, 空間注意力機制輸入特征更全面, 并行連接的空間注意力部分得到增強, 更加關注不同特征之間的圖像空間位置關系, 即關注圖像中對故障分類起決定作用的故障特征區域, 忽略無關區域. 其次, 傳統雙線性池化[16]特征的高維會導致整個模型參數大小和訓練時間增加, 本研究提出采用緊湊雙線性池化(compact bilinear pooling, CBP)[17]對并行通道結果進行融合, CBP使用 Count-Sketch 映射函數將2個向量投影到較低維空間, 然后通過快速傅里葉變換來計算2個向量的外積, 實現對圖像局部判別性特征進行交互與融合, 提取圖像成對的特征關系. 因此, 并行注意力機制的輸出為
f=F-1(F(C1(f1))?F(C2(f2)))
(2)
其中:C1和C2是2個Count-Sketch映射函數; ?是兩個向量的點積;F為快速傅里葉變換;f1表示特征圖經過通道注意力模塊的輸出;f2表示特征圖經過空間注意力模塊的輸出. 其計算式分別為
f1=Mc(F)?F
(3)
f2=Ms(F)?F
(4)
其中:Ms(F)、Mc(F)分別為基本通道和空間注意力模塊操作; ?特征圖加權乘法運算符號.
操作過程詳見文獻[16], 具體計算式為
Ms(F)=σ(γ7×7([AvgPool(F), MaxPool(F)]))
(5)
Mc(F)=σ(MLP(AvgPool(F)))+σ(MLP(MaxPool(F)))
(6)
其中:σ表示Sigmoid函數; MLP表示二層的共享全連接層; AvgPool、 MaxPool分別表示平均池化和最大池化定;γ表示卷積操作.
利用圖2所示的實驗平臺, 每個相電壓采樣400個數據點, 采樣頻率50 Hz. 對于每個故障狀態采集800樣本, 共有22種故障運行狀態, 共17 600個樣本. 數據按訓練集∶驗證集∶ 測試集=7∶2∶1的比例劃分, 并對訓練集樣本進行隨機順序打亂. 所有實驗獨立運行10次, 實驗結果取10次平均值.
3.2.1消融實驗
為了評估不同連接方式的注意力機制對ResNet18網絡性能的影響, 本研究選取ResNet18、 未加入CBAM的雙特征融合模型CBP_ResNet18、 單獨加入通道注意力的CAM_ResNet18、 單獨加入空間注意力的SAM_ ResNet18、 加入正向串聯連接的注意力的CBAM_ResNet18、 反向串聯連接的注意力R_CBAM_ResNet18和本研究所提出的P_CBAM_ResNet18網絡模型進行對比, 采用診斷精確率來評估模型的有效性. 實驗選用 Adam 優化器, 初始學習率為0.001, 最終平均診斷精度和時間如表2所示. 驗證集的準確率如圖7所示.

表2 ResNet18嵌入各注意力模塊的實驗結果

圖7 驗證集準確率Fig.7 Verification set accuracy
由圖7和表2可知, 相比于ResNet18模型診斷結果, 只對ResNet18使用緊湊雙線性池組合時, 準確率并無提升, 但嵌入注意力機制后準確率均得到明顯提升. 其次, 不同連接方式的注意力機制精度不同, 說明通道注意力機制和空間注意力機制的連接順序對模型精度有影響, 本研究提出的并行注意力模塊P_CBAM的表現最優, 其診斷準確率達到99.80%, 比ResNet18提高2.88%, 比串行注意力模塊提高1.15%. 因此, 采用并行連接的CBAM能夠有效提高故障的診斷準確率.
從表2中診斷時間可以看出, 單次診斷時間為0.017 3 s, 可為逆變器發生開路故障后的故障類型和器件進行快速定位.
3.2.2魯棒性實驗結果對比分析
在實際工況中, 三相電壓逆變器的電壓會受到外部噪聲的影響. 為了進一步驗證本研究所提出的網絡模型的泛化性和魯棒性, 在原始的數據中加入不同比例的噪聲作為實驗數據. 將本研究模型與以下4種模型進行對比, 分別是: 以原始三相電壓數據作為輸入的貝葉斯網絡(1D_BYS)、 基于時域分析的一維卷積神經網絡(1D_ CNN)、 以MTF轉換的數據作為輸入的MTF_ResNet18和直接將原始數據進行平鋪成方陣的2D_P_CBAM_ResNet18. 診斷準確率如圖8所示.

圖8 各算法在不同噪聲的識別準確率Fig.8 Recognition accuracy of each algorithm in different noises
從圖8可見, 雖然隨著信噪比的降低, 5個模型的平均精度均呈下降趨勢, 但當信噪比降至-4~-8 dB時, 其他算法都有較大的波動, 而本研究提出的方法準確率都在90%以上, 診斷效果穩定. 在不同信噪比下, MTF轉換圖像的平均診斷精度相比于直接平鋪成2D數據, 提高1.375%; ResNet18加入并行注意力的平均診斷精度相比ResNet18, 提高2.88%. 這兩組數據對比分析可知, MTF轉換和并行注意力機制均可有效提高模型的診斷精度和魯棒性. 這主要歸功于MTF可以有效保留原始數據的故障、 注意力機制可以通過計算位置信息和通道特征權重來挖掘關鍵故障特征, 并且抑制無用的噪聲干擾特征.
本研究以三相電壓源逆變器電壓信號作為故障診斷信號, 采集22種不同故障狀態下的電壓數據, 對原始數據進行馬爾可夫變換, 然后將轉變后的二維圖像數據輸入到P_CBAM_ResNet18進行故障識別. 消融實驗和魯棒性實驗結果驗證數據轉換和改進注意力模塊對提升模型精度和魯棒性的有效性. 與其他方法相比, 基于MTF變換和P_CBAM_ResNet18三相電壓源逆變器故障診斷方法優勢在于以下幾點.
1) MTF圖像轉換的預處理方法可以保留原信號內的時間特征, 減少信息損失.
2) 所提出的P_CBAM_ResNet18故障診斷方法, 可實現故障特征自動提取, 避免特征提取對經驗的依賴. 同時, 解決基本注意力串行連接時兩種注意力產生干擾的問題, 減少外部噪聲對診斷結果的干擾, 提高模型的診斷精度, 具有良好的魯棒性.