路士杰,董馳,顧朝敏,鄭寶良,劉兆宸,謝慶,謝軍
(1.國網河北能源技術服務有限公司,石家莊050400;2. 國網河北省電力有限公司電力科學研究院,石家莊 050021;3. 科暢電氣有限公司,河北 保定072558;4. 新能源電力系統國家重點實驗室(華北電力大學),河北 保定071003)
變電主設備正常運行是保證電力系統安全可靠運行的重要基礎[1 - 2]。局部放電現象作為引起絕緣性能降低甚至劣化的關鍵因素[3 - 4],對局放類型的精準辨識可以為電力設備健康狀態評估提供可靠的參考信息,及時消除故障,預防事故發生[5]。
人工智能技術隨著其高速發展在變電設備故障診斷領域也得到了廣泛的應用,傳統的機器學習算法[6 - 8]本質上屬于淺層學習,難以挖掘局放信號的高維特征,造成局放信號模式識別準確率偏低。深度學習因其優越的數據特征挖掘能力在局部放電故障診斷領域快速發展[9 - 11]。基于深度學習的局放信號模式識別模型對局放信號樣本的類間均衡度有較強的需求[12],樣本數量過少會帶來模型訓練過擬合甚至訓練過程不收斂等問題,樣本不均衡會導致模式識別結果偏向于多數類樣本,對少數類樣本識別效果不佳[13]。由于局部放電是偶發故障,樣本數量匱乏且類型分布極不均衡,造成局放故障漏判、模式識別準確率偏低等情況[14],限制了基于深度學習的局放信號模式識別模型的識別效果及泛化能力。
針對局放信號模式識別中樣本數量少、類型分布不均衡的現狀,通常采用數據增強的方法來提高分類器訓練效果和泛化能力。傳統數據增強方法包括欠采樣、過采樣以及圖形變換[15 - 17],這類方法忽略了數據集整體分布特征,在模型分類效果上提升有限[18]。近年來,基于深度學習的數據增強方法被廣泛應用于局放信號數據增強中。變分自編碼器(variational autoencoder, VAE)是一種深度隱空間生成模型,可以有效提取局放信號內在表達,但生成的局放信號圖像較為模糊,多樣性較差[19]。生成對抗網絡(generative adversarial network, GAN)能在沒有任何先驗假設的情況下,通過無監督學習獲得數據間的潛在分布規律并生成新的局放樣本[20],包括條件生成對抗網絡(conditional GAN, CGAN)以及Wasserstein生成對抗網絡(Wasserstein GAN, WGAN)[21]。傳統GAN模型雖然能夠生成局放樣本,但其對噪聲非常敏感,由于其選用了JS散度衡量生成數據與原始數據的距離,如果初始輸入噪聲的分布選擇不當,導致生出數據的概率分布與真實數據集的概率分布不相重合,則生成器的損失函數恒為常數,即遇到了梯度消失的情況,整個訓練無法進行。深度卷積生成對抗網絡(deep convolutional GAN, DCGAN)使用卷積層代替了全連接層,利用卷積核提取局放信號特征進行數據增強,但沒有從根本上解決訓練不穩定的問題,在訓練過程中需要小心平衡生成器與判別器的訓練進程[22]。邊界平衡生成對抗網絡(boundary equilibrium GAN, BEGAN)[23]將自編碼器作為生成模型的判別器,并引入了平衡策略,可以加速網絡的收斂過程,但生成局放信號多樣性較差。
針對上述難題,本文提出適用于局放模式識別的WGAN-GP數據增強方法,將Wasserstein距離作為目標函數、并引入梯度懲罰項來滿足1-Lipschitz條件限制,解決了GAN中因為分布不重疊帶來的梯度消失問題,生成的數據樣本相似性更高、多樣性更豐富,實驗結果表明,基于WGAN-GP數據增強的局部放電故障模式識別具有更高的準確率。
設計4種放電模型如圖1所示,用以模擬變壓器常見絕緣缺陷。尖端放電、沿面放電、懸浮放電中紙板厚度均為2 mm,氣泡放電模型中氣泡結構由厚度分別為0.5、2、0.5 mm的3層紙板組成。

圖1 4種局放絕緣缺陷模型Fig.1 Four models of partial discharge(PD) insulation defects
采用高頻電流法測量局放脈沖,試驗電路如圖2所示。實驗時采樣頻率為100 MHz,連續采集100個工頻周期放電信號作為一個長時信號樣本。

圖2 局部放電實驗平臺接線圖Fig.2 Wiring diagram of PD test platform
為了進一步提高局放信號質量,本文提出自適應加權分幀快速稀疏表示去噪方法[24],該方法幅值誤差及波形畸變均較小,采用該方法對局放樣本降噪,并進行脈沖分提取操作,得到的4種局放脈沖放電信號波形圖如圖3所示。

圖3 局部放電信號波形圖Fig.3 Waveforms of partial discharge
WGAN-GP的結構示意圖如圖4所示。

圖4 WGAN-GP結構示意圖Fig.4 Structure diagram of WGAN-GP
基于WGAN-GP的局部放電數據增強方法在GAN局放信號增強模型的基礎上引入了Wasserstein距離,其距離公式如式(1)所示。
(1)

式(1)中期望的下確界不易求得,于是可以將Wasserstein距離轉化為Kantorovich-Rubinstein對偶形式,Wasserstein距離的對偶形式如式(2)所示。
(2)
式中:D(x)為判別器D的距離代價函數;‖D‖L≤1表示判別器距離代價函數滿足1-Lipschitz限制。WGAN-GP在WGAN的基礎上加入了梯度懲罰函數以滿足1-Lipschitz限制,其損失函數如式(3)所示。
(3)

基于WGAN-GP的數據增強方法具體訓練流程如下:
1)固定生成器G的各項參數,根據式(3)調節判別器參數θD以最小化判別器損失函數LD;
2)固定判別器D的各項參數,調節生成器參數θG使式(3)中損失函數LG最小;
3)循環迭代上述兩個步驟,直到達到訓練網絡實現納什均衡即停止訓練。
可利用WGAN-GP網絡生成相似于原始數據概率分布的局放時域樣本,擴充后的數據庫作為樣本集訓練分類器提高其識別準確率,實現局放信號數據增強。基于WGAN-GP數據增強的局部放電模式識別方法框架如圖5所示,其主要步驟如下:
1)局放信號預處理:對實驗采集的局放信號進行去噪及脈沖提取;
2)數據增強:以局放脈沖信號作為樣本,輸入WGAN-GP網絡,按照訓練流程訓練生成網絡;
3)模式識別:擴充原始樣本庫并訓練分類器,實際應用時,將信號進行去噪及脈沖提取,將局放脈沖經分類器判斷局部放電類型,實現模式識別。

圖5 基于WGAN-GP數據增強的局部放電模式識別框架Fig.5 Framework of PD pattern recognition based on WGAN-GP data enhancement
經反復調試,確定判別器選用4層神經網絡結構,生成器采用5層神經網絡結構,WGAN-GP網絡結構參數如圖6所示。優化求解器選用Adam,生成器與判別器學習率設置為0.001,訓練輪次為4 000次。
為模擬現場環境中局放信號的非平衡小樣本特性,將實驗得到的局放信號數據切分成如表1所示。采用基于WGAN-GP的局放數據增強方法擴充局放信號樣本庫,增強后的局放信號樣本庫如表2所示。

圖6 WGAN-GP網絡結構參數Fig.6 Network structure and parameters on WGAN-GP

表1 數據增強前局放信號樣本庫Tab.1 PD sample library before data enhancement

表2 數據增強后局放信號樣本庫Tab.2 PD sample library before data enhancement
生成樣本的真實性、概率擬合精度以及樣本的多樣性都是評價模型生成能力的重要指標。本文納入BEGAN、VAE兩種生成模型作為參照對象,對3種生成模型生成能力進行評估。
相較于以時頻譜圖等非結構化數據作為樣本輸入來說,以局放時域信號作為樣本輸入生成網絡的好處是輸出同樣是時域樣本,省去了人工提取特征的不確定性,結果更簡潔直觀。以氣泡放電為例,分別用WGAN-GP、BEGAN與VAE 3種生成模型生成局放信號,其波形對比如圖7所示。

圖7 生成局放信號波形對比圖Fig.7 Comparison diagram of generated waveforms
觀察圖7可知,相對于真實樣本,BEGAN會在原始圖像上疊加許多微小波動,尤其是在極值點處容易失真;VAE相對比較平滑,但是丟失了許多原始信號存在的波動,極值點處的幅值與原始信號相差較大。本文選用的WGAN-GP在細節上與原始信號波形更為相似。
將上述真實樣本及各類模型生成的局放樣本進行FFT變換,得到各局放信號二維時頻圖,采用感知哈希算法對時頻圖相似度進行分析,并以指紋匹配比例作為相似度指標,匹配比例越高表明兩樣本相似度越高,結果對比如表3所示。

表3 不同生成模型生成樣本相似度指標Tab.3 Similarity index of PD samples generated by different models
由表3可知,VAE的生成樣本由于丟失了部分波動,其時頻圖相似度指標普遍較低;BEGAN的懸浮放電由于發生了模式崩塌,生成波形時頻圖相似度指標最低;WGAN-GP生成的各類局放信號相似度指標及其均值均最大,其波形與原樣本相似度最高。
以沿面放電為例,利用t-分布隨機鄰域嵌入算法(t-distributed stochastic neighborembedding,t-SNE)對真實樣本及各模型的部分生成樣本進行降維分析,可視化結果如圖8所示。由圖8可明顯看出,BEGAN與VAE兩模型生成的樣本集中于臨近真實樣本的某一小范圍內,而CWGAN-GP由于考慮了1-Lipschitz條件限制,生成樣本散落分布在真實樣本分布范圍內,多樣性較好。

圖8 局放信號降維可視化Fig.8 Dimension reduction visualization of PD signals
本文選用分類準確率λaccuracy%、F1度量λF1%兩種指標評價增強前后局放信號模式識別的效果,計算公式見文獻[25]。
為驗證數據增強技術對于局部放電模式識別性能的影響,分別選用了支持向量機(support vector machine,SVM)以及稀疏自編碼器(sparse autoencoder,SAE)作為分類器。其中支持向量機選用13-1000-400-1的全連接結構,激活函數選用ReLU函數;稀疏自編碼器采用13-5000-400-1的網絡結構。WGAN-GP增強后分類器模式識別效果如表4所示,其中增強前局放信號樣本庫如表1所示,增強后局放信號樣本庫如表2所示。

表4 數據增強前后模式識別效果Tab.4 Pattern recognition effects before or after data enhancement
通過對比表4各分類器數據增強前后的評價指標可明顯看出,經WGAN-GP數據增強后,支持向量機的分類效果得到提升,λaccuracy%、λF1%分別提升了12.9%與13.3%。稀疏自編碼器的分類效果更加顯著,λaccuracy%、λF1%分別提升了3.54%與7.04%。實驗表明,本文所提數據增強方法適用于SVM、SAE分類器,各分類器的分類準確率均有所提升。
針對局放樣本集合非平衡小樣本特點導致局放模式識別準確率低的問題,本文提出了適用于局放模式識別的WGAN-GP數據增強方法,結論如下。
1)基于Wasserstein距離的生成對抗網絡具有良好的局放信號生成能力,生成的局放信號相比于傳統生成網絡具有更高的相似度和更豐富的多樣性。
2)經WGAN-GP數據增強對分類器具有適用性,數據增強后的支持向量機針對局放信號的分類準確率上升了12.9%,稀疏自編碼器在數據增強后針對局放信號的分類準確率提升了3.54%。