齊振興, 張倩, 丁津津, 李國麗
(1.安徽大學電氣工程及自動化學院, 合肥 230601; 2. 安徽大學工業節電與電能質量控制協同創新中心, 合肥 230601; 3. 教育部電能質量工程研究中心(安徽大學), 合肥 230601; 4. 國網安徽省電力有限公司科學研究院, 合肥 230601;5. 工業節電與用電安全安徽省重點實驗室(安徽大學), 合肥 230601)
輸電線路是配電網的主要組成部分,電力通過輸電線路從發電站傳輸到用電站。隨著能源和電力系統的發展,電網的拓撲結構和運行方式也越來越復雜,以及用戶對安全、可持續和電能質量需求的提高,大大增加了電力系統的復雜性。一旦發生故障,將造成難以估量的危害[1]。而基于傳統的機理模型分析方法需要大量的先驗知識[2],在復雜的大電網結構下,無法建立機制模型。因此,如何及時精準地實現故障診斷,是亟待解決的問題。
在電網發生故障時,其中暫態分量幅值比穩態分量幅值更大[3],故障特征也更加突出,在已有研究中,多是對于暫態電流信號進行特征分析。文獻[4]通過在電線設置不同測量點,計算相鄰測點零序電流的相似性指標,從而實現故障識別,但該方法只適用于線路分支較多、線路較短的風電場景,適用性不強。近年來,人工智能算法的興起,如專家系統[5]、貝葉斯網絡[6]、Petri網[7]、人工神經網絡[8]等,在電網故障診斷領域已有了廣泛的應用,文獻[9]利用蟻群優化算法對Elman神經網絡進行優化,進而通過神經網絡實現故障測距。文獻[10]將離散小波變換與人工神經網絡相結合,實現電網故障區段識別。卷積神經網絡(convolutional neural network,CNN)[11-12]作為深度學習中的經典模型,能夠挖掘數據間深層次的特征,從大量樣本數據中提取故障特征并且自動分類。文獻[13]利用CNN算法對配電網區間內外進行故障類型的識別以及故障選線。文獻[14]利用CNN自動提取數據間的時序特征,實現端到端的暫態穩定性評估。綜上所述方法,在一定程度上實現了故障分類,但是當配電網的拓撲結構變化時,新場景下的目標域數據和源域數據存在特征差異性,機器學習效率大大降低,不能精準地分類預測。
為了提高深度學習模型的泛化性,引用遷移學習[15]的思想,它能夠將不同域的數據進行充分提取,并將提取到的特征遷移到目標域中,提高了模型預測精度。文獻[16]將遷移學習引入牦牛的圖像識別,將訓練好的CNN模型權重遷移到目標域模型中,提高了識別速度。文獻[17]將訓練完成的CNN預訓練模型遷移到新場景中,實現了線路故障選相。但上述方法需要不同域間的數據相似度盡可能高,分布差異性小。為此,現引入半監督遷移成分分析(semi-supervised transfer component analysis,SSTCA)方法[18],將不同域間的數據映射到Hilbert空間中,在核空間中采用希爾伯特-施密特獨立性系數衡量嵌入空間中數據和標簽的依賴關系,保留局部幾何結構,提高數據間的相似性。最后利用CNN對映射后的特征數據集進行故障分類訓練,從而完成了配電網目標域故障定位任務,解決跨域間深度學習模型精度無法提高的問題。
實際配電網發生的故障大部分為小電流接地故障,而小電流接地故障產生的暫態零序電流幅值遠大于穩態零序電流值,且不受消弧線圈的影響。以圖1中性點不接地配電網零序等效網絡來分析故障時的零序電流特征。

uk0為故障點零序虛擬電壓源,數值上等于故障點暫態零序電壓;非故障線路用電容來等效,CIu0、CId0、CⅡ0、CⅢ0、Cs0分別為故障點線路對地電容;線路Ⅰ發生接地故障,ik0為線路故障線路暫態零序電流,ihⅡ0和ihⅢ0分別為非故障線路暫態零序電流圖1 中性點不接地配電網零模等效網絡Fig.1 Zero-mode equivalent network of the neutral ungrounded distribution network
根據圖1,對于非故障線路j,暫態零序電壓u0(t)與電流ij0(t)滿足關系式為

(1)
式(1)中:Cj0為非故障線路電容。
故障線路k的暫態零序電壓u0(t)與電流ik0(t)滿足關系式為

(2)
式(2)中:Cb0為所有非故障線路電容與母線及其背后系統分布電容之和。
由式(1)、式(2)可知,非故障線路出口暫態零序電流為本線路對地分布電容電流,而故障線路出口暫態零序電流為其背后所有非故障線路暫態零序電流之和。所以故障線路的暫態零序電流幅值較大,且極性與非故障線路相反。因此以各線路的零序電流作為研究對象,分析故障線路與非故障線路之間零序電流的特征差異性,從而實現對配電網的故障診斷。
配電網新增線路的接入、線路節點的變化、電機組的并網都會引起系統拓撲結構和參數的變化,從而導致新拓撲結構下的目標域數據和源域數據存在分布差異性。
為了提高跨領域的學習能力,將源域和目標域的特征樣本集映射到同一特征子空間中,在子空間中縮小數據間的距離。領域自適應過程如圖2所示。

圖2 領域自適應圖Fig.2 Domain adaptive graph
SSTCA是在無監督主成分分析的基礎上增加對標簽的應用改進而來,主要優化目標是在嵌入空間中將源域和目標域數據分布最大程度地對齊、增強標簽與數據間的依賴關系、保留數據的幾何結構。
2.2.1 核函數
當電網拓撲結構改變時,不同域的零序電流信號存在分布不同的情況,為了減少數據間的差異性,構造高斯徑向基核函數Krbf和多項式核函數Kploy,根據Mercer定理對Krbf和Kploy按照不同比例進行加權混合,提升核函數泛化能力,以達到最佳映射的目的。加權混合核函數表達式為
K=λKrbf(xi,xj)+(1-λ)Kploy(xi,xj)
(3)
式(3)中:λ為多核權衡系數;(xi,xj)為不同域的輸入樣本集。
2.2.2 分布匹配
假設源域為XS,目標域為XT,φ(XS)和φ(XT)為經過希爾伯特空間進行映射后的源域和目標域樣本,映射后的距離公式表達式為
(4)
式(4)中:xi∈XS,yj∈XT;n1、n2分別為源域和目標域樣本個數;‖.‖H為RKHS范數。
直接最小化該式來求解,容易陷入局部極小值,為了簡化計算,引入域適應方法——最大均值差異(maximum mean discrepancy,MMD)。將映射函數轉換到核矩陣K上,最后再降維到共享的低維潛在空間,其中核矩陣K表達式為

(5)
式(5)中:K∈(n1+n2)×(n1+n2);KS,S、KT,T為域間的核矩陣;KT,S、KS,T為跨域的核矩陣。

(6)
Dist[φ(XS),φ(XT)]=trace(KL)
(7)
式中:trace表示求矩陣的跡 。

(8)
根據式(7)轉換為
Dist[φ(XSw),φ(XT)]=trace[(KWWTK)L]
=trace(WTKLKW)
(9)
2.2.3 標簽依賴性
HSIC為希爾伯特-施密特獨立性系數,用于度量兩個樣本之間的獨立性,衡量嵌入空間中數據和標簽的依賴關系,表達式為

(10)
式(10)中:X、Y分別為核空間特征樣本和源域特征樣本對應的類別標簽;Kyy為標簽核矩陣。

Kyy=γKl+(1-γ)Kv
(11)
式(11)中:Kv為單位矩陣;Kl為源域樣本矩陣;γ為建立映射后數據和標簽依賴、映射后數據方差兩者之間進行權衡。
若xi、xj均屬于源域,則[Kl]ij=kyy(xi,xj),否則[Kl]ij=0。
2.2.4 局部信息保留
在MMDE中,通過目標核矩陣增加距離限制來保留局部幾何結構,引入了密度矩陣M,元素表達式為

(12)
式(12)中:σ為參數;dij為特征空間中跨域間的距離。

(13)
式(13)中:λ為權衡系數;μ為正則化數據。
CNN作為深度學習中典型的神經網絡,主要由卷積層和池化層構成,本質是卷積網絡中多層濾波器響應不同復雜度的特征,相比較于其他網絡在處理稀疏數據方面表現更好,結構如圖3所示。

圖3 CNN結構原理圖Fig.3 CNN structure schematic
首先,對不同線路的零序電流時序數據進行預處理。其次,通過這些濾波器,輸入數據在前向通道中卷積。

(14)


(15)
式(15)中:?為卷積操作;k為降采樣核。
最后,利用全連接層對上一層的特征信息進行組合排列,得到一個特定的故障診斷向量。向量中的不同索引代表著不同的故障線路,其中索引的數值越大,代表此條線路發生故障的概率就越大。
當配電網拓撲結構變化時,源域和目標域特征分布不均衡,采用加權核SSTCA-CNN故障診斷方法如圖4所示,主要步驟如下。

圖4 基于特征遷移學習流程圖Fig.4 Flow chart of feature-based transfer learning
步驟1搭建配電網故障仿真模型,生成大量帶標簽的零序電流數據;改變模型拓撲結構,在新場景下生成目標域零序電流數據。
步驟2引入SSTCA算法,將源域和目標域的故障樣本集特征映射到Hilbert空間中,降低樣本維度,去除不相關成分,縮小數據間的距離,使得樣本分布更加相似。
步驟3將經過映射篩選后的源域數據輸入到CNN中進行迭代訓練,分別設置不同的CNN網絡結構、卷積核大小、學習率等參數。用映射后的目標域數據作測試樣本,從而完成基于CNN的配電網線路故障診斷。
為了驗證所提方法的準確性,通過仿真生成大量暫態數據與其他數據驅動算法進行評估。為模擬實際電網拓撲結構,在Simulink模塊中搭建 10 kV經消弧線圈接地配電網進行仿真分析,系統接線圖如圖5所示。在這個系統中,共有4條饋線,由電纜線和架空線組合構成,每條線路上均有若干個線路節點,一共有23個節點,22條支路。

圖5 10 kV配電網拓撲結構Fig.5 10 kV distribution network topology
為了模擬實際配電網發生故障的情況,設置系統仿真時長為0.2 s,故障從0.03 s開始到0.16 s時故障切斷,從故障開始前0.01 s開始采樣直到故障切除。在每個故障位置處設置不同故障類型(共10種);并按照等步長對系統電壓、采樣頻率、系統負荷、故障電阻等參數設置不同值,如表1所示。偏歷表上參數一共采集到10 800組零序電流數據,構成帶標簽的訓練數據,作為源域樣本集。

表1 系統參數遍歷表Table 1 System parameter traversal table
CNN模型結構參數的設置,直接影響預訓練模型的準確率和效率。因此設計了4種不同的CNN網絡結構,以序號2為例,第一層網絡卷積核大小為3×3,濾波器數量為16,池化層階數為2×2;第二層網絡卷積核大小3×3,濾波器數量為64,池化層階數為2×2。如表2所示。

表2 CNN模型結構參數Table 2 CNN model structure parameters
由圖6所示,當CNN結構為序號2時,預測效果最好,準確率提升最快,且接近100%正確率,因此選用結構2作為CNN的基本結構。

圖6 不同CNN結構預測效果圖Fig.6 Prediction effect of different CNN structures
考慮配電網重構的情況,改變10 kV配電網模型的拓撲結構。方案1:斷開線路L5,將節點4連接到節點5。方案2:在方案1的基礎上,斷開線路L21的連接。方案3:在方案2的基礎上,為節點11增加一個電機模塊和線路負載。結構如圖7所示,將此3種新場景下采集到的故障數據作為目標域樣本集。

圖7 新場景的仿真模型Fig.7 Simulation model of the new scene
4.4.1 混合核與單核實驗對比
為了方便處理,將源域樣本設為A,目標域樣本分別設為B、C、D。首先對SSTCA算法參數初始化,通過多次實驗對比將內核參數設為10,高斯徑向基函數設為1,正則化參數u設為1,knn取值為5,同時構建加權混合核函數和其他單一核函數進行對比,加權系數λ為0.6。將映射后的源域樣本作為CNN模型的訓練樣本,目標域線路作為CNN模型的測試樣本,不同核函數對比結果如表3所示。

表3 不同核函數對比實驗Table 3 Comparison experiments of different kernel functions
從表3中結果可以看出,混合核的模型測試準確率均比單一核要高,且平均準確率高達98%。因此在源域和目標域樣本分布不均勻時,混合核函數處理效果更好。
4.4.2 混合核SSTCA與其他算法對比
選用A作為訓練樣本,目標域B、C、D分別作為測試樣本的前提下,同時保持CNN模型結構參數不變。
為了測試混合核SSTCA特征映射的性能,分別選用KPCA、PCA算法進行對比實驗,對樣本集映射后的維度均設為30,結果如圖8所示。
從圖8可以看出目標域樣本B、C、D和源域樣本在經過SSTCA特征映射后的CNN分類準確率最高,更符合配電網故障識別高精確率的要求。

圖8 不同特征映射算法對比Fig.8 Comparison of different feature mapping algorithms
選擇源域數據集A作為預訓練模型的輸入,目標域C作為測試集,分別經過混合核SSTCA的特征映射作為模型的輸入。利用CNN對目標域進行預測分類,同時選用深度信念網絡(deep belief network,DBN)和支持向量機(support vector machine,SVM)進行對比實驗,結果如圖9所示。

圖9 不同算法對比Fig.9 Comparison of different algorithms
由圖9可以看出,CNN模型預測效果更好,隨著迭代次數的增多,波形迅速上升,且故障預測準確率接近100%。
提出一種基于特征遷移和深度學習相結合的配電網故障診斷新方法。搭建配電網仿真模型,采集不同線路的零序電流構建故障樣本集。
(1)利用遷移學習的思想,引進加權混合核SSTCA方法完成跨域間的學習任務,通過特征映射縮小源域和目標域之間的距離,提升數據間的相似性。
(2)將映射后數據作為CNN預訓練模型的輸入,保持CNN模型結構不變,分別將SSTCA和其他域適應方法進行對比實驗,測試配電網目標線路的故障類型,結果證明混合核SSTCA-CNN能對目標域故障線路精準定位且效果最好。
(3)最后將CNN模型和其他網絡模型進行對比實驗,結果表明CNN模型在處理大量暫態數據時,預測性能要更好。