王強,陳浩,劉煉
(三峽大學 電氣與新能源學院,宜昌 443000)
電力系統暫態穩定是指電力系統在受到大擾動后,各發電機保持同步運行并過渡到穩定運行狀態的能力[1]。暫態失穩易引發連鎖故障進而導致發生大面積停電事故[2],這不僅造成重大經濟損失,而且對人們的生產、生活產生了不可預估的影響。快速、準確的暫態穩定評估(transient stability assessment,TSA)能及時為系統的緊急控制提供參考依據,對維持系統的安全穩定具有重要意義。
目前,TSA方法主要包括時域仿真法[3-4]、直接法[5-6]和人工智能法。時域仿真法,評估精度高,但由于計算速度的限制,難以應用于在線評估;直接法,能快速提供TSA結果,但評估精度不高,難以應用于復雜的大規模系統。人工智能法以機器學習為核心,它從離線數據中尋求系統狀態參數到暫態穩定結果間的映射關系,基于該映射關系根據系統在線運行數據實現在線TSA,具有計算速度快、評估精度高等優點[7-8]。隨著新一代智能電網的建設,廣域測量系統(wide area measurement system,WAMS)/同步相量測量單元(phasor measurement units,PMU)迅速普及[9],為歷史數據的儲存和在線數據的采集提供了便利,基于機器學習的在線TSA成為了研究熱點[10]。
文獻[4]使用差分進化算法改進極限學習機,提高了TSA模型的準確率和魯棒性。文獻[8]首先使用改進的卷積神經網絡(convolutional neural networks,CNN)和雙向長短時記憶網絡進行特征提取,然后使用LightGBM算法預測系統暫態穩定狀況。文獻[11]采用XGBoost算法進行TSA,并利用注意力系數改進XGBoost算法的損失函數,提高了XGBoost算法的召回率。文獻[12]利用焦點損失函數改進LightGBM算法,提升了在不平衡樣本上的評估精度。文獻[13]采用多個結構相同、參數不同的CNN進行TSA,評估結果綜合多個CNN模型的分析,并對評估結果為不確定的樣本采取時域仿真進一步分析。
隨著現代電力系統迅速發展,在該領域的研究中仍面臨著以下問題:①現代電力系統的規模更大,需獲取的狀態參數特征迅速增加,分類器易陷入“維數災難”[14],另外過多的冗余特征、無關特征,將損害TSA模型的泛化能力;②隨著大規模新能源并網以及新裝置的不斷應用,電力系統的運行環境更加復雜、不確定性因素更多,這對TSA模型的精確性和泛化能力提出了更高要求;③由于設備故障、測量數據的遠距離傳輸導致出現數據錯誤,常規TSA模型的魯棒性可能無法滿足要求。
針對以上問題,提出一種結合最大相關最小冗余(maximal relevance and minimal redundancy,mRMR)[15-16]集成方案和多個CatBoost(unbiased boosting with categorical features)[17-18]分類器的TSA方法。首先,運行多個mRMR特征選擇過程,充分挖掘輸入特征與暫態穩定結果間的隱含關系,篩選出多個不同關鍵特征集;然后,訓練多個CatBoost模型,并綜合多個CatBoost模型的分析。最后,在IEEE 39節點系統和某省級電力系統上進行了性能測試實驗,并驗證了所提TSA方法的有效性。
應用機器學習算法來建立系統狀態參數到暫態穩定結果間的映射關系,首要任務是確定輸入特征和構建暫態穩定結果標簽。
在基于機器學習的TSA建模中,輸入特征分為兩類[11]:第一類輸入特征由故障前和故障后的電氣量特征構成;第二類輸入特征由故障前的電氣量特征構成。故障前的特征可在電力系統穩態運行時監測到,而故障后的特征只有在故障發生后才能監測到,系統的暫態過程極為短暫,這給電網操作人員的反應時間極短。而根據系統的穩態運行信息,預測系統的暫態穩定性,電網操作人員能夠擁有更加充足的時間分析當前系統的運行狀況,并能及時為后續控制措施的制定提供依據,所以采用第二類輸入特征進行建模。
如表1所示,列出了能夠反映電力系統的暫態穩定狀況的部分穩態運行電氣量信息。并且選擇使用這些電氣量信息來構建輸入特征集D。

表1 電氣量特征
對于故障前的TSA,使用電力系統的暫態穩定裕度(transient stability margin, TSM)來量化從當前工作點到穩定邊界的距離,常用的TSM表示方法有擴展等面積準則法、能量函數法、極限切除時間法等。在極限切除時間法中,故障后的極限切除時間(critical clearing time,CCT)能夠反映電力系統的暫態穩定性,CCT越長則系統保持暫態穩定的能力越強,如果實際切除時間(actual clearing time,ACT)小于CCT,可認為系統能夠穩定運行,否則認為系統不穩定。因此,將事故i下的TSM定義為
(1)
式(1)中:CCTi為電力系統某個位置在事故i下的CCT;ACTi為故障點在事故i下的ACT;TSMi取值為(-1 1),因此,暫態穩定結果標簽可構建為
(2)
2.1.1 mRMR準則
互信息常用于評價兩個隨機變量間的相關性,互信息值越高則表示這兩個隨機變量的相關性越大。若對于兩個離散的隨機變量X與Y,其聯合概率密度函數為P(x,y),邊緣密度函數為P(x)、P(y),則互信息MI(X,Y)可定義為
(3)
基于互信息原理,關鍵特征集S與暫態穩定結果間的最大相關性、關鍵特征集S中所有特征的最小冗余性可分別定義為
(4)
(5)
式中:|S|表示關鍵特征數目;MI(Fi,y)為特征Fi與暫態穩定結果y間的互信息值;MI(Fi,Fj)為特征Fi與特征Fj間的互信息值。
mRMR的目標是最大化特征與暫態穩定結果間的相關性、最小化不同特征間的冗余性。通過對相關性和冗余性的權衡,并將式(4)與式(5)組合建立關鍵特征集S的mRMR準則為
maxΦ(U,R),
Φ=U-R
(6)
2.1.2 增量搜索算法
在應用中,mRMR采用增量搜索算法[16]選取式(6)中Φ(·)所定義的最優近似特征。因而,采用增量搜索算法進行特征選擇的具體流程如下。
步驟1定義關鍵特征集合S;
步驟2根據式(3)計算每個特征Fi與暫態穩定結果間的相關性,并按相關性大小排序,選擇與暫態穩定結果最相關的n(n≥1)個特征作為第一選擇特征,將其添加到集合S中。
步驟3在已選特征的基礎上,對于剩余特征,根據式(6)中的mRMR標準選擇下一個特征Fj,可表示為
(7)
步驟4將步驟3選擇的特征Fj添加到集合S中,重復步驟3直到得到所需特征數目的關鍵特征集S。
采用一種mRMR集成方案,其示意圖如圖1所示,在該過程中,并行生成m個不同的mRMR特征選擇過程。每個特征選擇過程首先選取不同的第一選擇特征。隨后,運行m個不同的增量搜索算法,篩選出m組不同的關鍵特征集。不同關鍵特征集間相互補充,增強TSA模型的魯棒性。

圖1 mRMR集成方案示意圖
CatBoost算法是梯度提升決策樹(gradient boosting decision tree,GBDT)框架下的新型改進算法。它將對稱決策樹作為基學習器,對稱決策樹的對稱結構使其參數更少、訓練和測試速度更快。并且,在算法訓練中采用排序提升方法來避免標準GBDT模型所存在的梯度偏差問題,進而提升了算法的準確性和泛化能力,保證了TSA的可靠性。
3.1.1 CatBoost的整體迭代過程
在模型訓練中,每輪迭代生成一個弱學習器,并讓本輪迭代的損失函數最小。假設損失函數為L[y,f(x)],每輪迭代的目標函數ht可定義為
(8)
式(8)中:ht是從一系列H函數中選擇的樹;E為期望函數;Ft-1(x)為上一輪迭代中所獲得的強學習器。
(9)
隨后,得到本輪迭代的強學習器為
F(x)t=F(x)t-1+αht
(10)
式(10)中:α為學習率,即模型更新的步長。
3.1.2 排序提升
在迭代過程中,GBDT算法使用相同的訓練樣本計算在每輪迭代的梯度,并將式(9)表示為
(11)
式(11)中:n為訓練樣本數目;{xk,yk}為第k個訓練樣本,k=1, 2,…,n,其中yk∈{0,1}。
因此,這導致根據訓練樣本計算得到的梯度分布gt(xk,yk)|xk與數據空間中梯度的真實分布gt(x,y)|x相比存在偏差[17-18]。根據式(11)求得的目標函數ht就與式(8)中ht的定義產生了偏差,進而影響最終模型F(x)的準確性和泛化能力。
CatBoost算法則采用了排序提升方法來進行梯度的無偏計算,其基本原理為:對于每一個樣本xi,都使用不包含樣本xi的訓練集單獨訓練一個模型Mi,并使用模型Mi來計算樣本xi上的梯度。同時,文獻[17-18]證明了排序提升方法的有效性。
為最大限度地提升TSA模型的精確性,采用多個不同的關鍵特征集分別單獨訓練多個CatBoost分類器,然后將它們集成到暫態穩定分析中,并提出TSA綜合評估模型,其示意圖如圖2所示。

圖2 TSA綜合模型示意圖
構建TSA綜合模型的具體流程為:通過采用mRMR集成方案,從輸入特征集中選取m組不同的關鍵特征集。以這m組關鍵特征集和相應的暫態穩定結果標簽作為輸入,分別對m個CatBoost算法進行訓練和測試,并將訓練好的CatBoost模型結合構建TSA綜合模型。每個CatBoost模型的輸出分別為:y1、y2、…、ym,根據多數投票表決方式得到最終輸出結果。
基于多層CatBoost分類器的TSA流程圖(圖3),包括離線訓練、在線應用及模型更新。

圖3 TSA流程圖
離線訓練步驟如下。
步驟1根據電網公司所儲存的PMU歷史監測數據和預想事故集的模擬仿真獲取樣本集。其中,PMU歷史監測數據包含了電力系統實際存在的運行狀態和大擾動事故下的安全信息;基于預想事故集的模擬仿真,針對每個故障,應考慮系統的網絡拓撲變化、負荷波動以及發電機出力變化等因素的影響,盡可能覆蓋更多的電力系統潛在運行行為。
步驟2采用mRMR集成方案進行特征選擇。在該步驟中,生成多個不同的mRMR特征選擇過程,篩選出多組不同的關鍵特征集。
步驟3將多組關鍵特征集和相應的暫態穩定結果標簽作為訓練樣本,訓練多個CatBoost模型,并結合不同的CatBoost訓練模型構建TSA綜合模型。
根據WAMS提供的電力系統在線運行數據,結合mRMR特征選擇結果選取出相應的電氣量特征輸入訓練好的CatBoost模型,然后對多個CatBoost模型的分析結果進行綜合,得到最終的評估結果。若判定為不穩定則提示電網操作人員對系統運行狀況進一步分析,考慮是否采取必要的控制措施,避免出現連鎖故障和發生大面積停電事故。
電網在實際運行中受到多種因素的影響。如電網緊急事故、經濟調度以及檢修計劃等會導致電力網絡拓撲結構的變化;對于負荷需求,天氣和季節是一個重要影響因素;同時隨著大規模新能源并網以及分布式發電技術的發展,根據實際電網的需求會造成發電機/負載功率分布的變化。因此,僅靠離線訓練無法覆蓋電網所有可能存在的運行行為,為不斷完善TSA綜合模型的內容,進行更新步驟是必要的。
考慮上述影響因素,在系統出現故障、以及運行狀態發生顯著變化時,通過PMU裝置對電力系統運行數據實時采集,并選擇關鍵特征對CatBoost模型再訓練。
分別在IEEE 39節點系統和某省級電力系統上進行性能測試實驗,以驗證所提出的TSA綜合模型的有效性。所有測試在一臺裝有Intel Core i5 處理器和8 GB內存的計算機上進行。mRMR集成算法使用R語言mRMRe包搭建。CatBoost算法在Jupyter環境下基于Python開源機器學習庫catboost 0.24.2構建設置基學習器數目為300,最大深度為5,學習率為0.05。
IEEE 39節點系統的拓撲圖如圖4所示,該系統由39條母線、10臺發電機(G1~G10)和46條輸電線路組成。

圖4 IEEE 39節點系統拓撲圖
5.1.1 樣本集的生成
使用PSS/E軟件進行仿真,并調用Python程序控制PSS/E軟件進行仿真數據的自動收集。發電機設置為GENROU模型,負載采用恒阻抗模型,使負載在70%~130%范圍隨機波動,并相應調整發電機出力大小來模擬出不同的運行方式。記錄每種運行方式下的穩態運行參數信息,針對不同運行方式,在節點、線路的不同位置設置三相短路接地故障,并計算不同故障的CCT。由于實際中存在樣本不平衡情況,在隨機剔除部分不穩定樣本后,收集到4 152個樣本(包括:3 062個穩定樣本,1 090個不穩定樣本),每個樣本包含660個電氣量特征和一個相應的暫態穩定結果標簽。
為保證測試結果的客觀性,將80%的樣本用于訓練,20%的樣本用于測試,采用5倍交叉驗證法重復實驗,取5次測試結果的平均值。
5.1.2 模型性能評價指標
針對不穩定樣本漏判和穩定樣本誤判的代價差別,使用準確率Acc和召回率Rec指標來衡量訓練模型的好壞。準確率和召回率的定義為
(12)
(13)
式中:TP為不穩定樣本被正確分類的數量;TN為穩定樣本被正確分類的數量;FP為穩定樣本被錯誤分類的數量;FN為不穩定樣本被錯誤分類的數量。
根據定義可知,準確率為所有樣本中被正確分類的比例,召回率為不穩定樣本中被正確分類的比例。
5.1.3 基于mRMR集成方案的特征選取
mRMR算法選擇的關鍵特征數目與CatBoost分類器的準確率、訓練時間的變化關系圖,如圖5所示。可以看出,在選取150個關鍵特征時準確率達到最大值,之后特征數目的增加準確率不再升高,而且略有下降。另外訓練時間與特征數目成正比,在特征數目減少時,訓練時間也隨之降低。因此,使用mRMR算法來剔除冗余特征、無關特征,降低特征空間維數,有助于提高計算效率和增強模型的泛化能力。

圖5 不同關鍵特征數目的訓練時間和準確率
mRMR集成方案設置為5個mRMR特征選擇過程(m=5),每個過程分別選擇150個關鍵特征。如表2所示,給出了mRMR集成方案選擇的部分關鍵特征。

表2 mRMR集成方案特征選擇結果
5.1.4 不同模型性能比較
使用仿真所獲得的樣本對支持向量機(support vector machine, SVM)模型、決策樹(decision tree, DT)模型、深度神經網絡(deep neural networks, DNN)模型、XGBoost模型、單個CatBoost模型以及TSA綜合模型進行TSA評估。其中,SVM模型采用高斯核函數,并通過交叉驗證法和網格法尋找最優的懲罰因子C和核參數γ;DT模型設置為默認參數;DNN模型包含5個隱含層,每層神經元數依次為300-200-150-100-50;XGBoost模型采用與CatBoost模型相同的參數。不同模型的測試結果如表3所示。
由表3可知,TSA綜合模型的準確率為0.995、召回率為0.997,遠高于另外5種評估模型。由于使用多個不同的關鍵特征集訓練多個CatBoost模型,能夠充分挖掘輸入特征與暫態穩定結果間的映射關系,進而提高了TSA的精確性。另外,對于SVM模型,在小規模系統上通常具有較好表現,但當系統規模過于龐大時,將耗費大量的機器內存和運算時間;對于DT模型,當樹的深度很大時,會建立過于復雜的規則,這易導致模型出現過擬合;DNN模型的計算成本過高,且存在黑箱問題,其做出判斷的機理難以被解釋;XGBoost模型實現了大規模并行梯度提升,但仍然存在梯度偏差問題,在泛化能力上不如CatBoost模型;CatBoost模型有效解決了梯度估計偏差問題,在預測精度上也具有一定的優勢。

表3 IEEE 39節點系統上的測試結果
5.1.5 泛化能力測試
考慮實際運行中的電力網絡拓撲結構變化、發電機/負載功率分布變化以及負載特性變化,并將系統運行狀態改變后生成的新樣本用于測試,以驗證TSA綜合模型在新樣本中的適應能力。
(1)拓撲結構變化。將原來電力網絡的完全拓撲結構改變為相應的N-1、N-2、N-3拓撲結構,如表4所示。相應的測試結果,如圖6所示。

圖6 不同拓撲結構變化測試

表4 不同拓撲結構變化類型
(2)發電機/負載功率分布變化。不同發電機/負載功率分布變化的測試結果如表5所示,變化范圍與原始分布相對應。

表5 不同發電機/負載功率分布變化測試
(3)負載特性變化。設I為恒電流負載占比,Z為恒功率負載占比,其余為恒阻抗負載。不同負載特性變化下的測試結果如表6所示。

表6 不同負載特性變化測試
根據圖6、表5、表6可知,所提出的TSA綜合模型能夠為電力系統多變的運行環境提供理想的預測精度,并證明了該模型具有較強的泛化能力。
5.1.6 魯棒性分析
由于設備故障、測量數據的遠距離傳輸等,可能導致引入數據噪聲或異常值,實際中評估模型需具備較強的魯棒性。在測試中,通過在樣本集中添加不同數目的無關特征來評估TSA綜合模型的魯棒性,添加無關特征的數目分別為50、75、100、125、150,其中所添加的無關特征為高斯白噪聲,相應的測試結果如圖7所示。
根據測試結果(圖7)可知,添加無關特征確實會影響評估的精確性,但在添加無關特征數目為150個時,TSA綜合模型的準確率為0.965、召回率為0.963,仍然具有可接受的預測精度,表明TSA綜合模型具備較好的魯棒性。這是由于TSA綜合模型在基于mRMR的特征選擇過程中,能夠剔除了無關特征,并選擇出關鍵特征用于模型的訓練和測試,這能一定程度上減少了數據噪聲對預測結果的影響。另外,在訓練中所采用的排序提升方法也有助于對抗樣本集中的異常值[17-18]。

圖7 不同無關特征下的測試結果
為了進一步驗證論文所提評估方法的有效性,將TSA綜合模型應用于某省級電力系統,該系統包含2 036條母線、149臺發電機、761條交流輸電線路和1條直流輸電線路,其500 kV主網框架圖如圖8所示。在實際區域電力系統中,大多數停電事故通常與特高壓輸電線路和超高壓輸電線路有關,而低壓輸電線路故障對整個系統的暫態穩定性影響相對較小[19]。因此,選取電壓等級在500 kV及以上的線路、母線進行仿真,采用5.1節所述方法生成離線樣本,并從該系統上收集到8 862個樣本。

圖8 某省級電力系統500 kV主網框架圖
5.2.1 TSA綜合模型的構建
使用mRMR算法分別選取出不同數目的關鍵特征重復試驗,確定最佳的關鍵特征數目。經過多次試驗,當選取350個關鍵特征時,能達到最佳的評估精度。在生成不同的關鍵特征集數目時,其相應的評估準確率如圖9所示。
由圖9可知,在IEEE 39節點系統上,設置5個及以上的mRMR特征選擇過程(m≥5)準確率能達到0.995以上;在某省級電力系統上,設置為7個及以上的mRMR特征選擇過程(m≥7)準確率能達到0.987以上。在實際應用時,可供其他類似規模的電力系統參考。因此,在某省級電力系統上設置成7個mRMR特征選擇過程(m=7),篩選出7組關鍵特征集分別訓練7個CatBoost模型,并將這7個離線訓練模型結合構建TSA綜合模型。

圖9 生成不同關鍵特征集數目的評估準確率
5.2.2 性能測試
將80%的樣本用于訓練,20%的樣本用于測試,采用5倍交叉驗證法重復實驗,取5次測試結果的平均值。對于SVM模型、DT模型、DNN模型、XGBoost模型和單個CatBoost模型,則使用原始樣本進行性能評估測試。各個模型的測試結果如表7所示。

表7 某省級電力系統上的測試結果
某省級電力系統的高復雜性增加了TSA的難度,同時直流輸電線路的運行也使系統的動態特性發生了根本性變化[12]。因而,與IEEE 39節點系統上的測試結果相比,各個模型在某省級電力系統上的評估精度均有所降低。總體而言,TSA綜合模型的評估精度仍高于其他模型,其準確率分別比SVM模型、DT模型、DNN模型、XGBoost模型和單個CatBoost模型提高了0.041、0.046、0.019、0.027、0.015,同時召回率也分別提升了0.044、0.049、0.02、0.031、0.012。因此,與其他模型相比,TSA綜合模型更能滿足在線TSA的實際需求。
為進一步提升TSA模型的精確性和可靠性,提出一種將mRMR集成方案和多個CatBoost分類器相結合來構建TSA綜合模型的思路。并在IEEE 39節點系統和某省級電力系統上對所提出的TSA綜合模型進行了性能測試,根據測試結果,得出如下結論。
(1)所提出的TSA綜合模型,擁有比SVM模型、DT模型、DNN模型、XGBoost模型以及單個CatBoost模型更高的準確率和召回率。因此,使用TSA綜合模型進行TSA,能夠獲得更加精確、可靠的分析結果。
(2)在網絡拓撲結構變化、發電機/負載功率分布變化以及負載特性變化的情況下TSA綜合模型仍能提供較高的預測精度,表明TSA綜合模型具有較強的泛化能力,能夠適應電力系統運行環境的變化。
(3)由于PMU測量誤差而引入數據噪聲時,TSA綜合模型的準確率和召回率都在0.960以上;表明TSA綜合模型具備良好的魯棒性,在噪聲下能夠提供有效的評估。