譚本東,楊 軍,劉 源,劉雯靜,周 挺,孫元章
(1. 武漢大學電氣與自動化學院,湖北省武漢市 430072;2. 國網江西省電力有限公司建設分公司,江西省南昌市 330029)
暫態穩定性指的是電力系統在遭受大干擾之后過渡到穩定狀態的能力[1]。大電網之間的互聯、多種大規模可再生能源的接入以及電力市場的推進使得電力系統調度運行以及安全穩定控制面臨嚴峻挑戰,容易引發大停電及連鎖故障等電網事故[2-3]。因此,快速、準確地評估暫態穩定狀態對于電網安全穩定運行具有重大意義。
隨著同步測量技術的發展[4-5]和電力系統仿真技術的進步,實際電網數據和仿真數據為數據驅動型方法提供了足夠的數據基礎。此外,廣域測量系統 中 同 步 相 量 測 量 單 元(synchrophasor measurement unit,PMU)實時高速采集數據的能力也為數據驅動的暫態穩定評估方法提供了發展契機。特別是近幾年人工智能技術研究的持續突破,利用機器學習來研究暫態穩定的方式展現出了巨大的潛力。一般而言,通過歷史量測數據離線訓練機器學習方法即可建立量測數據與穩定狀態之間的函數映射關系,一旦從PMU 中在線獲得測量值,即可判斷出電力系統的暫態穩定狀態[6-8]。因此,利用機器學習進行暫態穩定評估可以做到實時判斷并為后續可能的緊急控制動作留下足夠的時間。由于本文重點不在緊急控制,因此不對如何將暫態穩定評估結果用于緊急控制做詳細討論,基于數據驅動的暫態穩定緊急控制相關內容可參見文獻[9-10]。
目前機器學習方法在實時暫態穩定評估研究工作中取得了一定的成果,支持向量機[11-12]、決策樹[13-14]、神經網絡[15-16]等方法均在這個領域成功應用,它們根據故障切除后的關鍵特征和穩定狀態之間的映射關系來實施暫態穩定評估,結果表明這些方法具有很高的準確性、快速性并適用于大規模電力系統。但是,電力系統可能發生通信延遲及PMU失效,造成基于機器學習的暫態穩定評估模型數據特征輸入缺失,在這種情況下其評估性能會極度惡化。為了解決這個問題,主要有2 種研究思路。第1種是利用預測方法對缺失的數據進行修復[17],但是這種策略計算量較大,無法滿足實時評估的需求。第2 種是根據數據特征之間的相關關系來降低數據缺失的影響。文獻[18]利用決策樹的特征分裂特性求取替代缺失特征的分支,但是其受到數據缺失的影響依然嚴重;文獻[19-21]基于滿足電網可觀性的最少數量特征子集構造集成模型來提高模型對數據缺失的魯棒性,然而它們需要滿足全網特征的可觀性且沒有考慮PMU 在重要性上的不同,最終在準確率、計算量和魯棒性上均有不足;文獻[22]利用對抗生成神經網絡來對缺失的數據進行填充,但是這類方法易受到噪聲的干擾且需要大量的算力來訓練此類模型。
針對上述研究工作的不足,本文提出了一種考慮數據缺失的電力系統暫態穩定自適應集成評估方法。首先,分析了電網PMU 觀測性的基本概念,基于此提出了考慮PMU 可觀測特征重要性的PMU子集搜索算法,并通過保證全網節點可觀性大大減少PMU 子集的數量,從而降低后續訓練模型的計算量。然后,根據PMU 子集集合提出了一種應對PMU 失效的自適應集成評估方式。最后,在新英格蘭10 機39 節點電力系統上對本文所提出的集成評估方法進行仿真驗證。
PMU 是一種能夠同步測量電網相量的設備,假設某一母線安裝了PMU,那么與其相連的母線及線路均可觀測,PMU 可觀性的具體規則可見文獻[23]。為了獲得對全網的可觀性,需要確定最優的一組PMU 安裝位置來實現這一目標。此外,當電力系統中存在零注入節點時,可以減少配置PMU的數量。為簡化分析,本文只考慮存在零注入節點的情況,下面以3 機9 節點電力系統為例說明PMU可觀性的概念,該電力系統結構如附錄A 圖A1所示。
附錄A 圖A1 中只需要在4 號和7 號母線上安裝PMU 即可對全網觀測。具體而言,安裝在4 號母線上的PMU 可以實現對紅色虛線框內的1、4、5、9 號母線直接觀測;安裝在7 號母線上的PMU 可以實現對紫色虛線內的6、7、8 號母線直接觀測。2 號和3 號母線則可以通過基爾霍夫定律實現可觀性。
因此,在保證全網節點可觀性的PMU 配置下,基于機器學習的暫態穩定評估方法只要獲得了全網的數據,就能快速、準確地對故障后電力系統的穩定狀態進行判斷。但是,當某些PMU 失效或者通信故障發生之后,這類方法評估結果的準確率會急劇下降而變得非常不可靠。所以如何根據PMU 配置的特性來降低數據缺失的影響是本文研究的主要內容。
在電力系統遭受干擾后的動態過程中,一般表現為某幾臺發電機失步造成暫態失穩的主導模式。而電力系統運行狀態定義為一組狀態變量,例如電壓幅值、電壓相角等,因此電力系統存在一些相對重要的特征(電壓、電流、功率等)來展現出暫態特性。那么在電網中安裝的每個PMU 由于其可觀測范圍不一樣,其在重要性上也是有區別的。為了定量計算電網中每個變量的特征重要性,本節引入經典的Relief-F 算法[24]來進行求解。對于特定的PMU,其重要性計算公式為:

式中:I為特征重要性之和;Wai為特征ai的特征重要性;ψ為該PMU 可觀測的特征集合。
一旦發生PMU 失效,基于機器學習的暫態穩定評估方法就有可能失去其有效性,因此本文采取分而治之的思路來降低數據缺失的影響。具體而言,根據不同PMU 的重要性及其觀測范圍來尋找一組保證全網節點可觀性的PMU 子集集合,在這個集合之下分別對子集中所包含PMU 觀測到的特征建立機器學習模型。最后利用加權集成的方式來實現模型融合,當若干個PMU 失效造成數據缺失后,剩下不被數據缺失影響的PMU 子集對應的模型依然能進行加權集成并能夠給出可靠的評估結果。
按照上述思路,對于安裝有N個PMU 的電力系統,可能的PMU 子集有2N?1 個,如果全部利用則需要訓練2N?1 個模型,這會造成巨大的訓練量。文獻[20]通過找到滿足全網特征(電壓、電流)可觀性的最簡PMU 子集集合來實現降低數據缺失的影響。實際上只要保證節點(電壓)可觀性的最簡PMU 子集集合,則全網電流可利用基爾霍夫定律獲得(文中假設可以通過機器學習獲得這一隱含關系),那么可以在不影響模型性能的情況下大大降低計算量。值得注意的是,這里描述的全網可觀性(特征可觀性)是指所有PMU 子集可觀測的特征范圍的并集,文獻[19-20]在搜索PMU 子集過程中并未利用基爾霍夫定律對PMU 子集之間的關系進行分析,因此在PMU 子集搜索目標為全網節點電壓可觀而非全網節點電壓及全網電流同時可觀時,需要構造的子集數量較少。
假設各機器學習模型對應的PMU 子集之間的交集為空集,那么將無法保證全網的節點可觀性,這是因為PMU 在布局的時候利用了零注入節點和基爾霍夫定律的特點來減少PMU 數量,也就是說多個PMU 需要一同配合才能實現全網節點的可觀性;又假設各個機器學習模型對應的PMU 子集相同,此時模型受到PMU 失效影響的可能性最大。因此,需要平衡全網可觀性和PMU 失效影響的可能性。此外,PMU 的重要性在PMU 子集搜索過程中也是需要考慮的一個重要因素,因此本文提出了基于特征重要性的PMU 子集搜索算法,從數量最少的PMU 子集開始搜索,找到相同數量PMU 的子集中特征重要性最大的,直到達到全網節點可觀性為止。其中,從數量最少的PMU 子集開始搜索是因為PMU 數量越少的子集其發生失效的概率越低,具體過程如附錄A 圖A2 所示,其中f(?)為根據1.1 節中PMU 觀測性規則返回PMU 子集觀測節點集合的函數。當確定電網拓撲參數及PMU 安裝位置后,首先初始化PMU 子集集合Ω=?,考慮1 個PMU 的可能子集情況,對所有PMU 子集按照PMU重要性從大到小進行排序分析;如果該PMU 子集能夠增加新的可觀測節點,那么其將被添加到集合Ω中。以此類推,逐漸增加包含PMU 數量的可能組合子集,直至全網的節點可觀測。
支持向量機是一種泛化性表現良好的二分類模型,目前在電力系統暫態穩定評估中取得了廣泛應用[11-12,25]。其學習目標是在特征空間中找到一個分離超平面,能夠將不同穩定狀態的實例加以區分。假設給定一個特征空間的電力系統暫態穩定訓練數據集T為:

式中:xi為第i個樣本的特征向量;yi為第i個樣本的標簽,yi∈{?1,1},當yi=?1 時表示暫態穩定,當yi=1 時表示暫態失穩;i=1,2,…,L,其中L為數據集樣本的數量。
為了獲得最優分離超平面,支持向量機可以歸結為下述優化模型。

式中:λ為懲罰參數;ξi為松弛變量;w為分離超平面法向量;φ(?)為核函數;b為超平面的截距。
為了對支持向量機進行自適應集成,需要對其輸出進行概率化處理[25],即

式中:y?i為第i個樣本的預測類別;P(y?i)為預測類別為y?i的概率;g(xi)=wTφ(xi);sgn(?)為符號函數。
基于機器學習的暫態穩定評估本質上是一種有監督學習,因此需要將數據集分為訓練集、驗證集以及測試集。綜合前人的研究工作[7,26],本文采用故障切除后第1 個周期的電壓幅值、電壓相角、線路有功功率、線路無功功率、發電機有功功率、發電機無功功率、負荷有功功率及負荷無功功率作為模型輸入特征。暫態穩定狀態η為模型的輸出,可以定義為[27]:

式中:δmax為時域仿真結束后任意2 個發電機功角差的最大絕對值;η≥0 時樣本被判定為暫態穩定,η<0 時樣本被判定為暫態失穩。
假設在1.3 節中搜索到M個PMU 子集,離線訓練方式可以分為以下2 個步驟。
1)根據每個PMU 子集能夠觀測到的特征范圍將訓練集分割成M個訓練子集,分別用來訓練M個支持向量機。
2)若只采用單分類器對電網暫態穩定進行評估,任何一個PMU 失效都會造成整個模型的失效,因此本文采用多分類器集成的方法來進行暫態穩定評估,那么任何一個分類器失效都可以利用剩余分類器進行集成評估,而且理論上集成模型泛化能力優于單個分類器模型的泛化能力。為了實現對M個支持向量機進行加權集成,采用和分割訓練集相同的方式來分割驗證集,利用其來求取每個支持向量機的權重,可以定義優化模型進行求解,如式(7)所示。

式中:i=1,2,…,D,其中D為驗證集的樣本數目;y?ij為驗證集中第i個樣本根據第j個PMU 子集分割出數據的暫態穩定預測類別;ti為集成概率;αj為第j個支持向量機模型的權重;y?i為驗證集中第i個樣本的集成評估結果。
式(7)中第1 個約束表示對M個支持向量機進行加權集成,由于支持向量機的概率輸出區間為[0,1],當集成概率輸出為0.5 時,表示該樣本到最優分離超平面的距離為0,因此0.5 可以作為式(7)中第3 個約束的穩定狀態概率閾值。
基于機器學習的暫態穩定評估方法嚴重依賴于測量數據的實時性及完整性,但是在實際應用中,由于通信延遲及PMU 失效均可能造成數據缺失。為了在任意可能發生數據缺失的情況下保證模型的準確性,本文提出了一種在線自適應融合集成暫態穩定評估方式,模型的整體框架如圖1 所示,具體如下。

圖1 所提模型整體框架Fig.1 Overall framework of proposed model
1)當某些PMU 子集受到數據缺失影響時,剩余不受數據缺失影響的PMU 子集集合定義為Φ,則對剩余可用模型進行自適應加權集成的輸出為:

式中:i=1,2,…,T。
本節采用如附錄A 圖A3 所示的新英格蘭10 機39 節點電力系統來構造數據集并驗證本文提出的模型的有效性。文獻[28]給出的保證全網可觀性的最少數量PMU 的4 種布局方案如表1 所示,圖A3中紅色圓點表示方案1 中PMU 的安裝位置。

表1 不同PMU 布局方案Table 1 Layout schemes of different PMUs
利用電力系統分析軟件PSS/E 編寫暫態穩定批處理程序,生成大量暫態數據集來訓練本文提出的模型。考慮不同的故障方式及運行水平,最終生成了5 775 個樣本,具體時域仿真參數設置如下。
1)考慮11 種不同的負荷水平(基準負荷水平的75%、80%、85%、90%、95%、100%、105%、110%、115%、120%、125%),同時,發電機的輸出功率也按照相同的比例調節。
2)每種運行水平下,分別在每個母線及線路的4 個位置(與首端的距離為線路總長的20%、40%、60%及80%)施加三相短路接地故障。
3)對于每個特定的瞬時故障,故障持續時間設置為0.1 s、0.3 s 或者0.5 s。
4)每次時域仿真總時間為10 s,仿真步長為0.01 s。
5)為了防止模型學習過擬合,所有數據集樣本按照3∶1∶1 的比例分割成訓練集、驗證集及測試集,其中訓練集用來訓練每個支持向量機,驗證集用來對所有支持向量機加權融合集成,而測試集則是對本文提出的模型進行評估。
根據Relief-F 算法的特性可知,重要性越高的特征表明其區分不同類別樣本的能力越強。通過計算可以得到所有特征的重要性,見附錄A 圖A4,所有特征重要性按照降序排列,可以看到極少數特征的重要性是負值,絕大部分特征對于暫態穩定評估都具有正面影響。在新英格蘭10 機39 節點電力系統中,PMU 配置下所有28?1=255 種可能的PMU子集對應可觀測的特征的重要性之和的分布見圖A5,可以看出不同PMU 子集的重要性是不一致的,PMU 子集的重要性和包含的PMU 數量呈正相關。但是為了降低模型訓練的復雜度,本文只考慮保證全網節點可觀測情況下重要性最高的最簡PMU 子集集合。
通過在新英格蘭10 機39 節點電力系統上應用基于重要性的PMU 子集搜索算法,得到不同PMU布局方案下的PMU 子集數量對比,如表2 所示。可以看出,和文獻[20]相比,本文提出的方法在PMU子集數量上最多可以降低26.32%,這在實際應用中減少的計算量是非常可觀的。這是因為文獻[20]要保證的是全網特征量的可觀性,而本文提出的PMU 子集搜索方法則只需要保證全網節點可觀性,最后利用集成學習獲取特征之間的相關性。

表2 不同方法的PMU 子集數量對比Table 2 Comparison of the number of PMU subsets with different methods

本文提出的自適應集成評估方法在不同布局方案下平均準確率隨著PMU 失效數量的變化趨勢如圖2 所示。

圖2 不同PMU 布局方案下平均準確率變化Fig.2 Variation of average accuracy with different layout schemes of PMU
由圖2 可以看出PMU 失效數越多,平均準確率越低。由于應對數據缺失的自適應集成機制的作用,只要存在未失效的PMU,平均準確率就能夠保持在98%以上,說明提出的方法對PMU 失效具有較強的魯棒性。此外,不同PMU 布局方案下模型的暫態穩定評估表現,也可以為PMU 布局設計提供參考。
進一步驗證本文提出的基于PMU 子集集合搜索結果的暫態穩定自適應集成評估方法在應對數據缺失上的有效性,目前應用于處理電力系統暫態穩定評估數據缺失的方法有:數據平均修復(mean imputation,MI)[29]、基 于 替 代 分 支 的 決 策 樹(decision tree with surrogate split,DTSS)[18]、基于替代分支的隨機森林(random forest with surrogate split,RFSS)[30]、基于前饋神經網絡的集成投票(用Ensemble RVFL 表示)[20],在文獻[20]中已經證明Ensemble RVFL 方法優于上述的其他方法,因此用Ensemble RVFL 方法與本文提出的方法進行對比。以PMU 布局方案1 來進行說明。以上所有模型參數均通過網格搜索確定,實現了自身評估結果的最優化。
本文提出的PMU 子集方法搜索得到的PMU安裝母線編號子集的結果為:{3},{8},{10},{16},{20},{23},{25},{29},{3,16},{3,10},{16,20},{3,8,10},{3,8,25},其重要性如附錄A 圖A6 所示。圖A6 中A 區表示包含1 個PMU 的子集重要性,B區表示包含2 個PMU 的子集重要性,C 區表示包含3 個PMU 的子集重要性。可以看到,在每個區中每個子集的特征重要性呈下降趨勢,表明了本文提出的PMU 子集搜索算法優先選擇特征重要性高的PMU 子集的特點。
定義總體準確率E為:

式中:a為PMU 的失效率。
圖3 展示了在不同PMU 失效數量下不同方法的平均準確率。

圖3 不同PMU 失效數量對平均準確率的影響Fig.3 Effect of different numbers of PMU failure on average accuracy
由圖3 可以看出,本文所提出的方法在任何PMU 失效情況下的平均準確率都是最高的。結果表明,本文提出的方法雖然只考慮了全網節點可觀性而使用更少的PMU 子集,但是因為采用的基分類器為支持向量機以及消除了PMU 子集的冗余性而在性能上優于Ensemble RVFL 方法。
圖4 呈現了PMU 失效率與總體正確率之間的關系,表明PMU 失效率對本文提出的方法及Ensemble RVFL 方法影響甚微。一般而言,單個PMU 的失效率不會超過2%[18],因此當PMU 失效率設置為2%時,可視為在實際中可能發生的最嚴重情況。本文仿真計算發現,當PMU 失效率設置為2%時,本文提出方法對暫態穩定評估的準確率為99.13%,優于文獻[20]中Ensemble RVFL 方法的準確率(98.34%)。

圖4 不同PMU 失效率對總體準確率的影響Fig.4 Effect of different PMU failure rates onoverall accuracy
在之前的分析中,假設所有的系統量測都是精確的,但是實際廣域測量系統不可避免地存在噪聲。因此,本節將分析廣域噪聲對不同模型性能的影響。根據文獻[18]中對PMU 所制定的標準,PMU 量測向量誤差應小于1%,具體表達式為:

式中:X?∠θ?為從廣域測量系統獲取的量測數據相量;X∠θ為廣域測量系統量測數據向量減去噪聲之后的真實值。
圖5 和圖6 分別展示了在廣域噪聲影響下,不同方法平均準確率和PMU 失效數量、總體準確率和PMU 失效率的關系,其表現出的基本規律和沒有噪聲影響時一致。

圖5 噪聲影響下不同PMU 失效數量對平均準確率的影響Fig.5 Effect of different numbers of PMU failure with noise on average accuracy

圖6 噪聲影響下不同PMU 失效率對總體準確率的影響Fig.6 Effect of different PMU failure rates with noise on overall accuracy
從圖7 可知,廣域噪聲越大,模型暫態穩定評估總體準確率越小,但本文提出的方法是一直優于Ensemble RVFL 方法。本文提出的方法在所有方法中所取得的性能是最好的,總體準確率在2%的PMU 失 效 率 下 為98.65%,優 于 文 獻[20]中Ensemble RVFL 方法的97.70%。這是因為采取的基分類器支持向量機采用了松弛變量,對可能存在的異常點進行“容忍”,提高了對噪聲的魯棒性。

圖7 廣域噪聲對模型總體準確率的影響Fig.7 Effect of model with wide-area noise on overall accuracy
針對PMU 失效情況下造成的數據缺失問題,本文提出了一種電力系統暫態穩定自適應集成評估方法,能夠有效降低數據缺失帶來的影響。在新英格蘭10 機39 節點電力系統上進行仿真可得到如下結論。
1)相比現有方法,本文提出的基于PMU 重要性的PMU 子集搜索方法只需要保證全網節點可觀性,因此得到的關鍵PMU 子集數量更少,降低了PMU 子集的冗余性,大大減少了計算量。
2)自適應加權融合機制在任意可能發生的PMU 失效情況下均能有效集成未受影響的暫態評估子模型,實現對數據缺失的魯棒性。
3)PMU 失效數量是影響模型性能的主要因素,由于考慮了特征的重要性,本文提出的暫態穩定自適應集成評估方法在準確性、魯棒性上均優于現有評估模型。
本文考慮的PMU 子集搜索是針對全網節點可觀性進行研究的,沒有考慮到風險最小化的問題,關注主要PMU 失效場景并構建PMU 子集搜索優化模型是未來研究的重點。此外,隨著深度強化學習的發展,將其應用于實時緊急控制并形成基于PMU實時量測的暫態穩定評估與控制框架是一個具有潛力的方向。而電網模型參數和實際存在一定偏差的問題,可以通過離線施加擾動的方式校核時域仿真模型響應數據和PMU 數據,使得兩者動態響應過程接近。這種方式得到的數據和歷史PMU 數據一起訓練機器學習模型,可以解決實際應用偏差的問題,這也是后續需要探索的內容。
本文審理過程中審稿人與作者的討論見附錄B。
附錄見本刊網絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網絡全文。