王 寧, 田家英, 董 寧, 韓 盟, 陳艷霞
(1. 中國農業大學 信息與電氣工程學院, 北京 100083; 2. 國網北京市電力公司 a. 電力科學研究院, b. 電力調度控制中心, 北京 100031)
隨著社會信息化水平的不斷提高,電網智能化也逐步成為重要的發展趨勢[1].高度集成和智能化的電網調控系統為電網的穩定運行提供了重要保障,但同時也伴隨著一些潛藏的風險,尤其在調控系統通信與數據安全等環節較為薄弱[2-3],因此,有必要深入研究電網調控系統的實時風險評估和預警技術.
殷加玞等[4]提出了一種基于全概率風險度量的電力系統備用風險評估方法,對源荷雙側預測誤差所引起的電力系統備用缺額風險進行了評估;商皓鈺等[5]針對包含風電和光伏等新能源的電力系統提出了一種運行風險評估模型,并全方位考慮風險指標,從而有效提高電網的運行安全性;何曉峰等[6]針對連鎖故障對電力系統帶來的安全風險,在完善連鎖故障模型的基礎上,引入多種系統級的風險評估指標,并從宏觀層面評估了目標系統運行風險.
但上述研究較多偏向于電力系統整體,而針對電網調控系統實時運行風險的評估與預警研究較少.因此,基于改進的支持向量機技術,本文提出了一種智能電網調控系統實時風險評估與預警方法.其將系統數據信息輸入卷積神經網絡(CNN)以得到數據特征,并將其估值輸入支持向量機(SVM)分類器完成風險等級的劃分,從而采取相應的預警措施.
所提算法基于傳統CNN,分別從全聯通層、匯聚層、激活層、卷積層以及嵌入層5個部分對該模型進行了優化[7].首先,針對數據集對每個詞的嵌入進行訓練,并作為特征輸入CNN模型完成迭代訓練.同時在其他網絡參數共同訓練作用下,將得到新的訓練特征作為SVM分類器輸入繼續訓練,并輸出最終結果[8].
支持向量機是一種基于線性模型的經典機器學習算法,其輸入空間通過非線性變換成為高維特征空間,以求解最優的線性界面.通常維數越高,計算復雜度越高,而在SVM算法中引入核函數解決了這一問題,降低了計算復雜度.
線性可分樣本為(Xi,yi),i=1,2,…,n,Xi為樣本矩陣,yi∈{-1,1}為樣本標簽.在多維空間中,線性判別函數的一般形式為h(X)=αX+b,則分類面可表示為αX+b=0.對其進行歸一化,并用等比的方法來調整系數矢量系數α和b,因此,分類曲面問題可描述轉化為
s.t.yi[(αXi)+b]-1≥0
(1)
根據描述的優化問題可得到最優決策函數為
(2)
式中:sgn()為符號函數;?i為每個樣本的拉格朗日乘數;B為分類閾值.
基于SVM基本思想,將非目標問題通過非線性變換轉化為高維空間的線性問題進行求解;而核空間理論通過非線性函數將數據從低維空間映射到高維空間,因此,分類問題可轉化為屬性空間,向量內積可以用核函數K(Xi,Xj)代替,則優化問題表示為


(3)
相應的決策函數為
(4)
CNN是一種典型的人工神經網絡,該網絡將上一層輸出作為下一層神經元輸入.通過多層卷積運算,完成從輸入層到輸出層的逐層非線性變換[9-10].通常CNN結構包含嵌入層、卷積層、池化層和全連接層,如圖1所示.

圖1 CNN的網絡結構Fig.1 Network structure of CNN
其中,嵌入層是一個矩陣,將樣本中的數據狀態向量按從上到下的順序排列;然后通過卷積層的卷積運算得到多個特征映射,并輸入池化層減小輸入數據的大小;最終池化層連接到一個或多個全連接層,并輸出數據特征量.
CNN具備空間采樣、局部連接和權值共享三個顯著特征.CNN中局部鏈接的神經元結構會明顯影響神經網絡結構參數大小,卷積操作后得到的特征數據可用于訓練與分類,但卻存在計算量大的缺點[11-12],因此,對于卷積特征數據需要進行降維處理.空間采樣方法作為常用降維方法,不僅降低了上隱層的計算復雜度,且增強了對時移的魯棒性[3].此外,CNN的權值共享網絡結構使其更接近于生物神經網絡,避免傳統機器學習算法中復雜的特征提取與數據重構過程.
所提技術中采用CNN網絡改進SVM,以得到深度神經網絡結合支持向量機模型(CNN-SVM)[13-14].將CNN輸出的數據特征輸入SVM分類器完成數據分類,并判定其風險等級,繼而進行風險預警,其模型結構如圖2所示.

圖2 CNN-SVM模型結構Fig.2 Model structure of CNN-SVM
CNN-SVM模型的第1層是數據輸入層;第2層用于數據預處理;第3層為5個并行的CNN模型,每個模型均由一個雙卷積組成,即卷積層與最大池化層的組合.為了充分考慮每個數據前后時刻的信息,提取不同大小的局部特征,從而改變窗口長度,于是將5個卷積結構的大小設置為5×100、6×100、7×100、8×100和9×100.經過卷積層的處理后,模型分類特性更為優越,且每個并行的CNN模型均連接一個Flatten層,進而完成多維數據降維處理.
在長度為l的窗口中,卷積核K完成卷積運算后的輸出特征為
oi=σ(ωXi∶i+l-1+d′)
(5)
式中:Xi∶i+l-1為濾波器滑動窗口內輸入矩陣X的信息;ω為權重矩陣;d′為偏置因子;σ()為激活函數.神經網絡中有眾多激活函數,如Sigmod函數、Tanh函數等,所提模型中采用Tanh函數.之后,采用兩個全連接層,一個是對以前的數據進行特征加權,另一個是提取輸出的特征.輸出向量具體計算表達式為
U′=δ(ωU+b)
(6)
式中,U與δ()分別為上層輸出向量和高級激活函數Leaky ReLU.通過引入包含非線性因素的Leaky ReLU函數,在增強模型表達的基礎上去除冗余數據,最大限度地保留數據特征.此外,為了加快特征數據的收斂速度并防止過擬合,設置了批量標準化層.
最終,電力數據在滑動窗口中被轉換成固定長度的向量U″,然后用Softmax函數對提取的特征U″進行處理,輸入SVM分類器進行訓練,并輸出分類結果.
隨著“大運行”體系建設的推進,智能電網調控業務高度集約,接入廠站數據量急劇增加.對智能電網調控系統的數據交互實時性、業務響應及時性、運行可靠性與健壯性提出了更高的要求,因此,采用CNN-SVM模型評估系統實時風險并作出預警.
智能電網調控系統的硬件架構是由大量服務器搭建構成的,服務器的健康與否直接影響系統整體安全.而負責發、輸、變、配電業務的調控系統也同等重要,其健康度同樣關乎系統安全,尤其是調控過程中數據傳輸質量對系統業務所產生的干擾不容忽視,故這也是系統安全的又一個影響因素.因此,系統實時風險評價指標體系中包含了服務器、業務與數據質量3種狀態因素.該評估系統結構如圖3所示.
系統實時風險評估體系采用層次分析法(AHP)自下而上分層計算,結合專家經驗確定的指標權重和各個評價標準得到系統實時風險等級.
系統評價指標體系主要由3層構成.第1層為CPU、網絡I/O等,通過監測系統獲取運行數據.在該層次中,對定量指標如CPU使用率等進行量化評定.而進程、網卡狀態等指標則經常進行定性評定,通常優先級較高.若存在風險,則分值為0;若不存在風險,則進行定量指標評定.

圖3 系統風險評估架構Fig.3 Architecture of system risk-assessment
第2層為中間層,主要構建包含進程、硬件健康度等在內的數據指標.在該層,根據第1層指標的分數與專家權重計算系統風險狀態值.系統部分指標的評價等級和評分標準如表1所示.

表1 部分指標的評價等級和評分標準Tab.1 Evaluation grades and scoring standards of some indicators
第3層為最頂層,可以直接影響調控系統安全的風險數據指標,如Scada應用狀態等.該層次結合前兩個層次定性定量指標的計算方法依次向上層指標計算,直至得到系統實時風險分值.
將電網業務數據流、服務器工作狀態等輸入實時風險評估系統,并利用CNN-SVM不斷深入分析系統數據,根據計算得到的風險分值進行相應預警,整個過程如圖4所示.
電網調控系統實時風險評估流程主要包括:數據采集、風險識別、風險評估及定級、風險預警等.其中,采集的數據主要有6個輸入指標:磁盤I/O、網絡I/O、網絡連接數、進程占用CPU、進程占用內存及線程個數.將采集數據輸入CNN進行特征提取,并結合AHP計算系統的實時風險值;然后將系統風險值輸入SVM,并結合動態的系統信息,完成風險等級的劃分,其分為完好、正常、異常、崩潰4個等級;最終根據系統風險等級采取相應的預警措施,保證系統的安全、穩定運行.

圖4 電網調度系統風險評估及預警流程Fig.4 Flow chart of risk-assessment and early-warning of power grid dispatching system
為驗證所提方法的可行性與有效性,模擬實際運行場景,搭建如圖5所示的電網調控系統閉環仿真測試系統.

圖5 系統配置圖Fig.5 System configuration diagram
系統由3臺雙網工作站構成.在實驗中,智能電網調度控制系統為D5000,其基礎平臺為V3.0,金倉數據庫管理系統為V7.0,凝思安全操作系統為V4.2.
典型場景并發規模測試中,輸入數據規模為:廠站數642個、通道數1 712條、模擬量44萬(441 070)點、狀態量82萬(829 104)點、遙控量5萬(52 300)點、遙調量1 800點,數據量為遙測量達到2 000點/s、遙信變位10點/s、帶SOE的遙信變位5點/s.
在線并發用戶數根據實際場景確定,由最初的10戶逐漸增至100戶.根據接口分析及日志數據整理編寫測試用接口腳本,創建測試的使用變量,這些測試變量驅動接口動態鏈接庫完成測試活動,并收集測試動態鏈接庫返回的數據.分析這些數據可以得出,系統是否可對用戶請求做出正確的響應,從而記錄響應時間.最終計算開始時間與結束時間得出系統的響應時間,并計算整個測試過程中系統的正確響應測試和錯誤響應測試,得出系統的錯誤率.調度系統并發能力測試結果如圖6所示.

圖6 并發用戶數與傳輸響應時間及CPU利用率的關系曲線
從圖6可以看出,系統響應時間隨著并發用戶數的增加而增長,兩者成正相關關系.當并發數到80時,系統正確響應時間顯著增加至20 s,超過專家經驗評價所得的響應時間臨界值;CPU平均利用率也躍升至60%,臨近日常狀態CPU占用率的異常指標.當并發數達到100時,絕大部分并發用戶響應超時并呈現較高錯誤率,且CPU平均利用率處于異常狀態.因此調控系統的合理并發用戶數應小于80戶,此時測試性能最佳.
為消除評價等級差異對評估精度造成的影響,實驗針對所有等級的風險評價精度、召回率和F1值進行了計算,并將所提技術與文獻[5]進行對比,結果如表2所示.

表2 不同評價等級的測試結果Tab.2 Test results of different evaluation grades %
由表2可以看出,當系統處于異常或更優的狀態時,各個風險等級的分類精度均在0.90以上,召回率和F1值也表現較好.因此可以排除評價等級間的差異對系統評估誤差的影響,且所提技術的分類精度、召回率和F1分數的均值分別為92%、86%、90%,均優于對比方法.但當風險等級處于崩潰狀態時,所提技術的性能出現了明顯下降,如分類精度僅為84%.由于數據量急劇增加,對系統造成了較大壓力,響應時間增長且錯誤率上升,因此系統整體分類性能降低.而相比文獻[5]中技術的分類準確率為71%,所提技術仍具有較明顯的優勢.
智能電網調控系統對可靠性要求極高,因此不光要保證風險預警的準確性,還應保證風險預警系統的可靠性.通過故障模擬,將所提CNN-SVM技術用于實時風險評估,利用故障數據驗證實時風險評價系統的可靠性.系統風險等級分為完好、正常、異常和崩潰4種,其中完好和正常狀態說明系統運行風險較低,因此本實驗驗證系統在異常和崩潰狀態下的預警可靠性,文中采用正評率評估系統可靠性,其計算表達式為
(7)


圖7 可靠性驗證實驗結果Fig.7 Experiment results for reliability verification
從圖7中可以看出,當系統數據不超過600 MB時,應用所提技術所得的PΩ值不低于90%,且文獻[5]所得PΩ值大約為88%.當系統數據超過700 MB時,PΩ值急劇下降,且應用文獻[5]技術的下降幅度更大.最終,應用本文所提技術系統的PΩ值未低于60%,符合要求;而文獻[5]僅為52%,已失去準確預警的性能.文獻[5]采用運行風險評估模型,其技術較為傳統,在處理海量數據時效果不佳.綜合來看,所提技術的預警可靠性更優,且全面考慮了各個影響因素,并利用CNN-SVM進行分類處理,提高了調控系統的穩定性.
調控系統作為電網的核心,其安全穩定地運行至關重要.為此,本文提出了一種基于改進SVM的智能電網調控系統實時風險評估與預警技術,構建出了一個包含各種影響因素的風險評估體系,并利用CNN模型獲得影響因素的特征.計算系統實時風險值,同時輸入SVM分類器模型完成風險劃分.基于構建的電網調控系統對所提技術進行實驗的結果表明,并發用戶數小于80戶時,系統測試性能最佳.即使當系統處于崩潰狀態,其評估可靠性也未低于60%,滿足系統實際運行的要求.在接下來的研究中,將考慮更多的影響因素,如天氣變化等,以實現智能電網調控系統更高可靠性的風險評估和預警.