章燕卿 梁侃
柯橋供電分局 浙江 312030
隨著電網的飛速發展和自動化技術的不斷進步,電力系統的規模迅速擴大,電力運行方式日益復雜,調度人員需要關心、監視的數據信息也成倍增加,形成了涉及多家廠商,多套產品的復雜局面,給調度人員帶來了極大的工作負擔,由于調度人員的疏忽或處理不及時會造成對電力安全運行的潛在隱患。同時支撐電力調度的調度自動化系統自身也可能出現各種異常情況,如自動化系統故障、網絡中斷、數據采集通道中斷、系統軟件異常、機房設備和環境異常等,倘若發生異常情況而沒有及時發現,則可能導致調度人員無法進行正常的調度指揮,嚴重時可能影響整個電力的安全運行,造成巨大的經濟損失和社會影響。針對這種情況我們提出了一種面向智能電網全網的故障告警管理模式,其主要作用就是對支持自動化機房的動力環境、設備狀態、系統狀態進行在線監控,及時對系統出現的運行異常情況自動產生告警,通過多種告警方式通知相應的值班人員,以及時處理系統的異常或故障。
電網所監測的內容,包括動力環境數據、自動化運行數據、設備、網絡工況數據、電力運行數據等,并不是孤立存在的。這些數據之間存在著復雜的聯系,某一個環節出現了問題,必然會產生一系列的影響。我們這里所要研究的就是通過被監測數據之間的聯系,構建出專業應用層面的邏輯拓撲模型,將故障告警系統真正建成一個綜合了動力環境、通信網絡、服務器、系統軟件、應用業務在內的大系統。
電網一般需要監控的系統包括 EMS、DPMS、電能量采集系統等多套自動化系統。監控對象也涉及應用進程、服務器工況、運行環境、業務功能等多個方面。以浙江省調為例,如果以EMS系統為核心出發,各個監控對象間的關系可以描述為:前置機通過101或104通道采集上來的前置數據經 SCADA核心交換機傳輸給 SCADA主機,在SCADA主機上,5分鐘數據以文件的形式經由正向隔離裝置傳輸給位于III區的DPMS及以熱定電等系統,作為基礎數據進行業務計算。同時前置機將三級網實時值通過三級網應用服務器,發送到三級網通信服務器,最終傳輸到地調三級網應用服務器。前置機還將計劃/轉發值經由 I區核心交換機發送給三級網計劃服務器,然后通過正向隔離裝置傳輸到DPMS服務器。運方計劃值在DPMS服務器上生成,經由Ⅲ區日志服務器通過反向隔離裝置傳輸到Ⅱ區日志服務器,然后發送到SCADA主機轉換成指令數據。省調SCADA主機將電網歷史數據通過SCADA核心交換機傳輸給電力市場數據庫服務器及SCADA數據庫服務器。計劃處導入的安全校核所需文件通過III區日志服務器經由反向隔離裝置傳輸到II區日志服務器,再用數據FTP轉發到PAS主機;在PAS主機上,安全校核程序對這些文件進行處理后生成結果文件;三級網計劃值服務器通過FTP下載安全校核結果文件,通過正向隔離裝置傳送給III區日志服務器,最后計劃處讀取結果文件。
我們將各個系統運行的每臺服務器都看作一個節點,服務器之間的業務進程關系作為有向連接線,服務器運行的動力環境、內存狀況、硬盤狀況、系統進程等這些被監視的物理對象組合起來作為虛擬的隔斷器,可以生成專業應用層面的邏輯拓撲結構圖(見圖1)。

圖1 邏輯拓撲結構圖
其中每條連接線的起始兩端都各設有一個虛擬隔斷器,其內部結構如圖2所示。

圖2 虛擬隔斷器
只要構成虛擬隔離器的幾個部分任何一個出現故障,虛擬隔離器將呈現開斷狀態,該條連接線將開斷。反之虛擬隔離器將是閉合狀態,該條連接線將呈現正常運行狀態。
構成電力系統的任何部分并不是孤立存在的,它與其他部分構成了互為依賴的錯綜復雜的各種關系。因此系統中發生的故障告警也不會是孤立存在的對象。有些故障告警會引發一系列的連鎖影響,從而導致更多相關告警的出現。相應的,有些監測到的告警本身并不是故障源,而只是其他故障影響造成的。因此,在眾多相關告警中,根據其邏輯拓撲關系,找出其根源性故障告警是非常重要的,可以實現快速關鍵問題定位,加快事件解決速度、提高維護服務效率、減輕值班人員勞動強度等效果。我們在上文中提出的構建綜合了動力環境、通信網絡、服務器、系統軟件、應用業務等在內的邏輯拓撲結構,目的就是在此基礎上進行故障告警管理,實現告警智能歸并和故障定位。
圖3展示了故障告警處理邏輯流程。統一數據平臺負責采集包括動力環境、通信網絡、服務器、系統軟件、應用業務等各方面的缺陷告警信息,形成標準的故障告警事件。由于不同廠家的多套系統有可能會對同一事件從不同角度進行多次告警,因此有必要進行告警合并,以保持告警信息的準確性和精確性。以上文構建的邏輯拓撲模型為基礎,對故障告警事件進行相關性分析進行告警智能歸并和故障根源點定位。經過分析后所有根源故障都被甄別出來組成主告警;每個主告警一起的連鎖告警則被定義為副告警。在此基礎上結合告警規則庫對所有故障告警事件進行分級。分級后的告警通過故障告警傳遞模塊在監控臺以列表,圖表,拓撲著色等的方式用B/S模式展現出來;另一方面所,有告警將通過告警智能糾錯庫的分析得出正確數據。同時告警事件將會通過故障告警通知功能按照級別以語音、短信、音響等方式廣播出去。所有的告警事件都會被存入告警庫,被加以統計分析自動形成各類報表。

圖3 故障告警處理邏輯流程
告警智能歸并及故障根源點定位是故障告警管理中的關鍵環節。其方法主要是通過歸并分析引擎和告警事件關聯規則來進行處理。告警事件關聯規則是由包含動力環境、通信網絡、服務器、系統軟件、應用業務等層面的邏輯拓撲模型和經驗知識庫共同組成。圖4就是告警智能歸并的流程圖。

圖4 告警智能歸并的流程圖
我們可以看到對于系統接收到的告警事件,歸并分析引擎通過關聯規則,進行智能歸并,找出故障根源點;分析結果作為經驗輸入知識庫與邏輯拓撲結構結合起來進一步豐富和優化關聯規則,形成一個閉環。因此告警智能歸并是一個循序漸進的過程。
歸并分析引擎主要是通過邏輯拓撲結構和有經驗知識庫提供的因果關系推斷告警根源。告警之間雖然有著錯綜復雜的各類關系,但基本關系卻可歸納為兩種:
圖5中的A、B、C等三個告警出現時,歸并推斷引擎在圖中確定出其在圖中的位置,通過從樹根向上遍歷的查找確定其為單串關系,且其中A為這個關聯關系的樹枝頂點。在這種單鏈關系中,故障根源比較容易確定,三個告警信息的根源,可確定為A,解決了A這個故障,其他B、C兩個問題一般就不存在了。
圖6中的D、E、F三個告警呈多鏈結構。當三個告警同時出現時。其中F可能由D引起,也可能由E引起。這種多鏈關系中無法簡單地推斷出主從關系。我們引入時域和影響度兩個因素來幫助確定根源。時域就是指兩個原因故障的發生時間,影響度是指在多個樹枝中哪個樹枝的可能性高一些。當多個根源中出現,其中一個的出現時間最早同時影響度最高時,即可確定其為根源性告警。如本例,如果D的影響度高,且時域在前;則可判斷D為根源告警。在無法根據邏輯拓撲結構進行根源性告警判斷時,歸并分析引擎還將自動引入經驗知識庫,利用值班人員的經驗來確定因果關系。

圖5 單串結構

圖6 多串結構
下面我們以實際運行過程中發生的實例來說明問題:電網同時從各監測系統中采集到下列告警:
(1) IIIqu_syslog服務器安全校核結果文件d:powermarketJ年月日SensDataForCheck.xml.txt文件不存在;
(2) IIIqu_syslog服務器安全校核結果文件d:powermarketJ年月日PowerFlowForCheck.xml文件不存在;
(3) IIIqu_syslog服務器安全校核結果文件d:powermarketJ年月日DailyDangerousPointResult.xml文件不存在;
(4) IIIqu_syslog服務器安全校核結果文件d:powermarketJ年月日DailyChangeScheduleForCheck.xml文件不存在;
(5) IIqu_syslog 服務器安全校核結果文件 d:powermarketJ年月日DailyChangeScheduleForCheck.xml文件不存在;
(6) Zjpas01-1服務器文件系統/users/ems/open2000e/var/使用率為100%,超出閾值95%;
(7) Zjpas01-1服務器安全校核程序應用進程運行異常這些告警之間可以通過關聯規則找到其因果關系。從這一模型中我們可以分析得出IIqu_syslog和IIIqu_syslog這兩臺服務器上的安全校核結果文件不存在是因為 Zjpas01-1上的安全校核程序運行異常造成的,而安全校核程序IIqu_syslog則是因為其使用的 /users/ems/open2000e/var/文件系統溢出造成的。所以由此判斷出 Zjpas01-1服務器文件系統 /users/ems/open2000e/var/使用率為 100%這一告警為故障根源,只要處理了這一故障其余故障就都會得到解決。
當前面向智能電網全局,構建一套跨專業的高度智能化的故障告警管理系統已經需要提上議事日程。這套系統將成為保證電力安全運行的重要支撐平臺,將電力安全調度的工作由被動變為主動,減輕值班人員的勞動強度,增強調度自動化系統的可靠性和電力調度的安全性;另一方面,通過對各類歷史報警信息的統計和分析,告警處理預案的建立和完善,將極大提高電力調度及系統的智能化管理的水平。在本文中我們從電網數據層面和專業應用層面探討了構建跨專業綜合調度值班系統的一些關鍵技術;為構建新一代同時監控動力環境、通信網絡、服務器、系統軟件、應用業務、電網數據等多層次多功能的故障告警管理系統打下了理論基礎。
[1]秦立軍,馬其燕.智能配電網及其關鍵.技術中國電力出版社.2010.
[2]匡洪海,黃少先.配網停電管理系統方案設計.2004.
[3]林宇峰.智能玷污那個技術體系探討.電網技術.2009.
[4]郭志忠.電網自愈控制方案.電力系統自動化.2005.