劉家嚴 施昌建 陳有才 肖 遙 尹文琛
(南京豐道電力科技有限公司,江蘇 南京 210000)
為保證智能電氣設備能可靠運行,一般采用主備運行方式,其中一臺運行在主機狀態,作為主要控制節點,其他設備運行在備機狀態,當主機非正常運行時,備用設備能隨時切換到主機模式,替換原設備成為主要的控制節點。常用的主備方法存在硬件改動復雜,控制靈活性不足,切換主備控制策略復雜等問題。文獻[1]涉及比較多的硬件操作,主備切換功能不能主動進行操作,缺乏控制靈活性。文獻[2]在雙機中增加硬件NOE模塊,同時判別網絡故障,故障后切換,未對檢修等非故障切換進行處理。文獻[3]分析了當前主備切換模式不能主站選擇帶來的問題,提出調度主站能主動切換主備機需求。文獻[4]公布了一種實現主設備和備用設備倒換的方法,通過固定的故障權重映射表來體現設備的權重值,具備固定故障切換規則。文獻[5]介紹了通過網絡方式替代硬件電路實現主備切換功能。文獻[6]提出了通過同步數據庫方式實現主備切換和數據恢復。文獻[7]提出了虛擬化遙信閉鎖信息方法,通過虛擬的遙信進行功能閉鎖。文獻[8]闡述了雙機冗余方式能有效提高系統可靠性,同時提出了數據窗插值方法。文獻[9]和文獻[10]闡述了當前電力系統對雙機冗余和主備運行需求,以及故障情況下主備切換方法。
鑒于上述研究,本文提出一種主備運行切換方法。在主備運行方式中,對影響設備運行狀態的條件進行抽象賦值,不同的影響條件選取不同的權重值,把所有涉及的條件(及權重)進行累計,形成自身的權重,通過比較其他設備的權重值大小,確定自身的運行狀態,從而得到本機是否為主機狀態,是否需要切換模式。
在主備運行情況下,引起主備設備切換的往往有手動切換、檢修切換、設備故障切換、主站主動控制等因素。同時,各個因素存在優先級差異,如當出現設備故障情況,需要立刻進行主備切換操作,避免主機故障影響系統正常運行。為便于系統對各個切換因素進行合理整合判斷,本文對影響主備運行的條件進行抽象化處理,形成權重值(圖1),通過雙方權重值比較,有效實現主備機相互切換,協調運行。該方法中,若設備發生故障,則確定設備的故障類別,根據不同的運行情況進行權重的動態計算,將該權重值與設備原有的故障系數比較,得到設備當前的權重系數;判斷主設備的權重系數是否大于備用設備的權重系數,若是,則進行倒換,由備用設備承擔業務。通過給故障賦以權重,可以實現較為精確的主、備設備故障程度的比較,保證電力設備的高可用性。

圖1 切換因素抽象成具體權重值
在系統方案中,對影響系統運行的切換因素進行抽象處理,包括手動切換、檢修切換、設備故障切換、主站主動控制等因素,各個因素根據具體策略配置優先級系數,如表1所示,將默認因素抽象成具體的權重值。

表1 默認權重因素和權重值構成示意表
具體步驟如下:
步驟A:主備設備交互各自的權重值、心跳值、遙調值等信息。
步驟B:設置各個條件的權重值。涉及的權重條件包括但不限于運行模式、故障切換、主站選擇、優選主機、前次模式等。
(1)運行模式:設置一個權重項x1,權重值為k1、k2、k3。
x1=k1,手動切換到主機模式。
x1=k2,手動切換到備機模式。
x1=k3,自動模式。
其中,k1>k2=k3=0。
(2)故障切換:當收不到對端心跳信息,則認為處于故障未同步狀態,包括初始時未建立連接和運行過程中通信中斷。延時一定時間等待同步,如果超時則切換為主機運行模式。設置一個權重項x2,權重值為l1、l2。
x2=l1,故障狀態,未同步。
x2=l2,無故障,同步。
其中,l1>l2=0。
(3)自動模式中,系統實現主站選擇進行主備切換,子站根據主站的遙調下發情況確定權重值。設置一個權重項x3,權重值為m1、m2、m3、m4。判斷方法:判斷兩個指令周期子站接收到的遙調情況,確定不同的權重值。
x3=m1,兩個指令周期沒有接收到主站指令。
x3=m2,兩個指令周期中接收到一個,這個遙調指令是新到的。
x3=m3,兩個指令周期中接收到一個,這個遙調指令是上次的舊指令(通過遙調量中的tick間隔確認指令時間。系統每次接收到遙調指令,記錄對應該指令時間計數tick,tick間隔是指此遙調tick和當前tick時間差),設置m3>m2,以滿足接收到兩個遙調指令才進行切換要求。
x3=m4,兩個指令周期接收到兩個遙調指令。
設置值大小順序為:m4>m3>m2>m1。
自動模式中,使用指令時間差實現指令比較,以避免遙調指令周期不確定的限制。判斷時用遙調緩沖中最新兩個指令和當前tick時間差及Δt1、Δt2。
(4)設備通過自身設置的默認優先級確定工作狀態,默認的優先級權重值為x4=n1,n1的值要小于m1,且n1<m1。
(5)前次設備運行情況權重值x5=f1。k、l、m、n、f按照不同數量級體現,它們均小于10,例如:k數量級為十萬,l數量級為萬,m數量級為千,n數量級為百,f數量級為個位。
步驟C:根據給定的條件進行判斷,形成不同的權重值,進行累計。設備的整體權重值為Qx=x1+x2+x3+x4+x5。
步驟D:比較設備之間的權重值大小,確定自身的運行狀態,權重大為主機狀態,權重小為備機狀態。
在主備機運行情況下,系統得到自身權重值后,通過建立的通信通道進行主機和備機通信交互。主備機之間的通信通道可以選取不同的物理接口,如網口、光纖、串口等方式。主備機之間的交互規約亦可以選用不同類型,常見的有IEC104、GOOSE等方式。
在一主一備架構中,采用網絡直接互聯,通過IEC104規約建立通信通道。在主備設備中分別建立服務器和客戶端,權重值等數據通過IEC104突變方式相互傳輸,如圖2所示。

圖2 一主一備直聯運行
在一主多備架構中,使用交換機形成設備局域網,網絡內主機和備機通過GOOSE組播傳輸自身權重和其他狀態數值,網內設備根據接收到的組播數據,結合自身權重值判斷是否需要切換操作,如圖3所示。

圖3 一主多備組網運行
以一主一備架構為例介紹具體的實施案例。系統以圖2為實施架構,設備1和設備2分別運行在主備狀態,兩臺設備通過網絡建立硬件通道,使用IEC104進行數據交換。主備設備交互各自的權重值、心跳值、遙調值等信息。默認正常運行時,設備1為主機,設備2為備機。
正常運行時,設備1自身權重值計算方式如下:
系統運行模式為自動模式,則權重值x1=k3,k3取0。設備未故障,則x2=l2,l2取0。主站未進行選擇主備,則x3=m1,m1取2。設備1為默認的優先級,權重值為x4=n1,n1的值取1。前次設備運行情況權重值x5=f1,f1取1。利用表1的權重計算方法,則Qx1=x1+x2+x3+x4+x5,即Qx1=k×100 000+l×10 000+m×1 000+n×100+f,Qx1=2 101。
正常運行時,設備2自身權重值計算方式如下:
系統運行模式為自動模式,則權重值x1=k3,k3取0。設備未故障,則x2=l2,l2取0。主站未進行選擇主備,則x3=m1,m1取2。設備1為默認的優先級,權重值為x4=n1,n1的值取0。前次設備運行情況權重值x5=f1,f1取0。Qx2=2 000。
設備1接收到設備2權重值Qx2后,和自身Qx1比較,因為Qx1>Qx2,在網絡中沒有比自身高的權重值設備,設備1認定自身為主機,設備1當前為主機狀態,不做改變運行狀態動作。
設備2接收到設備1權重值Qx1后,和自身Qx2比較,因為Qx1>Qx2,設備2認定設備1為主機狀態,自身自動運行在備機狀態,不做改變運行狀態動作。
當設備1故障時,設備2收不到對端通過IEC104傳輸的心跳信息,則認為處于故障未同步狀態,權重值x2=l1,l1取值1。則設備2計算的自身權重值Qx2=120 100,設備2緩存的設備1權重值為Qx1=2 101,和自身Qx2比較,因為Qx1<Qx2,設備2認定自身為主機狀態,設備2切換自身運行為主機狀態。
當設備1需要主動檢修時,則先設置設備2為主機模式,此時設備2的權重值x1=k1,k1取值1,則設備2計算自身的權重值Qx2=102 000。設備2獲取的設備1權重值為Qx1=2 101,和自身Qx2比較,因為Qx1<Qx2,設備2認定自身為主機狀態,設備2切換自身運行為主機狀態。待設備2切換完成后,對設備1進行檢修,從而不影響整個系統正常運行。
主備運行模式,能夠顯著提高系統的可用性。當主機發生故障時,備機會立即接管任務和數據處理,確保系統能夠繼續正常運行,無須手動干預,縮短了服務中斷時間,減少了故障排除和恢復的時間及工作量。主備運行方法在提供高可用性和故障恢復能力方面有著顯著的優勢,但其也存在資源浪費、數據同步延遲和系統復雜等缺點。
本文使用影響權重思想,對影響設備運行狀態的條件進行抽象賦值,不同的影響條件,選取不同的權重值,把所有涉及的條件(及權重)進行累計,形成權重,通過比較設備的權重值大小,確定運行狀態,對系統數據結構進行簡化,整體降低了系統復雜性。本文通過IEC104、GOOSE等自身具備的突變傳輸等機制,有效解決了數據同步延時等問題。綜上,該方法具備良好的應用前景。