沙一川 季惠英

摘要??? 采用歸納總結調度自動化系統(tǒng)及設備的軟硬件特征,抽象公共特征形成層次結構,建立自動化系統(tǒng)及設備的健康模型,通過構建自動化系統(tǒng)及設備運行數(shù)據采集和匯集機制,實現(xiàn)對自動化系統(tǒng)及設備的實時監(jiān)視與告警,形成自動化系統(tǒng)畫像和設備畫像,并自動生成系統(tǒng)及設備健康報告。
【關鍵詞】自動化系統(tǒng)及設備 健康模型 設備畫像 自動化系統(tǒng)畫像
近年來,國家電網公司各級調度中心已逐步完成智能電網調度自動化系統(tǒng)建設,其中硬件包括服務器、交換機、存儲、網絡設備等,軟件包括調度自動化系統(tǒng)、中間件、數(shù)據庫等。目前自動化運維人員需時刻監(jiān)視各軟硬件的運行情況,對異常問題進行處理。本文分析調度自動化系統(tǒng)值班、運維現(xiàn)狀,提出了一種調度自動化系統(tǒng)及設備統(tǒng)一運維技術。
1 自動化系統(tǒng)及設備自動建模
1.1 建模方法與范圍
采用層次結構方式,依據“模型自動生成,免維護”原則,歸納總結硬件和軟件的特征,從分類方法、資源監(jiān)視和故障分析三個維度構建自動化系統(tǒng)及設備運行狀態(tài)的健康模型。建模范圍包括設備信息和系統(tǒng)軟件信息。
1.2 自動化系統(tǒng)及設備健康模型
從系統(tǒng)、設備、軟件維度抽象出資源信息模型,從原始信息和統(tǒng)計信息維度抽象出運行信息模型,從性能分析、業(yè)務行為、故障分析維度抽象出規(guī)則模型,從公共基礎服務和應用服務維度抽象出功能/業(yè)務/服務模型,綜合資源信息模型、運行信息模型、規(guī)則模型和功能/業(yè)務/服務模型,構建出系統(tǒng)及設備健康模型,如圖1所示。
2 實時監(jiān)視與告警
2.1 實時監(jiān)視
以圖形化方式實時監(jiān)視自動化系統(tǒng)及設備運行的運行狀態(tài),通過圖元狀態(tài)、顏色等方式描述系統(tǒng)及設備運行狀態(tài),拓撲形式描述網絡狀態(tài),tips形式描述重要信息。
2.2 智能告警
智能告警包括告警匯集,規(guī)則定義,告警配置,告警推送、告警分析、智能告警庫。采用閉環(huán)告警管理策略,對問題和故障的閉環(huán)處理,逐步形成相應的知識庫,形成知識利用良性循環(huán)。
3 系統(tǒng)及設備畫像和健康報告
3.1 系統(tǒng)及設備健康畫像
綜合設備類型、投運時間、操作系統(tǒng)、CPU、內存、磁盤、網絡、響應時間等信息,抽象出設備運行標簽,形成設備健康畫像;綜合接入廠站、在線通道、應用、進程運行、數(shù)據同步、數(shù)據操作、消息傳輸、服務調用、圖形、告警、考核指標等信息,抽象出系統(tǒng)運行標簽,形成系統(tǒng)健康畫像。如圖2所示。
3.2 健康報告自動發(fā)布
根據自動化一體化運行管理規(guī)范要求,從系統(tǒng)資源消耗、核心服務響應時間、Web請求堆積、數(shù)據庫響應等多個維度詳細描述自動化系統(tǒng)及設備的運行狀況,實現(xiàn)自動化系統(tǒng)及設備運行健康報告自動發(fā)布功能;可自定義健康報告模板,根據個性化需求快速生成健康報告。
4 應用驗證
系統(tǒng)已經在西北電網公司和山東省電力公司試點應用,自動發(fā)現(xiàn)并采集調度自動化系統(tǒng)及設備的運行信息,并在三區(qū)進行匯集、統(tǒng)計分析并定期發(fā)布系統(tǒng)及設備運行健康報告。
5 結束語
本文提出一種自動化系統(tǒng)及設備統(tǒng)一運維技術,以值班需求為導向,通過整合軟硬件信息資源,實現(xiàn)自動化系統(tǒng)及設備統(tǒng)一運維,保障系統(tǒng)可靠運行。
參考文獻
[1]童辰,陳慧,季海.基于SNMP協(xié)議的通用數(shù)據采集系統(tǒng)[J].電子技術與軟件工程,2017(18):19-19.
[2]隋國政.淺談用戶畫像構建及應用[J].電子世界,2017(15):144-146.