李峰++郭文斌
摘 要本文引入了電力機房智能巡檢技術,針對傳統電力機房日常巡檢技術的工作內容,提出了基于業務域、基于場景可視化的智能巡檢技術,給出了智能巡檢系統平臺的系統架構和系統功能,實施效果表明,機房智能巡檢技術適用于電力企業,具有較好的推廣意義。
【關鍵詞】電力機房 智能巡檢 可視化 場景展示
目前隨著社會經濟的高速發展,具有數字化與高度信息化集成的電力信息系統成為實現智能電網的重要手段。電力機房,為整個電網系統提供所有應用服務運營的場所,是電網中發電、輸電、配電、售電的數據交互連接橋梁與應用服務無縫集成的平臺,但是,目前大部分電力機房在投入使用后的管理仍然有較大不足,日常運維、巡檢還停留在人工通過肉眼查看的方式,這樣不僅浪費寶貴的人力資源、同時由于容易出現設備管理與機房空間管理的混亂而對數據中心的安全運行與可擴容性產生隱患。因此,當下迫切需要一套能為電力機房管理人員提供直觀、遠程、便于操控的智能巡檢技術來解決此類問題。
1 機房日常巡檢
1.1 巡檢周期
巡檢是電網日常維護工作的重要任務。 一般來說,巡檢工作分為例行巡檢、節假日巡檢、自然災害和重要通信期的巡檢。機房的管理要求是定期對機房的狀況進行巡檢,如每天早上某一時間和晚上某一時間要求巡檢人員進入機房對機房內設備進行巡檢。為保障機房的穩定運行,最簡單的手段就是增加巡檢的次數,縮短了對機房的巡檢時間間隔,便于更全面地了解機房內各系統的運行情況。
1.2 巡檢內容
對機房設備進行巡檢時,主要包括機房各類基礎設施、服務器、網絡設備安全設備等,巡檢設備運行是否正常,是否存在告警或缺陷,同時巡檢的路線至關重要。一般情況下,一個典型的機房巡檢在進入機房時首先要對空調運行情況進行查看,然后對機房的溫濕度進行查看,最后依次對各個設備進行巡檢。
1.3 巡檢記錄
巡檢記錄可以直接反映巡檢人員對機房設備巡檢的結果,是體現機房內設備運行情況的重要依據。巡檢記錄的細致程度依不同區域、不同類型的機房有所差異,一般而言,比較關注于機房的環境信息,如溫度,濕度,重要設備的指標等內容。
2 智能巡檢技術
隨著電力企業信息化的建設,電力設備的智能化程度越來越高,同時承載這些設備的機房監控手段、信息化建設水平也越來越高,傳統的巡檢方式目前正逐步向智能化巡檢方式過渡,有應用智能機器人進行巡檢的技術研究,有應用信息系統數據挖掘進行巡檢的技術研究等方式。
2.1 基于業務域的機房智能巡檢
由于電力機房承載的系統較多,且系統跨區域跨機房的布局,單一模式下的機房巡檢模式難以適應各種各樣的業務系統,在兼顧巡檢工作共性,如工單管理、信息記錄、報表分析情況下,對特定業務域的巡檢要體現其業務特性。
基于業務域的智能巡檢策略其核心思想是:
(1)以機房基礎信息為各業務域的共性,涉及巡檢工作的基本內容,如巡檢路徑、工單管理、巡檢周期等內容提煉出共性,這些共性的集合作為機房基礎智能巡檢的公共項。
(2)針對不同業務域的特點提煉出屬于該業務域巡檢的必要項,并加以規范化,形成屬于該業務域的智能巡檢模板。
2.2 基于場景可視化的機房智能巡檢
可視化展示無疑是機房智能巡檢中重要的環節,其關鍵在于巡檢工作如何進行可視化展示,如機房基礎性質的資產可視化、容量可視化等內容顯然不是智能巡檢工作的重點,而實際設計中由于可視化工作具有開發周期,因此要盡量提煉巡檢工作展示的共性。
2.2.1 拓撲可視化
任何業務域是有其拓撲分布,即邏輯關系,對于以業務為導向的智能巡檢策略,拓撲可視化是基礎功能。
2.2.2 端口可視化
端口可視化不僅指設備端口呈現在巡檢人員面前,還指其連接關系,信息數據均能夠呈現,即端口可視化涵蓋了信息可視化。
2.2.3 故障可視化
故障點處于何處,要一目了然的呈現在拓撲圖上。
2.2.4 方法可視化
不僅要能夠找到故障點,還要有解決問題的策略,策略是日積月累逐步形成的,即機房智能巡檢的設計必須具有專家知識庫,否則難以稱之為“智能”。
2.2.5 報表可視化
對形成的策略,解決方式,解決結果以報表形式呈現給管理人員。
2.2.6 路徑可視化
對巡檢的路徑,周期,記錄等基礎信息形成簡潔有效的方式方法。
3 智能巡檢系統開發
智能巡檢系統使生產流程及時準確地按照巡檢計劃進行,并通過計算機通信網絡了解企業內部各工作點的數據信息,并提供相應的分析策略,為企業節省了人力、物力 。
3.1 系統構架
機房智能運維系統開發的內容涵蓋機房3D建模、軟件3D引擎加載、機柜室內定位、機房空間定位、數據庫同步等關鍵技術,最終呈現給運維人員的是智能化、自動化的動態可視化自成像運維管理平臺。系統具體構架見圖1。
3.2 系統功能
3.2.1 機房場景可視化
機房是立體的空間概念,包括所在環境、配電、制冷、消防、通信機柜、布線等多種環節,機房3D建模技術實現機房的桌面化3D呈現,實現機房可視化管理,可實現環境可視、機房可視、機柜組可視、機柜可視、設備可視、端口可視,實現所見即所得。
3.2.2 IT資源業務域分類管理
各類IT資源分布于實際的物理機房中,這些設備之間是構成特定的業務關系的,比如營銷系統、辦公系統、抄表系統,將這些設備根據業務、邏輯、冗余等關系進行分類能夠構成不同的業務域,準確、按需求的描述設備間的內在關系,尤其是在一個設備參與多個業務的情況就更能夠展示準確,實現業務層次的“所見即所得”。
3.2.3 連線資源智能配線管理。
設備布局布線對機房管理而言是非常重要的環節,由于施工方與運維方不一致,施工標準不統一,運維人員傳承等方面的問題,與IP層監控日益完善相比,物理層的配線管理成了機房智能運維的短板。
3.2.4 機房IT設備資產管理。
智能運維技術包括機房IT設備的資產管理功能,對現代化信息機房來說,機房內的設備種類千差萬別,數量巨大,靠人工管理及維護不僅容易出錯且很難快速定位及查找,對其歷史狀況更是難以入手了解,尤其是遇到設備移動,機房搬遷狀況時,且機房規模越大其管理復雜程度越高。對IT設備引入電子標簽,電子標簽內存儲有該設備的歷史及當前配置信息,生產相關、物流相關及運行相關的靜態信息,與運維平臺交互的可配置動態信息等。
3.2.5 核心設備狀態管理。
機房的服務器、交換機、路由器等設備是運維人員最為關心的核心設備,需要高的關注度,核心設備除基本的生產信息、物流信息、配置信息等偏靜態的信息外,動態的運行狀態信息如CPU使用率、進程數、數據流量、設備溫度、內存使用率等實時運行信息的提取、存儲、分析、預警是幫助運維人員管理核心設備的重要輔助手段。
3.2.6 機房自動巡檢功能。
機房定期巡檢是運維人員日常管理的重要職責,平臺提供自動巡檢功能,結合機柜微環境管理,IT設備動態運行信息提取功能及機房3D可視化呈現手段幫助運維人員獲得量化的巡檢數據,提高機房運維效果及運維效率,減少甚至擺脫靠運維人員目測方式進行巡查,提供數字化運維數據及報表。
4 應用成效
4.1 應用成效
非結構性場景展示已經在本人單位予以實施,并在可視化場景基礎上融合了動環監控、網絡監控分析、電子配線數據等相關業務信息,使運維效率得到明顯提高和改善。
(1)節省機房運行維護費用。實現機房3D自成像可視化、精細化管理,可快速實現設備自動定位,設備快速查找,提升效率70%以上。
(2)實現設備動態信息提取提與分析,提前預警設備問題,在設備故障時能快速查找問題的根本原因,設備平均故障解決時間減少30分鐘,通過設備預警方式解決問題占總問題數的60%,通過專家系統引導故障解決目前占比在25%左右。
(3)將日常巡維工作桌面化呈現,減少運維人員工作壓力,提高運維深度及廣度,提高機房管理的規范化程度,建立了普通配線架改造為電子配線架的標準。
(4)通過研究,提高了專業技術及管理水平,提高了工作效率及智能化應用水平。通過系統的應用,解決了機房信息碎片化和數據孤島的現象。
4.2 行業推廣
通過此項目實施,為電力機房管理人員提供直觀、遠程、便于操控的管理系統,有效減輕了基層人員機房日常巡檢的業務工作量,也有利用機房管理人員更加容易的把握在信息機房中的各種隱含信息、分析數據之間的聯系,從而有針對性的制定更加行之有效的策略來避免各類故障給電網所帶來的經濟效益和社會效益損失。
參考文獻
[1]詹鵬,曾玉榮,吳崢.電網通信網絡設備智能巡檢體系研究及應用[J].電信技術,2014(04):69-72.
[2]付曉峰,付興武,李楠.智能巡檢系統的開發與在生產管理中的應用[J].控制工程,2014(05):17-19.
作者簡介
李峰(1983-),男,河北省保定市人?,F為國網新疆電力公司電力科學研究院工程師。研究方向為信息安全。
作者單位
1.國網新疆電力公司電力科學研究院 新疆維吾爾自治區烏魯木齊市 830011
2.國網新疆電力公司阿勒泰供電公司 新疆維吾爾自治區阿勒泰地區 836500