張永梅++賈輝++唐軼軒++姚振++王麗

摘 要:隨著國網安徽省電力公司設備(資產)運維精益管理系統的上線,實現了橫向、縱向多系統數據共享和業務融合,推動了生產管理信息化水平再上新臺階。文章針對系統建設過程中出現的數據訪問反應慢、圖形卡頓和接口穩定性差等問題做的系統調優進行了介紹,并闡述了PMS2.0系統深化應用的管理方法和相應措施。
關鍵詞:系統架構;性能調優;“126”管控;深化應用
國網安徽省電力公司(以下簡稱“安徽公司”)為適應“三集五大”體系建設要求,支撐運維檢修全過程精益化管理和電網資產的全壽命周期管理,更大范圍地實現數據共享和業務融合,推動公司生產管理信息化水平再上新臺階,啟動了設備(資產)運維精益管理系統(以下簡稱“PMS2.0”)建設工作。
PMS2.0圍繞生產管理的全過程,以設備管理為中心,計劃任務為主線進行設計,是生產精益化管理的重要支撐平臺。系統包含標準中心、電網資源中心、計劃中心、運維檢修中心、監督評價中心和決策支持中心六大中心,系統用戶覆蓋了省電力公司本部、電科院、省檢修公司、送變電公司、16家地市公司及其所轄72家縣公司。
隨著系統的建成及推廣應用,逐漸暴露出系統架構不夠優化、圖形客戶端運行緩慢、配搶工單頻繁超時等問題。
1 系統架構介紹
安徽公司遵照國網統一發放的《SG-PMS2.0省公司系統安裝配置手冊》開展系統部署工作,系統總體架構如圖1所示。
其中,省公司側部署3臺數據庫服務器采用ORACLE11gRAC的集群方式對外提供服務,34臺應用服務器分布在不同資源池、不同區域,分別按不同的程序功能部署了PMS2.0系統的各類應用程序,所有應用服務器均接入radware做負載均衡對外提供服務。
應用服務器按其部署服務劃分為拓撲柵格服務14臺,PMS主服務9臺,接口服務6臺,GIS服務4臺,配網管控計算服務1臺。部署拓撲柵格分區服務的14臺服務器呈兩兩互備方式,避免單點故障;復用其中4臺配置高的服務器并部署了數據代理和柵格前置服務,呈兩兩互備方式,避免單點故障。部署PMS主服務的9臺服務器,復用其中4臺機器額外部署了SGUAP服務、空間信息服務和配搶消息服務,呈相同服務多節點方式,避免單點故障。6臺接口服務器中兩臺單獨部署為配搶專用接口服務,呈兩兩互備方式,避免單點故障。另外4臺部署對外接口、任務調度服務,同時還部署了PMS主服務以作備用。
2 性能優化
針對系統存在的性能問題,國網安徽省信通公司(以下簡稱“信通公司”)開展了數據庫、圖形和接口的相關優化工作,提升了PMS2.0運行穩定性及用戶體驗。
2.1 數據庫優化
為解決系統運行緩慢、數據庫服務器宕機問題,信通公司在國網典設的三節點ORACLE11g的RAC基礎上,又額外異地部署了一套三節點的ADG備庫,實現數據庫快速切換、災難性恢復及數據保護,當主庫出現故障時,備庫可以自動切換為主庫,并對外提供服務。同時,將應用程序的JDBC連接串由常規的IP∶PORT改為URL∶PORT方式,通過域名系統(Domain Name System,DNS)進行域名解析,當數據庫出現故障時主備庫切換后,應用在不需要任何干預的情況下實現自動重連當前可用數據庫;對最能體現數據庫運行安全及運行質量的DBtime,事務響應時間,數據庫等待事件數、活動會話走勢、物理讀寫、CPU負載率、文件系統及表空間使用率等關鍵指標部署了監控措施,設置指標告警閾值;同時按日將執行時間較長的結構化查詢語言(Structured Query Language,SQL)語句提取出來,數據庫與應用系統專業人員聯合分析,提出優化建議,部分SQL語句也同步報送國網總部開發分析,預先進行系統性能薄弱點的控制,避免因性能問題影響系統安全穩定運行。
2.2 圖形架構優化
針對PMS2.0出現的圖形編輯卡頓現象,信通公司通過對I6000監控系統主機運行關鍵數據的分析,發現該問題的主要影響因素為主機資源不足。系統使用24核CPU的虛擬機加載全省數據時,虛擬機CPU使用率指標長期居高不下,系統存在嚴重超負荷運轉現象,導致用戶前端操作卡頓現象頻現。對此,信通公司協調硬件資源進行優化,及時擴容低配置虛擬機CPU至48核,并新增4臺物理機(配置為80C/128G)同步投入運行。
在提升硬件資源、降低SQL響應時長后,PMS2.0系統響應速度有所提升,但圖形編輯卡頓現象仍然存在,重要功能模塊運行性能指標仍不理想。信通公司從監控指標的運行表象,分析發現在系統架構及程序設計上系統也需要進行進一步的優化處理,經過充分調研、比對、分析并測試后,決定從系統架構及數據分區方面開展優化調整,采用更改柵格拓撲服務數據加載機制,由加載全省數據改為加載地市數據,即“圖形分區方案”。將各地市按照電網數據量大小、地市行政區域界限劃分為6個區域,每個區域使用兩臺機器進行集群部署柵格拓撲服務,避免單點故障并負載均衡,從源頭解決圖形編輯卡頓問題,為開展各項業務應用提供了最大保障。
2.3 接口優化
針對PMS2.0與CMS營銷業務應用系統接口穩定性較差,導致配搶工單超時率高達9.35‰的問題,信通公司創新提出營銷側接口獨立部署的方案,將營銷接口服務剝離出來,單獨部署在4臺新的服務器上,并作F5負載均衡,大幅提升了接口性能;同時在所有接口都增加了監控“握手”記錄的機制,每次接口調用時,都會產生一條日志記錄“握手”結果,極大地方便了問題定位與分析。
3 深化應用
3.1 管理方法
3.1.1 管理目標
安徽公司在項目建設中建立里程碑節點清晰的項目工作計劃,在總體進度嚴格要求下依據任務緊迫性、實際開發及實施進度合理調整計劃細節,以確保達到“細節可操作、節點可控制、整體可完成”的目標。endprint
3.1.2 管理細則
為確保工程的順利實施,安徽公司嚴格按照國家對系統集成項目管理的有關規定和系統實施方案,對項目實施過程中的進度、質量和資源的使用進行全過程的管理。按照“統一規劃、統一標準、統一平臺、統一建設”的原則,PMS2.0系統實施工作成立項目領導小組、項目管控組、項目工作組、實施組、技術支持組,為項目推進提供組織保障。
同時,安徽公司積極推行“126”管控模式,即圍繞“一個計劃”—里程碑計劃,執行“兩個方案”—工作方案、單軌上線方案,推行“六項機制”—分級負責制、周月例會機制、關鍵指標通報考核機制、進度節點管控機制、問題管控機制、部門間橫向協同機制,細致分解工作任務項,落實各項工作責任方及時間節點。同時,要求各單位在嚴格執行省公司“126”管控模式及機制的基礎上,要比照建立自己的管控機制,為項目進度及質量提供了保障。
3.2 用戶培訓
為保障系統應用效果,省公司組織16家地市公司的輸變配專家關鍵用戶進行集中培訓,從中選拔出優秀學員作為培訓老師,與項目組專家一起組成培訓團隊,赴地市公司開展駐地培訓。同時,根據培訓效果,組織人員對教材進行優化,以實用為主,突出差異,重點培訓PMS2.0和PMS1.0在業務和流程上的差異,縮短培訓時間,使基層人員能夠盡快掌握。系統建設期間,累計培訓12 854人次,培訓范圍覆蓋管理人員及各個班組成員,培訓覆蓋率100%,為各單位業務正常開展打下堅實基礎。
3.3 工具研發
隨著PMS2.0系統上線運行,系統“應用情況指標”查詢模塊存在考核細度低于現場要求,功能完善進度慢等問題,影響了實際指標管控、分析工作。為此,安徽公司結合PMS2.0系統指標體系與本地基層實際業務應用情況,研發了“PMS智能管控分析平臺”,以精益化管理為主線,以推進PMS2.0系統實用化應用為重點,統計查詢各業務指標,提升各地市公司專業人員業務應用系統能力,建立統一、高效、集約的運維檢修管理信息化平臺,滿足執行層、管理層和決策層需要,提升電網運檢管理精益化水平。
“PMS智能管控分析平臺”針對基礎設備臺賬、生產業務數據、系統運行數據的各類指標進行分析、預警,秉承“以指標促應用,以應用促管理”理念,從月度、季度、年度3個維度對指標進行科學組合,強化指標評價對生產信息化專業管理的支撐作用,合理設置發布周期,科學指導各單位系統實用化推進,加大各單位管理改進和自我提升的關注度。
4 結語
PMS2.0是“三集五大”體系建設中的“大檢修”體系內容,支撐了運維檢修全過程精益化管理和電網資產的全壽命周期管理,安徽公司通過以上技術上、管理上的一系列措施,有效地提升了系統性能,提高了用戶體驗。目前,該系統已在安徽公司全面應用推廣,系統運行穩定,功能應用可靠,有效支撐了安徽公司現有設備資產的運維檢修、全壽命周期管理。
Optimization and application of equipment (asset)
operation and maintenance lean management system
Zhang Yongmei, Jia Hui, Tang Yixuan, Yao Zhen, Wang Li
(State Grid AnHui Information &Telecommunication Company, Hefei 230061, China)
Abstract: With the equipment (asset) operation and maintenance lean management system of State Grid Anhui Electric Power Company on the line, achieved a horizontal, vertical multi-system data sharing and business integration, and promoted the level of production management information to a new level. This paper introduces the system tuning in the process of system construction, such as slow data access, graphics caton and poor interface stability, and elaborated the deepen application management methods and the corresponding measures of the PMS2.0 system.
Key words: system structure; performance tuning; “126” management and control; deepen applicationendprint