摘 要:隨著計算機信息技術的快速發展,近年來IT系統規模持續擴大已經成為我國各類企業的常態,基于此,本文首先分析了IT系統一體化運維監控及服務預警平臺的建設需求,并詳細論述了該平臺的設計與實現思路,希望由此能夠為相關業內人士帶來一定啟發。
關鍵詞:IT系統;運維監控;預警平臺
中圖分類號:TP311.5 文獻標識碼:A 文章編號:1004-7344(2018)26-0326-01
前 言
資料信息分散、設備缺乏統一監控平臺、缺乏運行健康情況評估手段和預警措施均屬于較為常見的IT系統運與發展問題,隨著企業IT系統規模的不斷擴大,這類問題帶來的負面影響也往往隨之增長,而為了盡可能解決這類問題,正是本文圍繞IT系統一體化運維監控及服務預警平臺開展具體研究的原因所在。
1 建設需求
1.1 監測IT系統運行
結合我國現階段企業IT系統面臨的普遍性問題,本文研究的運維監控及服務預警平臺需首先滿足IT系統的運行監測需要,這一需要的滿足需關注IT系統監控、故障處理、健康運行報告生成、運行事件響應等功能的集成,企業IT系統的業務連續性、健康度由此即可得到較好保障。為真正實現IT系統運行的監測,平臺必須采用高效穩定安全的檢測工作,同時還需要關注IT系統核心內容的全流程監控、監控結果的可視化展示、大屏集中式告警,故障點快速定位也應成為平臺設計與實現所關注的焦點[1]。
1.2 保障業務連續性
隨著大數據、云計算等技術的不斷完善,我國企業的信息化進程不斷加快,IT技術與業務的融合已經成為很多企業的常態,企業的穩定運行、長期可持續發展實現也需要得到IT系統的支持,因此IT系統的業務連續性保障理應成為本文研究平臺的建設需求之一。在筆者的實際調研中發現,相較于IT基礎設施故障,各類業務系統故障的發生更為頻繁,因此平臺建設需同時關注IT系統的業務運行層、應用系統層、基礎設施層,以此更好為IT系統業務連續性保障提供支持。
1.3 管理業務容量
平臺還需要具備管理業務容量的能力,該能力需通過分析工作負載、調整業務系統容量、調整業務時間實現IT系統的高水準運行,由此將單一、零散的業務數據進行趨勢化整理,IT系統也將為企業運行發展提供更有力支持,業務的處理性能、處理量、各資源使用狀況同樣屬于平臺所關注的重點。
2 設計與實現
2.1 平臺技術架構
為保證IT系統一體化運維監控及服務預警平臺能夠真正實現應用系統、安全產品、網絡設備、計算機設備網上行為及運行狀況的集中監控,并同時實現各類設備的全面集中統一管理,平臺必須具備快速發現設備異常情況、快速定位故障并自動形成“工單”的能力,因此平臺采用了三層架構設計,數據使用層、數據處理層、數據采集層將通過相互配合賦予平臺事件告警、實時數據/故障診斷、歷史數據分析等功能,而在管理控制臺支持下,整個平臺可實現各個層面的全方位配置管理,具體平臺構成如下所示:①數據使用層。數據使用層也可以被稱作展現層,IT系統監測數據查詢、健康度巡檢報表、全局視圖屬于數據使用層的主要構成,其中IT系統監測數據查詢可通過日期、關鍵字查詢IT系統歷史運行情況,健康度巡檢報表則能夠通過重要設備、業務視圖、告警統計、邏輯拓撲直觀展示系統健康程度,全局視圖則能夠實時展示IT系統的監視與告警情況,同時全局視圖所展示的信息還會自動記錄于事件管理平臺。②數據處理層。數據處理層的功能實現需得到相應的性能指標集支持,這里的性能指標集構建需結合監控對象特點及運維管理需要,由此圍繞測量頻度、預警閡值、計算方法、數據來源、測量范圍等參數構建性能指標集,即可實時監測、分析IT系統性能,如發現系統出現超出預警閡值狀況,數據處理層將傳遞相應信息至數據使用層。③數據采集層。作為平臺的最底層,數據采集層主要負責故障數據、性能數據的采集,采集的實現需得到Agent部署、NSMP協議的支持,同時數據采集層還具備被動接收采集指令功能,平臺的后續分析、數據挖掘實現由此即可得到保障[2]。
2.2 平臺功能架構
結合IT系統一體化運維監控及服務預警平臺的建設需求,平臺選擇了基于松藕合的體系架構,同時結合了云計算技術賦予結構部署靈活性,靈活模塊化組裝也將由此實現,而為了更好賦予平臺“監控、管理、管控”的協同處理能力,平臺功能架構由統一訪問門戶、集中監控管理中心、事件與性能管理平臺、資源與指標管理平臺、運維管理中心組成,具體組成如下所示:①統一訪問門戶。個人工作臺、消息中心、個性化定制、大屏展示、用戶權限管理、綜合視圖屬于統一訪問門戶的主要功能模塊構成,由此即可為不同用戶提供針對性的輔助工具,滿足其個性化使用需要與權限分級需要。②集中監控管理中心。綜合展示、綜合分析、綜合報表、預警管理、告警管理、模型管理屬于其主要功能模塊,流量、拓撲、報表、性能等信息可由此實現多樣化展示。③事件與性能管理平臺、事件壓縮、事件過濾、告警策略、告警處理、性能壓縮、性能過濾屬于該平臺的主要功能模塊,采集信息將由此實現初步處理。④資源與指標管理平臺。模型管理、資源管理、自動發信、拓撲展現、模型管理、數據管理、定義管理屬于平臺主要功能模塊,事件的統一處理將由此得以實現。⑤運維管理中心。服務臺、計劃作業、任務管理、自助服務、故障管理、變更管理等屬于其主要功能模塊構成,資源的高效利用和綜合管理將由此實現。
3 結 論
綜上所述,IT系統一體化運維監控及服務預警平臺具備較高推廣潛力,在此基礎上,本文涉及的平臺技術架構、平臺功能架構內容,則提供了可行性較高的平臺建設路徑建議,而為了進一步提升該平臺性能,各類新技術的應用探索需得到關注。
參考文獻
[1]狄 剛.國家級“一帶一路”投資平臺信息化頂層設計的回顧與思考[J].金融發展評論,2018,02:1~8.
[2]陳志勇,李忠富,李 環.基于動態環境監測系統的新能源變電站管理方法的改進與創新研究[J].環境科學與管理,2018,4301:181~186.
收稿日期:2018-8-9