韓峰

摘要:目前上海聯通在上海各處有華為和中興通訊等多家自建或代建的數據中心,每個數據中心都要配備獨立專業的運維管理人員,而且各個數據中心的監管數據對上匯總也比較復雜,需一套統一的頂層數據中心DCIM平臺來將各個數據中心的管理系統納入到這個平臺來進行統一的監管。
關鍵詞:數據中心;運維管理;DCIM平臺;管理系統;統一監管
1緒論
目前上海聯通在上海的多個數據中心的管理平臺中有多個廠家的管理系統,有中興力維,艾默生等多個廠家的系統,管理水平參差不齊,沒有一個統一的標準化的要求。有些機房甚至還是采用傳統的人工的方式來日常維護,例如手動計算各種能耗分析,人工抄表式巡檢,點數式資產盤點等。這些管理手段耗時耗力,準確度也很低。在聯通總部也無法直接獲取到一線數據中心的數據。隨著上海聯通業務的爆發式增長,也急需一套綜合智能管理平臺,在人手有限、滿足基本需求前提下,提升運維和運營的質量。
這就需要一個“集中化、一體化、智能化”的垂直的頂層的DCIM管理平臺。
2.總體方案設計
2 1設計原則。方案設計本著“實用、可靠、先進、安全、經濟和共享”的建設原則,系統設計需滿足以下原則:
1)整體性、便捷性
各智能化子系統統一界面、統一管理,在同一個界面上顯示各子系統如動環、門禁、巡更、樓控、廣播、信息發布等設備的狀態,并可實現一體化操作,無需多平臺跳轉。
2)安全性
建立用戶安全機制,多用戶權限及強制密碼修改功能
重要設備如動環監控單元采用雙電源冗余,統一管理平臺服務采用雙機備份,重要監控點位采集設備冗余備份
3)開放性、擴展性
系統不僅可以向下集成各種軟硬件接口,還可對外提供各種接口,完全實現與其他平臺的無縫對接
隨著用戶業務的拓展,系統能方便的實現擴充與擴容,避免因擴充而需要更換中心設備或系統軟件等
4)穩定性、可靠性
系統采用分層化、模塊化的設計,保證各智能化系統在擴容、升級時不影響其他系統,整體綜合平臺可無間斷安全運行。
5)節能、經濟性
統一管理平臺的設計是對各子系統管理平臺的優化及集成,各類監測數據統一管理,避免各子系統管理平臺的重復建設,優化管理入口及呈現界面,提升管理人員管理效率,節約人力成本。
2.2系統架構
頂層DCIM管理平臺平臺建設需打破傳統運維各子系統獨立分散的垂直管理,將采用“集中化、一體化、智能化”的設計模式,實現主動、高效、流程化的運維管理。平臺架構采用分層設計,實現功能總集成、流程總調度、資源全監控。
3軟件架構
3.1呈現層。提供多種用戶交互方式。
組態通過圖形化界面分多個層次展現園區全景,包括園區組態、樓棟組態、樓層組態、機房組態和設備組態,組態界面可以通過控件進行任意的組合配置,按照用戶的要求形成實景或抽象的管理界面。
3.2業務層。業務層包括三個方面:統一管理功能,運維功能和管理功能。
3.3采集層。采集層有三類數據來源:
已有DCIM平臺的從平臺統一采集;
沒有平臺的各子系統單獨對接采集;
與聯通自有業務系統的對接;
4管理平臺功能
4.1事件流管理。以客戶服務為中心,個人工作臺作為運維人員的主要工作界面,包含關鍵參數展示及運維工作任務事項。
4.1.1關鍵參數顯示
關鍵參數指標包括:能耗數據、資產信息、容量信息;
關鍵參數指標的展示包括曲線圖、柱狀圖、趨勢圖等圖形化展示;
容量趨勢圖支持按年、月、日展示空間、電力、制冷容量信息。
4.1.2任務顯示
任務顯示模塊有待辦任務、已辦任務和我創建的任務,包括任務名稱、任務類型、任務日期、級別、發派人等信息,根據任務級別可以區分任務的優先級,主要級別有:緊急、重要、標準、次要;
已辦任務和我創建任務支持任務詳情查看功能和按照任務處理狀態進行查詢功能;
我創建的任務支持告警或資產工單創建菜單,根據工單類型跳轉至對應的工單創建頁面;
待辦任務支持任務快速處理菜單,根據任務類型跳轉到詳細的任務處理頁面,在任務處理頁面可以查看任務詳細信息、任務指派人信息、任務處理意見等信息。
4.2告警統一管理。系統告警分為四級:一級告警、二級告警、三級告警和四級告警(重要程度從高到低),其中,一級告警以紅色標識,二級告警以橙色標識,三級告警以黃色標識,四級告警以淡藍色標識,告警級別、告警上下限值可根據需要更改。
4.3機房環境管理。機房環境管理提供對機房、機架、機位的溫濕度數據的分析、呈現、和告警等管理功能。動環數據綜合分析
動環數據綜合分析需要保證動環等系統的接口提供相應數據(UPS監控、精密空調監控、配電柜監控、漏水監控、電池組監控、柴發監控、消防監控、冷凍機監控、冷卻塔監控、門禁卡監控等)。
4.4制冷、配電展示。集中監控系統支持按照空間維度(基地-樓宇-模塊-機房-冷通道-機列-機柜)進行制冷、配電等的展示。同時集中監控系統把制冷、電力等信息同步給資源管理系統,資源管理系統可實現對制冷、電力等容量信息進行查詢統計、容量報表、低容量告警和容量配置等功能。
4.5聯動管理。1、系統支持自動保存所有的動環、門禁和視頻之間的聯動記錄,保存的內容包括聯動的觸發事件信息(如××監控量告警/消除、時間)和聯動的結果(如聯動XX攝像頭錄像、轉到預置位或觸發××遙控量)。
2.可單獨查詢聯動日志,可按任意時間、觸發條件(單選)和聯動結果(單選)組合查詢。
3.可以查詢聯動異常情況,如觸發事件和聯動結果對應的對象已經刪除等情況。可根據聯動異常情況批量刪除聯動規則。
4.63D視圖。系統支持機房仿真3D呈現。查詢定位設備設施。支持3D方式呈現機柜容量信息。支持查看機房溫度分布云圖,提供顏色一溫度刻度尺。支持歷史溫度云圖播放,鷹眼視圖、3D視角切換、收藏、定位,自動巡檢等功能。
4.7問題管理。問題可以提供界面手動錄入問題信息,提供統計、查詢和導出功能。
4.8容量管理。系統具備結合資產管理對空間、電力等容量信息進行查詢統計、容量報表、低容量告警和容量配置等功能。結合資產管理對空間、電力容量,冷量。可輸出容量報表、高容量告警、容量配置。
4.9資產管理。按照區域、機房、樓層、房間展示資產列表,根據資產維護日期和維護人自動發出設備維護提醒通知,維護人員可填寫維護信息,導出維護記錄
5某電信公司案例
一個電信公司的頻統計可能有100萬個組合條件。包括:站點,設備類型,監控量類型,告警級別,告警時間段,告警次數,搜索時間范圍。
某電信公司A 2013年~2016年,3年歷史數據合計27億條,高速查詢對比。
某電信公司B 2010-16年,5年歷史數據:50億條,3萬種報警類型400萬條左右的報警數據。
由于自有的一些業務系統已經比較成熟,將其融合到總格管理平臺內能發揮更大的效益。同樣,自由業務系統需要定制對外接口,即可完成兩平臺的對接。
結語
在IDC領域,高速發展的IDC數據中心,也就意味著數據中心管理系統需要提升一個層次。大數據爆發的時代背景下,傳統的數據中心管理系統,只能完成了第一層響應響應型分析,即收集數據,報表統計,高速查閱;而目前設計的數據平臺,可完成第二層診斷型分析和趨勢分析;第三層預測性分析和預測模型的建立;以及第四層認知轉換這四個更高層級的分析。
后期的發展可以由聯通來提出業務模式、業務流程、業務時間軸,由供應商根據實際需求來搭建數據模型,使得采集的龐大數據依附在模型里面發揮更加實際更加智能化的效果。