楊代才 秦運龍
摘要:針對湖北省氣象云平臺資源池分散、異構、無法統一管理的現狀,設計了湖北省異構資源池的統一監控系統,實現統一監控,解決了多個分散異構資源池無法統一監控和運維的難題,以更好的規劃資源提升資源利用率。
關鍵詞:虛擬化;異構;分布式;資源池
中圖分類號:TP309 文獻標識碼:A 文章編號:1007-9416(2018)07-0060-02
我省從2013年起經過多年時間初步搭建了湖北省氣象云平臺,實現服務器虛擬化和桌面虛擬化,擁有混合異構的VMware資源、KVM資源和CTRIX資源池[1]。分階段多廠商參與建設,導致當前階段分散、異構的多資源池普遍存在,解決如何將不同的虛擬化技術架構下的集群環境采用一種統一的方式來進行監控管理,避免監控管理不同的池化資源需要采用不同的管理方法和工具,要達到的效果是在一個統一管理的工具環境下就可以監控管理VMware資源池、CTRIX資源池、KVM資源池,管理范圍包括網絡層、存儲資源層、服務器層,粒度能夠監控管理到服務器操作系統進程級別、磁盤組RAID級別、網絡VLAN級別。如何快速、有效的監控和管理云平臺中大量的網絡設備、計算資源、存儲設備,保障各種應用系統穩定可靠運行變的越來越重要,迫切需要開發建設混合異構的資源池的統一管理監控平臺。
1 總體設計
基礎設施資源池監控涵蓋對虛擬化環境和物理主機各項性能指標的監控,同時支持按業務系統維度、部門維度和地理位置維度進行的監視功能[2][3]。通過SNMP協議、IPMI協議、Agent代理等采集方式,對資源的KPI性能指標包括CPU使用率、內存使用率、存儲使用率、I/O速率、告警等,按設定監控時間進行主動輪詢收集,并在此基礎上達到實時監控資源健康狀態、主動發現故障、及時運維的目的。
(1)綜合視圖。綜合視圖為總體展示界面,從物理地域的角度、業務使用的角度以及部門角度對云系統中的資源進行展示。具體包括資源池運行概況、資源池運行趨勢、核心業務系統和各部門資源池使用情況。(2)資源池監控。對資源池中單個虛擬機及物理主機進行監控,用顏色直觀展示機器狀態,可進行精準查找和分組查看,支持圖形界面與表格界面切換。點擊問題機器小圓點可直接查看機器詳細狀態,方便業務人員處理相關問題。(3)各部門使用情況及各地區使用情況監視。為物理機及虛擬機添加標簽,標明其所屬部門及所屬地區,省級各部門及市縣地區可使用帶權限的用戶登錄,查看本部門及地區被分配的的虛擬化資源及所管轄主機的狀態信息。(4)權限管理。為省級、市(區)級、縣級建立區分權限的用戶,省級可查看本省所有物理主機、虛擬機及云管理平臺信息,可創建市、縣級用戶,修改權限配置;市級地區可查看本市所屬主機、縣級主機,市級可建立下級縣用戶,各縣級臺站使用本臺站用戶可查看臺站內主機運行狀態;省級還支持部門管理權限,各部門使用其賬戶登錄監控平臺,可查看本部門的主機運行狀態。(5)告警管理。在界面中展示當前告警,對嚴重告警需要有聲音提示和移動端告警功能。具體查看全流程告警模塊。(6)事件臺。在定義事件時,針對此事件定義告警規則。系統支持每次符合條件觸發、周期內發生多次產生事件、周期內一直產生事件,三種告警觸發策略。支持以占位符的方式靈活設置告警內容,且能以郵件、系統消息、短信等多種方式來發布告警消息,通知相關人員,以便告警得到及時處理。
2 系統設計與實現
異構的資源池的統一監控基于分布式架構實現,通過云平臺接口模塊調用云API接口,采集云計算資源。對于服務器設備采用客戶端軟件,SNMP協議主要用在對網絡設備的監控方面,如交換機、防火墻等。邏輯處理模塊負責將數據儲存在數據庫中,實現資源管理、時間管理和報警管理。最終通過Web前端展示,展示界面如圖1所示。
3 結語
本文設計了異構資源池的統一監控研究系統,告別了傳統運維管理針對不同的虛擬化服務和虛擬化設備需要采用各式工具集的繁瑣場景,使用一個統一的平臺就可以完成VMware虛擬機資源管理、KVM云平臺資源管理、基礎設施硬件監控、基礎設施存儲管理、基礎設施網絡管理等工作。使得計算資源、存儲資源、網絡資源得到高效復用,有力的支撐了我單位信息業務。
參考文獻
[1]楊光,謝銳,薛廣濤.私有云平臺資源監控與優化系統[J].計算機工程,2018,44(3):1-7.
[2]王笑宇,程良倫.云計算環境下動態資源碎片管理機制[J].計算機應用,2014,34(4):999-1004.
[3]劉鵬.基于OpenStack 的私有云部署和監控技術的研究[D].北京:北京郵電大學,2015.