陳開 陳柯辰
(浙江省大氣探測技術保障中心 浙江省杭州市 310000)
基礎設施資源池主要包括硬件資源和管理平臺。資源池硬件資源主要由計算 資源,存儲資源,以及可靈活配置的網絡支撐資源構成。基礎設施資源經過虛擬化軟件、分布式系統池化后,按照業務特點構成不同的分類精細化資源池,由資源池管理平臺統一管理。
基礎設施資源池[2]采用統一架構、統一標準構建,通過提供資源管理接口[1](定義為 CMAR-API),實現與基礎設施資源和資源池管理平臺[3]的交互;通過管理平臺,提供標準豐富的、強大的業務能力;通過資源池綜合管理接口(定義為 CMAC-API)實現國省資源池的統一管理,以及與第三方監控運維系統[4]的對接。
基礎設施資源池通過資源池管理平臺的統一門戶,為系統運營人員和用戶提供統一的接入和業務運營管理,保證了基礎設施資源池對各種類型應用、按需服務、自動彈性伸縮[5]、高可擴展、高可用性等的良好支撐。
2.1.1 資源管理需求分析
資源管理包括了基礎服務、管理控制和服務運營等功能。具體如下:
(1)基礎服務:云主機服務、塊存儲服務、對象存儲服務、自動伸縮服務、虛擬數據中心服務、虛擬負載均衡、虛擬防火墻、備份管理服務。
(2)管理控制:資源全生命周期管理(創建、啟動、分配、調整、停止、掛起、回收等)、資源組管理(資源分組)、用戶管理及權限控制、配置管理、接口(綜合管理及資源接口)。
(3)服務運營:服務申請、審批、服務編排、服務計量、統計報表等。
2.1.2 運維管理需求分析
根據國家級、省級氣象部門可能存在異構虛擬化層的實際情況,以及實現面向系統管理員、最終用戶、展示需求等不同維度的需要,通過池管理平臺的綜合管理接口 CMAC-API 獲取管理信息,實現各類資源和業務的狀態及性能監控、資源的統計報表等功能,包括對資源池及其上承載的各種業務實現實時監控、捕獲資源的部署狀態、性能指標、運行指標、各類告警信息等,以及資源操作日志等。監控運維是多種設備統一展現,提高運維效率,降低運維成本。
2.1.2.1 監視信息的采集
為實現對基礎設施資源池的監視,需要采集的數據包括性能、告警和配置信 息等。
(1)性能監視數據的采集。對虛擬資源的監視內容包括但不限于集群服務資源使用情況;來自宿主機、虛擬機、虛擬存儲的性能數據。對于物理資源的監視內容包括但不限于:采集對象范圍應該包括主機設備、數據庫軟件、中間件軟件、網絡設備(交換機、路由器、防火墻)、存儲設備(磁盤陣列、光纖交換機等)、備份設備(磁帶庫、備份軟件等);對于運行在虛擬機之上的操作系統、數據庫和中間件等軟件資源的數據采集內容與運行在物理服務器的采集內容相同;采集指標包括主機設備 CPU 使用率、數據庫軟件表空間使用率、存儲設備磁盤 IO 速率等。
(2)告警監視數據的采集。針對虛擬資源的需要監視的內容包括但不限于:來自集群、宿主機、虛擬機、虛擬存儲、虛擬網絡設備的告警。針對物理資源的監視內容包括但不限于:采集對象范圍應該包括主機設備、數據庫軟件、中間件軟件、網絡設備、存儲設備、備份設備;對于運行在虛擬機之上的操作系統、數據庫和中間件等軟件資源的數據采集內容與運行在物理服務器的采集內容相同,包括主機設備主機狀態、數據庫軟件數據庫狀態、磁盤陣列狀態等。
(3)配置信息監視數據的采集。針對虛擬資源的配置信息監視內容包括但不限于:虛擬數據中心名稱;集群名稱、是否開啟資源動態調配 、是否開啟 HA、是否開啟增強型在線遷移、是否支持動態電源管理 、是否支持存儲動態遷移、自動化模式等信息;宿主機采集內容應該包括:主機名、地址、型號、CPU 信息、內存信息、操作系統版本(虛擬化管理軟件及版本)、內置盤等信息;虛擬機采集內容應該包括:虛擬機名稱、IP 地址、各類虛擬通道信息、虛擬 CPU 信息、虛擬內存信息、虛擬硬盤信息、操作系統版本等信息。;虛擬存儲采集內容包括:存儲類型、容量、可用大小、存儲設備等信息。;虛擬網絡采集內容包括:虛擬交換機名稱、網卡類型、VLAN、端口組、端口等信息。
(4)監控信息采集的時效要求。應合理設計監控信息的采集及傳輸策略,以保證信息傳輸的實時性,且不影響被監控對象的正常運行。能夠指定不同對象的監控的生效時間和失效時間。能夠指定不同對象的周期性的數據采集任務,采集周期和采集時間可配置。能夠指定不同對象的定期性的數據采集任務,采集周期和采集時間可配置。
2.1.2.2 監視信息的展示
監控信息展示系統需滿足以下要求:對監控信息實時更新;支持按照資源類 型、業務系統等維度對監控信息進行展示;支持所有設備監控信息的展示,并能分層次、逐級細化顯示;支持通過圖表、儀表、統計報表等形式對監控信息進行展示。可根據日期手工設定信息的起始時間與截止時間,對超出閥值采用加亮顏色對比等方式著重展示。支持歷史曲線與發生的變更或事件進行關聯展示。與曲線關聯變更或事件描述應當包括:類型、發生時間及描述。支持資源池中各節點性能數據在同一界面中統一展示,便于集中觀測與管理。
2.1.3 備份管理需求分析
網絡高可用性,為保證核心業務的不中斷運行,在網絡整體設計和設備配置上均需按照雙冗余備份要求設計的。在網絡連接上消除單點故障,提供關鍵設備的故障切換。關鍵設備之間的物理鏈路采用雙路冗余連接,按照負載均衡方式或active-active 方式工作。關鍵主機需采用雙路網卡來增加可靠性。全冗余的方式使系統達到 99.999%的電信級可靠性。

圖1:技術架構圖
保護重要數據的存儲與傳輸安全,防止和防范數據被篡改,建立數據備份機制和提高容災能力。
2.1.4 系統管理需求分析
系統管理是對系統的日志以及狀態進行維護。在系統登錄時,系統對用戶輸入的賬號密碼進行校驗,若空則重新獲取賬號密碼,查詢用戶信息表,若未空,則重新獲取賬號密碼,否則判斷用戶的密碼是否與數據庫保存的一致,來判斷用戶是否為合法用戶。
系統的邏輯架構包括了表現層,邏輯層以及數據層。表現層是用戶輸入數據之后,通過請求,由路由找到對應的控制器,然后調用后端的業務邏輯進行處理。邏輯層是通過邏輯處理之后,調用對應的業務邏輯處理方法進行處理。數據層是對數據進行存儲,確保數據的安全性,數據安全以及備份是數據庫的重要方面,也是數據庫的優劣標志。
基礎設施資源池整合各種 IT 硬件資源,向上層應用系統提供基礎設施資源服務。系統技術架構如圖1 所示。
在國家、省級集中部署、整合集約基礎設施資源,提供統一服務,支撐國省地縣扁平化的業務、服務、政務、科研、教育培訓應用體系。國省兩級中心按統一標準,采用相同的技術架構,按實際業務需求確定建設規模,在保證基本服務相同兼容的框架下按需開發個性化服務。通過 CMANet/互聯網實現國、省互聯。系統功能結構如圖2 所示。
服務器虛擬化[6]將服務器物理資源抽象成邏輯資源,讓一臺服務器變成幾臺甚至上百臺相互隔離的虛擬服務器,讓 CPU、內存、磁盤、I/O 等硬件變成可以動態管理的“資源池”,帶來降低運營成本、加速部署應用、提高服務可用性、提升資源利用率和動態調度資源的技術優勢。
主要實現以下功能:
(1)完全虛擬化,無需綁定操作系統即可搭建虛擬化平臺;
(2)可以管理和控制物理主機、虛擬機以及虛擬資源,并進行權限管理與配額管理;
(3)虛擬化平臺可分布式跨交換機的虛擬機在線復制、遷移;
(4)為各類資源池設置不同的調度策略以滿足調度的需要;
(5)實現存儲管理功能;
(6)網絡管理功能。
桌面虛擬化是一種僅將操作系統桌面呈現在用戶面前的技術,由服務器端完成運算,一般會結合服務器虛擬化和應用虛擬化進行。虛擬桌面的存儲和執行(包括操作系統、應用程序和用戶數據)都集中在數據中心,用戶使用終端設備通過遠程協議(如:HDP、RDP、ICA)進行訪問。
桌面虛擬化具備物理 PC 終端的桌面特性,滿足高性能要求,提供強大的處理能力,保證用戶使用的良好感知。具備高可靠的自身安全性,保證網絡、自身設備的高可用性;提供方便靈活的部署方式、豐富的系統管理能力、便捷的維護管理方式等。
資源池管理平臺提供統一、全方位的資源管理功能,包括資源的調度、監控、服務和運營等,根據不同的用戶需求,動態配置、調度各類軟、硬件資源,實現用戶應用環境的動態彈性擴展,滿足用戶的云服務需求。

圖2:系統功能結構圖
資源池管理平臺同時為業務系統提供靈活的部署、運行和管理環節,屏蔽底層硬件、操作系統的差異,為應用提供安全、高性能、可擴展、可管理、可靠性和可伸縮的全面保障,降低開發、部署、運行和維護應用系統的成本。
通過池管理平臺的綜合管理接口 CMAC-API 獲取管理信息,實現各類資源和業務的狀態及性能監控、資源的統計報表等功能。運維流程管理包括了監控信息管理、權限管理、系統配置管理、告警和故障管理、日志管理。
監控信息管理實現監控信息的合理存儲;通過采集到的監控信息,根據資源池邏輯與物理的整體架構及其內部關聯關系生成不同的拓撲視圖,以供展示系統顯示;通過對資源總量、已分配資源、未分配資源進行統計,計算容量數據,并在容量接近飽和時生成報警信息;進行多維度統計分析,通過匯總歷史監控數據,并參照歷史數據計算出資源池各設備的動態健康閥值,按照時段生成文字或圖形報表以供查看。
權限管理是對資源池監控運維系統的權限進行管理,支持多個資源池運維系統管理員,不同的管理員管理的范圍和權限不同。資源池監控運維系統只能有一個超級管理員,超級管理員由云統一管理平臺預生成。資源池系統權限管理功能用于超級管理員為不同的資源池運維系統管理員分配不同的管理范圍和權限。
系統配置管理功能用于管理員對資源池系統正常運行必需的配置參數進行設置和管理。管理員通過系統配置管理可以對系統配置信息進行增加、刪除、修改、查找等操作,管理員的每個操作需要在日志中進行記錄。
告警和故障管理用于對資源池內所有物理設備的告警信息進行管理,包括對告警信息的查看、查詢、撤銷,支持告警信息的通知和提醒等功能,并對資源池內所有物理設備的故障信息進行管理,包括對故障信息的查看、查詢、處理,支持故障信息的通知和提醒等功能。
日志管理功能應能實現:日志數據的生成和采集、日志數據管理、日志數據備份、日志容量告警、日志文件、日志查詢和日志保存。
本文通過對基礎設施資源池管理平臺的分析,對基礎設施資源池管理平臺有了更深的理解,資源池硬件資源主要由計算 資源,存儲資源,以及可靈活配置的網絡支撐資源構成。基礎設施資源經過虛擬化軟件、分布式系統池化后,按照業務特點構成不同的分類精細化資源池,由資源池管理平臺統一管理。
在系統的開發中,缺少了對數據挖掘算法的應用,后期在這一方面需要加強研究,提升系統的智能化。