李華松 馬迅飛 張進鐸 張俊 趙葉平
摘 要: 以高性能計算機機房監控為背景,為提高機房的運維水平,從監控的便捷性、可靠性角度出發,構建了一套基于SNMP協議的新型集中監控管理系統。通過獲取MIB值,實現對機房內眾多節點設備的交互及管理。測試表明,該系統運行良好,能夠有效地對機房設備實施監控管理,為正常的生產活動提供有力保障。
關鍵詞: 計算機機房; 運維; SNMP協議; MIB值; 集中監控管理
中圖分類號:TP393 文獻標志碼:A 文章編號:1006-8228(2015)11-40-03
Abstract: Take high performance computer room monitoring as the background, to improve the operation and maintenance level of computer room, from the perspective of the convenience and reliability of monitoring, a new centralized monitoring and management system based on SNMP protocol is built. Test shows that the system runs well, can effectively monitor and manage equipments in computer room, and provides a strong guarantee for normal production activities.
Key words: computer room; operation and maintenance; SNMP protocol; MIB value; centralized monitoring and management
0 引言
機房作為信息服務的基礎載體,其安全可靠性越來越重要。由于機房子系統多、管理復雜,而且專業運維人員稀缺,因此,實現機房的科學化運營管理難度較大。通過智能化手段,實現機房設備的集中化管理,可降低運維人員管理壓力,降低運維成本。
機房監控管理系統是隨信息化建設應運而生的,它是機房環境監控管理服務與計算機網絡技術、多媒體信息技術、自動化技術結合的完美體現。以系統工程的觀點對機房的環境結構、服務需求、設備內容和管理模式四個基本要素以及它們的內在聯系進行優化組合,從而可提供一個穩定可靠、投資合理、高效方便、舒適安全的機房環境監控系統。
SNMP(簡單網絡管理協議)能夠很好的監管機房的各種動力設備(空調、UPS等)和環境設備(溫濕度、煙感等傳感器)[1]。目前,SNMP已經成為事實上的行業標準,在國內也得到越來越廣泛的應用。
1 SNMP網絡管理協議
1.1 SNMP協議簡介
SNMP由一組網絡管理的標準組成,包含一個應用層協議、數據庫模型和一組資源對象。SNMP網絡架構由三部分組成:NMS(管理者)、Agent(代理)、MIB(管理信息庫),圖1是SNMP網絡管理體系結構示意圖。NMS是網絡中的管理者[2],是一個利用SNMP協議對網絡設備進行管理和監視的系統,它既可以指一臺專門用來進行網絡管理的服務器,也可以指某個設備中執行管理功能的一個應用程序;Agent是網絡設備中一個應用模塊,用于維護被管理設備的信息數據并響應NMS的請求,把管理數據匯報給發送請求的NMS;MIB是被管理對象的集合,被管理的對象指的是任何一個被管理的資源,MIB定義了被管理對象的一系列屬性,包括對象的名稱、對象的訪問權限和對象的數據類型等。SNMP的目標是管理互聯網上眾多廠家生產的軟硬件平臺。
管理者和被管理對象之間的通信包括以下操作:Get操作,管理者讀取被管理對象MIB的值;Set操作,管理者遠程設置被管理對象MIB的值;Trap操作,被管理對象主動向管理者報告預制的特定事件。在正常運行狀態下,管理者采用主動輪詢的方法,監測下屬所有被管對象工作狀態的信息。當超過MIB預先設置的閾值后,被管理對象向管理者發出異常事件的報告,管理者在接收到異常情況報告后,對事件進行診斷,獲取更多關于異常情況的信息。
1.2 MIB及自定義實現
管理信息庫MIB指明了網絡元素所維持的變量(即能夠管理進程查詢和設置信息)。MIB由對象識別符(OID: Object Identifier)惟一指定,MIB給出了一個網絡中所有可能的被管理對象的集合數據結構,它是一個樹形結構。SNMP協議消息通過遍歷MIB樹形目錄中的節點來訪問網絡中的設備[3]。
MIB值負責整個系統的配置及運行所需的基本數據。本系統中的機房MIB值包括動力和環境兩個方面。UPS的MIB值可以依據RFC 1628及廠商提供的MIB值獲得[4];精密空調、溫濕度等的MIB值可依據廠家提供的資料獲得。
2 監控系統設計及實現
本設計是以一個機房為設計原點,在保證本地監控功能的基礎上,充分考慮多點集中監控,以及分布式管理等功能需求。對單個機房設計采用嵌入式網關服務器,對本地機房內動力環境設備進行本地化監控管理[5]。
通過制定策略的方式,滿足用戶的各項聯動管理需求。當監控對象發生故障時,能夠以短信、電話、郵件等方式實時發出對外報警。同時,嵌入式網關服務器還具備聯網管理功能,服務器可通過專用數據接口,將本地監控對象的實時參數上傳至上層監控平臺,以滿足用戶聯網監控管理需求。
2.1 系統架構
本系統由三部分組成:現場設備采集層、管理服務層、遠程Web瀏覽層。現場設備采集層由各監控對象和協議轉換模塊組成,主要進行通訊協議轉換和設備終端數據采集。管理服務層用于對設備采集層的數據進行集中分析、存儲,通過管理服務器,實現對底層動力環境監控對象的集中監控管理,管理服務器由多臺集中管理服務器組成,各站點設備信息以網絡方式上傳至集中監控平臺。遠程Web瀏覽層通過IE瀏覽器或客戶端方式,實現監控系統平臺的訪問。
本系統的總體邏輯結構如圖2所示。
2.2 子模塊搭建
本系統主要由UPS、精密空調、溫濕度傳感器等子模塊組成。UPS通過通訊接口RS232和通訊協議與現場監控主設備相連,采用總線方式傳遞其工作參數、運行狀態等信號;精密空調通過提供的遠程監控通訊RS232/RS485接口和通信協議連接至監控主設備,也是采用總線方式傳遞工作參數、運行狀態信號;溫濕度傳感器布設在機房內的重點區域,避免因局部區域制冷量不夠使設備溫度過高而宕機。
2.3 軟件實現
本系統使用Visual Studio 2010作為軟件開發平臺,使用C#語言開發。在程序命名空間中引用SnmpSharpNet開源組件,方便在程序中使用SNMP協議。
3 系統測試及分析
通過測試得到如圖3所示的UPS的運行狀態圖,以及如圖4所示的精密空調的運行狀態圖。
從圖3和圖4中的數據和狀態信息不難分析得出,系統運行準確、穩定、可靠。
4 結束語
上述結果表明,基于SNMP協議構建的集中監控管理系統能夠正確、可靠的運行,并且在高性能機房監控上具有十分理想的監控效果,可以預料,該解決方案必將有非常重要的應用前景。但同時對于監控服務器上資源的合理分配和使用尚需作進一步研究,系統規模擴容后的性能尚需進一步監測。
參考文獻(References):
[1] 李明江.SNMP簡單網絡管理協議[M].電子工業出版社,
2007.
[2] 郭軍.網絡管理[M].北京郵電大學出版社,2003.
[3] 熊英.基于SNMP的MIB庫訪問[J].計算機與現代化,
2007.139(3):90-92
[4] J.Case. UPS Management Information Base [OL].May
1994.http://www.ietf.org/rfc/rfc1628.txt.
[5] 王瑋.基于SNMP網絡管理系統的設計與實現[D].北京郵電
大學,2011:20-22