宋博文 岳寶成
摘 要:在超級計算機提出后,由于系統(tǒng)性能的不斷完善,如何加強系統(tǒng)的管理已經(jīng)成為超級計算機需要解決的重點問題,MMS中文名稱會員管理系統(tǒng),此系統(tǒng)采取的結構框架,可以有效地提升監(jiān)控管理系統(tǒng)的工作效率,并且由于是對信息的精細化處理,使其對網(wǎng)絡產(chǎn)生的影響大大降低并提高反應所需要的速度。因此本文便以計算機監(jiān)控管理系統(tǒng)作為主要的敘述內(nèi)容,對其中的問題進行淺薄的分析。
關鍵詞:大規(guī)模計算機;監(jiān)控管理系統(tǒng);科學
在科學技術不斷發(fā)展以及進步的過程中,對于數(shù)據(jù)的分析以及整理提出更高的要求,需要計算機具有超快的反應速度,并可以承擔更多的工作負荷,超級計算機使用的過程中,其適應行業(yè)越來越廣,例如天氣預報、基因分析工程等,為適應行業(yè)的發(fā)展,因此計算機應用系統(tǒng)的各項規(guī)模以及性能需要不斷地提高,在系統(tǒng)實現(xiàn)這些目標后,為系統(tǒng)的可靠性以及實用性帶來新的挑戰(zhàn),由于監(jiān)控管理系統(tǒng)的主要作用為實現(xiàn)大規(guī)模系統(tǒng)的管理以及監(jiān)控,對系統(tǒng)的可靠性以及功能性有著很大的提升,所以當前計算機管理系統(tǒng)的改革重點便是加強系統(tǒng)的工作效率。
一、 技術大況
大規(guī)模計算機系統(tǒng)的構造有很多種,因此相應的監(jiān)控管理系統(tǒng)的模式也不一樣,當前較為經(jīng)典的管理系統(tǒng)分為以下幾種:
1. Ganglia系統(tǒng)監(jiān)控,此監(jiān)控系統(tǒng)適屬于分布式監(jiān)控系統(tǒng),此系統(tǒng)的建設理念為分層設計,此設計起源于加州大學,是一種可以對當前節(jié)點的各種狀態(tài)信息進行監(jiān)控的系統(tǒng),例如CPU等使用狀況,并且將歷史數(shù)據(jù)展示出來,具有極強的擴展能力。Ganglia的工作原理為,通過實現(xiàn)格式之間的轉換達到數(shù)據(jù)傳遞的目的,可以更好地達到監(jiān)控效果。此監(jiān)控系統(tǒng)體現(xiàn)的優(yōu)點主要為,可以自動收集系統(tǒng)的工作數(shù)據(jù),此類收集方式是獨立的。在收集數(shù)據(jù)后,可以將數(shù)據(jù)以圖像的形式呈現(xiàn)出來,方便使用者的查看,因此可以根據(jù)節(jié)點裝填曲線查看相應的內(nèi)容,并且根據(jù)基本的排序規(guī)則,進行降序或者升序的處理。
2. Nagios也可以被稱為網(wǎng)絡監(jiān)視工具,是一種監(jiān)控主機工作狀態(tài)以及與路由器等外連設備網(wǎng)絡設置狀態(tài)的系統(tǒng)。在系統(tǒng)處于不正常工作狀態(tài)時,可以通過短信或者郵件的模式對工作人員及時通知,并且在恢復正常后,再次發(fā)出郵件短信通知。Nagios是一種監(jiān)控系統(tǒng)運行狀態(tài)以及網(wǎng)絡狀態(tài)的監(jiān)控系統(tǒng),其主要特點是可以實現(xiàn)本地或者遠程服務,并且將異常狀態(tài)通知他人。此監(jiān)控系統(tǒng)的主要功能為,監(jiān)控網(wǎng)絡服務、主機狀態(tài)等多種監(jiān)控服務。
以上管理軟件在應用的過程中,僅能實現(xiàn)一定規(guī)模的系統(tǒng)高效運行,但是一旦系統(tǒng)規(guī)模過大,那么此類監(jiān)控軟件在使用的過程中,會出現(xiàn)以下的問題:
1. 在計算機系統(tǒng)的規(guī)模擴大的過程中,監(jiān)控管理系統(tǒng)是否能夠在規(guī)模性能提高的過程中,繼續(xù)滿足高效的管理以及監(jiān)控。根據(jù)最近的數(shù)據(jù)可以知道系統(tǒng)的規(guī)模呈現(xiàn)日益擴大的趨勢,系統(tǒng)規(guī)模呈現(xiàn)多倍數(shù)的擴展趨勢,因此傳統(tǒng)系統(tǒng)中的應用方式已經(jīng)無法適用于當前的計算機系統(tǒng),需要提高監(jiān)控系統(tǒng)的應用性。
2. 系統(tǒng)工作的重點在于可靠性,能夠長期保持在穩(wěn)定的工作狀態(tài)中,所以當前監(jiān)控管理系統(tǒng)的發(fā)展方向之一便是可靠性發(fā)展。
3. 在當前的監(jiān)控管理軟件中,整體呈現(xiàn)功能單一化,僅側重于單一方面的發(fā)展,監(jiān)控系統(tǒng)在工作時,由于功能性不足,無法有效地提高計算機系統(tǒng)的實用性以及可靠性,因此為提高計算機系統(tǒng)的管理,需要將本身的功能進行全面發(fā)展,更好地管理大規(guī)模計算機系統(tǒng)。
二、 MMS系統(tǒng)的構成
大規(guī)模計算機,其本身具有節(jié)點數(shù)目較為龐大,系統(tǒng)設備復雜多樣的特點,例如儲存設備、供電設備等,因此監(jiān)控管理系統(tǒng)在工作的過程中,需要實現(xiàn)整體的把握,不但需要對資源進行管理,而且還要對硬件進行檢測以及控制,使監(jiān)控管理系統(tǒng)呈現(xiàn)多功能的管理狀態(tài)。
(一) MMS功能
MMS是一種通過訪問界面便可以實現(xiàn)遠程訪問的監(jiān)控管理軟件,將資源管理以及報警管理、網(wǎng)絡信息等結合在一起,實現(xiàn)多功能多方向性的管理。在此監(jiān)控系統(tǒng)中,有一個用戶接口,可以通過此接口,對系統(tǒng)的配置進行修改,并且調(diào)整整體的布局狀態(tài),監(jiān)控管理軟件需要根據(jù)用戶的具體需要提供相關信息的查詢,并且顯示系統(tǒng)的狀態(tài)。資源管理是MMS監(jiān)控系統(tǒng)的主要職能,內(nèi)容包括軟件系統(tǒng)的管理以及硬件信息管理,軟件系統(tǒng)管理的主要內(nèi)容為系統(tǒng)內(nèi)部信息、儲存信息、結點以及整體的工作狀態(tài)等,具體內(nèi)容為結點是否可用、對當前作業(yè)的運行狀態(tài)進行確認等。結點狀態(tài)主要在于CPU資源以及內(nèi)存兩個方面。系統(tǒng)的管理人員可以通過監(jiān)控軟件對系統(tǒng)當前的工作狀態(tài)進行監(jiān)控,例如使用狀態(tài)、功效運行狀態(tài)等。
(二) MMS系統(tǒng)的結構
MMS系統(tǒng)主要使用的結構為分布式結構,分布為三個層次。底層結點是由所有需要管理的系統(tǒng)組成的,中層管理是由多個代理管理點組成,最頂層的為結點,在結點上有著一個模塊,此模塊的主要功能便是信息的處理,負責將資源、配置等具體狀況進行監(jiān)控。
三、 監(jiān)控系統(tǒng)性能
MMS監(jiān)控系統(tǒng)可以整體把握計算機的各項數(shù)據(jù)以及各部分的使用狀況,實現(xiàn)實時監(jiān)測的同時,縮短系統(tǒng)的反應時間。并且MMS系統(tǒng)具有傳統(tǒng)監(jiān)控系統(tǒng)的優(yōu)點以及功能,不僅可以對系統(tǒng)運行過程中的異常信息進行妥善的處理,并且實現(xiàn)對系統(tǒng)功能消耗的控制,加強計算機系統(tǒng)的應用性。集中式的監(jiān)控由于過于簡單,僅能支持小規(guī)模系統(tǒng)的運行,無法承擔大規(guī)模系統(tǒng),在其可靠性等具有一定的劣勢,因此MMS監(jiān)控系統(tǒng)使用分布式的方式,實現(xiàn)監(jiān)控管理的高效性目標。
四、 結束語
為保證大規(guī)模計算機運行的高效性以及可靠性,需要對監(jiān)控管理系統(tǒng)的穩(wěn)定性以及全面性進行提升,MMS監(jiān)控系統(tǒng)采用分布式的結構方式,將結點與中間處理器之間的數(shù)據(jù)實現(xiàn)一致性的管理,減少傳統(tǒng)分布式監(jiān)控系統(tǒng)中復雜的協(xié)定方式,提高反應速度。
參考文獻:
[1]鄭明玲,蔣句平,袁遠,等.一種面向大規(guī)模計算機的監(jiān)控管理系統(tǒng)[J].湖南大學學報(自然科學版),2015,42(4):107-113.
[2]沈青,董波,肖德寶,等.基于服務器集群的云監(jiān)控系統(tǒng)設計與實現(xiàn)[J].計算機工程與科學,2012,34(10):73-77.
[3]臧冬松,Vincent Garonne,孫功星,等.一種大規(guī)模分布式應用性能分析系統(tǒng)[J].計算機工程,2012,38(24):37-41.
[4]楊帆,沈來信.基于C/S架構的電子教室管理系統(tǒng)[J].計算機技術與發(fā)展,2016,26(3):168-171.
作者簡介:
宋博文,岳寶成,遼寧省本溪市,遼寧科技學院。