摘 要:簡述Nagios及其工作原理,重點研究該系統(tǒng)可采用的多種報警方式,并結(jié)合實例給出部分配置與實現(xiàn)方法。最后討論和分析各報警方法的特點與應(yīng)用前景,為有效實現(xiàn)網(wǎng)絡(luò)監(jiān)控與管理提供應(yīng)用參考。
關(guān)鍵詞:Nagios;網(wǎng)絡(luò)監(jiān)控;報警
引言
隨著各行業(yè)信息化進程的快速發(fā)展,機房規(guī)模、設(shè)備數(shù)量、服務(wù)類型均不斷加大和豐富。保障系統(tǒng)的穩(wěn)定、可靠是高質(zhì)量服務(wù)的基礎(chǔ)和重要任務(wù),而龐大而繁雜的網(wǎng)絡(luò)環(huán)境運維是每位管理員面臨的艱難挑戰(zhàn),因此科學(xué)的監(jiān)控方法與管理模式是系統(tǒng)維護的重要組成部分,有效的監(jiān)控管理系統(tǒng)是故障快速響應(yīng)與處理的必要手段。具有一個能夠完成對主機或服務(wù)進行檢測的自動化工具就非常重要,Nagios(Nagios Ain't Gonna Insist On Sainthood)就是實現(xiàn)對遠程主機、服務(wù)以及網(wǎng)絡(luò)全面監(jiān)控的開源管理軟件,其在眾多監(jiān)控系統(tǒng)中具有成本低廉、結(jié)構(gòu)簡單、使用靈活、功能強大、可維護性強等諸多特點[1]。當(dāng)發(fā)生故障時,基于Nagios的監(jiān)控系統(tǒng)能夠以多種報警方式通知維護人員,并且準(zhǔn)確地描述故障點位置,為高效地處理故障提供保障。本文以SUSE Linux 10.2、Nagios 3.2.3、apache2.2.3、php5.2.5為配置環(huán)境,對Nagios系統(tǒng)各種報警功能進行測試與應(yīng)用描述。
1 Nagios及其工作原理
Nagios是一款基于GPLv2許可開發(fā)的開源網(wǎng)絡(luò)監(jiān)控軟件[2,3],其在Linux/Unix環(huán)境下運行,基于瀏覽器的接口允許從任意平臺上進行操作控制。Nagios采取靈活的模塊化設(shè)計,其本身不包含任何監(jiān)控機制,主要利用其眾多插件對多種系統(tǒng)的主機和服務(wù)進行檢查[4,5]。當(dāng)被監(jiān)控設(shè)備工作狀態(tài)發(fā)生異常變化時,Nagios可通過Web頁面、聲音、電子郵件、短信等[6-10]多種報警方式通知管理員,從而縮短故障的響應(yīng)和排查時間,提升服務(wù)質(zhì)量與效率[11]。
2 報警方式與實現(xiàn)
2.1 Web頁面報警
Nagios提供web界面查看和管理,其Web頁面報警即登錄后通過瀏覽器觀看被監(jiān)控的對象及相關(guān)日志。Nagios定義了4種監(jiān)控狀態(tài),代表不同級別的告警,具體參見表1,除OK代表正常不用關(guān)心外,其余3種都要引起重視。
2.7 其它報警方式
Nagios的報警方式較為靈活,除以上常用報警方式外還有如MSN等即時通訊軟件結(jié)合使用,即時通訊軟件的服務(wù)器端分私有協(xié)議和基于開放的XMPP(Jabber)協(xié)議,MSN是基于微軟研發(fā)的私有協(xié)議,報警信息與MSN結(jié)合,需要用MSN的機器人的PHP程序[7]。
3 特點分析與討論
通常在Nagios監(jiān)控應(yīng)用時,在保證報警信息快速、準(zhǔn)確,一般會采用多種報警同時觸發(fā)的方式。Web、郵件報警方式需要維護人員定時查看記錄,時效性不理想,不過目前公共郵箱有接收到郵件后即時發(fā)送短信功能(如139郵箱等),可以結(jié)合這一功能以郵件和短信郵箱功能較好實現(xiàn)故障告警信息的接收,實際應(yīng)用中,該類故障告警從接收郵件或網(wǎng)絡(luò)延時會消耗一定的時間。聲音報警每次都需要網(wǎng)絡(luò)驗證,且聲音告警必須在全部監(jiān)控點為正常狀態(tài)時才不發(fā)出告警音,否則將會總發(fā)出告警音(特別是報警音次數(shù)設(shè)置較多更為明顯)。
短信貓、飛信告警相對實用性較強,短信貓方式從硬件設(shè)備到SIM卡短信發(fā)送都將產(chǎn)生一定費用,增加了運行成本。使用飛信則可以節(jié)約我們的設(shè)備和短信費用,但由于飛信版本不定期進行升級,在升級期間飛信客戶端無法使用,這對監(jiān)控實時性要求較高的系統(tǒng)來說則不夠完美,另外目前的開源版本需要輸入驗證碼,配置和應(yīng)用上增加了一定的繁瑣程度。該兩種方式也可結(jié)合郵件報警一并觸發(fā)。
Nagstamon報警對于管理員在工作時間的監(jiān)控管理非常實用,其能夠在第一時間發(fā)現(xiàn)故障的服務(wù)(如果是短信通知的話,一般都是監(jiān)測3次都失敗時才發(fā)送短信,但nagstamon是第一次發(fā)現(xiàn)時就發(fā)出提醒)。對于MSN等即時通訊軟件在日常工作時間的監(jiān)控也是一種很好的備用報警方式。
4 結(jié)語
Nagios利用其強大的服務(wù)檢測和報警功能,對于及時發(fā)現(xiàn)系統(tǒng)運行時的問題和隱患,對于節(jié)省信息化維護的費用,保障信息系統(tǒng)的正常運轉(zhuǎn)都具有重要意義。Nagios系統(tǒng)的應(yīng)用將有效的解放勞動力,通過歷史監(jiān)測數(shù)據(jù)更可為改進和優(yōu)化系統(tǒng)提供基礎(chǔ)依據(jù)。靈活的報警方式可準(zhǔn)確、及時的判斷故障信息點,為快速進行故障處理、提高工作效率提供保障。在實際應(yīng)用中,Nagios對服務(wù)監(jiān)控存在誤報的情況,因此需要對針對網(wǎng)絡(luò)的實際情況對監(jiān)控腳本的參數(shù)進行優(yōu)化調(diào)整,從而實現(xiàn)最佳的監(jiān)控服務(wù)和報警功能。
參考文獻
[1]高俊峰.高性能Linux服務(wù)器構(gòu)建實戰(zhàn):運維監(jiān)控、性能調(diào)優(yōu)與集群應(yīng)用:機械工業(yè)出版社 2012.
[2]Barth W: Nagios : system and network monitoring. U.S. ed. Munich,San Francisco: Open Source Press,No Starch Press,2006.
[3]Barth W: Nagios : system and network monitoring. 2nd ed. San Francisco,Munich: No Starch Press ,Open Source Press,2008.
[4]李晨光.Linux系統(tǒng)網(wǎng)絡(luò)管理模塊的實現(xiàn).鐵路計算機應(yīng)用2008,17:35-8.
[5]尤國君.淺談基于Nagios的網(wǎng)管系統(tǒng).價值工程2010,29:254-5.
[6]宋化,劉可,張亦梅,李垠.Nagios在地震網(wǎng)絡(luò)監(jiān)控中的應(yīng)用.長江科學(xué)院院報2011,28:36-41.
[7]宋磊,王靜文.OpenBSD下基于Nagios的網(wǎng)絡(luò)服務(wù)監(jiān)控報警系統(tǒng)的研究.電腦編程技巧與維護2009:112-3.
[8]楊昌武,曹龍漢.飛信報警方式的Nagios網(wǎng)絡(luò)監(jiān)控系統(tǒng)在企業(yè)中的應(yīng)用.網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2012,7:013.
[9]李剛,王曉磊,孫路強,姚蘭予,周利霞,齊士超,姚會琴,劉文兵.基于Nagios軟件的綜合短信聯(lián)動告警系統(tǒng)在地震行業(yè)中的應(yīng)用研究.地震研究2012,35:133-8.
[10]李正,呂堅,付榮國.淺談基于Nagios的故障告警系統(tǒng).江西通信科技2011:16-8.
[11]劉彥波,邵興華,李則河.淺談基于linux環(huán)境的網(wǎng)絡(luò)監(jiān)控技術(shù).經(jīng)濟技術(shù)協(xié)作信息2009:134-.
[12]李晨光.Linux系統(tǒng)網(wǎng)絡(luò)管理模塊的實現(xiàn).鐵路計算機應(yīng)用2008,17:35-8.
[13]魏根芽.基于Linux的Nagios服務(wù)器監(jiān)控系統(tǒng)的研究與實現(xiàn).計算機與現(xiàn)代化2010:170-2.
[14]劉穎,劉景,鄭海燕.Cacti在校園網(wǎng)絡(luò)流量監(jiān)測中的應(yīng)用.電腦與電信2008:10-1.
[15]姚會琴,李悅,高遜,楊爽.NagVis等開源監(jiān)控軟件在天津地震前兆臺網(wǎng)的應(yīng)用研究.震災(zāi)防御技術(shù)ISTIC2012,7.
[16]張雷.基于飛信報警方式的Nagios網(wǎng)絡(luò)監(jiān)控系統(tǒng)的研究與實現(xiàn).考試周刊2011:144-5%@1673-8918.
作者簡介:高東輝(1980-),男,工程師,主要從事地震信息網(wǎng)絡(luò)與應(yīng)急指揮技術(shù)系統(tǒng)運維、管理與建設(shè)工作。