引言:筆者所在學(xué)校信息化建設(shè)經(jīng)過多年發(fā)展,至今形成了以網(wǎng)絡(luò)設(shè)施、服務(wù)器及校園網(wǎng)站和相關(guān)教學(xué)辦公系統(tǒng)為核心的信息化設(shè)施。隨著信息化加深,監(jiān)控目標從早期的關(guān)注軟硬件可用性,轉(zhuǎn)變?yōu)殛P(guān)注運行健康度。我校采用開源監(jiān)控工具Nagios,很好地實現(xiàn)了校園網(wǎng)健康監(jiān)控目的。
IT設(shè)施存在多種故障可能性:硬件會因老化或環(huán)境不佳導(dǎo)致性能表現(xiàn)下降、甚至完全損壞;軟件因設(shè)計編碼缺陷而會有段錯誤、耗盡資源等故障。這些故障幾乎無法避免,一旦發(fā)生就會影響IT設(shè)施對外服務(wù),輕則響應(yīng)速度下降,重則完全不可用。因此,必須有一套機制能確保迅速發(fā)現(xiàn)IT設(shè)施存在的各種故障,并能做出正確應(yīng)對措施,這就是監(jiān)控?,F(xiàn)在IT設(shè)施的規(guī)模都遠遠超出人力所能控制的范圍,需要自動化、可靈活擴展的工具實現(xiàn)無人值守監(jiān)控。
研究開源監(jiān)控軟件意義是既要節(jié)約軟件采購成本,又要利用開源軟件的技術(shù)優(yōu)勢,彌補當前筆者學(xué)校校監(jiān)控軟件的不足。
開源監(jiān)控軟件最大的優(yōu)勢是開放性。如果遇到軟件缺陷,用戶除了向開發(fā)者提交缺陷和在社區(qū)尋找問題的變通解決方法,還可以自己動手修改代碼來解決問題。開放性的另一個好處是用戶可以自己改裝以實現(xiàn)復(fù)雜的監(jiān)控邏輯。開源監(jiān)控軟件設(shè)計中都提供二次開發(fā)的接口。
只要遵守接口規(guī)范,用戶就能實現(xiàn)任意復(fù)雜邏輯的監(jiān)控。
Nagios是開源監(jiān)控軟件中的老牌產(chǎn)品,從2002年起便有投入使用的案例,至今依然在持續(xù)開發(fā)更新,至今很多企業(yè)依然使用Nagios作為主要監(jiān)控工具。……