■ 湖南有線長沙網(wǎng)絡有限公司 熊旺 趙軍 謝欽卿
編者按:本文筆者將介紹The dude 免費網(wǎng)絡運維管理工具并分享它在園區(qū)機房監(jiān)控管理上發(fā)揮的作用,為企業(yè)網(wǎng)絡的日常管理和故障排除方面提出了良好的運維思路。
The dude監(jiān)控系統(tǒng),是一款省時省力、操作簡單、定制功能強大的免費管理工具。它是由Mikrotik 公司開發(fā)的良心工具,相信大家常用Ping 命令來監(jiān)控主機在線狀態(tài)、抖動以及延時,通過SecureCRT 工具遠程telnet 登錄操作我們的網(wǎng)絡設備。這些對于網(wǎng)絡節(jié)點較少還能勉強應付,如果網(wǎng)絡規(guī)模較大呢? The dude 靈活的擴展特性建立一套適用的網(wǎng)管監(jiān)控系統(tǒng),可以定義子網(wǎng)內(nèi)自動搜索或手動添加設備,繪制和生成網(wǎng)絡拓撲圖,或者讀取SNMP OID 節(jié)點記錄設備重要指標的實時及歷史趨勢數(shù)據(jù),采用圖表的直觀展現(xiàn)分析,涵蓋了維護人員關注的重點,在服務中斷后發(fā)出報警提示,記錄到當前日志,并支持告警微信推送,有效輔助園區(qū)機房設備運維管理。
園區(qū)情況:園區(qū)機房為無人值守機房,該機房節(jié)點使用2G 專線完成與核心網(wǎng)連接,由于園區(qū)機房建立時并未納入動環(huán)網(wǎng)絡監(jiān)控,從而成為網(wǎng)絡監(jiān)管的盲區(qū)。雖然設備之間有連接,但是值班人員缺乏網(wǎng)絡監(jiān)控手段,不能及時發(fā)現(xiàn)網(wǎng)絡故障。
設備情況:GPON 設備是整個園區(qū)重要節(jié)點,區(qū)域內(nèi)用戶的匯聚點,一旦出現(xiàn)故障,將會造成片區(qū)內(nèi)大面積斷網(wǎng)。
總體思路:利用The dud e 網(wǎng)絡管理監(jiān)控工具,建立一套實時加歷史趨勢的監(jiān)控體系,采用圖表直觀展現(xiàn),有效輔助園區(qū)機房GPON 設備運行狀態(tài)的監(jiān)控,達到改善園區(qū)機房的網(wǎng)絡環(huán)境和及時發(fā)現(xiàn)網(wǎng)絡故障的目的。
層次化的拓撲管理,由于監(jiān)控園區(qū)機房和設備數(shù)量龐大,需要有一個清晰結構將設備的連接關系組織起來,因而借鑒網(wǎng)絡拓撲的組織形式,并繪制層次化結構圖。
運行軟件后進入The Dude 界面,選擇Network Maps,在右側框中點擊“搜索”,然后在彈出的對話框中設置搜索網(wǎng)段列如:172.16.0.1/24、服務種類(ping、telnet 等)設備種類如GPON 等相關參數(shù),就可以完成網(wǎng)絡設備和拓撲自動發(fā)現(xiàn)。
應急處理故障的同時,我們還需要對園區(qū)機房溫度、電源以及網(wǎng)絡的可用性、帶寬占用等指標進行監(jiān)控,園區(qū)機房采用220 V 交流和48 V 直流,GPON 設備采用是48V 直流供電,直流電源一體化整流模塊并安裝4 節(jié)電池保障。為了監(jiān)控園區(qū)交流是否出問題,我們在GPON 設備下掛220V ONU。當監(jiān)控ONU掉線,我們判斷園區(qū)停市電,這時我們準備發(fā)電。同時我們通過the dude 即時獲取帶寬利用率等指標,在網(wǎng)絡發(fā)生擁塞前,開展園區(qū)機房GPON 業(yè)務,網(wǎng)絡升級擴容。
具體操作:定義一臺GPON 標簽


圖1 Stunnel 界面
當有園區(qū)機房網(wǎng)絡中斷后或者預設閥值突破后,The dude 網(wǎng)絡管理工具及時報警,運維人員迅速響應,排除網(wǎng)絡故障。默認情況下,設備正常運行顯示為綠色,設備服務部分故障顯示黃色,設備網(wǎng)絡中斷故障顯示為紅色。網(wǎng)絡中斷故障發(fā)生報警音提醒微信推送,并將告警時刻記錄到系統(tǒng)日志中
The Dude 監(jiān)控設備中斷和恢復時通過Email 發(fā)送,如果你申請一個139 或QQ郵箱,將郵件發(fā)送到139 或QQ 郵箱中,還可以自動發(fā)送短信、微信提醒。只要有網(wǎng)絡,不管是否是RouterOS,都可以用The Dude 監(jiān)控,及時報警提醒你,畢竟這樣的免費軟件不多。
該功能從 wiki.mikroti k.com 上Dude 手冊中找到相關說明,Dude 自身有Email功能,但是不支持郵件發(fā)送,需要借助在Windows 上安裝相關的工具發(fā)送郵件。我們需要安裝一些工具和插件。通過Windows 系統(tǒng)搭建Blat+Stunnel+Dude+你的Email,完成The Dude 的Email 發(fā)送。
(1)Stunnel 工具
Stunnel 是一款免費的工具,Stunnel 是一個自由跨平臺軟件,用于提供全局的TLS、SSL 服務。針對本身無法進行TLS 或者SSL 通信客戶端及服務器,Stunnel可提供安全加密連接。
(2)Blat 工具
Blat 是一個命令行發(fā)郵件的小工具,僅支持簡單的SMTP 協(xié)議,需要SMTP 服務器的支持。
首先安裝Stunnel,安裝完成后再程序中找到圖1 所示,Stunnel 選擇Edit Configuration。
這里支持POP3、SMTP 等郵件功能,這里我選擇的是SMTP 的連接方式,筆者使用的是139 郵箱服務器,寫入以下代碼:

編寫完成后我們開啟Stunnel 服務。
解壓blat 文件后,在D:Dudelat 目錄下新建一個blat 文件,將blat.dll、blat.exe、blat.lib3 個文件拷貝到‘d:Dudelat’中,然后新建并編輯Emailblat.Cmd 的執(zhí)行腳本。


圖2 通告界面

登錄139 郵箱,在設置--常規(guī)設備里開啟SMTP。
編輯完成后,我們打開Dude,并添加Notification,雙擊加入以下代碼如圖2 所示。
加入到對設備的監(jiān)控中,一旦設備某項服務探測中斷或恢復都會發(fā)送Email。
這樣Dude 的郵件發(fā)送功能就完成了。
在139 郵箱里開啟短信提醒,這樣當設備狀態(tài)改變時,Dude 會發(fā)送139 郵件,同時手機也會收到Dude 的告警短信提醒。
在微信里設置QQ 郵件提醒,這樣只要微信開啟就可以收到Dude 實時告警推送。
The dude 網(wǎng)絡管理工具在園區(qū)機房監(jiān)控已運行1 年多,穩(wěn)定可靠。該軟件能有效改進園區(qū)機房管理方式,把運維人員從紛繁復雜的人工監(jiān)控、發(fā)現(xiàn)、告警中徹底解放出來,其直觀形象的操作方式,能夠提高運維人員工作效率,并促進企業(yè)運維管理信息化水平的提升。