最近筆者所在學校出現上網時斷時續,故障時間不定的情況,即設備內網用戶出現不定時斷網情況,斷網一段時間后恢復。
我校采購的是一臺銳捷RG-EG1000m的出口設備,主要采用了路由模式,使用了內容和流量審計功能,對學生訪問網站做了些限制,還使用了流控功能,對網速進行了合理分配。
筆者對接入交換機和匯聚交換機進行連接性檢查,未發現問題。繼續檢查網關設備,Web界 面 查看后發現設備提示內存不足(如圖 1)。
設備開機時內存使用率在60%左右,但當天下午18點后,查看內存使用率,達到98%以上。設備出現內存持續升高無法下降,最終導致轉發中斷。重啟后可恢復,一段時間后會再次出現故障(如圖2 )。
采用telnet方式,進入管理模式,使用show memory命令,查看設備內存達到98%(如圖3)。設備性能有回收機制,一旦出現內存占滿,會回收一部分內存,回收時,設備配置的上網用戶將會被重置。硬盤驅動寫不下去,流量審計不斷的產生數據往數據庫寫,然后數據庫就不斷的膨脹,之后導致的內存占滿。內存回調就會讓內部網絡暫時無法通過,內部用戶無法上網。

圖1 設備提示內存不足

圖2 出現不定時斷網現象

圖3 設備內存達到98%
經過和廠家溝通,故障根本原因是硬盤出現故障,無法寫。由于打開了流量審計功能,該功需要會按周、月匯總呈現流量數據,所以需要將數據記錄在硬盤內,才能整理出周報和月報。
當硬盤出現故障,無法寫的時候,該功能錯誤地將數據寫到內存,從而導致內存會持續消耗且無法釋放,最終導致內存完全消耗,轉發中斷。……