單位因臨時任務需要對外進行網絡連接,通信信道使用的是2M專線,本端連接的網絡設備是正在使用中的一臺華為路由器。連接完成后,根據要求對連接端口的IP地址、路由協議等相關信息進行了管理配置。配置完成后,對各方向的網絡情況進行檢測,發現至各方向的網絡均通暢。
運行一周左右,接到通知,需對網絡拓撲進行部分調整。負責網絡調整的同事,根據要求對連接的端口進行了調整,調整完成后,對部分端口的網絡參數進行了修改。修改完成后,對新調整的端口的外接網絡進行了測試,新增目標網絡均暢通。但約一小時后,有同事說至某個單位的文電無法送達,文電收發狀態不正常,對端沒有及時回執。
根據故障現象,筆者進行了故障排除。
一是對文電無法正常送達的目標文電地址進行檢查。目標文電地址無法正常到達,最可能的原因是目標文電地址無法正常解析或解析錯誤,還可能就是在人工手動輸入目標文電地址時輸入錯誤導致。后經檢查發現,該目標文電地址可以正常解析,因該目標文電地址由上級提供,既然可以解析,又不是手動輸入,那就不存在目標文電地址無法解析或解析錯誤的現象。
二是檢查本端文電服務。故障出現,還有可能是因本端文電服務出錯,重啟了本端文電服務器文電服務,然后又重新給正常可以接收文電的單位和無法接收文電的單位發送了測試文電,發現還是出現了類似的故障,可以正常接收到本端文電的單位依舊可以正常接收,無法接收本端文電的單位依舊無法正常接收。由此筆者推斷,可能是無法接收本端文電的單位的文電服務出現了故障,或至該單位的網絡出現了中斷。
三是對文電無法正常送達的目標文電服務進行了檢測。筆者打電話給友鄰單位,讓其對文電無法正常送達的目標文電地址進行文電測試,友鄰單位反饋該目標文電可以正常接收其文電。由此筆者判斷,該單位的文電服務正常,很可能是本端至文電無法正常送達的目標網絡出現了中斷。
四是對文電無法正常送達的目標網絡進行了檢查。筆者在找到該單位的相關IP地址信息后,使用Ping命令進行了測試,發現至該單位的網絡不通。友鄰單位至該單位的網絡正常,且前期本端至該單位的網絡是正常的,而本級并未調整至該單位的網絡參數,出現網絡故障的原因很可能是通信線路出現了故障,或該單位對其網絡參數進行了調整。
因為本端至該單位的通信線路為直連線路,中間有很多節點,完全有可能是中間節點出現了故障。從路由器連接的基帶Modem查看其信號,發現其信號燈指示正常。那么可能是中間節點對本端進行了環路或該單位對至本端的路由器參數進行了修改。
筆者打電話至該單位,該單位反饋說其也發現至本端的文電無法正常收發,并未對路由器的相關參數進行修改。不得已,筆者對該單位的網絡鏈路進行了回環,該單位反饋說在路由器上可以正常收環,物理鏈路沒有故障。
唯一的可能是本端光端機至路由器的物理連接線出現了故障,遂對光端機至基帶 Modem、基帶 Modem至路由器的物理連接線進行了檢測。經檢測,發現各連接線均正常,沒有出現斷路和短路現象,遂又對路由器的連接串口進行了檢查,發現串口也沒有出現變形、短路等現象。讓該單位對本端的物理鏈路進行環路,登錄路由器進行觀察,發現本端可以收環,也就進一步說明各網絡硬件和通信鏈路都沒有出現故障。
五是檢查了路由器的相關配置參數。登錄路由器,使用Ping命Ping該單位的網間網IP地址,發現可以Ping通。也就進一步說明,各網絡硬件和通信鏈路確實沒有出現物理故障。但是Ping該單位的網關卻無法Ping通,很可能至該單位的路由出現了故障。
使用display currentconfiguration命令查看當前配置,發現至該單位的路由配置竟然消失了,但前期網絡確實是暢通的,配置肯定存在且正常。有可能是配置信息丟失或給同事手動刪除了該路由信息。筆者增加了至該單位的路由后,網絡恢復正常。
筆者詢問了負責網絡拓撲調整的同事,該同事表示,其并未刪除至該單位的路由條目,只是在調整了鏈路和路由器的接口后,啟動路由器并增加了相關參數后,保存后就重啟了。
配置丟失一般有多種原因,其中最常見的原因是硬件故障和瞬間斷電。而根據同事提供的信息,應該不是這兩個方面的原因。后又根據同事的詳細描述,筆者查閱了相關資料并電話咨詢華為公司的技術人員,才得知可能是因為同事操作不當造成的。后又取了一臺華為路由器進行測試,發現按照同事的操作方法確實會出現配置信息丟失的現象。
原來,當路由器的業務插板過多和配置信息過多時,在啟動路由器后,如果所有的業務板還沒有正常運行,其配置管理界面卻有可能會生效,但此時,其原有路由器Flash中的配置文件尚未完全恢復至路由器內存中,此時,如果進行管理配置,并運行了保存命令,那么內存中不完整的配置信息就會覆蓋配置文件中的配置信息,造成部分配置信息丟失。
在路由器中,有兩個配置文件,一個是Flash中的配置信息,一個是內存中的配置信息,可以通過命令display savedconfiguration查看配置文件中的配置信息,通過命 令display currentconfiguration查看內存中的配置信息。
在配置管理時,使用的是內存中的配置信息,會即時生效,當使用了保存命令后,內存中的配置信息會自動加載至Flash中的配置文件,當路由器重啟后,路由器會將Flash中的配置文件恢復至內存中,以使路由器正常工作。如果內存的配置信息在配置管理后,未使用保存命令就重啟,那么配置管理信息就不會加載至Flash中的配置文件中,也不會生效。
正常來說,在系統所有單板正常運行后,配置文件和內存中的配置信息應該是一致的,當增加、修改、刪除配置后,配置文件中的配置信息和內存中的配置信息不一致,此時可以通過命令save來保存當前內存中的配置信息到配置文件。
在系統啟動階段,如果所有業務板還沒有正常運行,即配置文件還未完全恢復到內存中,此時執行命令save保存,內存中不完整的配置信息將會將原有的配置信息覆蓋掉,造成配置信息丟失,從而引發故障。