最近,筆者單位將甲站的網絡核心設備換成了華為設備,由于乙站的設備不經常使用,故還利用已有的思科設備。近期,乙站操作人員反映收不到甲站的組播數據。甲站和乙站網絡互聯關系如圖1所示,由于甲站的華為9306沒有配置2M接口板,因此乙站的思科2600的網絡業務通過甲站的思科3845互聯。三個網絡設備均啟用三層OSPF協議,配置組播模式為pim sm,并將華為9306配置為動態 RP(rendezvous point)。
組播數據不通,必然是組播鏈路出現了問題,應該檢查甲站和乙站的組播路由是否正確。在確認三個設備的路由協議、組播配置沒有問題后,登錄思科2600查看組播路由竟然為空,思科3845也是如此,但華為9306的組播路由及組播數據等都是正常的,由此,初步判斷問題出現在華為9306和思科3845之間的組播路由上。

圖1 甲站和乙站網絡互聯圖
首先在思科3845上查看RP的配置,竟然沒有發現RP的地址,也沒有發現逆向轉發路徑的存在。既然華為9306動態RP無法被思科3845獲取,試著在思科3845上 用ip pim rp-address×.×.3.2(即華為9306獲取的動態RP地址),再查看思科3845 RP地址時,發現RP地址和逆向轉發路徑正常。又在思科2600將配置了靜態RP地址,配置完成后滿以為組播數據應該正常了,但奇怪的是組播數據的轉發依然不正常。
在詢問乙站依然在發送組播數據的情況下,思科2600竟然沒有組播組加入的信息。RP地址需要靜態設置,難道組播組也要靜態設置嗎?
抱著試試看地心態,在思科3845和思科2600三層互聯接口上用ip igmp join-group ×.×.×.× 靜態配置了甲站、乙站實時數據傳送的組播組,再查看思科3845和思科2600時,有組播組的信息了,發現有甲站的組播數據發到思科2600上,但乙站仍然收不到甲站的數據。這時筆者認為網絡的問題已經解決了。
既然甲站有數據過來,乙站設備收不到,是不是乙站設備的軟件存在問題呢?于是筆者讓乙站設備的操管人員確認軟件的狀態:組播組及組播端口設置的是否正確。在乙站設備的操管人員確認完軟件的狀態后,筆者又遠傳了一個組播測試軟件來排除設備軟件的嫌疑。但啟用組播測試軟件乙站仍然收不到甲站的實時數據。
故障排到這里,筆者也覺得迷糊了:組信息都正常,數據為什么不正常呢?筆者決定還是在配置手冊里查一下問題的原因。在查看《CISCO網絡設備現場手冊:路由器配置》時,在組播這一章節發現了在VLAN下靜態配置組播組的內容,難道問題癥結在這里?組播數據只是到了思科2600上并沒有向VLAN里下發嗎?趕緊在思科2600上VLAN 55配置了靜態組播組加入,乙站和甲站的實時數據收發正常,故障排除。
實時數據的組播傳輸作為網絡的一種應用,依賴于基礎網絡的正常運行。隨著網絡鏈路串接的設備不斷增多,故障點也隨之增加。在組播應用出現故障時,首要的是排除應用設備的故障,然后通過分段排查基礎網絡及組播路由的原因。其次,在問題出現瓶頸時,書本就是最好的老師。在信息爆炸的當下,求助于網絡也是一個不錯的選擇。
總之,網絡應用若出現問題,網絡技術人員要有解決問題的思路,要綜合運用原理性的知識理解工作中出現的問題,只有如此才能為網絡應用可靠和高效地運行提供有力的技術支撐。