王軍棟
(北京中鐵建電氣化設計研究院有限公司,北京 100043)
華為OSN設備以太網業務故障簡析
王軍棟
(北京中鐵建電氣化設計研究院有限公司,北京 100043)
通過華為OSN設備在鐵路專用通信網中的運用,論述OSN設備中以太網的相關技術指標以及故障處理方法,確保運行的安全穩定,準確判明故障并及時恢復,為鐵路運輸安全提供保障。
OSN;以太網;故障處理
在鐵路專用通信網中,以太網單板主要完成視頻、監控、數據、辦公等任務。它是鐵路專用通信網中最大和最重要的組成部分。
通過以太網板的FE、GE端口,實現FE到FE業務點對點的透傳、FE到FE的匯聚,和EGS單板共同實現FE到GE業務匯集、以太網數據的二層交換、端口的隔離、流分類、數據流量控制、VLAN的管理、優先級配置等數據特性、以及數據的GFP封裝/解封、基于VC12/VC-3級別的虛級聯、SDH的映射/解映射,支持LCAS、OAM協議等功能。
在鐵路專用通信網中,華為OSN設備主要配置的以太網單板為EFS0、EFS0A和EMS2等。
1)EFS0單板:支持以太網二層交換單板,配合出線板ETF8/EFF8一起實現8路FE(光口或電口)的接入和業務處理功能。
2)EFS0A單板:支持以太網二層交換單板,配合出線板ETF8/EFF8一起實現16路FE(光口或電口)或8路FE(電口)+8路FE(光口)的接入和業務處理功能。
3)EMS2單板:支持以太網二層交換單板,單板本身自帶2路GE光口接口,可配合出線板ETF8/EFF8一起實現16路FE(光口或電口)或8 路FE(電口)+8路FE(光口)的接入和業務處理功能。
常見以太網配置情況如表1所示。

表1 常見的以太網配置情況
上述單板都支持EPL/EVPL/ELAN/EVPLAN業務功能。
2.1 故障現象
某路局OSN3500設備,組成一個PP環,中心站點A對B站和C站點開通10 M的以太網業務,實現以太網業務匯聚功能。首先按照以太網專線業務進行配置, 實現點對點業務。各個站點均使用EFS0單板。在配置好以太網端口并且綁定好通道,做好SDH業務配置后,用筆記本PING對端站發現業務不通。
2.2 處理過程
1)首先檢查SDH業務配置狀態,發現SDH業務配置正確。
2)檢查以太網業務綁定情況和路由配置情況,發現沒有問題。
3)檢查以太網單板端口設置,發現外部端口屬性設置為Access,并且VLAN ID設置為默認2,內部端口屬性設置和外部端口相同。分析信號流程和端口對信號的處理過程,發現內部端口屬性設置錯誤。更改內部端口屬性為Tag aware。再次測試業務,業務正常。
2.3 原因分析
首先分析以太網信號流和業務端口的具體意義,如圖1所示。
不同端口屬性對信號的處理過程是不同的,明白這個處理過程后就會知道問題的原因。端口分為外部端口PORT(MAC口)和內部端口VCTRUNK。 PORT是物理端口,VCTRUNK屬于邏輯端口,信號流的過程是從PORT至VCTRUNK。

圖1 以太網信號流和業務端口的構成
如表2所示,當端口屬性為Tag aware時,對帶VLAN信號入(tag)的時候透傳,對不帶VLAN信號(untag)丟棄。出的時候對帶VLAN的信號透傳。當端口屬性為Access時對于進入的信號,如果帶有VLAN的則疊加VLAN標簽,沒有VLAN的則加上VLAN。對于出的信號則去掉VLAN。用PC的Ping包是不帶VLAN標簽的,同時PC網口接收的信號也是不帶VLAN標簽的。在業務配置選項中,外部端口是指物理層面的端口,也就是以太網MAC端口,因為PC發的包是不帶VLAN的,所以在業務配置時,以太網外部端口設置應為Access,也就是外部來的信號流是不帶VLAN標簽的。同時在傳輸內部為了區分不同業務的不同路由,可以給該信號在傳輸內部加上自己的VLAN標簽,也就是前面設置的外部端口VLAN ID(這里設置的是2)。此時原來信號帶上VLAN 2由外部端口進入VCTRUNK端口,如果內部端口屬性仍為Access,則又會疊加一個VLAN ID,對端以后還會繼續疊加VLAN ID,導致在信號流到對端的時候是帶有兩個VLAN標簽的信號流。PC不能處理帶有VLAN的信號,所以導致業務不能Ping通。

表2 端口屬性對應處理表
分析完業務信號流的過程之后更改內部端口屬性,業務正常。
在網上實際應用時最可能的故障是業務不通,最大可能是配置問題,所以先從配置上找原因。
首先檢查一下端口屬性是否配置正確,包括TAG屬性是否配置正確,IP端口工作模式是否配置正確,兩邊VCTRUNK綁定是否一致,交叉連接是否正確,LCAS協議是否使能等。另外,如果有異常告警,特別是影響業務的告警,先找到告警產生的原因,消除告警,再看業務是否通。例如SDH的告警,如TU_LOP、TU_AIS,可以先檢查交叉連接、交叉板、相關線路板的告警等。有FCS_ERR告警,就可以檢查單板的封裝參數設置時候一致。如果配置沒有問題,告警也沒有問題,可以先用環回加測試幀的方法定位是哪邊出了問題:設置線路板光口內外環回,使用測試幀看業務能否通。如果能通,說明沒有問題,如果哪邊不通,說明哪邊有問題。
遇到以太網業務中斷的情況,根據總結的故障處理方法,參照“先性能后告警、先SDH后以太網、先日志后測試、先內部后外部”的原則,充分利用告警、性能事件、逐段環回、測試幀等維護手段,結合工具軟件、測試儀表、PING功能等進行有計劃、有步驟的定位。逐步判斷故障的原因,最終都可以把它解決掉。
除了正常處理故障外,還應盡可能采取其他的應急措施(如提供、切換備用鏈路),減少業務中斷時長,為鐵路運輸安全提供保障。
Combining with the application of Huawei OSN equipment in the private communication network, the paper discusses the relevant technical indexes and troubleshooting methods of Ethernet in OSN equipment to ensure operational safety and reliability, distinguish accurately faults and return to normal operation, for providing guaranty for railway transportation safety.
OSN; Ethernet; troubleshooting
10.3969/j.issn.1673-4440.2015.03.027
2015-04-20)