余林立



【摘 要】通過對傳輸線路光纜割接所引起的10G SDH光傳輸設備的誤碼告警的排查、研究,認識與分析了Metro 5000(華為)設備SL64板件的性能指標,并將兩者結合,加以總結歸納。討論了光纖鏈路中的“再生段背景誤碼塊”、“再生段誤碼秒”、“復用段背景誤碼塊”、“復用段誤碼秒”的產生機制,闡述了日常光纜割接對光鏈路造成的誤碼影響,以及相對應的問題處理方法與思路,為此類傳輸故障排查、定位與解決方案的制定提供參考。
【關鍵詞】光纜線路 SDH 誤碼 再生段 復用段
中圖分類號:TN913.7 文獻標志碼:A 文章編號:1006-1010(2016)09-0089-04
1 引言
由于當前城鎮化步伐不斷加快,各類基礎設施建設推進,使得通信行業原有的光纜線路需要配合市政施工的規劃不斷進行調整。頻繁的光纜割接則在所難免,且不乏有重要的骨干層級以上的線路光纜割接。
STM-64[1](10G)級別的SDH作為傳統的骨干層傳輸的重要光鏈路設備,可實現VC4/VC3/VC12的業務調度,適合多系統集成與系統間業務調整。Metro 5000是一類成熟的、由華為公司研發的SDH高端傳輸設備,該傳輸系統由網元設備和網絡管理系統OptiX iManager構成,相較于層級較低的SDH設備(如STM-1、STM-4等),其日常維護對光纖鏈路性能要求與系統維護操作復雜程度均較高,尤其以設備出現誤碼事件的處理較為棘手。本文將結合筆者日常維護經驗,結合一例由光纜割接造成的STM-64級別的SDH誤碼事件的處理,淺談光纜割接對10G SDH設備誤碼事件[2]的影響。
2 誤碼事件始發
某通信公司對A地與B地直連的一段本地骨干級別的144芯、型號為G.652型的傳輸光纜進行市政性質的遷移改造割接。在該條光纜上的承載業務中包含A地至B地SDH 10G設備(Metro 5000),兩側設備間的光鏈路由OLP設備進行保護[3],OLP設備主用鏈路即為該割接的144芯光纜承載,備用鏈路由租用電信兩地間的傳輸光纜進行承載。連接示意圖如圖1所示。
割接于次日凌晨6:00完成,同時,網管維護人員將割接時的備用電信路由上的業務倒換至主用144芯光纜線路上。然而在次日9:06,A地與B地SDH設備上進行互聯的光接口單板(型號為SL64)均分別出現“再生段背景誤碼塊(RSBBE,Regenerator Section Background Block Error)”、“再生段誤碼秒(RSES,Regenerator Section Errored Second)”與“復用段背景誤碼塊(MSBBE,Multiplex Section Background Block Error)”、“復用段誤碼秒(MSES,Multiplex Section Errored Second)”的誤碼類性能事件,并在復位時間的15分鐘內,累計數值分別突破越限值,省公司集中化工單系統派發不可用處理工單,需要進行緊急處理。表1與表2分別為A地和B地SDH設備(Metro 5000)SL64單板誤碼事件統計信息。
由表可見,兩端設備在業務處于主用鏈路時,無論是再生段背景誤碼塊(RSBBE)的數值或是再生段誤碼秒(RSES)的數值均處于快速累計的過程中,雖然A地至B地的10G SDH設備當前光鏈路處于正常狀態,并無相關告警,但實質上的業務則處于不可用狀態。
3 故障排查定位過程
當在網管側對A地與B地間OLP系統切換至備用(租用電信路由),并進行光功率對比,A地至B地的OLP光鏈路衰耗值(此時業務在備用電信光纜上承載)如圖2所示。
在通過對OLP系統光鏈路衰耗的觀察可見,無論是主用光鏈路(144芯光纜鏈路,A發B收衰耗為29.2 dB,A收B發衰耗為30 dB)或是備用光鏈路(租用電信的光纜線路,A發B收衰耗為24.9 dB,A收B發衰耗為28.1 dB),光纜在傳輸過程中的衰耗值均處在正常范圍內。并且,處于備用路由時侯的A地與B地的10G SDH設備的再生段背景誤碼塊(RSBBE)的數值或再生段誤碼秒(RSES)的事件均消失,因而確定,在A地或B地各自傳輸機房內的10G SDH設備至OLP系統設備間的光連接鏈路為正常,大量誤碼事件的問題出在A地OLP系統至B地OLP系統的主用路由上。
因該主用路由光纜鏈路路徑具體為:A地傳輸機房—B地鄉鎮中繼機房—B地傳輸機房。傳輸維護人員在申請業務中斷窗口后,連夜對該路由進行分段環回監測,排除A、B兩地機房內傳輸設備至OLP、OLP設備至光纜成端光纖連接;仔細排查B地鄉鎮中繼機房—B地傳輸機房之間的光纜纖芯型號、光纖光學性能的因素。最終斷定,觸發誤碼事件的問題段落為“A地傳輸機房—B地鄉鎮中繼機房”之間,而該段光纜之前曾進行光纜線路遷移割接[4],如圖3所示。
因此可以預估,由光纜線路遷移改造而造成當前A地與B地的10G SDH誤碼事件的可能性極高。
4 誤碼事件產生機制與危害
4.1 再生段誤碼
再生段誤碼產生機制是由對B1字節監測引起的[5]。再生段誤碼秒(RSES)指含有1個或多個誤碼塊的秒,或至少出現一次缺陷的秒。而再生段背景誤碼塊(RSBBE)指傳輸過程中出現了一個或者多個比特差錯的數據塊。
在再生段開銷處理器所提取到并處理的STM-N幀里面,B1字節即為所有的再生段開銷字節中最重要的字節。假設提取到的B1字節與前一個STM-N幀中提取到的BIP-8字節的結果不同,則產生B1誤碼。B1誤碼累計超過默認值10-3,就會有告警B1_EXC產生。在再生段中,假使B1字節性能進一步劣化,將產生B1_SD誤碼,并上傳至系統。再生段連續累計10個嚴重誤碼秒(SES,Severely Errored Second),那么就達到再生段不可用事件(RSUE,Regenerator Section Unavailable Event)的標準。
4.2 復用段誤碼
復用段誤碼[6]是對B2字節監測產生的。復用段誤碼秒(MSES)指含有1個或多個誤碼塊的秒,或出現至少1次缺陷的秒。而復用段背景誤碼塊(MSBE,MS Background Block Error)指傳輸過程中出現了一個或者多個比特差錯的數據塊。
若STM-N幀中復用出的B2字節與之前一個STM-N幀比特的BIP-24結果不同(除再生段開銷字節以外),則促發B2誤碼。同時,M1字節依據MS_REI(B2字節檢出的錯誤間插比特塊數目由MS_REI傳遞)來決定告警上報與否。一旦B2誤碼累計超過默認值10-6,就將有B2_SD告警產生。另外,若B2誤碼累計超出默認值10-3,B2_EXC告警就會產生。在B2_SD告警和B2_EXC告警共同促發復用段保護倒換。連續10 s內,若B2字節被檢測到復用段嚴重誤碼秒(SES),那么復用段不可用事件(MSUAT,Multiplex Section Unavailable Event)將會產生[7]。
5 本次誤碼事件處理方法
依據相關研究人員的研究以及通信工程的長期實踐,針對誤碼事件的起因,可以歸納為以下4類:1)外部環境干擾;2)光纖性能故障;3)線路板故障;4)時鐘單元故障。由于本次A地與B地的10G SDH設備均產生了誤碼事件(A地與B地設備線路板故障同時發生概率極低),結合OAM確認,可以排除是由線路板故障或時鐘單元故障引起。本次事件產生恰恰是在光纜線路遷移改造完成后出現的,因此,經地市級公司相關傳輸方面專家在割接現場檢查,發現光纜割接接頭盒內的纖芯熔接存在違規操作的情況[8],即現場操作人員在進行熔纖芯過程中,將12條纖芯為一組(正常情況為一芯纖芯用一根熱縮管),對熱縮管加熱固定。由此可以斷定,誤碼事件由外部環境干擾或光纖性能故障引起。且在之后的地市公司針對色散補償實驗中,對由于過多纖芯集中固定加熱,造成了纖芯內部變形,加大色散進而引起了光鏈路誤碼[9]予以了確認。
6 結束語
近年,由于運營商針對光纜線路的維護量不斷增大[10],入圍運營商的相關基礎維護隊伍水平參差不齊,施工中以不遵守工藝規范為典型的人為因素造成的故障數量呈上升趨勢,是各地通信運營商需面對的重要的管理課題。同時各地運營商也應加深對各廠家傳輸設備的技術細節的理解與應用,重視積累故障處理經驗。
參考文獻:
[1] 梁劍峰. 淺談SDH技術[J]. 數字技術與應用, 2014(1): 36.
[2] 屈小軍. 多業務SDH光傳輸設備應用與傳輸設備誤碼分析[J]. 大科技, 2015(22): 273.
[3] 陳雄,葉胤. OLP技術及其在工程應用中的注意事項[J]. 光通信技術, 2009(3): 3.
[4] 胡純兵. 光纜干線的維護與管理[J]. 信息與電腦: 理論版, 2011(7): 169-170.
[5] 梁娜威. 簡述SDH幀開銷的監控功能[J]. 廣播電視信息, 2009(6): 67-69.
[6] 劉東秀. SDH復用段環業務錯連問題的分析和處理辦法[J]. 信息通信, 2013(1): 78-79.
[7] 王夏青. 淺談SDH光纖傳輸系統誤碼問題[J]. 科技信息, 2011(6): 246.
[8] 宋志佗. YD/T 814.1-2013《光纜接頭盒第1部分:室外光纜接頭盒》標準解讀[J]. 現代傳輸, 2013(5): 55-59.
[9] 王巨輝. 光纜通信線路的維護管理對策[J]. 信息通信, 2015(4): 219.
[10] 張翔. 提高光纜割接成功率創新[J]. 城市建設理論研究: 電子版, 2011(23).