王靜怡
【摘要】 文章歸納并論述SDH傳輸系統故障排查的原則、方法和處理步驟;通過專網故障處理的實例,分析論述處理業務中斷和誤碼兩大類故障的排查過程,重點分析不同方法在故障排查工作中的靈活及其效果。
【關鍵詞】 光傳榆 故障處理 SDH
光通信是目前電力通信網的主要傳輸方式,而SDH作為一種結合了大容量光纖傳輸技術的體制,因其成熟的體系和較高的容量已在電力系統專網匯聚層、接入層中得到廣泛應用。SDH承載了大部分辦公自動化、生產、管理業務,既能滿足電力系統專網專用、分區隔離的要求,又具有較高的可靠性和實時性,很好的滿足了電力系統通信的要求。龐大的SDH網絡對維護人員的日常維護效率,特別是發生故障時的快速排查及搶修能力提出了較高的要求。本文根據理論和經驗,歸納并論述SDH傳輸系統故障排查的原則、方法和步驟,旨在為設備維護提供參考,為故障處理提供合理思路。
一、故障處理前的準備
SDH系統故障處理主要是對光線路和設備的檢查及操作,運行維護人員必須熟知系統的各方面情況才能做好故障處理工作,具體如下:
1、熟悉SDH原理知識,了解傳輸系統告警信號流及告警產生機理。
2、熟悉所維護系統的管理和運行狀況。主要是設備和網管的操作,能夠迅速做好故障現場數據的采集與保存;同時熟悉設備配置情況、機盤功能、接口情況、面板上各種告警燈和指示燈的顯示情況。
3、熟悉工程組網信息,包括網絡拓撲、業務配置、設備運行狀態,以及相應工程文檔的存放位置,能夠迅速做好故障現場數據的采集與保存。
4、熟悉常用儀表、工具的基本操作。SDH光傳輸系統常用儀表有:光功率計,光時域反射儀(OTDR),誤碼儀,2M話路分析儀等。
二、故障定位的基本思路和方法
2.1故障定位的原則
故障定位的關鍵思路是:將故障點準確定位到單站。
定位的基本原則可以概括為:先外部,后傳輸;先單站,后單板;先線路,后支路;先高級,后低級。
1)先外部,后傳輸。在定位故障時,應首先排除外部的可能因素。首先判斷是傳輸問題還是其它設備故障問題。首先排除光纖故障、中繼線路、供電電源,接地等故障問題。
2)先單站,后單板。在定位故障時,首先要盡可能準確地定位出是哪個站,然后再定位出是該站的哪塊板。
3)先線路,后支路。線路板的故障常常會引起支路板的異常告警,因此在進行故障定位時,應遵循“先線路,后支路”的原則。
4)先高級,后低級。即進行告警級別分析,首先處理高級別的告警,如危急告警、主要告警,這些告警已經嚴重影響通信,所以必須馬上處理;然后再處理低級別的告警,如次要告警和提示告警。
2.2故障定位及排除的常用方法
故障定位的常用方法和一般步驟可簡單地總結為:“一分析,二環回,三換板”。
2.2.1告警性能分析法
告警性能分析法是通過網管獲取告警和性能信息,進行故障定位的方法??梢匀?、詳實地了解全網設備的當前或歷史告警信息,獲取設備性能事件的具體數值。例如:由A、B站構成的網路,當A站點出現MS_RDI、HP_RDI、LP_RDI,而B站點出現R_LOS、TU_AIS告警時,基本可以確定R_LOS告警為根源告警,即A到B傳輸方向光路故障。
也可以通過查看通過設備告警指示燈和單板指示燈獲取告警信息。但設備指示燈僅反映設備當前的運行狀態,對于過往故障無法表示,且只能反映告警級別,不能準確告知具體告警,具有較大的局限性。
2.2.2環回法
環回法是SDH傳輸設備定位故障最常用的方法。環回有多種方式,如內環回與外環回,軟件環回與硬件環回,線路環回與支路環回等。進行環回操作時,首先應進行環回業務通道采樣,即從多個有故障的站點中選擇其中的1個站點,從所選站點的多個有問題的業務通道中選擇其中的1個業務通道;然后畫出所采樣業務的1個方向的路徑圖,圖中要標出該業務的源和宿及所經過的站點、所占用的VC4通道和時隙等(如圖1所示);最后逐段環回,定位故障站點及單板。采樣業務方向路徑圖如圖1所示,可以在依據中斷業務的路徑圖,在3號站第2塊支路板的第1個2M通道外接一個2M誤碼儀,監測業務好壞。
2.2.3替換法
替換法就是使用一個工作正常的物件去替換一個疑似工作不正常的物件,從而達到定位故障、排除故障的目的??商鎿Q物件包括電纜、光纖、法蘭盤、電源、單板、設備等。替換法適用于排除傳輸外部設備的問題,如光纖、中繼電纜、交換機、供電設備等;或故障定位到單站后,用于排除單站內單板或模塊的問題。
2.2.4配置數據分析法
查詢、分析設備當前的配置數據。例如:時隙配置、復用段的節點參數、線路板和支路板通道的環回設置、支路通道保護屬性等。分析以上的配置數據是否正常來定位故障,若配置的數據有錯誤,需進行重新配置。
該方法主要適用于將故障定位到單站后,進一步定位故障。一些典型的配置錯誤導致的故障包括:J1字節設置錯誤導致HP_TIM告警;C2字節配置錯誤導致HP_SLM告警;業務配置錯誤導致TU_AIS/AU_AIS告警;TPS參數配置錯誤導致TPS倒換失??;MSP節點參數設置錯誤導致MSP環倒換失??;SNCP參數配置錯誤導致倒換失敗等。
更改配置法適用于有空余時隙、通道、或槽位或一個VC4中的部分業務時隙中斷情況。具體方法包括:在時鐘告警、指針調整時,更改時鐘配置;懷疑單板或母版故障時,更改板位配置;更改時隙配置;以及在以太網和對接故障時,更改單板參數配置。
2.2.5儀表測試法
儀表測試法指采用各種儀表,如誤碼儀、光功率計、光時域反射儀、SDH分析儀等來檢查傳輸故障。例如:用2M誤碼儀測試業務通斷、誤碼;用萬用表測試供電電壓,檢查電壓過高或過低問題。用光時域反射儀針對R_LOS、R_LOF告警,排查光纖通斷或光板故障問題。一般適用于排查傳輸設備外部問題、設備對接問題或設備性能指標問題。
2.2.6經驗處理法
在一些特殊的情況下通過復位單板、單站的掉電重啟、重新下發配置等手段可有效及時的排除故障、恢復業務。但建議此方法應盡量少用,因其不利于故障原因的徹底清查。遇到這種情況,除非情況緊急,一般還應盡量使用前述方法,或請求支援,盡可能地將故障定位出來,以消除設備內外隱患。
三、故障處理案例分析
3.1業務中斷類故障
對業務中斷類故障,首先分析外部原因,典型的檢查次序是:供電電源、接地、環境異常、光纖或電纜故障。其次分析人為原因,如誤操作設置了光路或支路通道的環回,誤操作更改、刪除配置數據,設置業務未裝載等。也可能是設備本身故障,如單板失效或性能不好。
定位方法可以采用告警分析法、逐段環回法、替換法和更改配置法。定位的步驟可具體為:檢查各站登錄是否正常,檢查有無設備告警;檢查保護倒換是否正常;分析故障,即通過環回或更改配置定位到單站;將故障進一步定位到設備板卡并解決。下面就常用復用段保護環為例,闡述故障排查的方法和步驟。
圖2是容量為STM-4的雙纖雙向共享復用段保護環(MSP環),其中網元1為中心節點,各站均有到網元1的業務,其它各點之間沒有業務。逆時針(東發西收)方向為工作環,第1、3VC4為工作或保護時隙,第2、4VC4為空閑時隙。故障現象為:網元2與網元3間斷纖,上報R_LOS告警,網元1和網元3之間E1業務中斷,均上報TU_AIS,其它業務正常。
本案例中,根據故障情況進行分析,首先應排除因線路自動保護倒換(APS)啟動不成功所造成的業務不通的情況。查詢告警并檢查倒換狀態,若系統未進行自動線路倒換,應檢查APS協議是否啟動,必要時重新配置并下發MSP參數,并重新啟動APS協議,直到線路保護倒換成功執行。
在保護倒換執行的情況下,仍存在E1業務中斷,則應首先畫出倒換后的信號流,并采用“逐段環回”或“更改配置法”將故障定位到單站。案例中倒換后的業務信號路徑可用圖3表示。
明確了信號流向,可以綜合應用告警分析法和逐段環回法將故障定位到單站。本例中的分析定位可用圖4所示流程圖表示。
定位過程中,也可以采用“更改配置法”,這里以“配置單向廣播業務”為例,從網元1開始,分別配置指向網元1、2、3、4指定時隙的廣播業務,使得該廣播業務能夠遍歷網元1至4的相關支路板、交叉板和線路板,根據每個網元的業務接收情況來判斷故障點的位置。
將故障定位到單站后,可使用“替換法”分析定位具體的故障板塊,分析定位過程可用圖5所示流程圖表示。
3.2誤碼類故障
造成誤碼類故障的原因一般分為外部原因(如光功率問題、接地故障、環境溫度、電纜故障、設備外部干擾(瞬時大誤碼))、人為原因(如時鐘配置錯誤),或設備本身故障(交叉板、時鐘板、線路板或支路板單板失效或性能不好)。處理方法也可以綜合應用告警性能分析法、更改配置法、逐段環回法和替換法。
下面就無保護鏈為例,闡述故障排查的方法和步驟。圖6中網元1為中心節點,其他點均與網元1有業務,各其它各點間沒有業務。網元3東向有大量RSBBE、MSBBE、HPBBE告警,網元4西向有MSFEBBE、HPFEBBE、LPFEBBE,網元1有LPBBE告警。
本案例中,在排除了外部故障(如電磁、溫度)等的干擾后,可結合各網元故障告警進行分析:由網元1、4和網元3、4之間出現的誤碼告警及對端告警可知LPBBE為網元1收網元4的低階誤碼;而RSBBE、MSBBE、HPBBE為網元4到網元3的光路誤碼(高階誤碼)。
從而,低階誤碼是由網元3、4間的高階誤碼所造成,因此,故障應在網元3、4之間,可綜合應用告警性能分析、環回和替換法進行故障定位,分析過程如圖7所示。
四、小結
本文從SDH光傳輸的故障處理原則、主要處理方法、處理步驟思路幾個方面,總結歸納了SDH傳輸系統的故障處理經驗。同時通過實例,重點闡述了業務中斷類和誤碼類故障的處理思路和步驟,為傳輸系統的日常維護和故障處理提供了參考。光傳輸系統是通信網的重要組成部分,傳輸質量的好壞直接制約著通信網的服務質量。
作為SDH系統維護工作者,應充分了解故障處理的基本原則,靈活掌握并綜合應用各種常用方法,并明確典型故障的處理思路和步驟,才能夠有效進行運維管理和故障排查,為信息業務提供良好的數據傳輸平臺。
參 考 文 獻
[1] 周曉民,王永平,靳秀崢,等.SDH 光傳輸系統培訓手冊[M].深圳:華為技術有限公司編輯出版中心.1999:1-4.
[2] 肖萍萍,等.SDH 原理與技術[M].北京:北京郵電大學出版社,2002:10-12.
[3]曾甫全,李勇,王河.光同步傳輸網技術[M].北京:北京郵電大學出版杜,1996;18-38.
[4]鄧忠札,趙暉,等.光同步數字傳輸系統測試[M].北京:北京人民郵電出版社,2001:52-54.
[5] 李麗君.光纖通信[M].北京:北京大學出版社,2010:78— 18O.
[6] 杜繼紅.SDH 系統常見故障處理及其維護方法[j].電力學報,2007,(2),1-3.