[摘要] 本文結合工作實際,簡要分析了CC08程控交換機告警系統的類型、故障分析及處理原則,并結合案例,闡述了故障處理方法,供廣大網絡運維工作者參考。
[關鍵詞] 交換機; 故障; 分析; 處理; 告警
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 12. 041
[中圖分類號]F273.1;TN807 [文獻標識碼]A [文章編號]1673 - 0194(2011)12- 0062- 02
1告警系統分析
C&C08程控交換機在運行過程中,當某些部件出現故障時,交換機的告警系統就會檢測收集到各種軟、硬件故障,然后經維護軟件處理后在告警臺輸出告警信息報告,并通過告警箱顯示告警級別及告警原因,發出可視、可聞信號,提示維護人員進行必要的處理,以保證設備的正常運行。
C&C08交換機的告警系統采用分散采集、集中處理的方式,將各種告警信息集中到告警通信板分類處理后,再分別送到告警燈、告警箱和遠端網管中心。根據故障對設備的影響程度、重要性及緊迫性分為緊急故障、重要故障、一般故障和提示性故障等4個告警級別。
1.1緊急告警(一級告警)
緊急告警需要緊急處理,這種告警往往具有全局性,會導致主機癱瘓,對應紅色告警級別指示燈和急促鈴聲。如主機板故障、網板故障、時鐘板故障等,故障內容涉及CPU、EMA、BNET、CNT、CTN、SNT、FBI等重要部件。
1.2重要告警(二級告警)
重要告警指局部范圍內的單板或線路故障告警和事故告警,需要及時處理,否則會影響重要功能的實現,如用戶板故障、數字中繼板故障等;對應信號為紅色指示燈及次急促鈴聲。故障內容涉及SIG、MFC、DRV、ST、ASL、MC2、OPT及NOD等板件,以及信令鏈路故障等。
1.3一般告警(三級告警)
一般告警,指一般性的,描述各單板或線路工作是否工作的狀態故障告警和事故告警;提醒維護人員及時查找告警原因,消除故障隱患,對應信號為黃色指示燈及斷續鈴聲。故障內容涉及單板復位、PCM告警等。
1.4警告告警(四級告警)
警告告警是提示性告警,指不會影響系統性能的提示性的故障告警和事故告警,如測試板告警,這種告警不會影響系統性能,不必及時處理,但對交換機運行狀態要做到心中有數,對應信號為綠色指示燈及單次鈴聲。
在日常維護中,機房維護人員應從以下5個方面察看告警信息:一是機架行列告警燈,二是告警箱,三是維護終端的告警臺,四是單板指示燈,五是維護臺的“設備控制”單板狀態。另外有些故障可能在上述5處都無法查覺,而是來自用戶的申告。通過以上方面察看可以獲得告警信息和用戶申告信息。
2故障分析和處理的原則
C&C08的操作系統不僅具有各種軟件管理協調功能,同時還具有差錯分析和處理能力。對于機房維護人員來說,后者更具有重要現實意義。因為在實際操作中,我們可以利用交換機的差錯分析處理軟件對故障進行分析和判斷。
當C&C08的操作系統發出告警信息后,機房維護人員首先應根據告警的級別判斷障礙性質、重要性及地點,并遵循以下原則對故障進行分析和處理:
(1) 處理重要事件時,首先要提取話單,以免話單丟失;
(2) 在能夠處理的范圍內,盡量不影響全局通話;
(3) 避免在話務量高峰時處理,最好在話務空閑時進行故障處理;
(4) 觀察單板指示燈和維護終端的狀態,分析相關單板;
(5) 不要盲目更換單板,防止故障擴散;
(6) 插拔單板時,一定要帶防靜電腕套,并將接地端靠地連接。
3交換機的故障定位與處理方法
3.1C&C08交換機的測試診斷功能
C&C08具有較強的測試診斷功能。一方面,各智能單板都具有自檢功能,設備運行過程中,各智能單板可實時進行自檢,一旦發生故障將自動報警或倒換;另一方面可通過測試子系統向主機發送命令,對指定設備進行測試。
3.1.1測試系統的組成和基本原理
(1) 測試系統的組成。C&C08機的測試系統由硬件測試設備、主機軟件和終端軟件組成。硬件測試設備主要包括用戶電路測試板(TSS)、用戶模塊母板測試總線以及帶有自測功能的各種智能單板。測試系統的主機軟件是指運行于交換模塊MPU板的主機軟件中的TEST程序模塊。測試系統的終端軟件由BAM上的測試服務器和工作站上的測試臺組成。
(2) 測試系統的基本原理。測試子系統通過終端系統向主機發送人機命令,由主機下達相應的測試命令給相應的設備,啟動相應的測試任務。測試完成后將測試結果通過主機送回終端,由終端系統進行分析、統計、顯示與打印。
3.1.2測試系統的主要內容
C&C08測試系統的主要內容包括3個部分,即用戶電路測試、系統單板測試、測試系統自檢。
(1) 用戶電路測試。電路測試主要指對交換機用戶電路的各項性能或指標的測試。主要包括用戶內線測試、用戶外線測試及用戶儀表測試。測試的性能指標包括:線路絕緣電阻、絕緣電壓、絕緣電容及用戶板性能測試。
(2) 系統單板測試。系統單板測試是指系統對23種單板提供的單板自檢功能,如MPU、EMA、BNET板等。各智能單板在平時即可進行實時自檢,一旦有故障將自動向終端發送告警信息。當測試系統向上列單板發出測試命令后,根據各單板返回的測試結果可判斷出各單板的運行狀態,從面進行故障定位。
(3) 測試系統自檢。測試系統自檢主要是對測試板、測試總線的檢測,以防止因測試板或測試總線的原因導致測試結果出現錯誤。
在日常的維護工作中,維護人員經常需要利用交換系統提供的各種測試手段對設備出現的各類故障進行定位及定性分析,所以掌握交換機的各種測試內容尤為重要。
3.2C&C08交換機故障分析和處理的方法
故障不同,故障的表現形式也不盡相同。機房維護人員要根據不同故障的表現形式,結合實際工作經驗,判斷故障的級別,分析故障現象,找出故障產生的原因,并準確鎖定故障位置,迅速排除故障。C&C08交換機故障處理方法一般有以下5種:
(1) 排除法。某些故障由于涉及的故障點較多,應先羅列出故障現象及故障發生的可能性,根據話音和信令的流程進行分析,逐步排除。分析故障可能性時,要盡可能做到全面、客觀,不要有遺漏,實際排除可能性時,應從可能性低的開始排除,層層遞進。
(2) 對比法。參照本系統正常運行的設備或其他工作場地正常運行的設備數據作基準,仔細對比故障設備和正常設備之間的參數區別,分析故障發生的可能性,找出故障的準確位置。
(3) 替換法。對硬件設備故障的處理往往采用替換法。即當懷疑某個電路板出現問題時,維護人員可通過替換電路板的方法進行判斷和驗證。替換時應做到替換的正常設備要與被替換的設備完全相符,替換后進行相關的后續處理及恢復性的操作,如果一切恢復正常,則表示此故障為硬件設備發生問題。
(4) 數據修改、數據再設定法。此方法適用于軟件方面的故障鑒定。如果系統軟件在設計和編制時存在某種缺陷,或是系統參數、數據及用戶數據等出現某種錯誤,會導致系統不能在特定情況下正常執行某些任務。當此類現象發生時,維護人員可采用數據修改或數據再設定的方法進行處理。
(5) 人工啟動和邏輯復位法。即重新啟動或復位法,一般采取按復位鍵,重新插拔單板,或者直接關閉電源重新復位,對單板的硬件、軟件進行邏輯初始化,使其恢復正常的工作狀態。此種方法一般是在單板硬件或軟件發生混亂而無法正常工作的時候采用。
3.3C&C08機故障處理案例
C&C08交換機在通話質量方面的故障最為普遍,如雜音、噪聲大,串音、話音失真及斷話、單通等,這類故障有些來自用戶部分,有些來自中繼部分,還有些來自一些不良的傳輸設備等。下面筆者將根據自己多年來的維護經驗通過以下幾個案例闡述這方面的故障處理。
案例一:用戶話機不振鈴,但可正常通話。首先排除了話機質量問題及外線故障。初步懷疑是PWX電源板的問題,更換PWX后故障依舊存在。于是對該用戶所在用戶板進行內部測試,發現鈴流異常,于是又測試該用戶板的其他用戶,都發現了同樣的問題,確認該單板有故障,更換后故障排除。
案例二:兩對中繼電纜交叉連接(鴛鴦線),導至單向通話。本局與一個SMII遠端模塊對開4條中繼,剛開通時, 發現通話時有時出單通現象,但后臺及單板并沒有相應的告警信息,于是采用指定中繼撥打方法,發現中繼1、2并沒有單通現象,中繼3、4會出現單通或不通的情況。在遠端局拔掉一根2M線,發現兩個中繼板均有告警,于是在遠端模塊側檢查2M電纜,發現兩對電纜的收端交叉連接,倒換后故障排除。
案例三:光端機性能不良引發的故障。本局下掛的一個RSMII模塊的用戶陸續申告,通話時雜音特別大。開始以為是外線故障,但測試后發現外線正常。又測試一下相關單板也沒什么問題。在巡檢時發現光端機偶爾會有聲音告警,適值深冬季節,氣溫驟降,后來交換機告警箱出現信令告警,且光端機發出連續的聲音告警。通過維護終端查看發現該遠端模塊已中斷。斷定對端局光端機由于氣溫過低導致故障。對該遠端模塊重新做了防寒處理后,光端機告警停止,但交換機側的告警仍然存在,模塊仍處于中斷狀態。后來通過插拔LAP協議處理板進行復位,故障才消失。
案例四:BNET網板不良導致SMII中斷。用戶申告電話無聲,測試外線時發現測試失敗,提示TSS板損壞。在維護終端查看不到該交換模塊的所有硬件面板,而且軟件版本無法上報至后臺,但所有中繼正常,所以排除了中繼傳輸方面的故障。對MPU及BNET板進行主備用倒換,故障仍然存在,最后更換BNET板后故障排除。
4結束語
綜上所述,在日常維護工作中,交換機隨時都有可能出現這樣或者那樣的故障,有的可能很容易處理,但有些故障確實很棘手,作為一名維護人員不管遇到什么樣的故障,只要能夠采取科學的方法去分析處理,同時多看、多學、多記,其維護經驗將越來越豐富,任何故障都將迎刃而解。
主要參考文獻
[1] 張君光. C&C08數字程控交換系統維護手冊[M]. 北京:人民郵電出版社,1997.
[2] 張永霞. 程控交換機的管理和維護[M]. 北京:人民郵電出版社,2002.
[3] 朱世華. 程控數字交換原理與應用[M]. 西安:西安交通大學出版社,1993.
[4] 葉敏. 數字程控交換與現代通信網[M]. 北京:北京郵電大學出版社,1998.
[5] 胡谷雨. 現代通信網和計算機網管理[M]. 北京:電子工業出版社,1996.
[6] 白英彩. 計算機網絡管理系統設計與應用[M]. 北京:清華大學出版社,1998.