周瑋+陳立偉
摘 要:中國移動內蒙古公司于2014年啟動了故障管理系統工程,集中管理全自治區12個盟市通信設備故障,完成了全量告警的接入、故障管理系統的建設、綜合資源的改造、工單流程的調整、輔助支撐手段的建設,實現了由區公司網管中心對全量告警進行監控和故障處理調度、工單直派一線最小班組的目標,集中化故障管理工作成效顯著。
關鍵詞:故障管理:集中化:告警監控:運行成效
1 背景
中國移動內蒙古公司前期無統一的故障管理系統,各個網元系統根據自身需求各自完成故障和告警的監控管理,存在管理薄弱,單點故障,告警不可控,不能及時定位,時延大的問題;故障和告警沒有全局把控,各個系統以自己需要各自進行故障和告警監控,造成無謂消耗設備資源等問題。為了進一步加強對網管系統故障和告警的監控管理,滿足內蒙古移動業務發展要求,集中管理全自治區12個盟市通信設備故障,由區公司網管中心對全量告警進行監控和故障處理調度、實現工單直派一線最小班組的目標。
2 內蒙古移動故障管理系統實施進展
2.1 總體情況
內蒙古移動嚴格按照改革方案及工作部署認真并有序的開展故障管理工作的實施,完成了系統推廣使用和運維體制改革的整體方案,包括區公司、分公司、旗縣公司的組織機構調整方案、人員調配方案、職責和考核的調整方案等,并完成了全省12個盟市的接入,同時推進的工作還包括掌上運維系統的完善、語音督辦IVR系統的上線應用及故障管理系統的建設。
2.2 地市試點進展
內蒙古移動公司于2014年6月底前,實現12個地市全部納入集中化管理,已完成試點分公司的資源及角色梳理工作。目前承擔全專業1至3級告警全量派發工單,并且直派一線維護班組,對所有工單實現語音電話督辦,同時承擔全專業工單故障預處理工作,及地市的故障處理及割接配合工作。3月已經完成烏海、興安地市監控撤銷,人員已經全部轉崗。
2.3 組織機構、人員、職責優化調整
建立了從上到下的改革機構,完成了省公司網絡部組織、人員及職責的重新調整,并開始了“盟市-旗縣”層級的網絡維護架構調整的工作。12個盟市于2014年1月19日前完成了綜合一體化代維交接工作,同時完成了全省8家一體化代維公司的合同流程,地市一體化綜合代維工作穩步有序。
2.4 網管支撐手段建設進度
故障管理系統已于2014年9月部署上線穩定運行,系統已實現了全專業的告警監控、場景監控、性能監控、拓撲監控以及對集客專線的實時監控功能。
故障管理相關輔助有段中的掌上運維已經于2014年5月31日上線投入使用,包括以下八大功能:工單處理及查詢(故障工單、投訴工單和任務工單)、告警查詢、排障小助手、定點快報、位置導航、業務測試、代維巡檢和資源核查。
IVR呼入、呼出功能已正式啟用,實現多個分機同時受理故障處理電話,并可呈現呼入用戶的基本信息及工單信息,便于監控人員配合故障處理。
3 內蒙古移動故障管理系統運行成效
3.1 故障處理各環節進展及工單質檢分析
3.1.1 告警接入
為了進一步提升告警標準化率,對未標準化告警定期開展問題核查和標準化梳理工作。梳理無線、傳輸、動環專業集團未梳理告警174條、743條、59條。
WLAN告警標準化,梳理標準化告警449條,標準化率達到90%以上,CMNET、IP承載網告警標準化,梳理標準化告警191條,告警標準化率為25%。
3.1.2 工單直派一線
2014年6月30日前,完成所有分公司的整改,目前納入集中化的12個分公司均開啟工單直派一線工作,自維的派發至自維班組,代維的派發至代維班組,此班組為末端班組,組內人員已經按照區縣、網絡維護職責劃分。故障管理新流程相對舊流程由7個環節簡化為4個環節,增加3個功能模塊:EOMS增加自動關聯角色的功能,在工單處理環節減少監控人員54%的工作量;增加回復字段固化功能,簡化維護人員回單環節,至少每張工單縮短2分鐘回單時間。由事后質檢改為事中質檢,提高工單回復準確性。
3.1.3 告警關聯、工程告警標識規則梳理
為了進一步提升告警關聯收斂率,通過對告警和工單實時進行跟蹤、分析,對需要進行關聯的告警實時完成關聯規則梳理和系統部署。分別梳理無線、傳輸、動環告警關聯55條、61條、16條,分別優化無線、傳輸、動環專業告警關聯規則32條、28條、25條,告警關聯收斂率得到明顯提升。
3.1.4 故障預處理、故障預處理手冊梳理
針對數據制作流程及故障處理配合能力開展了省內調研工作,聽取優化流程的建議,找到技術薄弱環節,設定提升目標。對無線、傳輸、動環3個專業26項數據制作工作流程進行調研,監控人員對“無線網基站動環數據刪除、添加”的工作提出流程改進建議;對無線、傳輸、動環、WLAN4個專業11廠家101項故障預處理配合工作能力進行調研,監控人員提出其中25項工作不具備相關能力,19項工作需改進配合流程。
故障預處理工作現狀:區公司監控日均故障工單處理量2685張,占總工單的61%;經區公司處理恢復直接攔截520張,攔截率為19%。
3.1.5 故障處理配合、割接配合調整計劃
IVR呼入功能已正式啟用,實現多個分機同時受理故障處理電話,并可呈現呼入用戶的基本信息及工單信息,便于監控人員配合故障處理。省(區)監控中心承擔全專業故障處理配合及割接配合工作,負責一線維護人員故障處理時的網元狀態查詢、解閉單板等操作,協助定位、處理故障、割接前后告警確認等工作。
3.1.6 工單督辦、質檢等工作實施標準
IVR已于2014年6月完成所有地市督辦規則的部署,正式投入使用,主要對未及時接單和未及時回復工單進行升級督辦。一級響應工單進行全量質檢,二三級工單分專業按照12%的比例進行抽檢。
集中化工作回復內容簡化、事中6個質檢規則、事后14%質檢率。各環節把控質檢工單占比、質檢合格率、工單歸檔及時率、問題解決率四個主要指標。
工單質檢分為事中質檢和事后質檢。事中質檢:人工+系統完成,一級工單100%質檢,二、三級6條規則,非自動上報清除時間全量質檢。事后質檢:按地區、網絡分類設定不低于2%比例抽檢,由值班人員完成。
3.1.7 工單處理時長
雖然集中化后工單平均流轉歷時為15.8小時,較集中化前延長了1.5小時,但是整個T2環節工單平均響應時長為2.14小時,較集中化之前大幅縮短了10.31小時,這表明整體故障處理時限明顯提升。2月工單響應時長全區平均值0.875小時,達標值為≧2小時。2月平均故障歷時全區平均4.2小時,達標值為≦10小時。2月工單回復歷時全區平均11.475小時,達標值為≦24小時,全部達標。
4 基礎管理日趨完善
通過多方位人員技能提升,導師幫扶等舉措,輸出各專業預處理手冊21本,故障攔截率由年初的8%提升至目前的20%。輔助支撐手段發揮實際作用,自掌上運維上線以來,解決一線回單難的問題,手機處理工單量由系統上線時的5%提升至92%。“誰維護、誰接單、誰處理”最小班組化推行效果顯現,人員處理工單更貼近實際維護情況,自維處理工單占比由61%下降至9%。
4.1 減員增效
集中化前,全區12個分公司7*24監控人員共52人,區公司7*24監控人員共24人,全區監控人員共76人。集中化后分公司52名監控人員充實到其他崗位,區公司7*24監控人員增加至42人,全區監控人員共42人,減少34人,降幅達到45%。
4.2 促進員工職業生涯發展
區公司監控人員綜合素質得到提升,后續職業發展空間廣闊。故障集中化管理后,拓寬了監控人員的工作內容,從單純的網絡監控,向監控發現、故障預處理、應急調度、維護配合的綜合型人才轉變,專業技術水平逐步提升,能夠向專業維護人員逐步轉型。
分公司原監控人員崗位分流,有機會向更高崗級發展。各分公司的52名監控人員,按實際需求充實到專業維護、投訴處理、網絡優化等崗位,為崗位職業生涯的轉型發展打開上升空間。
5 結論
內蒙古移動公司制定了故障管理的新目標, 穩步推進“集中化網絡維護管理和屬地化服務支撐相結合”的運維管理方式。按照中國移動集團公司的工作要求,結合省內的自身情況,分批將12個地市接入集中化,整體對故障集中處理、集中監控、集中維護流程、支撐手段優化,重點對短板指標提升,各環節嚴密把控、最終實現區公司一點監控,取消盟市公司值班監控班組,指揮調度全區各分公司故障處理,將故障處理準確定位至一線最小維護班組,有效提高整體運維管理工作效率,縮短精簡工作流程。
根據中國移動對于網管監控集中化的要求,內蒙古移動還將繼續推進集中化故障管理改革工作,以進一步深化區縣網絡質量的統一管理,降低網絡運維成本,通過集中化、精細化、透明化的運維管理模式,使得網絡運維效率得到更高提升,為客戶提供更優質的網絡服務。
參考文獻
[1] 矯秀梅.推進集中故障管理提升網絡生產效率[J].科技與創新.2014(20)
[2] 陸茵.中國移動網絡運維管理的探索與實踐[J].電信技術.2014(1)
[3] 曉英.順勢而為積極推動集中故障管理改革[J].世界電信.2014(6)
[4] 王洋.集中監控模式下的信息通信網絡故障管理探索與實踐[J].電信科學.2015(31)