矯秀梅
摘 要:隨著TD、WLAN、有線網絡的快速發展,網絡維護范圍從原有網絡設備拓展到客戶側、內容源設備。大量增加的新網元沒有按照集中化的要求管理,原先適用于2G網絡的運維模式和理念已經無法滿足“面向客戶、面向端到端業務管理”的要求。面臨變革的需求,要從更高層面和更大范圍思考并建立適應全業務發展的運維管理新體系。在這一背景下,移動集團公司制定了集中故障管理的新目標,即大力推動網絡監控集中化,以省為單位集中管理、集中監控、集中維護,逐步取消地市公司監控值班,簡化工作流程,提升工作效率。以吉林移動分公司集中化故障管理為例,闡述了集中化的目標、實現集中故障管理的措施和集中故障管理的應用效果。
關鍵詞:集中化;故障管理;網絡生產效率;應用效果
中圖分類號:TP393.06 文獻標識碼:A 文章編號:2095-6835(2014)20-0137-02
1 集中故障管理的總體目標
集中故障管理改革的總體目標為:取消地市監控和代維調度,故障直派一線班組??傮w流程和職責分工由原來的省、市二級監控轉變為省級一點監控,即地市公司、縣公司、代維廠家不再承擔監控和故障調度的職責,從根本上實現了運維流程的標準化、扁平化、透明化和精細化,提升了網絡生產效率。
2 實現集中故障管理的措施
2.1 派單新模式
以“區域+設備類型+告警名稱”為判斷標準的故障工單派單新模式。在集中故障管理體系下,將故障預處理分為人工預處理和自動預處理,原有的按網絡層級和網絡類型派單的模式無法滿足這一需求。集中化項目組提出了具有創新性的派單新模式,順利地解決了這一問題。從全網故障情況來看,以“區域+設備類型+告警名稱”為判斷標準的故障工單派單新模式有效地縮短了故障歷時時間。
2.2 設定關聯規則
跨專業告警關聯新規則,提升工單關聯性和告警派單比。為了支撐集中故障管理工作,有效壓縮了各專業告警派單量,精準定位故障工單,項目組組織各專業技術骨干對傳輸、無線、動環3個專業共6大跨專業故障場景設定了關聯規則。
2.3 雙向核查
通過掃盲行動和告警雙向核查,32類網元設備的監控率達到了100%.
2.4 新型監控團隊
在運維新體制下,打造新型的監控團隊,建立新型監控人員培養模型。為了提高地市故障管控質量,項目組以網絡層級為標準,將省監控劃分為大本地網監控和省網監控,其中,大本地網監控團隊負責全網接入層的設備和線路監控,省網監控團隊承擔著全省核心網和匯聚網的監控職責。在集中故障管理下,新型監控團隊要適應省公司對全網的調度能力和對末端網絡的把控能力。
新型監控團隊要按照“監”“控”“管”三類智能職責制訂相應的人員需求模型和人員培養模型,新型監控人員培養模型為監控一線員工提供了職業上升通道。“監”團隊的重復性工作量相對較多,需要具備初級的專業技術知識和跨專業的故障判斷能力;“控”團隊具備一定的故障分析經驗,部分是從“監”團隊重點培養的骨干員工,負責在T2環節中配合故障現場維護人員完成網管告警查詢、設備狀態確認、性能指標跟蹤、配合操作網元等工作;“管”團隊具備較高的技能水平和多年維護經驗的技術人員,選擇溝通能力較強的人員擔任“新型值班長”。
2.5 引入輔助支撐手段
首次引入語音IVR、掌上運維、飛信機器人等輔助支撐手段,填補我省一線維護人員現場型故障輔助手段的空白。一線維護人員現場型故障輔助手段如圖1所示。
2.6 故障通知新方法
根據地市提出的告警通知需求,提出將聲光告警與語音IVR相結合的故障通知新方法。該方法增加了聲光系統與IVR系統的關聯,在聲光系統界面上增加了派發IVR語音和短信提醒的功能鍵,控件為人工選擇,這樣可以實現系統自動通知,減少監控人為編輯短信和系統操作的時延。
3 集中故障管理的應用效果
流程標準化、扁平化、透明化和精細化是集中故障管理改革后“破舊立新”的主要體現。該項目旨在通過故障流程改造、支撐手段建設,打破原有的分布式、粗放式、黑匣子式的運維管理模式,確立更加集中化、精細化、透明化的運維管理新模式。
3.1 故障處理流程
故障處理流程由告警接入、故障預處理、派單及督辦、故障處理、工單歸檔5個階段13個環節組成,實現了從告警發現到故障解決全流程閉環管理。
3.1.1 告警接入
3.1.1.1 統一派單界面
推動傳輸、動環告警納入綜合告警平臺實行集中監控和派單的進程,實現了在一套系統上完成全網故障監控。
3.1.1.2 開展告警雙向核查
開展告警雙向核查,一方面,確保了廠家OMC與綜合告警平臺原始告警消息、告警清除消息100%的一致;另一方面,還確保了綜合告警平臺與告警派單模塊標準化告警100%的一致。
3.1.1.3 跨專業(專業內)告警關聯
6大跨專業關聯場景均已上線,截至目前,無線、傳輸、動環3個專業空間資源一致率達到90%以上,6類跨專業關聯場景全部完成開發、上線,并完成了模擬驗證,現已正式開始應用,跨專業告警關聯對故障精準定位起到了重要的作用。
3.1.2 故障預處理
集中故障管理后,工單直派一線班組,省監控在短期內達到或高于地市公司原有的預處理能力,是影響一線維護人員感知的關鍵因素。為了進一步提升集中故障管理效能,省網管綜合監控室通過梳理流程、培養人員、建設手段等途徑,提升自身的預處理、自處理能力,組織各專業部室聯合地市公司組成故障預處理梳理項目組,將告警分為人工預處理或自動預處理兩種類型,有針對性地開展故障預處理梳理工作,在此期間,共完成了6大專業684條告警預處理的梳理工作。我省集中化故障預處理專項工作自2013-09開展以來,取得了顯著的成效,全省故障攔截率從最初的10%左右上升到20%以上,極大地降低了地市維護一線人員的工作量。
3.1.3 派單和督辦
3.1.3.1 派單流程改造
結合我省網絡維護的實際情況,提出了以“區域+設備類型+告警名稱”為判斷標準的故障工單派單新模式。故障歷時已從集中化前的10.17 h縮短到了目前的5.2 h,遠遠優于集團標準。
3.1.3.2 工單督辦
語音IVR系統已經開始試用,將進一步明確通知標準,并根據試用情況逐步完善?,F階段,它已完成了各試點地市梳理短信通報、聲光告警觸發和故障通報、短信提醒標準,通過試運行,取得了較好的效果。確定標準條件后,后期將會逐步推廣。
3.1.4 工單質檢分析
嚴格把控工單回復質量,專門成立工單質檢組,詳細核查故障工單回復的規范性、及時性和故障的真實原因。這樣做,一方面,可以進一步聯合各專業部室加強工單壓縮工作,減輕維護人員的負擔;另一方面,還可以加強對不合格工單的通報和考核,提升工單回復質量。
3.2 手段建設
為了保障集中故障管理工作的穩步推進,前期從資源維護、告警派單、故障流轉和考核統計四方面開展了支撐手段建設工作,支撐故障工單的直派代維。其中,主要涉及的系統包括電子運維、代維管理、綜合告警、傳輸網管、數據網管和綜合資源等系統。
3.2.1 資源維護
資源維護主要是通過綜合資源、傳輸網管、數據網管進行資源與代維關聯關系維護,完成直放站資源維護模板調整,完成其他專業資源維護模板整改,使其具備能夠在資源系統上進行各專業設備代維歸屬關系維護的條件。
3.2.2 流程改造需求
流程改造需求包括電子運維派單規則的梳理和改造,以及故障督辦功能的完善。它支持按照代維、網格、維護班組三種模式派單。
4 結束語
建立“集中化網絡維護管理和屬地化維護及服務支撐相結合”的運維新模式,在集中化運維的基礎上,全面實施面向業務、面向客戶感知的網絡運維。堅持省公司提出的“集中管理、集中監控”的原則,分層落實省、市、縣各級維護部門的職責,加強端到端業務管理,強化面向業務的屬地服務支撐,逐步實現從“單純面向網元和網絡維護”向“面向網元和網絡維護及端到端業務管理并重”轉變,從整體上提升網絡生產效率。
〔編輯:白潔〕
3.1.3 派單和督辦
3.1.3.1 派單流程改造
結合我省網絡維護的實際情況,提出了以“區域+設備類型+告警名稱”為判斷標準的故障工單派單新模式。故障歷時已從集中化前的10.17 h縮短到了目前的5.2 h,遠遠優于集團標準。
3.1.3.2 工單督辦
語音IVR系統已經開始試用,將進一步明確通知標準,并根據試用情況逐步完善?,F階段,它已完成了各試點地市梳理短信通報、聲光告警觸發和故障通報、短信提醒標準,通過試運行,取得了較好的效果。確定標準條件后,后期將會逐步推廣。
3.1.4 工單質檢分析
嚴格把控工單回復質量,專門成立工單質檢組,詳細核查故障工單回復的規范性、及時性和故障的真實原因。這樣做,一方面,可以進一步聯合各專業部室加強工單壓縮工作,減輕維護人員的負擔;另一方面,還可以加強對不合格工單的通報和考核,提升工單回復質量。
3.2 手段建設
為了保障集中故障管理工作的穩步推進,前期從資源維護、告警派單、故障流轉和考核統計四方面開展了支撐手段建設工作,支撐故障工單的直派代維。其中,主要涉及的系統包括電子運維、代維管理、綜合告警、傳輸網管、數據網管和綜合資源等系統。
3.2.1 資源維護
資源維護主要是通過綜合資源、傳輸網管、數據網管進行資源與代維關聯關系維護,完成直放站資源維護模板調整,完成其他專業資源維護模板整改,使其具備能夠在資源系統上進行各專業設備代維歸屬關系維護的條件。
3.2.2 流程改造需求
流程改造需求包括電子運維派單規則的梳理和改造,以及故障督辦功能的完善。它支持按照代維、網格、維護班組三種模式派單。
4 結束語
建立“集中化網絡維護管理和屬地化維護及服務支撐相結合”的運維新模式,在集中化運維的基礎上,全面實施面向業務、面向客戶感知的網絡運維。堅持省公司提出的“集中管理、集中監控”的原則,分層落實省、市、縣各級維護部門的職責,加強端到端業務管理,強化面向業務的屬地服務支撐,逐步實現從“單純面向網元和網絡維護”向“面向網元和網絡維護及端到端業務管理并重”轉變,從整體上提升網絡生產效率。
〔編輯:白潔〕
3.1.3 派單和督辦
3.1.3.1 派單流程改造
結合我省網絡維護的實際情況,提出了以“區域+設備類型+告警名稱”為判斷標準的故障工單派單新模式。故障歷時已從集中化前的10.17 h縮短到了目前的5.2 h,遠遠優于集團標準。
3.1.3.2 工單督辦
語音IVR系統已經開始試用,將進一步明確通知標準,并根據試用情況逐步完善。現階段,它已完成了各試點地市梳理短信通報、聲光告警觸發和故障通報、短信提醒標準,通過試運行,取得了較好的效果。確定標準條件后,后期將會逐步推廣。
3.1.4 工單質檢分析
嚴格把控工單回復質量,專門成立工單質檢組,詳細核查故障工單回復的規范性、及時性和故障的真實原因。這樣做,一方面,可以進一步聯合各專業部室加強工單壓縮工作,減輕維護人員的負擔;另一方面,還可以加強對不合格工單的通報和考核,提升工單回復質量。
3.2 手段建設
為了保障集中故障管理工作的穩步推進,前期從資源維護、告警派單、故障流轉和考核統計四方面開展了支撐手段建設工作,支撐故障工單的直派代維。其中,主要涉及的系統包括電子運維、代維管理、綜合告警、傳輸網管、數據網管和綜合資源等系統。
3.2.1 資源維護
資源維護主要是通過綜合資源、傳輸網管、數據網管進行資源與代維關聯關系維護,完成直放站資源維護模板調整,完成其他專業資源維護模板整改,使其具備能夠在資源系統上進行各專業設備代維歸屬關系維護的條件。
3.2.2 流程改造需求
流程改造需求包括電子運維派單規則的梳理和改造,以及故障督辦功能的完善。它支持按照代維、網格、維護班組三種模式派單。
4 結束語
建立“集中化網絡維護管理和屬地化維護及服務支撐相結合”的運維新模式,在集中化運維的基礎上,全面實施面向業務、面向客戶感知的網絡運維。堅持省公司提出的“集中管理、集中監控”的原則,分層落實省、市、縣各級維護部門的職責,加強端到端業務管理,強化面向業務的屬地服務支撐,逐步實現從“單純面向網元和網絡維護”向“面向網元和網絡維護及端到端業務管理并重”轉變,從整體上提升網絡生產效率。
〔編輯:白潔〕