摘要:
業務保障是業務供應鏈中突出的管理環節,由于目前中國的電信運營商普遍缺乏有效的運營支撐系統,因此文章對美國電信運營商在業務保障領域的成功應用進行了介紹,并對美國電信運營商基于電信運營圖設計的集中式電信業務保障操作平臺的功能及工作流程管理進行闡述,希望能為中國電信運營商開展相關工作提供參考。
關鍵詞:
業務保障;電信運營圖;運營支撐系統;工作流程管理
Abstract:
Although service assurance has gradually become a key management area in the service supply chain, Chinese telecom operators are generally lack of effective operational support systems. In this paper, successful stories of American operators in the same domain are introduced, with a detailed presentation of the functions of a centralized workflow management for telecommunications service assurance operations platform,which is designed based on the telecom operations map. The purpose is to provide corresponding reference for Chinese telecom operators.
Key words:
Service assurance; Telecom operations map; Operational support system; Workflow management
新一代的電信網絡是以業務驅動為特征的網絡,業務保障逐漸成為業務供應鏈中突出的管理環節。簡單地說,業務保障是指電信運營商為了向客戶提供具有服務質量(QoS)保證的業務而從事的一系列業務管理活動。它集成面向業務等級協定(SLA)的業務性能監控、業務障礙管理和遠程測試等手段,對SLA中規定的QoS目標進行測量和報告,適時地通知管理者調整業務配置,從而有效地改善業務運行環境和運行狀況,提高客戶的滿意程度。
目前,中國電信運營商已經開始致力于業務保障系統的投資和建設,期望籍此來優化現有的運維機制和業務結構,以在開放、競爭的電信業務市場中贏得更多的客戶。為了使人們對業務保障有一個全面的了解,本文以美國電信運營商在業務保障領域的系統應用為背景,介紹它們在規劃和實現集中式電信業務保障操作平臺方面的流程化管理經驗。
1、 電信運營圖
業務保障反映了基于業務生命周期的一個管理側面。與網絡管理的目標不同,業務管理更多關注的是如何提高客戶對業務使用的滿意程度,如何調配網絡資源,保證QoS,并能夠及時地發現和處理影響QoS的問題。由于各種類型的業務都具有獨特的應用模型,不同的電信運營商在設計業務邏輯時也要綜合考慮本企業的經營目標和策略,這不可避免地帶來了業務管理應用的無序性,即:缺乏統一的標準或方法來指導實際業務管理系統的開發。
國際標準組織電信管理論壇(TMF)在業務管理領域做了大量卓有成效的工作,其中最為突出的貢獻就是提出了電信運營圖(TOM)模型[1, 2],如圖1所示。TOM由一組分層的、可重用的經營過程組成,這些過程反映了電信運營活動中獨立于具體的電信運營商、技術和業務類型的操作,覆蓋了電信運營活動中的客戶服務、業務支撐和運行維護等方面的公共功能。除此之外,TOM還明確給出了將抽象的經營過程映射為面向業務實現的運營支撐系統(OSS)組件時可參考的輸入/輸出信息流。
TOM的作用在于展現了面向業務管理的運營視圖。它使用了電信運營的常用術語,從電信運營商的內部自頂向下地審視企業的經營過程,以分層的模型描述了客戶服務、業務支撐和運行維護等運營環節的過程,以及這些過程如何向網絡管理功能(包括配置管理、性能管理和故障管理等)進行適配。電信運營圖從水平方向的視點解決了客戶服務、業務支撐和運行維護過程的協作關系和支撐關系,定義了客戶服務處理層、業務開發與操作處理層和網絡與系統管理處理層的經營過程;從垂直方向的視點確定了基于業務生命周期的業務實現、業務保障和業務計費這3個不同的管理域。

因此,當定制具體的業務管理應用時,可以基于TOM管理模型選取其中若干個經營過程繪制工作流程,描述各經營過程之間交互的信息,靈活地設計并實現不同粒度的OSS組件,最后仍以TOM管理模型為準繩衡量電信運營商和業務管理系統開發商在理解業務管理需求方面的一致性。
2、 業務保障系統
SLA中規定的QoS目標是面向客戶的,由客戶可理解的一組指標表示,如:業務可用性、平均業務開通時間(MTTP)、平均業務恢復時間(MTTR)、失效頻率(FF)等。美國聯邦通信委員會(FCC) 規定了電信運營商在向客戶承諾SLA時各類業務可參考的QoS指標值,各電信運營商可以根據客戶的實際需求和自身的業務配置情況進一步細化指標值。如何對這些QoS指標進行定義、測量、報告,以及采取有效的措施改善業務的運行性能,是業務保障系統需要解決的主要問題。
TOM給出了業務保障管理域的功能定義,美國的電信運營商基本都遵從TOM模型來組織業務保障功能。針對客戶服務處理層發現的業務失效或服務質量降級等異常現象,業務保障系統分別啟動相應的維護處理工作流程,從上到下貫穿客戶服務處理、業務開發與操作處理(業務支撐)和網絡與系統管理處理(運行維護)等運營層次,及時地為客戶恢復業務的正常運行。此外,業務保障還包括對業務運行情況的例行檢測,根據SLA的規定定期地向客戶提交業務運行報告。
一個典型的業務保障系統包括了以下的功能組件:
(1)業務性能監控
業務性能監控對SLA規定的QoS指標進行實時或輪詢方式的指標測量、采集和處理,將性能統計的結果制成報告,為客戶提供接入方式進行查詢。
(2)業務障礙管理
業務障礙管理過濾、處理網元或網元管理系統上報的告警,通過檢測、分析和隔離網絡故障迅速地定位受到影響的業務及客戶,在業務發生障礙之前向客戶預警。業務障礙管理通常需要配備告警關聯性分析的數據庫和管理功能。
(3)遠程測試
遠程測試是業務保障系統中一個非常重要的輔助功能。由于現階段很多舊的網元設備管理接口未達到所期望的開放性程度,從網元管理系統上報的性能/告警數據無法滿足業務保障系統對處理數據的要求,因此,遠程測試成為有效的主動測量手段。美國的電信運營商一般都將遠程測試OSS軟件裝載在一個業務測試中心的管理操作平臺上,而在網絡中不同位置的網段安放相應的測試探針(Probe)硬件。中心的管理員或管理系統可以在軟件平臺上有策略地發起測試命令,遙控遠端的測試探針對某處的業務電路或流量進行測試,測試探針形成的測試結果返回到軟件平臺進行集中的分析和處理。
在實際的應用中,遠程測試配合業務性能監控或業務障礙管理完成各自的管理目標。以業務障礙管理為例,電信運營商經常會遇到這樣的困惑:當客戶向客戶服務中心申告業務障礙時,網絡運行中心(即網管中心)的性能數據和告警數據卻顯示網絡運行狀態正常。雖然根據經驗判斷業務障礙多半發生在客戶端,但是由于缺少有力的測量手段,電信運營商無法向客戶提供數據證實判斷。因此,在電信運營商網絡和客戶網絡的邊界處安放測試探針設備,通過業務測試中心對兩端的網絡分別進行回環測試,可以定位業務障礙發生在網絡的哪一端,分清責任,避免無端的賠償。遠程測試的這種應用同樣適用于多個電信運營商合作為客戶提供一種業務時出現業務障礙所引起的責任劃分。
3、 工作流程管理
集中式的業務保障操作平臺就是在一個管理中心的計算機管理操作平臺上集成業務保障的所有功能軟件,包括業務性能監控、業務障礙管理和遠程測試。這些功能軟件為可即插即用的OSS組件,由工作流程管理OSS根據一定的流程邏輯統一調度,完成自動化的、可定制的業務保障任務。
業務保障操作平臺所面臨的一個重要的問題是如何解決來自不同廠商的OSS組件的互操作性。特別是在自動化的工作流程管理過程中,為了實現無人工干預的全程業務診斷和派工,OSS組件之間的接口應該具有較好的開放性。目前,國外的一些業務保障系統生產廠商已經開發了基于CORBA的網關軟件,用于適配業務保障OSS組件和電信運營商的其他工作管理系統(如訂單處理系統、故障工單派發系統、資源管理系統等)的接口信息,同時也通過網關軟件向客戶提供基于Web頁面訪問業務保障系統內統計數據的能力。

業務保障操作平臺所面臨的另一個需要解決的問題是如何建立一套完整的業務資源數據庫。一個電信運營商擁有的電路資源往往是分布在很廣泛的地理區域內,分別由下屬的分支機構管理和調度。建設集中式的業務保障操作平臺,需要將所有的電路數據集中在一個統一的數據庫中存儲,通過業務保障操作平臺來部署電路的分配和回收。只有這樣,才能夠對業務管理層出現的各種異常現象迅速無誤地做出重配置的反應。中國的電信運營商普遍缺少這種企業級的資源數據庫,電路的調度周期顯得冗長而低效。
在建立業務資源數據庫時特別需要注意內容的一致性,即:數據庫中記錄的電路信息和狀態必須符合當前物理電路的實際情況,電路的分配和回收必須能夠真實同步地反映在業務資源數據庫中。
圖2所示為基于工作流程的業務保障系統結構框架。其中,核心的OSS系統是自動執行工作流程處理過程的工作流程管理器(WFM)。WFM定義了業務保障管理域內的若干個工作流程,以流程規則的形式存儲在數據庫中。WFM是一個智能的OSS組件,它除了保存流程規則之外,還包括有關業務診斷策略以及所涉及的遠程測試步驟等數據。這些數據事先錄入到WFM的數據庫中,在工作流程的執行過程中通過內置的解釋器解析為可自動判決的智能操作,同時可以根據電信運營商的經營策略進行調整。測試系統(TS)是執行WFM派發的遠程測試任務的OSS系統,它接受來自WFM的測試會話請求,對指定的業務電路進行測試,并將測試的結果返回給WFM。測試的過程需要調用資源管理庫的電路數據,測試的目標電路標識符、測試項目等參數通過TL1(Transaction Language 1)命令傳遞到布放在網絡中的測試探針,由探針設備上的測試軟件完成物理測試。業務性能監控OSS和業務障礙管理OSS分別完成業務管理層的性能和障礙管理,它們所發現的問題成為觸發維護工作流程的前提條件。從降低運營成本的角度考慮,電信運營商有時候會將這兩部分功能放置到網絡運行中心,和網管系統結合起來進行管理。
遠程測試的觸發包括以下幾個來源:
(1)業務訂單處理系統發起的安裝測試請求,通常是在業務開通之前的驗收階段。
(2)故障工單系統發起的維護測試請求,是指客戶通過受理中心提交的故障申告引發的工單。
(3)業務性能監控OSS發現的業務性能下降。
(4)業務障礙管理OSS發現的影響業務及客戶的網絡故障告警。
WFM在接收到這些測試請求之后,根據自身存儲的診斷規則設計測試任務(如測試目標和測試項目等),和測試系統之間進行多輪測試會話,最終確定問題的根源。可以說,遠程測試是業務保障工作流程中最關鍵的處理環節,是電信運營商了解自身的網絡及業務狀況的最有力的智能手段。
以故障工單系統發起的維護測試請求為例,業務保障維護工作流程包括以下一些處理步驟:
(1)工作流程管理器接收故障工單系統傳遞過來的維護測試請求(故障工單在故障工單系統處生成,其觸發可以來自客戶申告,也可以來自業務性能監控和業務障礙管理報告的嚴重告警)。
(2)WFM對故障工單進行分析,判斷是否具備遠程測試的條件。這一步驟包括確定故障工單中的現象性質,輸入的電路標識符是否合法,以及檢查當前面向該電路的測試資源配置情況等。如可以執行遠程測試,則向TS發起測試會話,由TS執行故障的診斷;如不可以執行遠程測試,向故障工單系統返回維護測試應答,指出不可測試的原因。
(3)TS調用資源數據庫的電路數據,將測試的目標分解為遠程測試探針可識別的TL1指令,發送給探針進行實地物理測試,并將探針返回的測試結果進行匯總,傳遞給WFM。
(4)WFM分析測試結果,做出業務配置的部署或派工維修的決定,形成工單發送給相關的維護部門,通知故障工單系統關于該工單的處理結果并及時地監督并關閉故障工單。
對于其他的測試請求情況,WFM執行類似的處理過程。測試的分析結果顯示在WFM的界面上,通常包括分類的統計結果,如:測試正常情況、內部故障情況、外部故障情況、測試復查情況、未定義故障情況以及測試錯誤情況等。
4、 結束語
美國的電信運營商通過建立集中式業務保障操作平臺以及規范相應的維護處理工作流程取得了顯著的成效。以數字電路業務(如:DS0和DS1)為例,1998年數字電路的MTTR指標的平均水平處于18~24小時之間,在建立了業務保障操作平臺之后,2000年該指標改進為4.5~5.5小時左右。此后,電信運營商不斷地完善工作流程環節,在2002年將MTTR指標降到了不足4小時。顯然,這種改進的效果增強了電信運營商向客戶承諾具有更高業務等級SLA的信心。國內的電信運營商如今面對的競爭和市場格局和90年代末美國的情況類似,因此從規范管理和提高綜合競爭力等方面來說,美國電信運營商在建立集中式的業務保障操作平臺方面的成功經驗是值得借鑒的。□
基金項目:國家杰出青年科學基金項目(60025104);國家自然科學基金重大研究計劃項目(90104023);國家“863”計劃項目(2001AA121051)
參考文獻:
[1] 夏海濤,孟洛明,邱雪松等.重新審視
TMN—自動化的電信運營管理剖析[J].電信技術,2002,(4):3—7.
[2] TMF GB910 Version 2.1, Telecom Operations Map [S].
收稿日期:2003-03-06
作者簡介:
夏海濤,北京郵電大學交換技術與通信網國家重點實驗室博士研究生,研究興趣領域為電信業務管理、新一代運營支撐系統以及工作流程管理。曾從事ATM交換機、網卡驅動器、IP路由器的研發工作,參加過網絡管理領域的國家“863”計劃項目和自然科學基金項目工作,已發表學術論文5篇,專著1部。