張 維 肖 鶴
網絡通信與安全紫金山實驗室
5G+工業互聯網催生了一批全新的、前所未有的電信業務模式,也深刻影響著電信網的網絡架構和技術路徑。5G園區專網正待破繭而出,企業內網改造已寫入國家信息行業“十四五”規劃,高質量企業外網不斷得到驗證,云網融合業務即將進入深水區。新變革對網絡運營系統提出了更全面、更敏捷、更智慧的要求。
運營商傳統BOSS系統嚴格來講不能稱之為“系統”,稱為“系統集群”更為恰當。該系統集群由多個割裂的系統組成,開通一個業務需要手工分段開通若干網段,資源管理數據也不同步,因此面對5G+工業互聯網的新挑戰顯得臃腫而乏力。正因如此,三大運營商都提出了新架構云網融合BOSS系統的規劃。但由于現網系統龐大復雜,歷史包袱沉重,而網絡運營不能有絲毫干擾,規劃落地之路必然面臨巨大困難,需要較長的過渡期。
紫金山實驗室綜合實驗平臺利用自建的國內規模最大、一站式科研試驗基礎設施——長三角新型網絡、南京城域網、新型無損數據中心、自研司絡網絡控制器——開展創新技術研究和工業互聯網示范應用。一方面內在需要開發運營系統實現平臺資源管理,支撐示范應用落地,另一方面也希望利用輕裝上陣的優勢為業界重構運營系統提供試驗場,由此兼收并蓄,充分吸收業界經驗,初步建成了面向5G+工業互聯網的新型運營系統,可為業界發展提供借鑒。
傳統系統大多各自獨立擁有一整套采集控制、數據存儲、業務應用的功能模塊,各系統垂直縱向一體,系統內數據與邏輯、邏輯與界面緊耦合,這就造成系統可配置性差,對新業務、新網絡的需求快速支撐能力不足。尤其在5G+工業互聯網領域,未來由于新業務的發展,5G園區專網將成為新的網絡形態,企業內網和外網深度交織,企業上云快速普及,勢必要求運營系統具備靈活敏捷的配置能力。企業更加重視內網和外網的自主可控和數據安全,也將促使用戶側小型運營系統的普及,或由運營商提供系統服務。而傳統的煙囪式系統集群顯然無法滿足這一需求。
新型運營系統目標架構為縱向解耦、橫向融合、B&O一體。系統由前臺、中臺、后臺和能力開放平臺四個部分組成,前臺、中臺、后臺縱向解耦、橫向融合,后臺提供統一的基礎平臺、前臺提供若干能力中心+應用場景;中臺即統一數據中臺,提供數據存儲、處理、分析、訂閱等能力;能力開放平臺提供系統的管理、API控制等能力。如圖1所示。

圖1 新型運營系統總體架構
新型的系統架構打破專業界限,實現了相近功能以原子化統一開發,系統統一登錄,應用需求配置化實現。
資源管理提供存量管理、基礎管理、資源應用,實現資源的納管和動態擴展、資源的可視化管理,提供豐富的查詢、統計分析支撐運營管理,是網絡運營的核心能力之一。在傳統系統集群中,由于各系統是縱向垂直一體的,造成各系統重復采集資源信息,又因采集周期不同步導致數據不同步,無法實時準確地開展資源管理。當收到業務請求時,需要人工復核各系統數據是否一致,確認業務資源是否就緒。
5G+工業互聯網業務向互聯網模式趨近,提出了業務一鍵快速開通的要求。這就必然要求資源實時精確管理,且可端到端查詢、配置。在新型運營系統架構中實現這一能力的核心是兩個“統一”,其一是“統一采控”,其二是“統一數據中臺”。新架構縱向解耦,統一采集平臺成為系統中資源信息的唯一來源;數據和邏輯解耦,所有數據都存入統一數據中臺,在數據中臺完成整理、分發、AI分析,供所有前臺應用中心訂閱。
應用中心訂閱數據時,將首先檢查該資源數據是否為實時數據,再決定后續執行流程。如該數據不需要按實時數據使用則直接從數據中臺訂閱,如需按實時數據使用則通過能開平臺調用后臺統一采集平臺能力,發起一次數據采集。統一采集平臺采得數據后北向寫入統一數據中臺完成數據更新,數據中臺完成數據處理。應用中心調用相關AI分析服務完成數據分析并訂閱該數據。具體如圖2所示。

圖2 資源管理流程
如上所述,新型運營系統實現了所有資源數據均為一個采集周期內的實時數據,為業務一鍵開通、開通過程可視化奠定了基礎,提升了使用者實時掌握資源全貌的能力。
網絡自動駕駛是網絡運維的最終目標,因質量保障在網絡運維中的優先級最高,所以當前網絡自動駕駛的探索基本集中在故障管理領域。運營商有龐大、高效、強力的運維隊伍,但垂直行業企業用戶的運維能力相較而言比較薄弱,因此用戶對故障智能處理的需求更為強烈,是5G+工業互聯網業務發展中尤其需要重視的方向。
新型運營系統以非硬件故障“自發現、自定位、自處理、自恢復”(以下稱“4自”)為目標,探索示范應用運維保障中的故障智能處理。其流程如圖3所示,當故障發生時系統采集到故障告警,完成告警壓縮和根因分析,匹配根因特征,如滿足“4自”特征則調用統一控制平臺按流程自動排障,如不匹配則轉人工工單。

圖3 “4自”智慧排障流程
因此故障特征庫是“4自”處理的核心,特征庫的建立經驗上依賴專家知識庫,技術上可依托知識圖譜、大數據分析、AI算力、機器學習等,其中專家知識庫是基礎。
故障智能處理的下一階段目標是故障自預測,有待進一步研究。
工業互聯網業務與傳統業務存在顯著差異,其一業務產品不再是生產的輔助工具而是直接工具,其二業務對網絡性能,如帶寬、時延、確定性、可靠性、安全性極度敏感,兩者共同作用下,用戶的關注焦點自然地從產品延伸到網絡。因此5G+工業互聯網業務前所未有地將業務產品和網絡緊密連接在一起提供給用戶,用戶也前所未有地關注業務產品后面的網絡資源。用戶從訂購產品的一刻起就迫切希望獲知產品包含了后臺哪些網絡資源,哪些網元為自己提供服務,承載業務的鏈路拓撲,網絡性能是否滿足業務要求,業務開通過程中哪些資源已經被激活、哪些等待激活等等,可以稱為“電信產品可視化”。
在傳統BOSS系統中,由于前述原因,用戶無法實時獲取上述信息,即使在專門服務大客戶的“大客戶網管”中也難以做到過程可視化、鏈路可視化。在新型運營系統中,由于解決了資源數據實時性和唯一性問題,打通了業務側和網管側,具備了向用戶可視化呈現開通過程的條件。
新型運營系統是運營系統在5G+工業互聯網時代發展的有益探索,驗證了縱向解耦、橫向融合、B&O一體新型架構的可行性,能夠滿足綜合性、一站式、大規模科研設施的運營需要,為工業互聯網示范應用提供強大支撐,實現了綜合試驗平臺全生命周期服務。