張雪
(中國電信股份有限公司研究院,北京 102209)
2020年全球大多數(shù)主流運營商已轉向5G獨立組網(wǎng)架構,并開始了5G獨立組網(wǎng)架構的商用部署[1]。5G 網(wǎng)絡 3 種典型的場景為:增強型移動寬帶(enhanced mobile broadband,eMBB)、低時延高可靠通信(ultra-reliable and low latency communication,uRLLC)和大連接物聯(lián)網(wǎng)(massive machine type communication,mMTC)。傳統(tǒng)的專用硬件難以適應網(wǎng)絡和業(yè)務發(fā)展的需求,采用網(wǎng)絡功能虛擬化(network function virtualization,NFV)技術進行5G核心網(wǎng)的部署,能夠實現(xiàn)5G業(yè)務的快速部署、資源的靈活調用、故障的快速隔離和自愈,對5G網(wǎng)絡特性發(fā)揮起到了重要的作用[2]。同時網(wǎng)絡功能虛擬化技術的使用帶來一些運營維護的難點,例如軟硬件的一體化監(jiān)控和告警關聯(lián)、網(wǎng)元和網(wǎng)絡功能虛擬化基礎設施(network function virtualized infrastructure,NFVI)的兼容性以及維護團隊職責的協(xié)同問題,這些難點都將是運營商在5G核心網(wǎng)運營維護過程中需要解決的問題。
與4G核心網(wǎng)架構不同,5G核心網(wǎng)引入服務化架構(service based architecture,SBA)進行設計。5G核心網(wǎng)的SBA借鑒了軟件開發(fā)領域成熟的面向服務的架構(service-oriented architecture,SOA)和微服務架構(micro-service architecture,MSA)的綜合優(yōu)勢,提出了面向服務的總線架構,將傳統(tǒng)的以網(wǎng)元和信令傳輸為基礎的網(wǎng)絡架構轉變?yōu)橐苑蘸蛻贸绦蚪涌冢╝pplication programming interface,API)為主的服務架構,其主要架構如圖1所示[3]。此架構實現(xiàn)了網(wǎng)絡功能的靈活組合,能夠支撐業(yè)務的敏捷提供和能力開放。

圖1 5G核心網(wǎng)服務化架構
延續(xù) 4G核心網(wǎng)業(yè)務平面與控制平面完全分離的理念,5G核心網(wǎng)將網(wǎng)絡功能(服務或網(wǎng)元)分為控制面功能和用戶面功能。其中將用于數(shù)據(jù)轉發(fā)用戶面功能(user plane function,UPF)進行下沉,實現(xiàn)UPF靠近用戶側進行部署,可以有效避免長距離網(wǎng)絡傳輸時延,提升用戶體驗。控制面功能的網(wǎng)元采用集中式部署或分布式部署方式,采用服務總線的方式連接,各網(wǎng)元功能根據(jù)不同的功能統(tǒng)一接入服務總線,實現(xiàn)基于通用網(wǎng)絡訪問接口進行遠程訪問。5G核心網(wǎng)主要的網(wǎng)元功能定義見表1。

表1 5G核心網(wǎng)網(wǎng)元功能定義
基于SBA的5G核心網(wǎng)對各網(wǎng)元功能的重新梳理,使整個網(wǎng)絡架構更加靈活,業(yè)務部署更加敏捷,同時SBA使NFV的優(yōu)勢得以充分發(fā)揮。NFV技術將傳統(tǒng)的CT業(yè)務部署到通用物理硬件虛擬化所形成的虛擬云平臺,實現(xiàn)軟硬件解耦的一種技術。NFV技術的應用不但避免了設備對專用硬件的依賴,減少運營商的CAPEX,同時,資源的靈活獲取,可能幫助運營商進行網(wǎng)絡切片的構建,滿足不同業(yè)務的需求,使寬帶、連接、安全性等特性在不同切片中體現(xiàn)出差異,在不同的場景發(fā)揮作用。在 NFV 技術的支持下,網(wǎng)絡的軟件、硬件得以分離,這使得網(wǎng)絡資源的配置和部署更為靈活,對進一步發(fā)揮5G系統(tǒng)的獨特優(yōu)勢起到了重要的作用。
當前業(yè)界NFV架構主要采用歐洲電信標準協(xié)會(European Telecommunications Standards Institute,ETSI)為NFV制定的參考架構,如圖2所示。NFV架構分為3層:基礎設施層、虛擬網(wǎng)絡層和運營支撐層。

圖2 ETSI NFV參考架構
(1)基礎設施層
基礎設施層為 VNF提供部署、管理和執(zhí)行環(huán)境,并實現(xiàn)對硬件資源和虛擬資源的管理和監(jiān)控,主要包括NFVI和虛擬基礎設施管理(VIM)兩部分,NFVI包括硬件資源層、虛擬化層及虛擬資源層,實現(xiàn)對虛擬網(wǎng)絡層業(yè)務網(wǎng)元的承載;VIM 實現(xiàn)對NFVI資源的管理、編排和調度等功能。
(2)虛擬網(wǎng)絡層
基于底層云化基礎設施實現(xiàn)業(yè)務能力,主要包括VNF、EMS及VNF管理系統(tǒng)(VNFM),VNF基于NFVI虛擬資源部署業(yè)務網(wǎng)元;EMS是VNF業(yè)務網(wǎng)絡管理系統(tǒng),提供網(wǎng)元管理功能;VNFM是VNF管理系統(tǒng),主要負責VNF生命周期管理。
(3)運營支撐層
實現(xiàn)對業(yè)務的編排、運維與管理,主要包括OSS(operation support system)/BSS(business support system)和NFVO(network functions virtualisation orchestrator)。OSS/BSS是業(yè)務網(wǎng)絡支撐系統(tǒng),實現(xiàn)與NFVO的交互,共同完成維護與管理功能。NFVO主要負責跨VIM的NFVI資源編排及網(wǎng)絡業(yè)務的生命周期管理和編排,并負責NSD(network service descriptor)的生成與解析。
另外,參照ETSI NFV架構,NFVO、VNFM與VIM合稱NFV管理和編排(management and orchestration,MANO),負責提供可管、可控、可運營的服務環(huán)境,使基礎資源可以便捷地提供給應用。
除了基于NFV的架構外,5G核心網(wǎng)具有控制面和用戶面徹底分離的特性,這種特性使用戶面網(wǎng)元UPF可靈活下沉,分布式部署于更靠近用戶和數(shù)據(jù)源的邊緣節(jié)點,最大程度降低網(wǎng)絡時延,提升5G業(yè)務體驗。NFV架構使業(yè)務上線更加敏捷,可提升運營商與互聯(lián)網(wǎng)巨頭之間的競爭力,而分布式架構可以使5G網(wǎng)絡廣泛注入算力,讓運營商提供的業(yè)務更豐富,用戶的感知體驗更優(yōu)。當前中國三大運營商 5G核心網(wǎng)的虛擬化部署已經(jīng)進入商用階段,但是,對NFV網(wǎng)絡的運營維護系統(tǒng)和方案還處在探索階段,現(xiàn)階段有必要對虛擬化的5G核心網(wǎng)運營維護方案進行梳理,結合運營商4G網(wǎng)絡的運維經(jīng)驗,在運維技術、流程和組織架構方面保障5G核心網(wǎng)的網(wǎng)絡安全、穩(wěn)定,發(fā)揮5G業(yè)務特性。
當前5G核心網(wǎng)的新架構,能夠滿足5G新業(yè)務的需求,同時也能降低設備采購成本,但卻給5G核心網(wǎng)的運營維護工作帶來很多困難和挑戰(zhàn)。5G時代的核心網(wǎng)運維復雜度和工作量將呈幾何級數(shù)上升,運維工作朝著集約化、智能化、自動化的方向發(fā)展,運營維護系統(tǒng)和運營維護的組織架構都進行相應的變革,以適應網(wǎng)絡新架構。
5G核心網(wǎng)的虛擬化和分布式架構,將會給運營維護工作帶來如下挑戰(zhàn)。
· 5G核心網(wǎng)從樞紐機房遷至DC(data center)機房,基站與5G核心網(wǎng)間流量跨機房、跨專業(yè),組網(wǎng)結構更加復雜,涉及的廠商、軟硬件模塊、接口眾多,參數(shù)配置、聯(lián)調測試、故障定界都需要多專業(yè)、多廠商配合,運維復雜度大幅提升。且隨著網(wǎng)絡規(guī)模不斷擴大,故障點相比傳統(tǒng)網(wǎng)絡提升數(shù)倍,故障也容易迅速擴散。
· 網(wǎng)絡切片、UPF下沉等場景的引入使核心網(wǎng)網(wǎng)絡管理對象增多,變更操作更加頻繁。未來的邊緣節(jié)點可能有成千上萬,甚至幾十萬個廣泛分布于網(wǎng)絡中的各個位置,維護難度和工作量都將大幅增加。
· 分層解耦的架構使資源管理更加復雜,且各層、各網(wǎng)元告警上報方式不一致,造成故障告警信息的處理難度更加復雜,同時跨層告警需要進行關聯(lián),以便快速地定位故障并進行相應處理。
· 5G 將賦能千行百業(yè),政企(2B)業(yè)務對網(wǎng)絡的性能、穩(wěn)定性的需求比個人(2C)業(yè)務更高,同時對網(wǎng)絡的SLA更加苛刻,虛擬化的 5G核心網(wǎng)必須保障網(wǎng)絡的高穩(wěn)定性和高可靠性。
5G核心網(wǎng)新網(wǎng)絡架構和新業(yè)務需求對運營維護提出了新的挑戰(zhàn),需要適應這些挑戰(zhàn)設計全新的智能化、集約化、融合化的5G核心網(wǎng)運營維護系統(tǒng)。
5G核心網(wǎng)的運營維護系統(tǒng)需要提供統(tǒng)一的5G核心網(wǎng)網(wǎng)絡運維服務能力和網(wǎng)絡綜合保障功能,需要支持自動化運維、智能根因分析、跨層一體化運維、網(wǎng)絡故障和性能管理、策略和安全管理,實現(xiàn)全網(wǎng)統(tǒng)一監(jiān)控、全網(wǎng)統(tǒng)一管理。運營維護系統(tǒng)還要支持對5G新業(yè)務的管理能力,實現(xiàn)5G 核心網(wǎng)切片的全生命周期(設計、部署、閉環(huán)保障等)管理能力,實現(xiàn)5G 2B業(yè)務的統(tǒng)一策略能力,實現(xiàn)MEC(multi-access edge computing)管理等能力。
3.2.1 5G核心網(wǎng)的運營維護系統(tǒng)架構
5G核心網(wǎng)是具有虛擬化、云網(wǎng)融合、云邊協(xié)同特質的網(wǎng)絡系統(tǒng),適應這種網(wǎng)絡架構,運營維護系統(tǒng)應具有微服務化、云化、智能化、集約化的特點。微服務化使用“平臺+應用”的架構,依托統(tǒng)一的數(shù)據(jù)平臺和能力,構建5G核心網(wǎng)運維應用;IT云化即運營維護系統(tǒng)開發(fā)和部署技術架構采用IT化的架構,部署在云端;由于5G核心網(wǎng)的操作維護工作量大,引入大數(shù)據(jù)、AI,推進運維的自動化和智能化,能夠降低維護難度,同時節(jié)約維護成本;集約化設計尤其重要,為了提升運維管理的效率,適應5G業(yè)務互聯(lián)網(wǎng)化、全網(wǎng)統(tǒng)一、快速加載、一點開通的特征,應建立全網(wǎng)統(tǒng)一集約的5G核心網(wǎng)運營維護系統(tǒng),一級系統(tǒng)供集團和省公司的運維人員分權分域使用。
運營維護系統(tǒng)統(tǒng)一納管集團、省以及地市邊緣5G核心網(wǎng)網(wǎng)元,包括集團、省層面5G核心網(wǎng)所有網(wǎng)元、地市以及園區(qū)下沉UPF等。實現(xiàn)統(tǒng)一平臺、統(tǒng)一視圖、統(tǒng)一管理以及統(tǒng)一調度,資源實現(xiàn)統(tǒng)一管理、業(yè)務實現(xiàn)統(tǒng)一發(fā)放、網(wǎng)絡能力實現(xiàn)統(tǒng)一開放。同時,通過運營維護集約系統(tǒng)協(xié)同省和集團兩級運維體系,進行跨省故障協(xié)同,云網(wǎng)邊協(xié)同故障定位,多級運維人員協(xié)同進行故障處理。
5G核心網(wǎng)云網(wǎng)一體運營系統(tǒng)既要面向內部運維人員,也要面向其他系統(tǒng)和業(yè)務開放能力,還要面向外部客戶。面向運維人員需要讓集團/省/地市等各級運維人員能夠利用運營系統(tǒng),更加方便高效地處理日常運維工作,例如網(wǎng)元新建、割接、故障處理、巡檢等;面向其他系統(tǒng),要開放針對5G核心網(wǎng)的診斷、感知、測試等能力,同時支撐切片、MEC等5G新業(yè)務;面向客戶要提供對5G產(chǎn)品的在線訂購能力,對客戶業(yè)務的可視化能力和管理能力等。
基于5G核心網(wǎng)特點和運維工作的需要,梳理基本運維需求功能,其主要包括網(wǎng)絡監(jiān)控管理、業(yè)務支撐、用戶預診斷,同時根據(jù)5G核心網(wǎng)的特點和運維難點,增加了網(wǎng)元自動化管理、云網(wǎng)統(tǒng)管、云網(wǎng)一體化支撐、切片保障和 MEC協(xié)同等能力,后續(xù)針對網(wǎng)絡自動駕駛,考慮引入決策智能、操作智能等模塊。5G核心網(wǎng)一體化運營系統(tǒng)的總體架構如圖3所示,系統(tǒng)通過數(shù)據(jù)共享平臺進行實時數(shù)據(jù)采集,通過能力共享平臺對網(wǎng)元進行控制指令下發(fā),通過該運營調度系統(tǒng)獲取告警數(shù)據(jù),通過AI中心獲取AI幾何能力,通過數(shù)據(jù)湖獲取話單等靜態(tài)數(shù)據(jù),5G核心網(wǎng)運營維護系統(tǒng)完成5G核心網(wǎng)網(wǎng)絡運維服務能力的封裝,實現(xiàn)5G 核心網(wǎng)的全生命周期管理能力。

圖3 5G核心網(wǎng)云網(wǎng)一體運營系統(tǒng)架構
3.2.2 5G核心網(wǎng)運營維護系統(tǒng)重要功能
針對5G核心網(wǎng)運營維護系統(tǒng)的目標和定位,設計了5G核心網(wǎng)運維系統(tǒng)的功能模塊,7項功能模塊細分成33項功能清單,請各省公司5G核心網(wǎng)運維人員針對33項功能清單進行需求重要性進行打分。通過對省公司調研結果進行匯總分析如圖4所示,發(fā)現(xiàn)運維人員對網(wǎng)絡監(jiān)控、業(yè)務保障的需求最高,在網(wǎng)絡監(jiān)控中需求重要性最高的是告警管理和故障診斷。

圖4 5G核心網(wǎng)云網(wǎng)一體化運營系統(tǒng)功能優(yōu)先級調研結果
5G核心網(wǎng)的告警管理和故障診斷同時是運營技術中的重點和難點。由于5G核心網(wǎng)的虛擬化架構,與4G核心網(wǎng)的運營維護不同,5G核心網(wǎng)的運營維護系統(tǒng)要形成硬件層、虛擬層、業(yè)務網(wǎng)元層相互關聯(lián)的跨層資源管理能力,建立跨層可控可管的網(wǎng)絡保障能力,實現(xiàn)跨層網(wǎng)絡告警關聯(lián)、故障定位和故障快速處理。
資源跨層關聯(lián)即通過挖掘網(wǎng)元跨層間資源的相互關聯(lián)關系,并利用拓撲關系進行展開,形成3層資源拓撲透視模型,為現(xiàn)網(wǎng)日常運營及維護中業(yè)務層、資源層、硬件層的告警發(fā)現(xiàn)、告警定位以及告警收斂提供有效的參考依據(jù),實現(xiàn)從應用層一點切入即可關聯(lián)發(fā)現(xiàn)虛擬層及硬件層的準確關聯(lián)關系和具體定位信息。包括計算、存儲、網(wǎng)絡資源的關聯(lián),以下以計算資源的關聯(lián)為例說明資源關聯(lián)的過程。
基于計算資源定義的邏輯并結合 5G核心網(wǎng)現(xiàn)網(wǎng)部署的特性,首先構建資源結構的設想,網(wǎng)元層主要包括 5G核心網(wǎng)關鍵網(wǎng)元,如 AMF、SMF、UPF等。向下映射到虛擬層的虛擬機及其信息,包括虛擬機 ID、虛擬機名稱、IP地址、MAC端口地址等,完成虛擬網(wǎng)絡虛擬機內部資源的拓展。并從這些信息中提取關聯(lián)項,映射虛擬機與宿主機間的關聯(lián)關系,同時挖掘宿主機的屬性及字段信息,包括主機名稱、主機IP地址完成主機到服務器間的位置關聯(lián)。通過EMS/NFVO的北向接口導出網(wǎng)絡資源靜態(tài)表,獲取容器所在的虛擬機唯一識別碼(UUID),再依據(jù)UUID查詢虛擬機信息、主機信息、服務器設備列表,將查詢獲得的服務器設備列表,通過主機ID實現(xiàn)與物理服務器 SN序列號的匹配關聯(lián),完成從容器→虛擬機→主機→物理服務器的計算資源查詢以及拓撲關系關聯(lián)。
跨層告警關聯(lián)和故障定位是5G核心網(wǎng)運營維護系統(tǒng)必須具備的重要功能。5G核心網(wǎng)采用NFV架構后,告警的層次增加,告警數(shù)量激增,底層告警隱藏在由它引發(fā)的多層衍生告警中,很難分析告警的根原因,需要對各層之間的告警信息進行關聯(lián),進一步實現(xiàn)跨層故障診斷。基于人工智能的方法對告警數(shù)據(jù)進行壓縮十分必要,對告警數(shù)據(jù)進行壓縮的關鍵是挖掘告警之間的有效關聯(lián)規(guī)則,然后利用規(guī)則對告警數(shù)據(jù)進行壓縮。告警關聯(lián)規(guī)則挖掘首先對告警數(shù)據(jù)進行預處理,然后根據(jù)事件的發(fā)生時間、位置、原因等信息生成事件列表,從事件列表中挖掘關聯(lián)規(guī)則,并在規(guī)則中提取規(guī)則泛化模式,最后使用泛化模式和關聯(lián)規(guī)則對告警數(shù)據(jù)進行壓縮。
5G核心網(wǎng)云網(wǎng)一體運營系統(tǒng)引入面向業(yè)務和網(wǎng)絡的跨層告警關聯(lián)、智能預警和輔助決策,使用AI算法對業(yè)務量、異常事件、KPI等實時數(shù)據(jù)進行分析,可以先于客戶發(fā)現(xiàn)故障,及時預警并定位故障,及時處理問題。根據(jù)5G核心網(wǎng)運營系統(tǒng)上線半年來系統(tǒng)承接相關告警、監(jiān)控、故障處理等功能,并通過AI稽核等功能,發(fā)現(xiàn)局數(shù)據(jù)配置隱患3 000余個,業(yè)務配置錯誤超萬個,這些故障均及時進行了處理,增強了客戶滿意度,提升了5G客戶體驗。
5G新業(yè)務和新網(wǎng)絡架構,不僅需要運營維護系統(tǒng)具有全新特性,也應對組織架構和工作模式進行相應的變革。5G核心網(wǎng)網(wǎng)絡及業(yè)務維護涉及多專業(yè),除核心網(wǎng)專業(yè)外,需IP專業(yè)、云計算等專業(yè)深度協(xié)同,建設跨專業(yè)、跨地域的核心網(wǎng)云網(wǎng)一體化運維團隊,負責 5G核心網(wǎng)云網(wǎng)一體化運營維護。5G核心網(wǎng)云網(wǎng)一體化運維團隊負責5G核心網(wǎng)的維護和管理工作,通過5G核心網(wǎng)的運營維護系統(tǒng)對5G核心網(wǎng)的網(wǎng)元層、虛擬化層和對應的硬件實現(xiàn)跨層一體化告警關聯(lián)和資源一體化管理。
虛擬化的 5G核心網(wǎng)是電信技術和云計算技術的融合,因此對運維人員的要求也要具備 CT和IT融合的技能。對網(wǎng)絡功能虛擬化要有深刻的理解和認知,具備對虛擬化網(wǎng)元進行全生命周期管理的能力;對云數(shù)據(jù)中心的基礎設施具備維護能力,能夠在 NFVI出現(xiàn)告警時,對虛擬層或硬件層進行修復;對核心網(wǎng)的業(yè)務邏輯有深刻的理解和認知,在業(yè)務出現(xiàn)告警時能夠對告警原因進行相應的判斷,及時進行故障的處理。因此對于5G核心網(wǎng)一體化運營維護的人員的能力要求是CT、IT和DT能力的多維度融合,需要對現(xiàn)有人員進行培訓,使運營維護人員具備云網(wǎng)一體融合運維能力。
5G核心網(wǎng)新的架構和部署模式,為運營維護工作帶來了挑戰(zhàn),同時也為運營維護的智慧化、自動化帶來了新的機遇。伴隨著網(wǎng)絡云原生技術的發(fā)展,網(wǎng)絡的NFV化進程會逐步推進,業(yè)務將更加靈活,網(wǎng)絡能力更加開放,運營維護也會向網(wǎng)絡自動駕駛方向演進。結合大數(shù)據(jù)、AI等新技術,構建合理的運營維護系統(tǒng),多專業(yè)運營維護人員協(xié)同合作,建立云網(wǎng)一體化運維體系,必能有效地提升5G核心網(wǎng)的運營維護效率,使5G核心網(wǎng)網(wǎng)絡安全、穩(wěn)定、高性能地為5G用戶提供優(yōu)質的服務。