楊 旭,沈昱佳,唐文強
(中國移動通信集團云南有限公司,云南 昆明 650228)
5G的出現為推動社會數字化發展提供了有力支撐,同時為業務多元化發展提供了良好契機。隨著5G技術的不斷發展和業務不斷擴張,5G終端運維也遇到一些問題和挑戰。5G時代下,滿足當前網絡運維管理的需求和保障5G網絡穩定性成為廣大學者積極討論與研究的重要課題[1,2]。
相較于計算機主機而言,5G終端屬于外設,本身并不提供運算處理功能。5G較強的連通性催化了通信服務逐漸向數字化轉型,而相關運營與維護管理也由通信技術(Communication Technology,CT)升級到互聯網技術(Internet Technology,IT)運營。5G時代,運營與維護都是由原生云計算和DevOps來驅動,軟件開發、技術運營以及質量維護3個環節相互協同形成5G終端與局端設備運行維護專用的DevOps體系。隨著全云化的應用,在設備和戰略方面,運營商要與設備制造商緊密合作,同時嚴格遵守有關技術規范和標準,以此確保終端設備之間的網絡連接和業務互聯?;ヂ摼W用戶爆發式增長的趨勢下,網絡可靠性和安全性成為網絡維護與運營中不可避免的現實問題。5G終端中使用的容器式內核共享在一定程度上會造成極大的安全隱患,需要對其進行科學、高效的管理[3]。
5G終端運維對于維護人員的要求較高,受諸多因素影響,操作人員可能會在工作中出現差錯,從而影響終端安全穩定運行。由于操作人員很難保證多臺設備和基站的全面維護和管理,導致運維效率無法提高,如果不能及時解決問題,那么造成的后果會越來越嚴重。運營商所使用的移動終端通信設備主要是由廠商提供軟件與硬件,日常維護、故障檢修等工作中,如果設備出現硬性故障,需要廠家維修人員及時到場維修。此外,因5G終端設備維護環境不一,存在時間、空間協調問題,勢必會導致設備長時間處于故障狀態,對于保障5G信號穩定性造成一定影響。邊緣計算(Multi-access Edge Computing,MEC)和網絡切片的出現使得網絡變得更加復雜,5G網絡環境下如何降低運維費用并實現遠程運維、快速、資源分配等都給運營商帶來新的挑戰[4,5]。
5G是具有高速率、低時延以及大連接特點的新一代寬帶移動通信技術,5G通信設施則是實現人機物互聯的網絡基礎設施。與分組核心網(Evolved Packet Core,EPC)相比,5G終端核心網具有以服務為導向、網絡分層、用戶面和控制面結構分離3大優勢[6]。
5G終端核心網絡設計中不僅要考慮到節點自身特性,還要考慮到其所提供的各種服務與功能,根據用戶的具體需求選取相應功能構成具有邏輯性的網絡[7]。在用戶面和控制面結構分離的情況下,維護人員能夠分別調節控制平面和用戶平面的系統能力。用戶平面功能(User Plane Function,UPF)主要包括數據包的路由轉發、包的檢查、服務處理、包過濾以及數據流量監測等。服務管理功能(Service Management Function,SMF)主要承擔著分配用戶終端地址、控制策略執行、會話管理等功能。認證管理功能(Authentication Management Function,AMF)主要負責端與端之間的控制信令傳輸、用戶數據安全管理、待機狀態下的移動性管理以及認證。需要注意的是,核心網絡的功能實現多種多樣,所有功能可通過同一云平臺來完成[8]。
遠程運行管理平臺能夠為用戶提供遠程運行維護服務,主要由數據采集層、人工智能(Artificial Intelligence,AI)算法框架層以及應用層3部分組成。該平臺支持多形態跨云邊緣部署、邊緣端協作,通過數據采集為5G網絡遠程運維提供服務。5G終端遠程運維管理平臺架構如圖1所示。

圖1 5G終端遠程運維管理平臺架構
5G終端運維需要制訂完整的信息傳輸方案,為其提供相應的管理服務。圍繞5G終端絡建設過程分別提出相應的管理措施,主要從前傳、中轉、回傳等環節進行。前傳網絡中采用密集型光波復用(Dense Wavelength Division Multiplexing,DWDM),運維管理需要對這一環節進行控制,提高系統性能,從而保證5G終端正常工作。在5G終端實際應用階段,建立專門的網絡管理中心進行針對性管理。網絡管理中心主要負責數據傳輸、數據交換、業務拓展等工作,可以推動5G終端互聯模式下的業務品質的提高。為了保障5G信號的穩定,維護人員需要根據網絡連接順暢程度、信號強度、網絡傳輸速度等制定5G終端遠程運維管理方案[9,10]。針對家庭無線網絡用戶,可以將5G網絡與傳統網絡效能進行比較,利用速度測量軟件分析造成5G網絡不正常運作的原因。
5G終端可靠性高、延時低,應進一步加強對各項指標的監測,提高5G終端遠程運維的科學性與合理性。為保證網絡穩定,可采用相應指令來設計新的登錄方法,并運用相應算法優化網絡指標。通過實時性刷新和歷史查詢功能,為各類資源的投入和故障檢查維護提供便利。為進一步提升5G終端運維管理效率,應提高故障預警相關性。多故障場景中,找到故障成因是提高系統可靠性的關鍵因素。利用機器學習方法綜合處理和分析歷史數據,歸納出與其直接相關的因素,通過去噪、去重、聚合、二值化以及時序化等方法得到有效的信息內容。
此外,利用Apriori等算法對各個預警間的關聯進行有效分析,歸納出關聯規律,與樸素貝葉斯、邏輯回歸相結合,構建完善的關聯模型。利用關聯庫進行網絡維護,根據其狀態信息變化及時發現設備異常,并采取相應預防措施防止故障范圍進一步擴大,提高故障定位精度和故障解決效率。綜合現有資料,通過歸納與分類得出當前5G終端運維中極易發生的故障,將相關資料存入知識庫。設備日常檢修和維修中,收集各類設備的工作數據,將其與知識庫中的數據進行對比分析,確定具體故障發生前和發生時數據的不同,將相關數據用作故障預報參考指標,對提高5G終端遠程運維管理水平具有重要價值。
除了提升故障預警相關性之外,還應注意提高故障自我修復能力。將已建立的知識庫與預警相關結果相結合,可獲得相應的故障預報信息,以便選擇有效的解決方案。運維管理中如果發現設備運行故障,可自動觸發重啟功能,同時重啟成功后發送故障信息至運維平臺,給出相應預警和自我修復報告。如果自我修復失敗,則報告“自我修復失敗”,進而由維護人員進行檢修,減少不必要的工作量,提高故障修復效率。在系統穩定的前提下,要保證系統參數配置能適應不同終端的要求,以此保證系統運維合理。
5G時代背景下,對5G終端遠程運維管理及維護是提高其運行穩定性的重要組成部分。通過分析與研究5G終端發展現狀,結合5G終端的特點提出5G終端遠程運維思路,結合5G終端發展和運行需求提高其預警關聯性、預測能力、自愈能力以及自動化水平。