陳 楊,劉 作,黎 聰,龍俊霖,趙群帥
(廣西東信易通科技有限公司,廣西 欽州 535000)
隨著移動通信技術從2G、3G 發展到4G、5G,時分復用和報文交換技術也在持續迭代和發展。2G、3G 的發展應用在解決了模擬信號質量問題的同時,首次將分組交換和網際互連協議(Internet Protocol,IP)的概念引入通信網絡。然而相較于電路交換,分組交換的實時性較低。隨著傳輸控制協議/網際協議(Transmission Control Protocol/Internet Protocol,TCP/IP)在互聯網領域的成功應用以及3網融合概念的推進,TCP/IP 在電信網絡中得到推廣和應用。作為5G 兩大核心技術,軟件定義網絡(Software Defined Network,SDN)與網絡功能虛擬化(Network Functions Virtualization,NFV)均離不開TCP/IP 協議。其中,NFV 是虛擬化云計算發展下提出的網絡功能虛擬化概念。隨著5G 萬物互聯時代的到來,各行業在互聯網及物聯網的應用對網絡功能可定制性、可變更性、易擴容性提出了更加嚴苛的要求[1]。
本文提出的軟交換系統應用于4G、5G 網絡。與傳統的控制與承載分離不同,該系統的主要控制方式是隨路信令。該信令與會話描述協議(Session Description Protocol,SDP)及交互 式連接設施(Interactive Connectivity Establishment,ICE)相結合,解決混合云化部署后所形成的內外網網絡地址轉換(Network Address Translation,NAT)穿越問題。該信令與Docker 容器相結合,實現應用pod 解決動態彈性伸縮擴容問題。
軟交換系統中的軟交換主要邏輯功能包括:用戶鑒權與接入、對接核心網絡、實現互聯互通、媒體流的控制及轉碼、話單與計費能力[2]。
SDN 與NFV 是支撐5G 網絡切片的兩大核心技術,旨在顛覆傳統專用硬件組網的通信網絡。SDN與NFV 優勢如圖1 所示,將這兩種技術與云計算及IT 快速迭代敏捷開發相結合,能通過快速編排能力的方式輸出定制化需求,符合萬物互聯與移動互聯網時代下的核心網發展趨勢。

圖1 SDN 與NFV 技術的優勢
隨著5G 技術的逐漸成熟,網絡功能虛擬化技術的應用已具備成熟的基礎設施環境[3]。然而,在SDN 與NFV 的底層技術以及頂層的互聯網化應用需求的相關研究中,仍存在研究空白。電信運營商的通信產品離真正的“互聯網+”通信時代仍存在不小差距。
軟交換虛擬網絡功能(Virtual Network Function,VNF)應用包含5 個邏輯模塊。它們彼此之間可以靈活組網及均衡負載,并能夠根據業務形態需求進行定制化部署。該5 個邏輯模塊如圖2 所示。

圖2 媒體網關切片
圖中5 個模塊的主要功能如下文所述。
(1)媒體服務器(Media Server,MS):負責實現媒體協商、轉碼、錄音以及放音等功能。
(2)信令網關(Signal Gateway,SG):負責實現信令協議棧及呼叫過程控制,包括sip、ss7 和bicc 等。
(3)業務邏輯處理模塊(Service Control Function,SCF):編排原子通信能力,定制化輸出服務給B 端客戶。
(4)數據庫系統(Data Base System,DBS):存儲話單、錄音機放音文件。
(5)媒體服務器控制單元(Media Server Contrl Point,MSCP):負責打造原子化通信能力。
基于VNF 的軟交換應用切片能夠定制化部署與承載業務,圖3 所示為軟交換切片內服務調用過程。

圖3 一個切片內的服務輸出
云通信系統測試與問題暴露遵循的框架流程如圖4 所示,包括私有云平臺搭建及網絡互通配置、系統上線部署及監控采集搭建、問題暴露及調優[4-6]。其中,監控采集搭建所監控的業務指標包含以下兩大領域。

圖4 系統建設與分析框架
(1)軟交換性能指標:私有云底層3 大資源指標、錄音監聽轉碼、系統服務性能;
(2)核心網資源指標:Sigtran 耦連及電路識別碼(Circuit Identification Code,CIC)電路碼使用情況、媒體通道帶寬情況[7]。
搭建私有云是構建NFV 環境的基礎,本文研究的云通信平臺基于研究私有云部署與物理機部署服務的性能對比,旨在將通信技術(Communication Technology,CT)通信網的能力通過定制化編排實現互聯網快速輸出云化的通信服務[8-10]。系統組網規劃如圖5 所示。

圖5 系統組網架構
軟交換應用部署采用小粒度大集群方式,單個粒度節點承載并發能力上限設置為600,單節點配置詳情如表1 所示。圖6 所示為到核心網偶聯建立過程。

表1 VNF 應用部署粒度

圖6 到核心網偶聯建立
本文旨在建設高穩定性的云通信能力平臺,其中最重要的指標是使系統達到電信級穩定性能,其次是系統總體延遲、各模塊協作實時性及系統易擴展性等性能指標。
2.3.1 話路監聽轉碼服務掛死
錄音監測機制的建立是為了捕捉線上出現問題的瞬間系統信息,以方便還原復盤定位問題。圖7為系統告警推送信息,系統通過監測合成實時性效率,捕捉到隨機偶發話路轉碼服務被掛死現象其發生延遲的概率約為4.62%,信息捕獲如圖8 所示。經分析,基于任務優先級劃分以及虛擬調度層所產生的計算能力支出大概占CPU 能力的30%,當系統呼叫量并發達到峰值時,會出現系統瓶頸[11-12]。

圖7 錄音抽查報警

圖8 資源搶占導致線程掛死后捕獲到的信息捕獲到的信息
2.3.2 核心網鏈路中斷問題
在系統運行期間,系統支撐運行呼叫業務時而發生服務中斷,表現為存量呼叫無影響,但無法繼續增加呼叫,即無法獲取信令路由[13]。經復盤定位,基于NFV 部署的軟交換系統與核心網對接的信令模塊所在底層資源,存在因故障Reboot 所引發的虛擬漂移、浮點IP 丟失、Sigtran 需要重新握手、信令通道中斷,導致無法正常路由,影響了增量的話路呼叫。圖9 為虛機遷移過程,圖10 為1 周時間內統計閃斷數據,圖11 為閃斷發生時各資源使用情況。

圖9 虛擬機遷移

圖10 7 天閃斷統計結果

圖11 業務閃斷及底層物理資源使用數據
2.4.1 解決虛擬化層計算資源搶占問題
通過7 天連續統計與觀測,當底層物理計算資源使用率超過70%時,將有概率出現服務搶占線程導致的卡頓問題。解決辦法為:通過容器云引入pod 自動擴容方式進行優化,及時擴充底層物理資源;通過優化錄音轉碼組件,將服務綁定單線程改為多線程,比例由1:1 改為1:N后,組合策略觀測,問題延遲出現概率從4.62%降至0%。圖12 為優化后的系統業務運行觀測圖。

圖12 采取優化方案后業務連續性觀測
2.4.2 業務中斷問題解決
在定位出業務偶發中斷問題原因后,解決方案采用業務層面的負載均衡及邊緣分布式承載策略。將關鍵模塊業務節點鏡像部署于不同云環境中,應用總數采用偶數,架構層面50%互為主備,當出現該黑天鵝事件瞬間,實現自動業務轉移,達到容錯目的。經優化后連續觀測,系統穩定運行無中斷。
綜上所述,在基于NFV 打造電信及穩定性應用時,可以聯合K8S 的pod 彈性伸縮與擴容以及優化第3 方組件方式[14],打磨電信級穩定性應用。然而,NFV 虛擬化底層的調度策略只能解決基礎可靠性,同時業務穩定性的保障離不開業務層面的架構設計,需要在運行中不斷打磨,長期來看架構穩定性是需要不斷修改的[15]。
5G 的兩大核心技術均基于軟件及算法,提高了靈活性的同時,對網絡功能虛擬化定義及部署提出了更嚴苛的要求。本文系統性建立了測試機制,構建了SDN 與NFV 系統基礎組網環境,部署了VNF 應用切片,并對實際承載業務進行觀測與統計分析,解決了系統閃斷及錄音延遲問題,為行業VNF 應用切片運行穩定性打磨提供了一定的經驗與見解。