吳濱,張劍寅,周越,魏彬
(中國移動通信研究院,北京 100053)
以GSM(Global System for Mobile Communications)為代表的2G移動通信技術經過20年的發展和普及,使全球移動話音通信業務獲得了空前的成功。到了4G LTE時代,伴隨網絡速率的大幅提高,話音實現了高清音質傳輸,并在音頻通話的基礎上開始拓展視頻通話業務市場,同時,以多媒體彩鈴為代表的各種話音增值業務也推動了用戶業務和體驗的不斷升級。
5G時代話音業務仍然是運營商的核心業務,5G網絡[1]商用為語音業務和體驗進一步升級帶來了新的契機。3GPP已明確5G網絡仍基于IMS(IP Multimedia System)提供話音業務。4G VoLTE(Voice over LTE)及5G VoNR(Voice over New Radio)作為IMS話音業務的不同接入方式存在,VoNR下強制支持EVS(Enhanced Voice Services)編解碼,可有效提升語音通話音質到高保真級別,視頻業務質量也將有更大提升。與此同時,網絡技術也在進一步演進,3GPP在2021年4月舉行的會議上確定以5GA(5G Advanced)作為5G網絡演進的新階段[2],5G及5GA網絡帶寬的進一步提升,使得運營商有更為充分的資源提升話音業務用戶體驗,面向5GA,用戶話音業務的訴求不再局限于音視頻,新型數據通道的引入使得用戶針對同一事務共同協作和互動成為可能。預計到2025年,5GA架構下話音業務將進一步向交互式及沉浸式通信方向演進。
移動通信網絡以十年一代的節奏演進,網絡經歷了從2G到3G、4G、5G的演進,與移動網絡技術演進相匹配,無線側體現為從GSM向UMTS、LTE等發展,核心網側則體現為PS(Packet Switch)域、EPC(Evolved Packet Core)的出現和演進,在這個過程中,話音業務經歷了從TDM(Time-Division Multiplexing)到IP、從傳統交換機到軟交換的發展,4G網絡開始,LTE技術[3]的逐漸成熟使移動網絡端到端VoIP業務商用部署成為可能,VoLTE基于IMS[4-5]的全IP架構實現了基于分組域的語音和多媒體業務的迅速發展,用戶在LTE網絡上的話音業務可擁有優于傳統CS話音的業務體驗。IMS采用SIP協議[6-7]作為不同分組接入網絡的統一會話控制協議,從而成為業界公認的下一代的語音/多媒體業務控制和網絡融合的架構。VoLTE的實施標志著移動網絡向全IP網絡邁出了重要的一步,傳統CS域也將逐步退出歷史舞臺,話音網絡也將成為真正的VoIP網絡。
VoLTE是4G網絡下的話音方案,通過IMS實現將語音業務承載在IP網絡,將2G/3G電路域所有業務在4G網絡全部IP化。4G網絡建成后,出于對網絡發展的不同階段及對語音業務連續性的考慮,4G還提出了電路域回落(CSFB,Circuit Switched Fallback)過渡方案。與此類似,在5G網絡下,話音業務目前也有兩種方案,一個是VoNR,另一個就是EPS Fallback。VoNR方案下可實現語音業務和數據業務并發,所有業務都通過5G網絡承載,語音業務使用IMS進行控制。EPS Fallback方案用于終端在5G網絡不支持語音業務的場景,通過重定向或切換的方式回落到4G網絡,由VoLTE來提供語音業務,語音通話結束后再返回到5G網絡。可以看出,VoNR在語音和數據業務體驗上優于EPS Fallback,且利于加速2G電路域語音退網,重耕2G/3G優質頻段。
隨著5G網絡逐步實現連續覆蓋及5G VoNR標準的逐步成熟,基于5G VoNR超高清多媒體通信能力的全媒體增值服務——VoNR+將進一步提升4G及5G話音業務體驗,豐富業務內涵[9]。伴隨著網絡從4G、5G到5GA的演進,話音業務也將逐步實現VoLTE、VoNR到VoNR+的演進(圖1)。VoNR+是指在5G VoNR多媒體實時通信的基礎上搭載新的數據傳輸通道,為用戶提供除高清音視頻之外更豐富的實時交互服務,并建立以多媒體實時通信能力平臺為中心、統一開放的網絡架構,在兼容現有業務的基礎上實現創新業務的敏捷開發和快速部署。

圖1 話音業務演進路線:從VoLTE到VoNR,繼續演進到VoNR+
5G VoNR+秉承不同于現有話音業務及架構的新理念,VoNR+將運營商的封閉話音網絡發展成為一個可管、可控、易用的服務網絡,在傳統話音聽說體驗的基礎上,為用戶提供高清、可視、實時交互通信服務,通過算網融合及端云協同技術,對高清音視頻及數據進行實時渲染,為用戶提供沉浸式通信體驗。
(1)交互式通信需求
1)2C市場交互式通信:移動終端智能化和大屏化使得用戶實時通信的訴求不再局限于通話雙方聲音和影像的交流。觸、摸、拖、拽等操作的互動,通話雙方共同協作,交互操作需求讓話音業務有了新的生命和活力。一個典型的應用場景是交互式菜單,用戶在通話過程中可以在手機屏幕上接收云端推送的可觸摸客服菜單,并通過點擊菜單按鈕進入相應的子級菜單獲取信息。交互式菜單業務使客服菜單內容一目了然,用戶不必擔心記錯或點錯菜單編號,大幅簡化了消費者與客服的服務交互,提升交互效率和用戶體驗。
2)2B垂直行業交互式通信:通過引入實時交互通道,面向垂直行業在高清實時多媒體通話過程中可按需增加行業特色交互式應用。一個典型應用場景是遠程醫療,醫生可以遠程控制戴在護士手上的觸覺手套對救護車里的病人進行超聲診斷,獲取超聲圖像,第一時間做出診斷決策。
(2)增強現實及沉浸式通信需求
XR(Extended Reality)技術[10]的不斷發展和產業成熟將催生沉浸式音視頻業務體驗。在AR(Augmented Reality)游戲、VR(Virtual Reality)視頻直播點播、360度視頻直播點播等應用后,AR已經率先在2C/2B領域開始了商用。典型應用場景包括AR社交、AR遠程購物及AR遠程維修。采用VoNR+技術可以將音視頻信息與包含用戶FOV(Field of View)等信息同步傳遞及渲染,在網絡側實現AR渲染功能,從而大大簡化現有AR終端的設計。
1)AR社交:在高清視頻通話的基礎上,通過疊加表情包、虛擬形象、任務道具等AR互動增加通話和交互的趣味性,滿足年輕人追求時尚、彰顯自我的需求。
2)AR遠程購物:通過AR視頻通話,為實際購買者提供遠程購物協助。雙方開啟視頻通話,現場的實物影像可以通過高清視頻傳送給實際購買者,購買者可以在手機屏幕上對自己想要購買的物品做出標記。標記好的畫面會傳送到購物現場,當現場的鏡頭發生移動時,購買者做出的標記會始終綁定被標記物。現場的親友可以一邊進行語音交流,一邊根據實物上的標記選擇正確的待購物品。
3)AR維修:高清視頻通話與AR、AI[11]等技術結合可遠程解決一些簡單的故障,或者提前識別潛在的故障原因,避免上門或減少上門次數,可大幅提升維修效率。AR維修適用于家庭寬帶、汽車、車間等應用場景,比如,家中的電器壞了,可以立即與專業維修人員進行視頻通話,并在視頻畫面上用指示箭頭或激光筆標識出故障點或相關關鍵信息,讓遠端的維修人員幫助進行遠程診斷。
(3)萬物互聯需求
5GA時代,音視頻連接將延伸到超過200億的人與人和人與物的連接。在5G應用場景中,諸如超高清視頻、AR/VR通信和IoT等場景需要構筑在話音通信能力上,這意味著話音會從消費者話音業務轉變為增強的實時通信網絡能力,并將在專網和互聯網中運行,終端也將從手機變成為諸如電視、手表、車,甚至是機器人,通過在用戶通話過程中同步傳遞通信雙方體感設備或周邊設備的數據信息,將大大增強消費者話音業務的使用體驗,為運營商創造商業價值。
可以看出,VoNR+結合多媒體、AI、XR等能力重塑通話入口,本質上是打造了一個基于全新的原生通話入口。用戶無需下載安裝APP和注冊,即可享受多媒體、全交互、可信的全新通話體驗。新的業務體驗也將推動VoNR+催生更為靈活的、可定制化的商業模式。
(1)數據通道技術
3GPP目前已完成5G網絡IMS DC(Data Channel,數據通道)實時交互通道相關技術標準,于2020年3月寫入并發布了TS 26.114 V16.5.0版本[12]。IMS DC技術為運營商原生通話帶來了全新的想象空間。VoNR+可借助數據通道技術,在原來打電話的語音通道、視頻通道之外,再建立一條數據通道。網絡側針對音視頻通道業務進行分層編碼和分層傳輸,并提供不同的5QI(5G QoS Identifier)進行QoS保障;針對數據通道業務,識別不同的數據包并以更細粒度實施QoS控制,引入新的QoS參數以支持觸覺數據或傳感器數據傳輸。數據通道可伴隨通話傳遞位置、圖片、文字疊加AR,甚至是聽覺、視覺、觸覺、動覺、環境信息等更豐富的交互信息,將通話從單一話音升級為多媒體(如圖2所示),從雙向視聽升級到多維交互,從視聽通信升級到全感通信,為用戶提供同步的全沉浸式體驗,帶來基礎話音業務的顛覆性升級。

圖2 數據通道技術
(2)算網融合技術
VoNR+業務將承載更為豐富的媒體流,其中涉及對音視頻流處理、數據通道媒體與音視頻媒體的混流渲染等需要大量算力的應用場景,而算力與網絡在形態和協議方面是需要深度整合的。VoNR+為了同步支持音視頻及數據通道媒體的渲染和計算,需要統一部署、就近調度,建立VoNR+算網一體化基礎設施,實現媒體算力和IMS網絡由網隨算動、算網融合走向算網一體,打破IMS網絡和算力基礎設施的邊界,實現算網一體內生[13]。IMS網絡需要根據業務需求,按需進行算力編排,靈活調度泛在算力資源,協同網絡算力和資源,實現IMS算力路由,通過靈活部署的在網計算對IMS多媒體流進行就近加速處理,降低應用響應時延,提升系統處理效率。
VoNR+中的媒體計算處理業務包括實時話音翻譯及AR遠程標注等對音視頻進行處理的業務,網絡側算力資源需要對話音媒體進行分布式處理,通過將媒體算力節點與IMS數據面核心網元SBC(Session Border Controller)進行融合實現媒體面的算網一體(如圖3),需要IMS網絡實現算力資源調度及實時處理,基于IMS的算力網絡將是未來VoNR+業務體驗保證的重要技術。

圖3 媒體面算網融合技術
(3)終端關鍵技術
為滿足用戶VoNR+業務需求,3GPP定義了終端DC技術要求(如圖4),終端需升級音視頻通信協議棧來支持IMS DC通道的建立和協商,支持根據交互式業務的可靠性要求,協商業務帶寬、時延及丟包率等QoS指標,通過內置原生系統服務實現疊加于音視頻之上的數據通道的連接和管理[14]。基于Web技術及JavaScript腳本可以實現應用及網絡自定義的靈活界面顯示,減少對端側繁瑣的定制訴求;同時,終端應支持將IMS DC向應用層開放調用接口,使能IMS DC作為新的行業應用入口,壯大基于運營商音視頻的行業應用生態。

圖4 3GPP定義的DCMTSI終端功能
(4)端云協同技術
VoNR+需要支持多媒體通信數據流的協同,比如,觸感通信需要多維數據采集,以實現多業務流間的傳輸協同和統一調度,保障數據包同步到達處理服務器及終端,因此端云協同將是VoNR+業務體驗的重要保證技術。借助端、邊、云的協同,VoNR+將運營商的封閉話音網絡發展成為一個可管、可控、易用的服務網絡,將云端能力通過邊緣云傳遞給終端(如圖5),使得VoNR+具備了業務快速創新、快速部署和快速上線的能力,并且避免了終端頻繁升級,使得持續地業務創新和體驗升級成為可能。

圖5 VoNR+端云協同架構
(1)3GPP(3rd Generation Partnership Project)
VoNR+相關標準工作主要在SA1、SA2、及CT開展。3GPP在R16已完成5G網絡的IMS DC實時交互通道相關技術標準,于2020年3月寫入并發布了TS 26.114 V16.5.0版本,實現了5G VoNR業務能力的增強。在CT1,R17項目FS_eIMS5G2研究了IMS如何更好地使用5GC能力,特別是利用5GC的MEC(Mobile Edge Computing)能力實現信令媒體面優化。在SA1,R18項目FS_MMTELin5G中定義了可視菜單、屏幕共享、AR通信及第三方ID接入等場景和需求,并發布了TR 22.873,完成了TS 22.261的修訂。在R18中將重啟IMS切片、服務化等研究內容,將納入SA1新通話需求。3GPP SA2中NG.RTC立項申請也已獲得通過。
(2)GSMA(Global System Mobile Association)
2021年1月,NG 5GJA啟動virtual task force,制定VoNR+數據通道白皮書,納入數據通道典型應用場景、構建產業和生態,目前已完成發布版本。2021年2月IP COMMS啟動Future of Voice Calling討論,探討話音業務的未來發展方向。2021年3月IP COMMS啟動Business Voice Calling討論,探討面向2B的話音發展方向。
(3)ITU(International Telecommunications Union)
2021年7月,中國移動在ITU-T SG11組主導完成“基于DC(Data Channel)的IMS增強信令架構”立項,該立項旨在加強基于DC的VoNR+架構領域的標準制定,并為3GPP、GSMA等其他標準組織提供更多有益的反饋及輸入。
(4)CCSA(China Communications Standards Association)
2020年11月,CCSA在TC3WG4組啟動5G增強實時通信業務研究,面向通信網絡和媒體技術的持續演進及人們多元化的通信需求等提出潛在的、高價值的VoNR+業務場景,包括傳統業務、企業通信、新型業務、特殊群體和安全通信等,探討網絡架構和安全隱私等關鍵訴求,支撐下一代通信網絡技術研究。在TC3WG1工作組開展下一代實時通信網絡研究技術,從傳統業務的演進和體驗增強、新型業務的構想和需求識別等方面,基于現有IMS系統研究構建下一代通信網絡架構,同時在TC11WG3工組組也啟動了終端支持VoNR+業務的技術研究。
(5)5GDNA(5G Deterministic Networking Alliance)
運營商聯合產業各方已經開始了多層次、多維度的新型商業模式探索,共同打造VoNR+產業生態,實現開放、合作和共贏。2021年8月,中國移動在5GDNA聯盟中聯合多家伙伴成立業界首個VoNR+工作工作組,該工作組由芯片、模組、終端、網絡、應用等十余個行業伙伴組成,主要從技術路線、商業模式、終端推進三大方向形成產業共識,推進VoNR+生態建設。
話音業務演進與移動通信網絡發展是相輔相成的,隨著5G大規模商用及VoNR的進一步普及,預計2025年話音業務將演進到VoNR+。VoNR+是基礎通信邁向未來全息沉浸式交互通信[15]的核心突破口,后續將通過引入算力網絡等技術,不斷將VoNR+的觸角延伸到沉浸式、低延遲和擬真模式,讓用戶具有身臨其境的感官體驗,并將作為未來元宇宙(Metaverse)的基礎使能業務能力,通過全感通信,推動現實世界社交關系鏈在數字世界發生轉移和重組,最終將實現基礎通信業務的顛覆式突破,形成一個安全、穩定、有序的現實世界的元宇宙空間。