陳 洋,陳 浩,趙 文,姜鵬博
(中國電子科技集團公司第三十研究所,四川 成都 610041)
LTE承載語音(Voice over LTE,VoLTE)是基于長期演進(Long Term Evolution,LTE)和IP多媒體子系統(IP Multimedia Subsystem,IMS)技術的全IP語音業務,是電信業固網完成IMS部署,LTE網絡的演進分組核心網(EPC,Evolved Packet Core)核心網接入IMS系統后,用戶體驗明顯優于傳統電路域語音的IMS應用,是電信業公認的語音業務目標方案。電信運營商為公眾用戶等提供了高質量的VoLTE基礎設施,然而并不能完全滿足金融、公安等特殊行業或大型企事業用戶在語音安全性上面的需求。雖然利用公網運營的普通VoIP系統具有較為成熟安全通信方案,但由第三方企業提供的針對VoLTE語音的安全通信方案,仍處于探索階段,屬研究熱點。
VoLTE的發展依賴于固網的IMS技術和移動網絡的LTE技術的發展。IMS技術由國際標準組織第三代合作伙伴計劃(Third Generation Partnership Project,3GPP)在2002年的R5版本中提出。明確了以SIP協議作為統一的從終端到網絡的信令標準實現呼叫控制,以RTP協議作為音視頻等實時數據的傳輸協議承載媒體數據,明確了以IP方式進行網絡融合互通,為移動網絡及既有電路域網絡的接入統一了標準。IMS作為一個開放架構,促進了異網融合,業務拓展。每隔一兩年3GPP就會發布新版標準,涉及到IMS架構的優化擴展,融合網絡計費規則的完善,固移融合的接口標準補充等各方面。2008年底的R8版本,提出了標準化項目LTE,開始為LTE移動網絡與固網的網絡和業務融合制定標準,截至2018年R15版本已凍結,使得LTE演進成為5G時代IMS網絡的重要組成部分。
移動通信系統,從20世紀70年代的1G模擬語音,到90年代的2G數字語音,到21世紀初的3G電路域語音加分組域多媒體,再到10年代的4G(LTE技術為主,IMS技術已被確定為4G移動核心網標準架構及解決方案),發展脈絡就是從模擬到數字,從電路到分組,從窄帶到寬帶,從純語音業務到多業務融合的過程。
國內中國移動的IMS網絡于2011年正式商用,2015年率先支持了VoLTE網絡的正式商用。中國電信由于固網基礎設施IMS改造工程較大,2010年才開始大規模改造,建設LTE網絡期間,使用了雙待機終端、電路域回落(Circuit Switched Fallback,CSFB)、單一無線語音呼叫連續性(Single Radio Voice Call Continuity,SRVCC)[1]等 VoTLE 的替代方案,于2018年末VoLTE才正式商用。中國聯通2013年才啟用IMS正式商用,截至2018年,VoLTE仍在部分城市試點中。
完整的VoLTE系統架構,兼顧了不同模式終端的接入,LTE終端與電路域互通,LTE網絡與2G/3G網絡切換保持通話連續性等應用需求,網元諸多,技術復雜不作細述。本章節僅聚焦LTE網絡全覆蓋,LTE終端間進行VoLTE通話的終極應用場景,對語音通信原理進行介紹,裁減了電路域及相關網元的VoLTE系統架構如圖1所示。

圖1 簡化的VoLTE系統架構
該終極應用場景下,僅包含分組域網元,架構上包含運營支撐層、業務平臺層、核心層、接入層和終端層。終端與eNodeB基站之間,LTE空口協議作為終端TCP/IP協議棧鏈路層協議接入,上層最核心的協議仍然是SIP協議進行呼叫控制,RTP協議負責媒體數據承載。一次VoLTE語音業務流程如圖2所示。

圖2 簡化的VoLTE通信流程
流程圖中略去或合并表示了部分網元,通話大致流程為:VoLTE終端開機后,會主動與eNodeB建立無線連接,向移動管理實體(Mobility Management Entity,MME)發起附著消息,向歸屬用戶服務器(Home Subscriber Server,HSS)發起鑒權信息,通過后即可獲取IMS域呼叫會話控制功能(Call Session Control Function,CSCF)網元地址,為SIP信令建立默認承載通道。之后,終端即可向IMS的CSCF網元發起SIP注冊。發起語音呼叫時,首先進行SIP信令交互,QoS資源預留,與eNodeB間建立媒體專有承載通道,即可媒體通信。掛機后,SIP信令觸發所有預留資源釋放。
運營商對自己管控的網絡從系統安全的角度,已經通過入網鑒權,雙向認證,空口保護,虛擬路由專網等技術手段進行了一定程度的網絡安全防護,但是VoLTE最關鍵的SIP和RTP兩大協議的安全狀況十分堪憂,因為竊聽者長期“默默無聞”的監聽,才是其終極目標[2],用戶無法知悉。圖3為信令和語音數據在VoLTE通話業務進行時各重要網元的協議棧剖面圖。

圖3 協議棧剖面圖
(1)從協議棧層次角度分析
VoLTE涉及的各異構網絡均在IP層互通,盡管IP層之下,運營商網絡有部分鏈路層安全防護措施,如LTE協議棧的用戶面PDCP協議是有密碼保護的[3],但IP層整體是沒有完整的安全防護措施的。SIP和RTP作為應用層協議,在VoLTE通信時,均需要穿越運營商會話邊界控制器(Session Border Controller,SBC)設備,SBC是IMS用戶域與IMS核心網的邊界網關類設備,具有網絡地址轉換功能,對SIP信令和RTP媒體流提供應用層代理轉換和控制的網關功能,會解析完整SIP消息,RTP報頭。因此,若要依賴網絡層或鏈路層的保護,則無法支持到端到端的語音保密,因為必須在數據包進入SBC設備前脫密。
(2)從數據傳輸路徑角度分析
目前絕大部分UE設備的Modem芯片實現了語音數據的RTP封裝解封裝及收發,在移動終端上對語音數據的截獲處理只能在Codec芯片(語音編解碼器)與Modem芯片之間進行。前文已提及LTE協議棧用戶平面有密碼保護,因此UE與eNodeB之間的空口通信段可以認為語音是安全的,而語音數據在網絡側其他各節點間的傳輸則沒有安全保護措施。
既要滿足網絡適應性,又滿足VoLTE語音數據在機密性,完整性,可認證性,抗重放性等方面的安全需求,只能采用應用層端到端的語音信源級單層保密措施。利用成熟商用手機平臺定制安全手機產品是業界的普遍做法[4],涉及到運營商,終端廠商,安全廠商多方技術協作。定制改造需要重點解決以下三個技術問題。
(1)如何標識明密通話
移動終端必須使用定制撥號軟件,由主叫用戶來選擇發起密通或明通。密通時,普遍采用SIP協議的擴展功能,啟用附帶預置條件的呼叫會話流程來指示主叫與被叫即將進行密通。需要核實Modem芯片是否已支持或需改造支持SIP擴展字段的實現,因為移動終端已事實上由Modem芯片實現了SIP協議棧功能。IMS的CSCF網元對SIP擴展字段默認采用透傳方式以保障通信雙方能自行識別處理。使用該機制能夠在SIP信令交互過程中就盡早明確即將密通或明通。
(2)如何完成密鑰協商
通常有兩種方式,其一是依賴于SIP協議的擴展機制,在信令交互過程完成密分功能[5],也稱作帶外協商。這種方式需要安全廠商部署密鑰分發設備到IMS核心網,與CSCF網元協同工作,就像增加了一個應用服務器(Application Server,AS)應用服務網元一樣,需要與運營商約定SIP擴展定義,IMS業務觸發規則,才能在信令交互過程中,由SIP完成主被叫雙方的密鑰攜帶分發。這種方式安全廠商與運營商耦合較深,不僅阻力較大,調試驗證的工作也非常巨大。其二是直接在RTP業務通信階段由RTP包承載協商協議[2],也稱作帶內協商。這種方式對運營商IMS網絡低耦合,無需密分設備,終端間自主協商,用戶會有摘機后通話延遲感。
(3)如何進行語音數據變換
有兩種方式,其一是在模擬數據采集后,進入Codec芯片之前,核心思想是對模擬數據進行置亂。這種方式必須要使置亂后的語音數據符合Codec芯片對語音信號的特征要求[6]。國內有運營商主導的安全手機采用了這種方式,這種對模擬數據的變換,理論上可以適應通信雙方在電路域和分組域的兩種網絡環境。劣勢是語音數據置亂后才進行數字化編碼壓縮轉換,逆過程后,還原的語音質量可能不同程度受損。其二是在Codec芯片之后,Modem芯片之前進行語音數據的變換。此時語音已經數字化,變換的質量和安全性都更高。業界普遍采用了Codec芯片在加密通話過程中根據控制指示啟動或關閉靜音檢測,并將上下行語音幀中的語音凈荷取出送往AP處理器,由TF(Trans Flash,微SD卡)安全卡進行加解密處理的流程。這種方式下,通信雙方只能在同時駐留同一運營商的LTE分組網絡時密通,其他場景下加解密會失敗。
綜合前文VoLTE語音安全通信的一般解決方案,重點滿足金融、公安等行業用戶群體在系統容量,互通性,移動性,安全等級,終端管控模式等方面存在的特殊需求,提出了如圖4所示的解決方案。

圖4 VoLTE語音安全通信系統框架
運營商平面提供VoLTE通信的基礎設施,保障了電信級用戶量的接入能力和業務互通性、可靠性,并具備對用戶號碼進行業務限制的能力。
安全廠商平面提供了TF安全卡和安全管理中心網絡基礎設施,TF安全卡插入終端與定制APP(Application,應用)協同工作,安全管理中心網絡通過向運營商申請APN(Access Point Name,接入點名稱)接入點方式整體接入運營商數據網絡,安全管理中心提供離線TF安全卡的初裝、配發、維修等服務,提供在線TF安全卡的狀態監測,號碼綁定管理、卡內資源管理,審計遙斃等功能。
終端廠商平面,提供定制VoLTE終端,作為TF安全卡的宿主設備,通過定制撥號APP既提供普通明話通信的基本能力,也為語音提供數據變換服務,支持一話一密。通過配套的TF安全卡管理APP,也提供硬件及軟件相結合的安全計算環境管理,本地敏感資源管理等功能,提供LTE數據通道支持TF安全卡的在線管理。
從網絡安全角度看,安全廠商須制定在線安全管理協議,保障合法TF安全卡才能與安全管理中心通信。安全卡應采取周期性在線認證結合本地啟動認證方式,使可持續處于工作態,避免終端數據通道不可用時,無法進行VoLTE密話通信。安全廠商也須制定業務通信協議(含基于證書的協商協議,支持雙向認證),明確由RTP直接承載,則可實現端到端的語音信源級保護,杜絕網絡監聽和泄密風險。
從終端安全角度看,由于終端本身和TF安全卡具有易丟失性,遭遇惡意軟件等安全風險,二者的安全短板均需要分別補齊。
TF安全卡方面,安全廠商應制定并遵循專用的SDIO(安全數字輸入輸出,Secure Digital Input and Output)訪問協議,對宿主機提供標準API,以保障宿主機升級換代,TF安全卡能夠不作改動,只需定制APP做適配或升級。TF安全卡主要實現隨機數產生、密碼算法運算、密鑰產生、密鑰存儲、證書存儲等密碼處理功能,可根據不同的使用領域和行業適配不同的算法[4],盡管功能復雜靈活,也必須保證VoLTE語音密通時,無論是協商還是業務數據變換,密鑰均不出卡,即便宿主機的惡意軟件能截獲明密文,也無法破解其關系。
定制終端方面,因為是商用手機硬件為基礎,一般無法裁剪硬件,但可通過定制安全操作系統,裁剪無關軟件,開機異常檢測與緊急銷毀等措施消除一定隱患。結合TF安全卡管理軟件,實現安全卡與用戶號碼的綁定功能、狀態自檢、資源更新、本地密鑰銷毀等安全管理功能。結合定制的撥號軟件,實現VoLTE語音通信過程中,協商的觸發與明密結果的呈現,語音保護等功能。目前國內華為,小米等手機廠商普遍推出了雙系統手機,在與安全廠商的合作中,能夠提供更加精細化的安全定制,能夠保障上層的APP在可信運算環境中運行。
盡管電信業正發生著巨變,2019年運營商移動無線網絡已經發展到5G試點,物聯網的到來使終端上IPv6地址也逐步開始啟用,2G/3G網絡將逐漸停退,商用移動終端也會加快更新換代支持5G,但可以確定的是,移動通信系統LTE+IMS的核心架構并未改變,SIP+RTP的協議組合并未改變,即便是5G時代,所有移動終端將最終支持VoLTE語音業務的方向不會改變,本文提出的移動終端VoLTE語音的安全通信方案可以繼續發揮效用。