張舒黎,石元兵,任旭斌,竇步紋,馬 超,周澤恒
(成都衛士通信息產業股份有限公司,四川 成都 610041)
視頻會議系統是基于圖像和聲音交流的實時通信系統,使得在地理上分散的用戶可以共聚同一會議空間,通過圖形、聲音等多種方式交流信息,增加參會人員對會議內容的理解能力,極大地方便了協作成員之間真實、直觀的交流[1]。當前,視頻會議逐步向著多網協作、高清化、開發化的方向發展,被廣泛應用于各行各業。特別是在新冠抗疫期間,視頻會議對于遠程醫療會診、政府遠程指揮、企業復工復會等多方面具有重大意義。
在視頻會議的應用中,會議內容可能涉及國家機密、軍事情報、商業秘密及私人信息等敏感信息,一旦泄露,將面臨極大的安全風險。本文從典型視頻會議系統抽取密碼需求,結合商用密碼算法進行研究,設計視頻會議加密方案,確保視頻會議信息數據安全,保障視頻會議持續發展與安全應用。
視頻會議系統的典型組成如圖1 所示,可以將其大致分為終端側、平臺側兩部分,此外還包括線路、網絡等[2]。終端側主要是會議終端,包括專用的會議終端、以及移動終端+APP、大屏顯示等其他形態的設備。平臺側包括會議管理、MCU 等后端服務器,用來實現會議控制、會議呼叫、混音、畫面編輯等功能。
在實際應用中,視頻會議系統往往進行級聯擴展、云化部署,以滿足廣泛的視頻會議通信需求。

圖1 典型視頻會議組成
隨著視頻會議的持續發展和廣泛應用,視頻會議的安全性日益凸顯,其加密需求顯得尤為迫切。很多的科研機構、企業紛紛對加密視頻會議技術進行研究,并推出相應的解決方案和產品[3-4]。然而現有方案往往基于國際密碼算法,使用單一加密方式,防護效果并不突出。本文結合當前視頻會議的發展趨勢以及實際的密碼使用情況,歸納出如下三方面的加密需求:
(1)端到端高效加密需求:隨著視頻、帶寬、編解碼等技術的成熟和發展,視頻會議呈現出高清化、規模化等特點,相應地,端到端保護、高效視頻加密、多路視頻并行加密等成為了新的需求。
(2)安全可擴展需求:視頻會議場景各異,不同場景下,其具體的安全需求不盡相同,因此,需要制定差異化、可擴展的加密方案以滿足不同的安全需求。
(3)密碼合規性需求:目前,很多的視頻會議系統往往采用國際密碼算法[5](如:AES、RSA、DES、SHA1、MD5 等)。然而,隨著“棱鏡門”事件的曝光以及王小云院士宣布攻破國際密碼算法等[6],國際密碼算法的安全性問題日益顯現。另一方面,我國推出安全自主可控的商用密碼算法[7]SM1、SM2、SM3、SM4、SM7、SM9、ZUC 等,已經(或將要)成為國際標準,被廣泛應用于金融、能源、黨政等重要領域。對視頻會議進行加密保護時,應當結合國產商用密碼,構建安全合規的密碼應用體系。
在傳統視頻會議中,與會人員控制會議平臺,向視頻會議終端發起會議,會議終端采集本地音視頻并發送到其他會議終端。加密視頻會議系統中,平臺在發起會議的同時向終端分發密鑰,參會終端對本地采集的音視頻進行加密并傳輸給對端設備,當接收到對端設備發送的音視頻密文后進行解密和播放。其框架如圖2 所示。

圖2 加密視頻會議框架
在加密視頻會議系統中,視頻會議終端設置密碼設備,如USBKEY、TF 卡、密碼軟模塊等,使其具備數據加解密、密鑰及證書存儲等安全能力。平臺配置密碼機、密鑰管理系統、數字證書管理系統,實現密碼運算、密鑰生命周期管理、證書生命周期管理等功能。典型組成如圖3 所示。
系統采用SM2/3/4 商用密碼算法。SM2 算法用于簽名驗簽、對稱密鑰加密保護等。SM3 算法用于完整性保護。SM4 算法用于對音視頻數據的加密保護。系統使用雙證書(加密證書、簽名證書),采用三層密鑰,密鑰體系如表1 所示。
加密視頻會議的密鑰流程如圖4 所示。密管向參會終端分發會議密鑰,所有參會終端共享同一個會議密鑰。作為視頻發送者的參會終端產生會話密鑰,通過會議密鑰加密保護的形式,將其發給視頻接收端。收、發雙端共享相同的會話密鑰,基于會話密鑰進行端到端的加解密。

圖3 加密視頻會議系統典型組成

表1 密鑰體系
發送端和接收端處理音視頻的總體流程如圖5所示。由圖可見,方案采用了三層防護:混淆加擾、選擇性加密、選擇性完整保護。混淆加擾的目的是讓碼流更加混亂,增大碼流分析破解的難度;選擇性加密提供不同等級的加密強度,保護音視頻數據的機密性;選擇性完整保護是按需對部分音視頻進行完整性保護,防止非法篡改和破壞。三層防護的設計,極大地增強了系統的安全性。
發送端混淆加擾算法如圖6 所示。
混淆加擾的關鍵是亂碼本。亂碼本采用一會一本的機制。平臺在每次新建會議時生成亂碼本,安全分發給參會終端。亂碼本包括AudioRN(音頻幀亂碼)、IframeRNCoe(I 幀亂碼系數)、PBframeRN(P/B 幀亂碼)、ParaRN(參數集亂碼)四部分內容,相關的設計和使用準則如下:

圖4 密鑰流程設計

圖5 端到端加密總體流程

圖6 發送端混淆加擾算法
AudioRN:為不低于單音頻幀最大長度的隨機數串。將AudioRN 截斷為與音頻幀等長的數串,然后與音頻幀數據進行異或運算。
IframeRNCoe:包括1K 字節的隨機數串A、64字節的增量隨機數串B、遞增偏移量X。使用式(1)得到IframeRN,將IframeRN截斷為與I 幀等長的數串,然后與I 幀數據進行異或運算。
PBframeRN:為64 字節的隨機數串。將P/B 幀的前32 字節與PBframeRN 的前32 字節異或,將P/B 幀的后32 字節與PBframeRN 的后32 字節異或;如果P/B 幀不足32 字節,則將PBframeRN 截斷為與P/B 幀等長的數串,然后與P/B 幀數據進行異或運算。
ParaRN:為64 字節的隨機數串。如果參數集長度小于64 字節,將ParaRN 截斷為與參數集等長的數串,然后與參數集進行異或運算;如果參數集長度大于64 字節,只對參數集前64 字節進行異或運算。
由于I 幀數據量大,對IframeRNcoe 進行擴展,可以得到足夠長的亂碼IframeRN。其實現方式如下:

其中||表示數串拼接,⊕表示按位異或,<<表示循環左移。
發送端選擇性加密算法如圖7 所示。

圖7 發送端選擇性加密算法
在算法流程7 中,涉及三種安全等級:I 級(一般)、II 級(較高)、III 級(高)。三種安全強度的定義如表2 所示。

表2 安全強度定義
不同強度下,不同類型的數據將采用全加密或者部分加密的方式。其中,部分加密過程如下:
設待處理數據為M,長度為L,設置分組參數T(T>4),將M分為T組數據,前T-1 組數據長度均為,最后1 組數據長度為;
發送端選擇性完整保護算法如圖8 所示。
采用選擇性完整保護的方式對視頻I 幀數據進行保護。在等級I 時,不進行處理;在等級II 時,發送端對I 幀數據計算SM3_HMAC,將HMAC 值封裝進I 幀數據的末尾;在等級III 時,發送端計算I 幀及其前k(k>0)個連續幀的樹頂摘要值,將其值封裝進I 幀數據的末尾。
樹頂摘要計算示意如圖9 所下。
接收端的流程為發送端的逆向流程,需要保證接收端與發送端共享同樣的策略和參數配置。具體實現形式可以通過平臺控制、收發雙方協商、事先預置等方式實現。
密碼算法強度高:常用的視頻會議加密系統往往采用AES、RSA、SHA1 等國際密碼算法,本系統采用由我國自主設計的SM2/3/4 商用密碼算法,安全強度不低于國際算法且自主可控,更適合部署于黨政、金融、能源等行業領域。

圖8 發送端選擇性完整保護算法
三重防護高安全:本系統輕耦合式地組合應用混淆加擾、選擇性加密、選擇性完整保護三種安全技術。系統中的關鍵信息(如策略配置、亂碼本、密鑰信息、身份信息等)均以密文的形式在網絡中傳輸,以防止非法網絡截獲和破壞。某一安全技術敏感信息的泄露都不會直接影響其他技術的安全性,此種設計大大增加了系統的復雜度,提升了整體的安全性。

圖9 樹頂摘要算法
安全等級可擴展:傳統的視頻會議加密系統往往只對音視頻進行加密,未對安全等級進行區分。本系統充分考慮音視頻數據的結構特點,對視頻數據I 幀、視頻數據P/B 幀、視頻參數集、音頻數據幀進行區分,綜合運用混淆加擾、選擇性加密、選擇性完整保護等多種安全技術,提供不同等級的安全保護能力,以滿足廣泛的加密視頻會議場景需求。
本章節通過構建模擬的應用場景,分析加密技術對系統性能的影響情況。
場景1:高清視頻會議中,視頻碼率為2 Mbps,幀率24 fps,I/P 幀頻率比為1:10,I/P 幀大小比為5:1,無B 幀,音頻碼率為64 kbps,T=10,k=4。表3 展示了單個會議終端在處理單路碼流時的密碼運算能力情況。能夠看出,隨著安全等級的增加,會議終端所需的密碼運算速度持續增加,系統性能負載也越高。
場景2:基于場景1 的視頻會議,提供三種運算能力的密碼設備。第1 種為低性能密碼設備(A-id),SM3/4 運算速度不高于4Mbps,SM3 運算次數不高于20 次每秒;第2 種為中等性能密碼設備(B-id),SM3/4 運算速度不高于20Mbps,SM3運算次數不高于200 次每秒;第3 種為高性能密碼設備(C-id),SM3/4 運算速度不低于200Mbs,SM3 運算次數不低于1000 次每秒。圖10 展示了在不同安全等級下,三類密碼設備支持加密視頻會議的最大接入數情況。由圖可見,當安全等級一定時,配置更高性能的密碼設備可以支持更多的終端進行加密會議;當密碼運算能力一定時,安全等級越高,實際可參會的終端數量越少。在實際部署時,可以靈活地根據安全需求、參會數量等選擇適當運算能力的密碼設備。

表3 處理單路信號的密碼性能要求
本文對加密視頻會議進行研究,分析現狀與密碼應用需求,基于國家密碼局發布的商密算法對視頻會議進行安全設計,引入混淆加擾、選擇性加密、選擇性完整保護三重機制進行層層防護,實現視頻會議的加密保護,最后對方案進行分析和評估。本文設計的視頻會議加密方案具備高安全、可擴展、靈活性等優點,具有較高的實用性。