張 婷
(武警甘肅省總隊,甘肅 蘭州 730000)
近幾年,隨著我國信息化進程的加快,IT 技術持續革新。加上疫情原因,高效、穩定、可靠的視頻會議系統,成為支持人們實現遠程實時交流、開展協同工作的交流模式,并被提出新的更高要求。音頻和視頻壓縮技術是視頻會議的核心技術,直接關系到視頻會議的質量。
H.265 標準是繼H.264 標準之后的新的視頻編碼標準。H.265 標準在基于H.264 標準的框架下,支持更精確的幀間預測、多個方向幀內預測等,并對每個圖像進行了優化,根據每個圖像分割出更小的宏塊,根據不同的區域進行預測,提高了編碼效率,提高了動態補償和矢量預測效果。因此,高分辨率、高幀率、高壓縮率的H.265 標準在視頻會議系統中得到普遍運用。
H.265 標準在繼承H.264/AVC 標準基礎架構的基礎上,總體上沒有太大的改變,仍然是基于混合編碼的框架[1]。其特定的代碼結構如圖1 所示。

圖1 H.265 編碼框架
在此架構中,幀間預測與幀內預測組成了編碼的預測部分,并結合單幀圖像內部的圖像參數,進行圖像冗余度壓縮,以減少空間冗余。幀間預測是以特定的參考幀為基礎,通過計算當前幀的運動矢量,以消除時間相關性。一般情況下,在第一幀圖像中,由于沒有相應的參考幀,因此只能先進行幀內編碼,然后再進行幀間編碼。在預測裝置生成預測信息之后,將所述預測信息連同所述當前幀的信息進行編碼器差分,從而對數據進行一系列量化轉換,進一步消除冗余信息,并且結合對比編碼信息與預測信息,形成數據流并輸出。而在此架構下,反量化、反變換、濾波等操作則與譯碼器的對應功能相同[2]。該部分的主要作用是通過轉換和量化的殘差信息來重構原始的殘差信息,并將其與某些預測信息結合起來,成為幀內預測的必要數據;或對某些列進行過濾,最后將其作為參考幀,用于幀間預測[3]。
H.265 標準是在H.264 標準基礎上的升級版,在保持H.264 部分技術的基礎上,對編碼流、編碼質量、延時及復雜性等方面進行了改進[4]。在相同的圖像質量和相同的編碼速率下,H.265 標準理論上要比H.264 標準節省50%的內存;采用較好的算法,可以支持在1 ~2 Mb·s-1的傳輸速率下,傳輸720P(1 280×720)的普通高清音視頻傳輸,在實現4K 與8K 超高清視頻傳輸時能有效降低帶寬[5]。
H.264 標準中,每個宏塊大小都是固定的16×16像素,相比較于H.264 視頻編碼技術,H.265 高效視頻編碼技術將不同的宏分成不同的宏塊,大小從8×8 到64×64。將信息不多的區域分割成大的宏塊,可以減少編碼字節;而對細節更多的圖片,將其分割成更小的宏塊,并在編碼后增加更多的字節,就相當于對圖像進行了集中編碼。H.265 標準在這種塊結構劃分的基礎上采用一系列自適應預測和變換等編碼技術,從而降低了碼率,提高了編碼效率[6]。
幀內預測的核心是假設圖像內部有大量重復或關聯元素,比如重復的紋理、明暗變化的色塊等。因此可以從當前幀的相領區域里找一塊,直接預測當前塊。H.265 標準對H.264 標準的預測方向進行了進一步的改進,其中H.265 標準的亮度預測方向為33 個,加上DC 預測模式和Planaar 預測模式(DC模式適用于整塊平坦區域,Planaar 適用于像素值漸變的區域),而H.264 亮度4×4 和8×8 塊支持4個方向、9 個顏色。這樣,H.265 標準幀內預測的準確性更高,能夠減少殘差數據。H.265 標準的幀內預測模式如圖2 所示。

圖2 H.265 幀內預測模式圖
H.265/HEVC 標準,采用了運動補償方式進行幀間預測。H.265 標準在H.264 標準基礎上使用了更高階的濾波器,通過不同濾波器的適配實現不同像素插值的直接計算。高階濾波器直接取值,省去了中間取整過程,直接提升了運動插值的準確性[7]。H.265 標準的插值精度與H.264 標準一樣,都達到了1/4 的亮度,但是插值濾波器的抽頭長度和系數卻有很大差別。
對于130 萬像素的攝像頭,碼流速率為2 MB·s-1,采用H.264 標準,一天的存儲量為2 048×3 600×24÷8÷1024÷1024,約等于20 GB。H.265 技術下,存儲一天的數據量為10 GB。以半年時間為例,使用H.264 標準存儲數據為20×6×30=3.6 TB,而使用H.265 標準則是1.8 TB 的數據[8]。從帶寬方面來說,采用H.264 標準的視頻傳輸130 萬像素的圖像,最低需要上行速率是6 Mb·s-1,而H.265 標準在4 Mb·s-1帶寬下,就可以傳輸300 萬像素的高清視頻或2 個200 萬像素的視頻,這樣不僅節省了硬盤的存儲費用,還減少了交換機的開銷[9]。
相比H.264 編碼,H.265 編碼應用到會議系統中,可以將會議端到端的延時降到最低,可以有效解決視頻卡頓,可以實現在低帶寬的條件下實現高清視頻的傳輸,使會議更加流暢高效[10]。
視頻會議在解決了編碼的問題后,需要考慮實時不間斷的大量視頻數據傳輸,RTP(實時傳輸協議)在UDP 傳輸協議的基礎上加入了實時控制協議,即可以控制數據丟包率,又能保證數據的可靠性,因此,RTP 協議是視頻會議中較好的傳輸協議[11]。H.265標準分為VCL(視頻編碼層)和NAL(網絡提取層),視頻編解碼功能包括宏塊劃分、運動補償預測處理以及循環過濾器處理等都在VCL 層實現;H.265 的NAL 把VCL 的輸出封裝成NALU(NAL 單元),以適應基于包的網絡傳輸或面向包的多路復用環境。NALU 的結構由開始碼、NALU 頭以及NALU 數據組成。NALU 載荷數據中包含圖像的標識、參數、視頻格式、幀數、補充信息及幀類型等信息。
編碼器在生成H.265 編碼后,采用RTP 傳輸模式,每個封包單元都要占據一定大小的頭信息,這就要求封包策略要適應網絡體系,控制每一個RTP包的載荷大小。H.265 標準中,每一個NAL 單元被封包在一個RTP 分組里,再加上RTP 頭信息,RTP封包的問題就變得非常簡單了,即一個NAL 單元作為一個RTP 分組的載荷,直接加上RTP 頭封裝成一個RTP 包。但是這種情況需要VCL 編碼將生成的NAL 控制在小于RTP 最大有效載荷,有時候一幀或一組的數據量非常大,H.265 標準支持將過大的NALU 分割成多個RTP 包,也可以將多個較小的NALU 封裝在一個RTP 包中。
值得注意的是,不能將幀首與第一個塊分別包裝成RTP 包,也不能將塊與第一個宏塊單獨包裝成RTP 包。此外,宏塊有時不會以整字節開頭和結尾,RTP 包裝是將宏塊作為最小的劃分單元,因此包頭部中包括兩個3 位的整數Sbit 和Ebit(其數值從0至7),用于識別封裝H.265 數據的首、末字節中的位數。
H.265 標準的目的是在有限的帶寬下傳送高品質的網絡視頻,而它的帶寬要求只有原來的一半。這就意味著智能手機、平板電腦等移動設備可以在線觀看1 080p 的高清晰度視頻。H.265 標準還支持4K(4 096×2 160)和8K(8 192×4 320)的超高清晰度視頻。H.265 標準使得網絡視頻能夠與屏幕的“高解析度”同步。
在疫情的大背景下,視頻會議成為人們工作生活不可缺少的工具。對于跨地區的企業或政府部門,視頻會議是組織大型活動、發布工作部署、開展學習教育的重要手段。在平時生活中,視頻會議是網上教學學習、培訓或者遠程交流的重要方式[12]。
會議系統的功能絕不僅僅是實現交流,各種新需求的產生,不斷對會議系統提出更高的智能化要求,如背景虛化、自動捕捉、智能分析會議信息、自動添加字幕等。隨著人工智能(Artificial Intelligence,AI)技術的日益成熟,可以在會議系統中集成AI,從而實現人臉識別、入會簽到及在線標注個人姓名。智能化的另一個方面是提高系統的可操作性,功能越來越多而操作越來越簡單,是發展潮流[13]。
視頻會議發展至今,安全性問題需要更加引起重視。隨著國際局勢的變化,視頻會議系統中芯片國產化及會議軟件國產化已成為不可忽略的趨勢。我國相關產業的核心能力不足,特別是硬件視頻會議系統所需的音視頻處理芯片和攝像機機芯等核心零件依然高度依賴進口,尚未實現自主可控[14]。同時,需要從安全系統架構、更有效的安全防護、多重加密技術以及完善管理機制等方面,使視頻會議系統安全得到真正的保障[15]。
傳統硬件視頻系統正在被基于云的視頻會議取代。各大主流廠家紛紛推出了軟件MCU 平臺,發布了基于通用服務器或虛擬機的云視頻系統。未來視頻會議的發展將是云視頻會議與軟件的結合。動態變化的多速率視頻碼流,可以智能適應不同終端接入會議的問題,解決不同應用場景的需求,從視頻應用延展到應急指揮、防控調度、個人互聯、移動介入、監控融合等多種應用場景[16]。
由于用戶的要求越來越高,因此視頻會議成為編碼和解碼技術的先鋒。未來視頻會議中,以硬件視頻為主的專有視頻會議系統,可以通過軟件擴容實現現有會議系統的擴展,利用桌面集成型的小型攝像頭和顯示器,實現機動條件下的音視頻傳輸。目前,以H.265 標準為基礎的HM、X265、T265 軟編碼器以及各種各樣的國產硬件編碼器,為H.265標準在視頻會議系統中的應用提供了更好的良機??偟膩碚f,H.265 視頻編碼改進了基于塊的視頻壓縮模式,其特點是可變尺寸轉換的宏塊、基于候選列表的運動矢量預測、多幀內預測模式、更精確的運動補償濾波器以及優化采樣點自適應補償濾波器等,占用更小的帶寬就可以獲得更高清晰度的視頻信號。結合多速率視頻,云視頻會議采用更新的視頻編碼,智能適應系統中不同與會終端的帶寬要求,PC、手機、會議終端應用于不同網絡(專網、局域網、因特網、移動網絡、WiFi 甚至藍牙),能夠使視頻會議系統真正實現任何網絡、任何場合、任何終端都能看得清。