魯小麗
摘 要:本文基于H.264/AVC關鍵技術進行典型專利分析,以期通過分析獲得各大主流圖像公司針對視頻編解碼改進路線以及改進技術效果。
關鍵詞:視頻編碼;H.264/AVC;專利分析
DOI:10.16640/j.cnki.37-1222/t.2018.14.212
視頻編碼標準隨著圖像標準需求而不斷改進與修訂,其中非常引人注目是H.264/AVC。H.264/AVC采用 DPCM/變換為基礎的混合編碼模式,在此編碼框架下采用了一系列先進的視頻編解碼關鍵技術,從而使其視頻編碼性能優于其他視頻編碼標準。
本文對專利文件進行檢索、閱讀和分析,基于主要研究方向對相關專利文獻進行分類,并對各個分類的特點以及典型方案進行分析,獲得各大主流圖像公司針對視頻編解碼改進路線以及改進技術效果,對研發方向有所啟發。
1 研究方向分類
通過對專利文獻的閱讀和分析,獲取關于H.264/AVC的主要研究方向,包括:幀間預測;幀內幀間預測;整數變換與量化;熵編碼;率失真優化策略;環路濾波器。
1.1 幀間預測
幀間預測主要利用視頻序列中幀與幀存在著高度相關性,通過運動估計和運動補償的預測編碼過程來消除視頻序列中的時域冗余。視頻序列的鄰近幀之間通常存在時域相關性,根據預測塊所在的位置,得到編碼塊與預測塊之間的運動矢量,運動估計即通過搜索得到運動矢量的過程,運動補償則是根據運動矢量,在鄰近參考幀中搜索到最相似預測塊的過程[1]。
典型方案:鄭州大學申請的專利(CN101854534A)公開了一種H.264快速幀間模式選擇方法,對skip模式優先進行判斷,并在此基礎上縮小宏塊級的模式判斷范圍;其次根據亞宏塊編碼模式與量化參數的關系,對亞宏塊級模式進行集合劃分,對不同的量化參數下的宏塊選擇不同的亞宏塊模式集合,縮小亞宏塊級模式判斷范圍。
1.2 幀內預測
幀內預測是利用圖像幀在空間域上相鄰像素間相關性的特征,由相鄰已重建像素塊來預測當前幀像素塊,接著對實際當前塊和預測塊的殘差進行變換、量化以及熵編碼,從而有效地去除空域冗余,提高編碼效率[2]。
典型方案:三星電子株式會社從2004年至2016年提出了從以下三個方面有針對性地進行改進:壓縮率、準確度和計算量。其中專利(CN1965586A)公開了:根據已確定的編碼模式確定預測方向,基于該方向離目標像素最近的像素來預測剩余像素值,并根據熵編碼技術對目標像素與預測像素的差值進行編碼,從而提高編碼壓縮率。專利(CN1921630A)公開了將幀內預測和幀間預測結合從而提高準確度,具體為,將圖像分塊為多個子塊,對其中的一個子塊執行幀內預測,將該經編碼子塊作為參考,對剩余的圖像子塊進行幀間預測編碼。專利(CN101578879A)公開了提取已編碼圖像中包含的經幀內預測的圖像塊,從所提取的塊中預測當前塊。因此,可以利用關鍵幀和與相鄰畫面的相關性來執行進行編解碼從而提高速度。
1.3 整數變換與量化
H.264/AVC 標準基本檔次中使用了4×4整數變換代替了傳統的浮點DCT變換,這種變換在能量壓縮的性能上與DCT變換十分接近。由于變換矩陣中的系數均為整數,所以不會產生DCT中存在的由于浮點精度引起的正逆變換間的漂移誤差。
典型方案:高通股份有限公司申請的專利(CN101946516A)公開了一種用于對多媒體視頻進行編碼的系統和方法。在對視頻進行編碼時,針對每一宏塊選擇一量化參數。如本文中所描述,可通過將所有可能量化參數的總體限于可能量化參數值的特定范圍而選擇每一宏塊的所述量化參數。此通過減少針對每一視頻宏塊所測試的量化參數的數目而增加視頻編碼的速度。
1.4 熵編碼
H.264/AVC定義了兩種類型的熵編碼方法,基于內容自適應的變長編碼(CAVLC)和基于內容自適應的算術編碼(CABAC)。兩者相比,CABAC的編碼性能更好,而 CAVLC的編碼更為簡單快速。
典型方案:高通股份有限公司申請的專利從減低計算成本以及提高編碼效率兩個方面進行了改進:其中,專利(CN103181169A)基于上下文進行自適應熵編碼,設置聯合上下文模型,在32×32的變換塊與16×16的變換塊之間共享,第一變化塊具有經歸零以產生具有第二大小的所保持系數塊的系數。在具有不同大小的變換單元之間共享的聯合上下文模型執行熵譯碼,從而減少存儲量和計算成本;其中,專利(CN103563378A)公開了確定用于視頻數據塊的上下文信息,所述塊為已編碼塊,在已編碼塊的頂部塊行下方,上下文信息去除來自已編碼單元的上方相鄰塊的信息。基于上下文信息對當前塊數據進行熵譯碼,從而提高效率。
1.5 環路濾波
H.264/AVC由于量化技術而帶來的在視頻圖像碼率高以及圖像快速運動情況下而不可避免地產生塊效應,使用去塊濾波技術來消除塊效應,邊界像素的平滑。環路濾波作為一種典型的去塊濾波技術而在H.264/AVC中一個重要特性。主要包括水平邊界濾波和垂直邊界濾波,通過對宏塊進行閾值判斷,而選擇不同的濾波強度進行循環濾波。
典型方案:三星電子株式會社申請的專利(CN1189652A)公開了一種環路濾波,提供水平尺寸以及垂直尺寸的濾波窗口,試用一維梯度運算,獲得二值邊緣映射,檢查該窗口內是否存在邊緣信息,根據是否存在邊緣信息來決定用于由像素相對應濾波窗口的像素濾波的不同強度值。
2 結語
本文基于H.264/AVC關鍵技術進行典型專利分析,以期通過分析獲得各大主流圖像公司針對視頻編解碼改進路線以及改進技術效果。
參考文獻:
[1]高樑.視頻編碼的關鍵技術及優化研究[D].杭州電子科技大學, 2011.
[2]姜明俊.H.264幀內幀間預測算法的優化[D].西安電子科技大學, 2007.