雷海軍,危 雄,楊 張,袁梅冷
(1. 深圳大學計算機與軟件學院,廣東 深圳 51 8060;2. 廣東省普及型高性能計算機重點實驗室,廣東 深圳 518060;3. 深圳市服務計算與應用重點實驗室,廣東 深圳 518 060;4. 深圳職業技術學院,廣東 深圳 51806 0)
一種快速HEVC幀內預測模式決策算法
雷海軍1,2,3,危 雄1,2,3,楊 張4,袁梅冷4
(1. 深圳大學計算機與軟件學院,廣東 深圳 51 8060;2. 廣東省普及型高性能計算機重點實驗室,廣東 深圳 518060;3. 深圳市服務計算與應用重點實驗室,廣東 深圳 518 060;4. 深圳職業技術學院,廣東 深圳 51806 0)
高性能視頻編碼(HEVC)標準是視頻編碼聯合小組提出的新的視頻編碼標準。針對HEVC幀內預測模式決策的高計算復雜度問題,提出一種基于邊緣方向強度檢測的快速幀內預測模式決策算法。將35種幀內預測模式根據5個基本方向分為5個預測候選模式集合,每個集合中有11種預測模式。分別計算預測單元(PU)的5個方向的方向強度,以及每個方向所占比例,選擇比例最大的方向所對應的候選模式集合為該PU塊的候選預測模式,有效減少幀內預測的計算復雜度。實驗結果證明,與HM8.0相比,該算法能夠以保證視頻質量為前提,在高效率條件和低復雜度條件下平均節省15%和18%的編碼時間。
視頻編碼;高性能視頻編碼標準;幀內預測;預測單元;模式決策;邊緣方向檢測
高性能視頻編碼(High Efficiency Video Coding, HEVC)標準于2010年4月在德國德累斯頓召開的JCT-VC第一次會議上提出。該標準主要面向高性能高清視頻應用,提供從QVGA(320×240像素分辨率)到1 080p甚至超高清(7 680× 4 320)分辨率的視頻應用。HEVC的核心目標在于:相比于H.264視頻編碼標準,大幅提高視頻壓縮效率,即在相同視頻質量前提下,視頻流碼率減少50%[1]。
相比H.264標準,HEVC依然采用混合編碼框架[2],但在很多方面做出了改進來提高壓縮效率。具有代表性的技術方案有:基于大尺寸的四叉樹分割結構[3]和殘差編碼結構,多角度幀內預測[4],運動估計融合技術等。其中,多角度幀內預測,HEVC的預測方向數從H.264標準中的9種增加到33種[4],很大程度上提高了幀內預測的精度,但同時也帶來了很高計算復雜度的負面效果。
針對H.264幀內預測的高計算復雜度,已有眾多學者提出了優化改進的方法。文獻[5]提出了一種基于二維直方圖的快速幀內預測算法,在幀內預測之前對宏塊預判,減少預測算法復雜度,提高視頻壓縮編碼效率。文獻[6]利用預測圖中相鄰模式及次優模式與最優模式的相關性特點,對幀內預測模式進行選擇,提出了一種基于Intra4×4的快速模式選擇算法,減少了幀內預測的候選模式數。文獻[7]通過對前4×4塊幀內預測方向度量,利用相鄰塊和相鄰方向預測模式的相關性進行幀內模式預測。文獻[8]利用幀內預測模式與視頻圖像塊紋理方向的相關性提出了一種快速幀內預測算法,使用Sobel算子計算出視頻圖像中紋理最強的方向,在紋理最強方向和與該方向最接近的2個方向以及DC方向模式搜索最優的預測方向,將H.264中的9種幀內預測方向減少為4種預測方向,從而大量節省計算時間。
同樣,針對HEVC幀內預測的高計算復雜度問題,文獻[9]采用反向預測順序進行色度分量預測生成深度圖和候選預測模式集合,再進行亮度分量幀內預測,以降低HEVC幀內預測計算復雜度。文獻[10]利用HEVC四叉樹編碼的特點,縮短預測像素與參考像素之間的距離,提高幀內預測精度。這種短距離幀內預測方向能大幅提高細節豐富的圖像的幀內預測精度,從而提高編碼效率。
本文使用一種新的方法,對幀內預測模式進行優化,減少參與率失真優化(Rate Distortion Optimization, RDO)計算的幀內預測模式,將HEVC中35種幀內預測模式減少為11種預測模式來實現快速幀內預測模式決策過程,從而降低幀內編碼時間,提高編碼效率。
HEVC標準定義了3種單元塊:編碼單元(Coding Unit, CU),預測單元(Prediction U nit, P U)和變換單元(Transform Unit, TU)[11]。編碼單元是HEVC視頻編碼的基本單元,類似于H.264編碼中的宏塊,CU塊是正文形,并且CU塊的最大尺寸為64×64(即Largest Coding Unit, LCU),最小尺寸為8×8(即Smallest C oding U nit, S CU)。對于每個CU塊,HEVC使用PU塊實現該CU塊的預測過程。PU塊支持多種分割類型,對于幀內預測,PU塊的分割類型只能為2N× 2 N和N×N這2種類型。TU塊可支持對4×4至32×32基本單元的編碼變換和量化。圖1所示為CU與PU的分割關系。

圖1 C U、PU分割關系
HEVC軟件測試模型HM8.0[12]中的幀內預測共有33種角度預測模式,如圖2所示,另外還包括2種非方向性預測模式:直流預測模式(Intra_DC)和平面預測模式(Intra_ planar)。PU塊的大小共有5種,分別為64×64,32×32,16×16,8×8,4×4,這5種尺寸PU塊所對應的幀內預測模式數分別為4,35,35,35,18。當前PU塊的幀內預測值是從相鄰PU塊的參考像素矩陣中通過線性內插得到。該預測過程中,每個像素預測值需要大量的算術計算,增加了預測過程的計算復雜度。

圖2 幀內預測模式方向
在HEVC軟件測試模型HM8.0中,首先根據當前PU塊的大小得到當前PU塊的可用幀內預測模式,再通過對預測殘差哈達曼變換計算出各個模式下的殘差絕對值總和(Sum of Ab solute Transformed D ifference, SA TD),選出SATD最小的前n種預測模式為率失真優化(Rate Distortion Optimization, RDO)候選預測模式。幀內預測過程中為保證預測的準確性,最可能預測模式(Most Pr obable Mode, MPM)始終包括在RDO候選預測模式集合中。最后對各RDO候選預測模式進行率失真優化計算,得到幀內最優預測模式。
3.1 P U塊邊界方向檢測
在HEVC的幀內預測模式中,有33種方向性預測模式,若某個PU塊選中某一預測模式則說明該PU塊的紋理方向與該預測模式方向具有相似性。因此,可以首先計算出各PU塊的紋理方向,對幀內預測模式進行快速搜索。如圖3所示,對4×4的PU塊,可以劃分為4個2×2的子塊。

圖3 用于邊緣方向檢測的PU塊4分割
每個子塊可以用其中包含的4個像素的平均值表示。各子塊的計算過程如下。
4×4的PU塊的各像素值為:p(m, n), m, n=0,1,2,3;則被分割后的各子塊的灰度值為:

對于該4×4的PU塊,若塊內無明顯邊界,則(S00+S11)/2 與(S01+S10)/2的差將會很?。蝗魤K內存在一個明顯的水平邊界,則(S00+S01)/2與(S10+S11)/2將有明顯的差值,垂直方向類似;若塊內存在一個明顯的45°對角線邊界,則S00與(S01+ S10+S11)/3或S11與(S00+S01+S10)/3有明顯差值,135°對角線邊界類似。
本文將PU塊劃分5種邊界方向,分別是無明顯邊界、水平邊界、垂直邊界、45°對角線邊界、135°對角線邊界、如圖4所示。

圖4 P U塊的5種邊界方向
這5種邊界方向的強度值Eθ(θ∈{ND,0,π/4,π/2,3π/4})的計算如表1所示,則PU塊的邊界方向即為Eθ最大值所對應的邊界方向。

表1 邊界方向強度計算
以上為4×4的亮度塊的邊界方向檢測過程。對于8×8,16×16,32×32的PU塊,將其分割成4×4的PU單元,再進行邊界方向檢測。如圖5所示,將16×16的PU塊分割成16個4×4的PU塊,計算這16個4×4的PU塊的邊界方向,則16×16的PU塊的邊界方向由16個4×4的PU塊邊界方向中占比例最大的方向決定。由于尺寸較大的PU塊被檢測為無邊界方向的可能性更大,為避免將有邊界方向誤判為無邊界方向,特別設定只有在無邊界方向的4×4塊所占比例超過75%時,當前PU塊才被檢測為無邊界方向。

圖5 16×16 PU塊分割成4×4 PU單元的方向檢測
3.2 幀內預測模式的劃分
由于幀內預測模式與視頻圖像塊內的邊緣方向是密切相關的,因此可根據上述5種邊緣方向將33種幀內預測模式劃分為5類。
(1)無邊界方向預測模式:END={0,1,3,4,5,6,7,8,9};
(2)水平方向預測模式:EH={1,7,8,15,16,28,29,30,31};
(3)垂直方向預測模式:EV={0,4,5,11,12,20,21,22,23};
(4)45°對角線方向預測模式:E45°={5,6,9,13,17,24,25, 32, 33};
(5)135°對角線方向預測模式:E135°={5,6,9,13,17,24,25, 32, 33}。
為保證幀內預測的準確性,Intra_DC和Intra_planar預測模式將加入到上述5個預測模式集合中,每個PU單元的可用預測模式數從33種減少為11種。若檢測到當前PU塊的邊緣方向無明顯邊緣方向,則當前PU的可用幀內預測模式為集合END,對于其他方向的選擇過程與此類似。由于每個PU塊的可用幀內預測模式數減少,本文所用方法中將4×4和8×8大小PU塊的候選幀內預測數設定為5。
為了驗證所提出方法的效率,本文以HEVC的軟件測試模型HM8.0為參照進行實驗。實驗平臺為Inter(R)酷睿雙核CPU,主頻2.83 GHz,內存3 GB,操作系統Windows XP。實驗所用的序列的測試條件來自文獻[13],量化值分別為22、27、32、37。實驗結果如表2所示。比較編碼效率的參數指標有PSNR增量(ΔPSNR)、碼率增量(ΔBitrate)和編碼時間增量(Δtime),分別用以下公式進行計算:




表2 實驗結果對比
從表2中可以看出,在高效率條件下本文提出的算法的碼率與HM8.0相比有明顯提升,視頻編碼質量僅提高了0.14 dB,但是編碼時間節省了約15%。,在低復雜度條件下本文算法的碼率與HM8.0相比有明顯提升,視頻編碼質量僅提高了0.12 dB,但是編碼時間節省了約18%。
本文通過檢測各PU塊的邊緣方向強度,將幀內預測模式數從35種減少為11種,簡化了對不必要的預測模式的率失真優化(RDO)計算,從而降低視頻編碼的計算復雜度,節省編碼時間,提高編碼效率。實驗結果證明本文所提出的快速幀內預測模式決策算法是正確和有效的。但是所提出的算法僅優化了HEVC幀內預測的粗選模式決策過程,并未考慮幀內預測模式的率失真優化計算過程,有待進一步研究以提高幀內預測的編碼速度。
[1] Sullivan G J, Ohm J, Han W J, et al. Overvie w of the High Efficiency Video Coding(HEVC) Standard[J]. IEEE Transactions on Circuits and S ystems for V ideo Technology, 2012, 22(12): 1649-1668.
[2] Wiegand T, Ohm J R, Sullivan G J, et al. Special Section on the Joint Call for Proposals o n High Ef ficiency V ideo Coding(HEVC) Standardization[J]. IEE E T ransactions on Circuits and Sys tems for V ideo Technology, 201 0, 20(12): 1661-1666.
[3] Kim I K, Min J, Lee T, et al. Block Partitioning S tructure in the HEVC S tandard[J]. IEEE T ransactions on Circuits and Systems for Video Technology, 2012, 22(12): 1697-1706.
[4] Lainema J, Bossen F, Ha n W J, et al. Intra Coding of the HEVC S tandard[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2012, 22(12): 1792-1801.
[5] 謝 晶, 賈克斌. 一種基于二維直方圖的H.264/AVC快速幀內預測判決算法[J]. 電子與信息學報, 2005, 27(7): 1053-1057.
[6] 王維哲, 周 兵, 張行進. H.264 編碼中的幀內預測模式選擇算法[J]. 計算機工程, 2008, 34(2): 226-228, 231.
[7] 王啟文, 黃東軍. H.26 4中4×4塊的快速幀內預測算法[J].計算機工程, 2010, 36(2): 217-219.
[8] Pan F, Lin X, Rahardja S, et al. Fast Mode Decision Algorithm for Intra Predict ion in H.264/AVC V ideo Coding[J]. IEEE Transactions on Circuits and Systems for V ideo Technology, 2005, 15(7): 813-822.
[9] Chen Weijing, Su Jia, Li Bin, et al. Reversed Intra Prediction Based on Chroma Extraction In HEVC[C]//Proc. of International Symposium on In telligent Signal Processing and Communications Systems. [S. l.]: IEEE Press, 2011: 1-5.
[10] Cao Xiaoran, Lai Changcai, Wang Yunfei, et al. Short Distance Intra Coding Scheme for HEVC[C]//Proc. of Picture Coding Symposium. [S. l.]: IEEE Press, 2012: 501-504.
[11] Han W J, Min J, Lee T, et al. Improve d Video Compression Efficiency Through Flexible Unit Representation and Corresponding Extension of Coding Tools[J]. IEEE Transactions on Circuits and Systems for V ideo Technology, 2010, 20(12): 1709-1720.
[12] JCT-VC. The Reference Software of HEVC[EB/OL]. (2012-11-10). https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/ tags/HM-8.0.
[13] Bossen F. Common Test Conditions and S oftware Reference Configurations[Z]. 2011.
編輯 顧逸斐
A Fast Mode Decision Algorithm for Intra Prediction in HEVC
LEI Hai-jun1,2,3, WEI Xiong1,2,3, YANG Zhang4, YUAN Mei-leng4
(1. College of Computer Science & Software Engineering, Shenzhen University, Shenzhen 518060, China; 2. Key Laboratory of Affordable High Performance Computer in Guangdong Province, Shenzhen 518060, China; 3. Key Laboratory of Service Computing and Application at Shenzhen, Shenzhen 518060, China; 4. Shenzhen Polytechnic, Shenzhen 518060, China)
High Efficiency Video Coding(HEVC) is a kind of new standard of video coding developed by the Joint Collaborative Team on Video Coding(JCT-VC). For the problem of high computational complexity of intra prediction in HEVC, a fast intra prediction alg orithm based on edge direction detection is pro posed. The proposed method divides 35 intra prediction mo des into 5 sets o f candidate modes according to 5 basic directions, and each set contains 11 intra prediction modes. The edge direction strength of Prediction Unit(PU) in 5 directions are calculated. The proportion of each direction is calcul ated and the candidate modes are selected to set corresponding edge direction with the lar gest proportion as best ca ndidate modes for PU to reduce computational complexity effectively. Experimental results show that the proposed method saves encoding time of 15% and 18% on average compared with HM8.0 in high efficiency and low complexity.
video coding; High Efficiency Video Coding(HEVC) standard; intra prediction; Prediction Unit(PU); mode decision; edge direction detection
10.3969/j.issn.1000-3428.2014.05.056
國家自然科學基金資助項目(60972037);廣東省部產學研基金資助項目(2012B091100495, 2009 B090300267);深圳市基礎研究基金資助項目(JCYJ20120613113419607);深圳大學校重點基金資助項目(2213k3190007)。
雷海軍(1968-),男,副教授,主研方向:圖像處理,網絡多媒體技術;危 雄,碩士研究生;楊 張,碩士;袁梅冷,副教授。
2013-01-28
2013-04-01E-mail:yangzhang120@163.com
1000-3428(2014)05-0270-04
A
TP301.6
·開發研究與工程應用·