摘要:為了降低H.264編碼器的計算復雜度,提出了一種快速幀間模式選擇算法。該算法利用宏塊的圖像內容特征和量化參數(shù),對宏塊幀間編碼模式進行預選擇,從而有效跳過不必要的幀間預測待選模式,提高了編碼速度。實驗結果表明,該算法在保持圖像質量和碼率變化很小的前提下,平均編碼時間減少了39.14%。
關鍵詞:H.264; 率失真優(yōu)化; 幀間模式選擇
中圖分類號:TP391文獻標志碼:A
文章編號:1001-3695(2008)01-0283-02
新一代視頻編碼標準H.264/AVC[1]采用了一系列先進的視頻編碼技術,與以往標準相比極大地提高了編碼效率和圖像質量。其中最重要的一項技術是可變塊的運動估計和補償,對每一個宏塊有7種幀間劃分模式(16×16、16×8、8×16、8×8、8×4、4×8、4×4),13種幀內預測模式和1種skip/direct模式。在對圖像進行幀間編碼時,對每一個宏塊,H.264需要遍歷所有的幀內和幀間編碼模式,運用率失真優(yōu)化(RDO)方法[2]計算各種宏塊模式的編碼代價(RDCost),并選擇最小代價的宏塊模式為最優(yōu)編碼模式。采用該技術雖然能很好地提高壓縮效率,但同時增加了編碼器的計算復雜度。
為了降低H.264編碼器的計算復雜度,許多學者提出了大量的幀內和幀間模式選擇算法[3~5]。例如,文獻[3]直接利用空間域的特征,根據(jù)邊界方向直方圖(edge direction histogram)預先排除一些可能性小的預測模式,減少了幀內預測的復雜度。文獻[4]通過對原始圖像下采樣得到的1/2分辨率圖像進行預編碼,提出了快速的幀間模式選擇算法。但這些算法沒有對P幀中幀內預測模式進行預選擇。然而,幀內模式的統(tǒng)計數(shù)據(jù)[6]顯示:盡管P條帶中宏塊采用幀內編碼的準確概率依賴于特定輸入視頻序列的特征,但在P條帶中宏塊采用幀內編碼的最大概率為0.09,平均概率為0.03。而花費在幀內模式選擇上的計算量大約為幀間預測模式的五倍[5]。因此,在P條帶中提前預測宏塊編碼是否采用幀內模式,可以大大降低編碼的計算復雜度。
本文考慮到圖像內容特征(運動和細節(jié)信息)以及宏塊編碼用到的量化參數(shù),提出了一種快速幀間模式選擇算法。
1快速幀間模式選擇算法
本文提出的快速幀間模式選擇算法分為三步:a)對待編碼宏塊進行跳過模式(skip)的早期判定;b)利用待編碼宏塊的運動信息來預先決定宏塊編碼是否采用幀內模式;c)利用宏塊的細節(jié)特征,對幀間編碼模式子集進行進一步的刪選。
1.1Skip模式的早期判定
在P幀中,宏塊采用skip模式編碼的概率非常大,如果能預先確定宏塊編碼采用skip模式,則可以跳過對該宏塊其他編碼模式的RDCost計算,節(jié)省大量的編碼計算量。由于標準規(guī)定,采用skip模式進行編碼必須同時符合以下四個條件:最好的運動補償塊尺寸為16×16;參考幀為前一幀;運動矢量即為預測運動矢量;變換系數(shù)量化后均為0。
在判斷時,首先檢測16×16塊的運動矢量和參考幀,然后計算該塊的RDCost。一旦滿足上述四個條件,則停止計算其他模式的RDCost,并把skip模式作為最佳編碼模式。
1.2P條帶宏塊幀內編碼模式預判定
為了獲得較高的編碼效率,H.264在P條帶中允許使用幀內編碼模式,宏塊編碼時不僅要遍歷所有幀間預測模式,還要遍歷所有的幀內預測模式(九種Intra_4×4模式和四種Intra_16×16預測模式)。圖1為宏塊編碼時模式選擇的最大RDCost計算量。
從圖1中可以看出,在P條帶中,對每一個宏塊編碼時,花費在幀內模式選擇上的計算量大約為幀間預測模式的五倍。然而宏塊采用幀內編碼的概率非常小。如果能預先判定宏塊編碼時采用幀間編碼模式,就可以不對幀內編碼模式進行檢測,大大節(jié)省了編碼時間。
(a) 幀間預測模式(b) 幀內預測模式圖1宏塊模式選擇的最大RDCost計算量
1)根據(jù)圖像運動特性進行預選擇
圖像采用的編碼模式與其內容有很大的關系,一般來說,靜止區(qū)域和慢運動區(qū)域(稱為背景區(qū)域)采用匹配塊較大的幀間編碼模式的概率就較大;反之,運動劇烈且包含細節(jié)多的區(qū)域 (稱為運動區(qū)域) 采用幀內編碼模式和匹配塊較小的幀間編碼模式的概率就較大。
3結束語
本文基于圖像的內容特征(運動信息和細節(jié)特征)以及宏塊的量化參數(shù),提出了一種快速幀間模式選擇算法。該算法能有效跳過一些不必要的宏塊待選預測模式,大大降低編碼器的計算復雜度。在對圖像質量損失很小,比特率變化不大的條件下,該算法最多能節(jié)省43.13%的計算時間。該算法的計算量小、簡單可行,適合于實際應用。
參考文獻:
[1]Joint Video Team (JVT) of ISOIIEC MPEG ITU T VCBG. Draft ITU T recommendation and final draft international standard of joint video specification. JVT G050[S]. 2003.
[2]段大高,崔巖松,鄧中亮. H.264的幀間宏塊模式選擇算法[J]. 現(xiàn)代有線傳輸, 2004 (3):77-79.
[3]PAN F, LIN X, SUSANTO R, et al. Fast mode decision for intra prediction[C]//Proc of 7th Meeting,Joint Video Team (JVT) of ISO/IEC MPEG and ITU T VCEG, JVT G013. 2003.
[4]ZHU Dong dong, DAI Qiong hai. Algorithm of H.264 speed interframe coding mode selection[J].CATV Technology, 2004(9):36-40.
[5]LEE J, JEON B. Fast mode decision for H.264[C]//Proc of IEEE International Conference on Consumer Electronics Digest of Technical Papers International Conference on Consumer Electronics.2006:33-34.
[6]LEE J, JEON B. Pruned mode decision based on variable block sizes motion compensation for H.264 [C]//Proc of Multimedia Interactive Protocols and Systems (MIPS). 2003:410-418.
[7]WU D,WU S, LIM. Block inter mode decision for fast encoding of H.264[C]//Proc of 2004 IEEE International Conference on Acoustics, Speech, and Signal Processing. Montreal:[s.n.], 2004:181.
[8]Joint Video Team (JVT) Reference Software[EB/OL]. http://bs.hhi.de/~suehring/tml/download/.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”