郭龍盛,殷海兵,徐 寧
(中國計量學院信息工程學院,浙江 杭州 310018)
隨著視頻技術的發展,一系列的視頻編碼標準相繼出現,H.264/AVC是目前最成熟的視頻編碼標準。在視頻編碼過程中,碼率控制和模式選擇已經成為一個研究熱點。碼率控制即通過R-D模型來選擇量化參數,分配編碼比特。R-D模型通常包括R-Q模型和D-Q模型,本文主要對D-Q模型進行深入研究。
近幾年來,一些學者專家基于DCT系數分布模型提出了許多D-Q模型。文獻[1]基于柯西分布提出D-Q模型;文獻[2-3]提出一種基于拉普拉斯分布的D-Q模型;文獻[4]提出一種基于廣義高斯分布的D-Q模型,文獻[5]對基于柯西的D-Q模型進行了改進,文獻[6]基于這些失真模型總結了其在率失真模型中的應用。面對這些主流的D-Q模型,有必要對其進行精確度和復雜度的比較,分析其優缺點,目的是在此基礎上對D-Q模型加以改進。
本節將簡單介紹目前幾種主流的D-Q模型,包括基于拉普拉斯分布、柯西分布、廣義高斯分布的D-Q模型。
文獻[2]中基于拉普拉斯分布提出了估計編碼失真的方法,公式為

式中:β是一個模型參數;p與編碼幀類型有關。
文獻[1]根據柯西分布概率密度函數,通過理論推導簡化了D-Q模型

式中,參數b與編碼幀熵值有關。
文獻[7]根據QP和PSNR的關系推導出了一個新的D-Q模型

趙欣等人在文獻[4]中提出了一個新的D-Q模型

本節通過實驗對上述4種D-Q模型幀級精準度進行分析。Model SATD,Model Cauchy,Model MSW,Model GGD分別代表上節中公式(1)(2)(3)(4)的模型。由于篇幅限制,只給出了對Foreman和Bus序列的測試(筆者已經證實對其他序列的測試也有相同結果),如圖1所示。

圖1 幀級D-Q模型精確度的比較
由圖可見,Model GGD可以較好地估計出實際失真,但復雜度也是最高的,對于硬件實現是一個比較大的挑戰。從上節中的4個公式也可發現,Model Cauchy的復雜度是最低的。
由于宏塊級的D-Q模型對碼率控制和模式選擇而言非常重要,因此有必要對宏塊級的D-Q模型進行研究,為了比較宏塊級D-Q模型的精確度,筆者做了大量實驗。如圖2所示,橫坐標表示用模型估計出的失真和實際失真的差值(error),縱坐標表示宏塊的數目(nMB),在橫坐標為0附近的時候,縱坐標的值越高,說明了該模型的精確度越高。該實驗的測試環境是foreman和football序列,QP值為36。可見,在foreman序列中,基于柯西分布的D-Q模型精確度是最高的;在football序列中,Model Cauchy的精確度要略低于其他D-Q模型,但其復雜度最低。

圖2 宏塊級D-Q模型精確度的比較
在對幾種主流D-Q模型的精確度進行比較之后,下面將對基于柯西分布的D-Q模型加以改進,以提高其精確度。
如式(2)所示,基于柯西分布的D-Q模型中有兩個參數——b和β,它的參數更新是根據前一幀相同位置塊的實際失真來計算當前塊的參數。眾所周知,相鄰幀里的宏塊由于運動會發生位移,直接采用前一幀相同位置的宏塊來計算當前參數會產生誤差,因此,本文提出了一種基于運動補償的D-Q模型,即通過補償后的參考幀來預測當前塊的模型參數。結果如圖3所示,橫坐標表示宏塊實際失真和模型估計得出的失真的差值,縱坐標表示宏塊個數,本實驗的測試序列是foreman序列,圖3a和圖3c是原始柯西模型的結果,圖3b和圖3d是改進后模型的結果,可見改進后的模型明顯要比原始模型的精確度要高。為了更加清楚地對這兩個模型精確度進行比較,在表1中列出不同序列、不同QP下計算得到

式中:distortion_a(i)和distortion_a(i)分別代表實際失真和模型估計的失真。

圖3 改進后的模型和原始D-Q模型精確度的比較

表1 原始柯西模型和改進后模型error_rate的比較
本文介紹了目前主流的幾種D-Q模型,并且從宏塊級和幀級進行了精確度的比較,在宏塊級中,針對不同的序列,各模型有不同的性能,當視頻運動信息比較少的時候,基于柯西分布的D-Q模型精確度較高,當視頻運動比較復雜的時候,趙欣等人提出的模型精確度較高;在幀級中,公式(4)中的模型精確度較高。然后在基于柯西分布的D-Q模型基礎上加以改進,提高了模型精確度。
由于D-Q模型的復雜度和數據依賴關系,在硬件中實現是一個較大的挑戰。在以后的工作中,將重點研究適用于硬件實現的D-Q模型。
[1]KAMACI N,ALTUNBASAK Y,MERSEREAU R M.Frame bit allocation for the H.264/AVC video coder via cauchy-density-based rate and distortion models[J].IEEE Trans.Circuits Syst.Video Technol.,2005,15(8):994-1006.
[2]KWON D-K,SHEN Mei-yin,KUO C-C J.Rate control for H.264 video with enhanced rate and distortion models[J].IEEE Trans.Circuits Syst.Video Technol.,2007,17(5):517-529.
[3]GUO Liwei.A novel analytic quantization-distortion model for hybrid video coding[J].IEEE Trans.Circuits Syst.Video Technol.,2009,19(5):627-641.
[4]ZHAO Xin,SUN Jun,MA Siwei,et al.Novel statistical modeling,analysis and implementation of rate-distortion estimation for H.264/AVC coders[J].IEEE Trans.Circuits Syst.Video Technol.,2010,20(5):647-660.
[5]HU Sudeng,WANG Hanli,KWONG S,et al.Rate control optimization for temporal-layer scalable video coding[J].IEEE Trans.Circuits Syst.Video Technol.,2011,21(8):1152-1162.
[6]馬宏興,張伶.H.264/AVC率失真優化技術綜述[J].電視技術,2010,34(6):19-22.
[7]MA Siwei,GAO Wen,LU Yan.Rate-distortion analysis for H.264/AVC video coding and its application to rate control[J].IEEE Trans.Circuits Syst.Video Technol.,2005,15(12):1533-1544.