徐 寧,殷海兵,郭龍盛
(中國計量學院信息工程學院,浙江杭州310018)
視頻編碼標準H.264/AVC的測試模型采用基于拉普拉斯分布的二次R-Q模型。編碼過程中,通過碼率控制分配編碼比特,獲得量化參數QP,并且獲得率失真參數λ進行率失真優化,而QP和λ是影響視頻編碼效率的關鍵因素。視頻實時傳輸,緩沖區十分有限,幀級碼流控制不能精確控制,宏塊級碼流控制更為精細[1],而進行運動估計、模式選擇需要用到率失真參數λ。因此,R-Q模型宏塊級應用尤為重要。
實驗證明,DCT系數統計概率分布符合一定的概率密度函數,據此建立R-Q模型。早期,學者們認為DCT系數中的AC系數符合高斯分布。后來,學者相繼提出拉普拉斯分布、廣義高斯分布和柯西分布,其中拉普拉斯分布應用廣泛[2]。運用以上這些分布進而推導相應的R-Q模型。
關于R-Q模型的研究很多,文獻[1-2]基于柯西分布提出R-Q模型;文獻[3]提出一種基于拉普拉斯分布的R-Q模型;文獻[4]和文獻[5]分別對文獻[3]中的R-Q模型進行改進、優化。文獻[6]基于文獻[2]提出一種新的R-Q模型;文獻[7]提出一種基于廣義高斯分布的R-Q模型。文獻[8]根據碼率與零值在變換系數量化后所占百分比之間的關系,提出一種新的模型。本文主要對4種主流R-Q模型宏塊級精準度和復雜度進行分析。
運用拉普拉斯分布概率密度函數推導出率失真函數R(D),對其進行泰勒級數展開、簡化得到[3]

式(2)為式(1)的應用

文獻[4]對式(2)進行改進、簡化,得

式中,參數p與編碼幀類型有關。
文獻[2]作者根據柯西分布概率密度函數,理論推導,簡化R-Q模型為

式中,參數p與編碼幀熵值有關。
文獻[7]詳細敘述了此模型,用于編碼比特預測,降低模式選擇復雜度。此模型理論推導與上述模型不同,首先根據廣義高斯分布概率密度函數計算像素點自信息,然后根據塊自信息預測編碼比特,整個過程參數多、運算復雜,即使大部分數值采用查表方式獲得。式(5)是塊自信息與編碼比特之間的表達式

式中,rB代表塊信息量。
對式(2),(3),(4)和(5)4種R-Q模型進行測試、比較。
本節通過實驗對上述4種R-Q模型宏塊級精準度進行分析。MAD model,SATD model,Cauchy model,GGD model分別代表基于拉普拉斯分布的R-Q模型、基于拉普拉斯分布的改進R-Q模型、基于柯西分布的R-Q模型及基于廣義高斯分布的R-Q模型。本實驗采用JM12.0作為測試代碼,測試條件:RDOptimization=1,RateControlEnable=0,SearchRange=16,ProfileIDC=77,NumberReferenceFrames=1。
圖1~4分別表示4種模型誤差分布情況,橫坐標表示預測產生的誤差,縱坐標表示擁有相應誤差的宏塊數目,可以大概看出,較之其他3幅圖,圖3誤差分布范圍窄,精準度高。

圖1 SATD模型誤差分布

實驗分別測試qcif,cif,720p這3種分辨力序列。表1~4給出4種R-Q模型在不同分辨力序列下比較的詳細信息。各表表身第2~5列測試數據是4種模型預測誤差率在20%以內的概率。第2列數據數值比其他3列高,基于廣義高斯分布R-Q模型的精準度之所以如此高,正如第1節所述,此模型依據廣義高斯分布概率密度函數計算像素點自信息,進而預測編碼比特;而其他3種模型的預測是根據相應的概率密度函數,計算熵值(自信息均值),然后預測編碼比特。
各表第6,7列數據分別等于第3,4列數據之差和第4,5列數據之差。從第6列數據來看,基于柯西分布的R-Q模型與基于拉普拉斯分布的R-Q改進模型差別很小,式(3)和式(4)結構相似,但參數賦值不同,式(4)參數是根據已編碼宏塊信息設定,式(3)參數包含當前編碼宏塊復雜度信息SATD,這是式(3)比式(4)精準度高的一個原因。由第7列數據,結合式(2)和式(3),基于拉普拉斯分布的R-Q改進模型,無論從精準度還是復雜度方面,要比之前的模型好。

表1 4種模型的測試數據1(qcif分辨力序列)

表2 4種模型的測試數據2(cif分辨力序列)

表3 4種模型的測試數據3(720p分辨力序列)

表4 4種模型的測試數據4(qcif mobile序列)
表4說明了量化后為零的系數占的比例(percentage of zero)對于R-Q模型精準度的影響。這4行數據是qcif的mobile序列在QP分別為28,32,34,36下的測試數據。從這些數據可以看出,隨著QP的增大,percentage of zero增大,R-Q模型精準度下降。依據建立4種R-Q模型的推導過程,可以認為理論上量化后為零的系數都參與了編碼比特預測,而在實際編碼過程中,并不是所有量化后為零的系數都貢獻編碼比特,為零的系數理論概率值與實際存在差別,因此4種模型的精準度有所下降,但這并不是唯一導致精準度下降的原因。
表1~3中*1、*2和*3行數據分別是qcif,cif和720p測試序列每列數據的均值。從上述3行數據來看,720p測試序列4種模型的預測精準度不及qcif,cif測試序列。這與測試序列內容有關:720p的測試序列視頻內容平坦,無劇烈運動,時間相關性強,因此,量化后為零的系數所占的比例(percentage of zero)較其他2種分辨力測試序列高。
從第2列數據看到,測試序列football的精準度最低,但它的percentage of zero不是最高的,這說明系數為零的比例并不是影響R-Q模型精準度的唯一原因。測試序列football較之其他測試序列,時間相關性不強,場景變化快;而4種R-Q模型參數根據已編碼宏塊信息設定,也就是系數準確度受到時間相關性影響,因此football精準度較之其他測試序列低;這列數據中cif的mobile的精準度最高。此測試序列內容空間復雜度較之其他測試序列高,percentage of zero較之其他測試序列低,實際量化后系數為零的概率與理論值差值小,因此,此測試序列的精準度高。
實驗證明:1)因為上述R-Q模型是由概率密度函數計算自信息或熵值(自信息均值),預測編碼比特數,理論上量化后系數為零的概率與實際概率存在差別,所以存在誤差。2)產生誤差的另外一個原因是,R-Q模型系數準確度的影響。由于上述R-Q模型系數由已編碼宏塊信息設定,因此若測試序列時間相關性不強,則影響到系數準確度,進而影響R-Q模型精準度。
根據R-Q模型結構把4種模型分為兩類:
1)基于廣義高斯分布R-Q模型:此模型參數計算和更新分為自信息參數更新和預測編碼比特參數更新,根據相鄰參考幀內容計算自信息參數更新,而預測編碼比特的參數更新運用線性回歸方法計算。此模型共有18個參數進行計算和更新,每幀自信息參數計算和更新復雜度為16×(1次×指數+1次×對數+2次×除法)運算。每個宏塊的預測編碼比特參數計算和更新復雜度為2×(1次×指數+1次×乘法)運算,此模型精準度高,適合于編碼比特預測,但復雜度高不適合用于碼率控制。
2)其他3種R-Q模型:每種模型只擁有一個計算和更新的參數,當前編碼宏塊采用已編碼幀對應宏塊的參數進行運算、宏塊編碼之后,運用實際編碼比特進行參數更新,每個宏塊預測編碼比特的參數計算和更新復雜度為1×(1次×指數+1次×除法)運算;雖然3種模型精度不及前一種模型,但復雜度低,適合用于碼率控制。
本文對4種R-Q模型宏塊級精準度進行分析。1)分析4種模型的推導過程,基于廣義高斯分布的R-Q模型與其他3種模型推導過程有所區別。因為兩者的用途不同,前者用于編碼比特預測,精準度高,但運算復雜,而后者用于碼率控制進行碼率分配、QP選擇。2)4種R-Q模型產生預測誤差的原因有兩個:(1)DCT系數統計分布中,系數為零的概率理論值與實際的概率不符;(2)R-Q模型參數的準確度受到視頻內容時間相關性影響。
綜合上述分析,R-Q模型精準度受到兩方面因素影響,有待于進一步改進。本文為改進R-Q模型及提出新的R-Q模型和優化碼率控制算法提供了基礎的數據分析,并且將R-Q模型用于模式選擇中編碼比特數預測復雜度過高,需進一步簡化。
[1]SANZ-RODRIGUEZ S,DEL-AMA-ESTEBAN O,DE-FRUTOS-LOPEZ M,et al.Cauchy-density-based basic unit layer rate controller for H.264/AVC[J].IEEE Trans.Circuits Syst.Video Technol.,2010,20(8):1139-1143.
[2]KAMACI N,ALUNBASAK Y,MERSEREAU R M.Frame bit allocation for the H.264/AVC Video coder via cauchy-density-based rate and distortion models[J].IEEE Trans.Circuits Syst.Video Technol.,2005,15(8):994-1005.
[3]CHIANG T,ZHANG Ya-qin.A new rate control scheme using quadratic rate distortion model[J].IEEE Trans.Circuits Syst.Video Technol.,1997,7(1):246-250.
[4]KWON D K,SHEN M Y,KUO C C J.Rate control for H.264 video with enhanced rate and distortion models[J].IEEE Trans.Circuits Syst.Video Technol.,2007,17(5):517-529.
[5]MA Siwei,GAO Wen,LU Yan.Rate-distortion analysis for H.264/AVC video coding and its application to rate control[J].IEEE Trans.Circuits Syst.Video Technol.,2005,15(12):1533-1544.
[6]HU Sudeng,WANG Hanli,KWONG S,et al.Frame level rate control for H.264/AVC with novel rate-quantization model[C]//Proc.IEEE International Conference on Multimedia & Expo.Singapore,2010.[S.l.]:IEEE Press,2010:226-231.
[7]ZHAO Xin,SUN Jun,MA Siwei,et al.Novel statistical modeling,analysis and implementation of rate-distortion estimation for H.264/AVC Coders[J].IEEE Trans.Circuits Syst.Video Technol.,2010,20(5):647-660.
[8]李浩,張穎,張兆揚.一種H.264視頻編碼碼率控制方法[J].電視技術,2003,27(12):10-20.