摘要:運動估計技術(shù)作為影響整體壓縮速度的關(guān)鍵過程,一直是視頻研究的重點。文章通過相鄰宏塊間運動向量的相關(guān)性與殘差值的相似性,采用不同的搜索模板,在大幅度減少運算時間的情況下保持了與高精度搜索算法相同的搜索精度。關(guān)鍵詞:視頻壓縮;運動估計;搜索模板;殘差值
0引言
評價視頻壓縮技術(shù)的最關(guān)鍵指標就是清晰度、壓縮率和計算的復(fù)雜度。對于新一代的數(shù)字電視,也稱作高清數(shù)字電視,圖像的質(zhì)量是第一重要的。另外,現(xiàn)在電視頻道和電視節(jié)目的數(shù)量都大幅度地增長,自然大大加重廣播網(wǎng)絡(luò)的負載,如何提高壓縮率減少帶寬就成了另一個需要重點考慮的問題。此外,為了節(jié)省電視節(jié)目的制作成本,視頻的壓縮設(shè)備都會盡量采用低廉的硬件,所以壓縮算法也要盡量簡單。
在視頻壓縮中,采用運動估計的方法提取時域上的冗余度對壓縮率的貢獻最為重要,但同時運動估計也是計算量需求最大的部分,因此出現(xiàn)了許多優(yōu)秀的快速運動估計算法,也叫運動搜索算法。它們大致可以分為兩類:一類是簡單預(yù)測點方法。因為這類算法實現(xiàn)比較簡單,需要的硬件配置要求不高,所以都應(yīng)用在視頻會議,可視電話等領(lǐng)域。另一類是高精度的搜索方法。主要適用于高碼率和高清晰的廣播領(lǐng)域,如高清電視,DVD等。這類應(yīng)用對圖像的質(zhì)量要求十分嚴格,因此相應(yīng)的算法在簡單預(yù)測點方法的基礎(chǔ)上增加了許多不同的搜索模板,用以減少搜索中止在局部最優(yōu)位置的可能性。
1基于殘差值的運動估計策略
簡單的快速算法屬于基于預(yù)測點的搜索算法。這類算法是在搜索區(qū)域中,有條件地選定幾個位置作為初始的搜索位置,這些被選中的初始搜索位置也叫作預(yù)測點,然后在這些預(yù)測點上應(yīng)用一些簡單的搜索模板,如鉆石型,方型和六角型進行搜索。圖1就是這類算法的一個示例。

這類算法搜索成敗的關(guān)鍵就是預(yù)測點的選擇。當前最常使用的預(yù)測點分兩類。一類利用運動向量空間相鄰性,把左、左上、上和右上宏塊的運動向量以及它們的中值運動向量作為預(yù)測點。另一類利用了運動向量的時間相鄰性,把前后相鄰幀的運動向量作為預(yù)測點。這種基于預(yù)測點的搜索方法執(zhí)行速度是十分快的,可以把每個運動向量的搜索位置控制在10左右。
但有三種情況大大地影響這種簡單搜索方法的精度。首先,如果當前的運動向量與相鄰的運動向量都沒有關(guān)聯(lián),而預(yù)測點與實際的運動向量相差甚遠,簡單的搜索方法很容易就會中止在某一個局部最優(yōu)的位置上。這種情況經(jīng)常發(fā)生在視頻場景切換的時候。其次,采用基于預(yù)測點的搜索方法,位于圖像邊緣的運動向量在極大程度上會影響所有運動向量的搜索。因為視頻編碼通常是采用光柵掃描的順序,由上自下逐行掃描,頂行的運動向量和最左列的運動向量都直接或間接地成為其余運動向量的預(yù)測點,這些基本預(yù)測點的精度同時也影響了其余運動向量的精度。第三,對特征不明顯的宏塊進行搜索,例如一堵墻或一塊布,不同位置所得到的殘差值都是十分接近的,所以在這些位置上搜索出來的運動向量有一定的混亂性,利用它們作為其他運動向量的預(yù)測點是非常不適當?shù)摹?/p>
為了解決上述三個問題,本文提出一種自適應(yīng)搜索模板的運動估計算法。雖然簡單快速算法利用了時間和空間上相鄰運動向量之間的相關(guān)性,但通過實驗發(fā)現(xiàn),相鄰宏塊之間的殘差值也有很強的相關(guān)性,同時,宏塊間的運動向量越接近,宏塊與宏塊間的殘差值也會越相近。根據(jù)這個特性,在運動估計的過程中,可以通過比較當前位置的殘差值與相鄰宏塊的殘差值來判斷當前運動向量是否是最終的運動向量。另外,通過殘差值的相關(guān)性還可以決定當前使用的搜索模板,當殘差相關(guān)性低的時候,就采用復(fù)雜的搜索模板,反之,當殘差相關(guān)性高的時候就采用較為簡單的搜索模板。這樣就可以防止在使用小模板搜索時最終的運動向量落在局部最優(yōu)的位置上。
2實驗結(jié)果

本文使用的測試平臺是H.264的參考模型(JM)10.2,其中除了第一幀為I幀外,余下的都作為P幀。幀內(nèi)的運動預(yù)測使用了JM中提供的快速算法。運動預(yù)測范圍是±8像素,不使用哈達瑪變換,并且應(yīng)用了快速的率失真優(yōu)化的快速選項。參考幀的數(shù)目為JM中可以選擇的最大數(shù)目——5幀,幀間的運動預(yù)測只使用16×16的模式。編碼方式采用上下文自適應(yīng)算術(shù)編碼方式,運動向量的精度為1/4像素。表l提供了本文算法與H.264 JM中三種運動估計算法:Full Search,UMHexagonS,EPZS比較的結(jié)果。
從表l的數(shù)據(jù)可以看出,本文的算法在信噪比和碼率基本不變的情況下,速度比JM提供的標準算法有很大的提高。
3結(jié)束語
本文通過分析簡單搜索算法的不足之處,提出了一種自適應(yīng)搜索模板的運動估計策略。這種方法通過結(jié)合運動向量與殘差值之間的相關(guān)性,根據(jù)視頻的內(nèi)容自動調(diào)整搜索所需要模板的復(fù)雜度,克服了單一采用固定方式進行運動估計的缺點,在準確度上接近于高精度算法,而在運算速度上接近于簡單算法。實驗表明,本文提出的基于殘差值的運動估計方法,在相同碼率和相同質(zhì)量的情況下,能比其它算法大大節(jié)省搜索時間。
(注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。)