摘 要:對多描述編碼的實現(xiàn)原理進行了描述,并說明了多描述編碼在視頻領(lǐng)域中的應(yīng)用,對多描述編碼技術(shù)的前景進行了展望。
關(guān)鍵詞:多描述編碼;視頻多描述編碼;圖像編碼
中圖分類號:TP31文獻標(biāo)識碼:A文章編號:1672-3198(2008)04-0275-01
1 多描述編碼原理
多描述編碼假設(shè)在信源和信宿之間有多個信道,一個信源通過多描述編碼器生成多個編碼碼流(每一個碼流稱為一種“描述”),這些同等重要的碼流通過獨立的信道傳送到解碼端,解碼器最少接收0個描述,最多接收n個描述,總共有n種接收情況。顯然接收到的描述數(shù)目不同,解碼器能恢復(fù)的信源程度也不同,當(dāng)所有描述都收到時,能最大限度地恢復(fù)信源,收到的描述越少,恢復(fù)得效果越差。
有關(guān)收到描述與信源失真之間的關(guān)系一直是多描述編碼的難點,在理論上它等價于多用戶的信息率失真問題,但在應(yīng)用中完全由理論指導(dǎo)實踐,還要考慮算法復(fù)雜度、算法效率等實際問題。目前對于兩描述(n=2)的情況,已經(jīng)在理論上取得了一些結(jié)論。
這只是簡單的高斯無記憶信源時的情況,實際的信源比這要復(fù)雜得多,有關(guān)多描述編碼的理論研究工作還一直在進行中。
2 視頻多描述編碼
2.1 多描述量化
多描述量化的基本思想是對一信源使用多個不同的量化過程,產(chǎn)生不同的量化結(jié)果。這種方法的主要問題在于冗余度較高,因此如何設(shè)計出比較好的量化過程,既不會產(chǎn)生很大的冗余,又能達到理想的效果成為關(guān)鍵。
2.2 多描述相關(guān)變換
DCT變換的作用是去相關(guān),但若信源被編碼成多個描述,要從收到的描述中恢復(fù)出丟失的描述就需要這些描述之間有一定的相關(guān)性,因此需引入相關(guān)。設(shè)A、B表示輸入,C、D表示輸出,T是相關(guān)矩陣,則T控制著C、D之間的相關(guān)程度,也控制著多描述相關(guān)變化的冗余度,T要求是可逆的。
2.3 多描述運動矢量
多描述運動矢量指的是將運動矢量包含在不同的描述之中,主要
CD=TAB的問題是當(dāng)某個描述丟失時,如何從已收到的描述中恢復(fù)出丟失的運動矢量。
2.4 多描述時間預(yù)測
利用時間預(yù)測進行多描述編碼,最簡單的方法是將奇偶幀放在不同的描述中,但這種方法會引起編碼效率降低,因為幀之間的間隔變大了,相應(yīng)地幀之間的冗余就減小了,而且這樣做也不利于丟失幀的恢復(fù)。在實際應(yīng)用中需要進行改進。
前面多次提到多描述編碼的一個優(yōu)點是可以提高數(shù)據(jù)可靠性,它的另一優(yōu)點是有利于差錯掩蓋和狀態(tài)恢復(fù)。傳統(tǒng)方法中若某幀丟失,只能用利用丟失幀的前一幀進行恢復(fù),在多描述編碼中,可以得到丟失幀的前后幀,利用這兩幀顯然可以更好地恢復(fù)出丟失幀。狀態(tài)恢復(fù)的問題和運動補償內(nèi)插(MC-I)問題有類似之處,它也是利用前后幀來預(yù)測當(dāng)前幀。運動補償內(nèi)插的許多算法和思想都可以用到狀態(tài)恢復(fù)中來。但它們又是不相同的,MC-I是為了讓觀看效果更好,而狀態(tài)恢復(fù)時為了產(chǎn)生被破壞幀的精確估計,使之作為后繼幀的參考幀。因此對狀態(tài)恢復(fù)來說,預(yù)測精度相比視覺效果而言是更重要的。多描述編碼的優(yōu)點還包括:多描述編碼系統(tǒng)可以獲得較高的壓縮效率,同常規(guī)的單描述符(SD,single description)壓縮原理相比,它壓縮所得的總比特率只比后者略高;多描述編碼系統(tǒng)可以在支持不同比特率的路徑上成功運行,MPEG-4 V2(具備NEWPRED功能)、H.263V2(具備RPS功能)和H.264/AVC,這些視頻編碼標(biāo)準(zhǔn)的增強層都支持多描述編碼。
3 多描述編碼的研究展望
多描述編碼問題雖然早在20世紀70年代就被Bell實驗室提出,但是真正研究的時間還是近十年,多描述編碼已經(jīng)得到了很多非常有意義的結(jié)果,有了很多構(gòu)造編碼器的有效算法,其理論已經(jīng)達到了一定的深度。由于其研究難度以及相關(guān)技術(shù)的不斷發(fā)展,目前還存在一些需要進一步研究的問題。主要有以下幾個方面:
(1)理論上有待研究的工作。首先是率失真區(qū)域的研究,到目前為止,在多描述編碼中,我們所完全知道的可達到的率失真區(qū)域僅僅是在無記憶高斯源在MSE失真下的率失真區(qū)域。其次是多描述的推廣,到目前為止,人們只對兩個信道的情況給出了較為充分的理論分析用于指導(dǎo)具體系統(tǒng)的設(shè)計,而對于多個信道,目前只有一些具體算法的提出,對最終系統(tǒng)的性能實際上并沒有具體的分析。
(2)基于ROI的多描述編碼。假如不考慮圖像中不同內(nèi)容對圖像的不同重要性而同等對待,必然會降低編碼效率。為此,可以將感興趣區(qū)域(ROI)與多描述編碼結(jié)合起來,對ROI分配更大的冗余或使其比特率在整個描述中所占的比重加大。雖然現(xiàn)在已經(jīng)有了一些文獻在多描述編碼問題中考慮了ROI的編碼,但是研究得還是非常不夠。
(3)信道自適應(yīng)得多描述編碼。若從信道角度出發(fā),可以將多描述編碼分為三種類型:針對理想的MD信道,針對丟包率固定的、信道容量固定的Erasure信道,針對信道狀況(信道容量、丟包率等)不穩(wěn)定的刪除信道。而多描述實際應(yīng)用的信道是狀況不穩(wěn)定的刪除信道。為此就需設(shè)計信道自適應(yīng)得多描述編碼,它能根據(jù)信道的狀況來調(diào)節(jié)系統(tǒng)的冗余度,使系統(tǒng)的性能達到最優(yōu)。但是,常見的所描述編碼方法很難做到自適應(yīng)地調(diào)節(jié)冗余度。
(4)多描述解碼器相關(guān)技術(shù)的研究。多描述解碼器相關(guān)技術(shù)的研究可以分為兩個方面:根據(jù)解碼端所采用的差錯掩蓋技術(shù)來指導(dǎo)多描述編碼器的設(shè)計,或者根據(jù)所使用的差錯掩蓋技術(shù)來指導(dǎo)編碼端冗余的添加;多描述編碼的解碼,如何利用兩個描述所提供的信息來得到一個高質(zhì)量的重建圖像
(5)實際編碼系統(tǒng)的構(gòu)造。
現(xiàn)有的多描述編碼器主要是基于JPEG的編碼器,即主要的研究是集中在靜止圖像上的編碼。如何將多描述編碼和視頻編碼結(jié)合起來是一個難題,雖然現(xiàn)在已經(jīng)有了一些新的文獻研究視頻的所描述編碼問題,但多數(shù)方法效果不佳,或者實現(xiàn)起來過于復(fù)雜。
參考文獻
[1]Vivek k Goyal.Multiple Description Coding:Compression Meets the Network[J].IEEE Signal Processing Magazin,2001;9.
[2]YaoWang,Amy R. Reibman,Shunan Lin.Multiple Description Coding for Video Delivery[J].Processing of the IEEE, VOL. 93,NO.1, JANUARY,2005.
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。