多描述編碼的原理及其應(yīng)用

2008-01-01 00:00:00吳際忠

現(xiàn)代商貿(mào)工業(yè) 2008年4期

摘要：對多描述編碼的實現(xiàn)原理進行了描述，并說明了多描述編碼在視頻領(lǐng)域中的應(yīng)用，對多描述編碼技術(shù)的前景進行了展望。

關(guān)鍵詞：多描述編碼；視頻多描述編碼；圖像編碼

中圖分類號：TP31文獻標(biāo)識碼：A文章編號：1672-3198（2008）04-0275-01

1 多描述編碼原理

多描述編碼假設(shè)在信源和信宿之間有多個信道，一個信源通過多描述編碼器生成多個編碼碼流（每一個碼流稱為一種“描述”），這些同等重要的碼流通過獨立的信道傳送到解碼端，解碼器最少接收0個描述，最多接收n個描述，總共有n種接收情況。顯然接收到的描述數(shù)目不同，解碼器能恢復(fù)的信源程度也不同，當(dāng)所有描述都收到時，能最大限度地恢復(fù)信源，收到的描述越少，恢復(fù)得效果越差。

有關(guān)收到描述與信源失真之間的關(guān)系一直是多描述編碼的難點，在理論上它等價于多用戶的信息率失真問題，但在應(yīng)用中完全由理論指導(dǎo)實踐，還要考慮算法復(fù)雜度、算法效率等實際問題。目前對于兩描述（n=2）的情況，已經(jīng)在理論上取得了一些結(jié)論。

這只是簡單的高斯無記憶信源時的情況，實際的信源比這要復(fù)雜得多，有關(guān)多描述編碼的理論研究工作還一直在進行中。

2 視頻多描述編碼

2.1 多描述量化

多描述量化的基本思想是對一信源使用多個不同的量化過程，產(chǎn)生不同的量化結(jié)果。這種方法的主要問題在于冗余度較高，因此如何設(shè)計出比較好的量化過程，既不會產(chǎn)生很大的冗余，又能達到理想的效果成為關(guān)鍵。

2.2 多描述相關(guān)變換

DCT變換的作用是去相關(guān)，但若信源被編碼成多個描述，要從收到的描述中恢復(fù)出丟失的描述就需要這些描述之間有一定的相關(guān)性，因此需引入相關(guān)。設(shè)A、B表示輸入，C、D表示輸出，T是相關(guān)矩陣，則T控制著C、D之間的相關(guān)程度，也控制著多描述相關(guān)變化的冗余度，T要求是可逆的。

2.3 多描述運動矢量

多描述運動矢量指的是將運動矢量包含在不同的描述之中，主要

CD=TAB的問題是當(dāng)某個描述丟失時，如何從已收到的描述中恢復(fù)出丟失的運動矢量。

2.4 多描述時間預(yù)測

利用時間預(yù)測進行多描述編碼，最簡單的方法是將奇偶幀放在不同的描述中，但這種方法會引起編碼效率降低，因為幀之間的間隔變大了，相應(yīng)地幀之間的冗余就減小了，而且這樣做也不利于丟失幀的恢復(fù)。在實際應(yīng)用中需要進行改進。

前面多次提到多描述編碼的一個優(yōu)點是可以提高數(shù)據(jù)可靠性，它的另一優(yōu)點是有利于差錯掩蓋和狀態(tài)恢復(fù)。傳統(tǒng)方法中若某幀丟失，只能用利用丟失幀的前一幀進行恢復(fù)，在多描述編碼中，可以得到丟失幀的前后幀，利用這兩幀顯然可以更好地恢復(fù)出丟失幀。狀態(tài)恢復(fù)的問題和運動補償內(nèi)插（MC-I）問題有類似之處，它也是利用前后幀來預(yù)測當(dāng)前幀。運動補償內(nèi)插的許多算法和思想都可以用到狀態(tài)恢復(fù)中來。但它們又是不相同的，MC-I是為了讓觀看效果更好，而狀態(tài)恢復(fù)時為了產(chǎn)生被破壞幀的精確估計，使之作為后繼幀的參考幀。因此對狀態(tài)恢復(fù)來說，預(yù)測精度相比視覺效果而言是更重要的。多描述編碼的優(yōu)點還包括：多描述編碼系統(tǒng)可以獲得較高的壓縮效率，同常規(guī)的單描述符（SD，single description）壓縮原理相比，它壓縮所得的總比特率只比后者略高；多描述編碼系統(tǒng)可以在支持不同比特率的路徑上成功運行，MPEG-4 V2（具備NEWPRED功能）、H.263V2（具備RPS功能）和H.264/AVC，這些視頻編碼標(biāo)準(zhǔn)的增強層都支持多描述編碼。

3 多描述編碼的研究展望

多描述編碼問題雖然早在20世紀70年代就被Bell實驗室提出，但是真正研究的時間還是近十年，多描述編碼已經(jīng)得到了很多非常有意義的結(jié)果，有了很多構(gòu)造編碼器的有效算法，其理論已經(jīng)達到了一定的深度。由于其研究難度以及相關(guān)技術(shù)的不斷發(fā)展，目前還存在一些需要進一步研究的問題。主要有以下幾個方面：

（1）理論上有待研究的工作。首先是率失真區(qū)域的研究，到目前為止，在多描述編碼中，我們所完全知道的可達到的率失真區(qū)域僅僅是在無記憶高斯源在MSE失真下的率失真區(qū)域。其次是多描述的推廣，到目前為止，人們只對兩個信道的情況給出了較為充分的理論分析用于指導(dǎo)具體系統(tǒng)的設(shè)計，而對于多個信道，目前只有一些具體算法的提出，對最終系統(tǒng)的性能實際上并沒有具體的分析。

（2）基于ROI的多描述編碼。假如不考慮圖像中不同內(nèi)容對圖像的不同重要性而同等對待，必然會降低編碼效率。為此，可以將感興趣區(qū)域（ROI）與多描述編碼結(jié)合起來，對ROI分配更大的冗余或使其比特率在整個描述中所占的比重加大。雖然現(xiàn)在已經(jīng)有了一些文獻在多描述編碼問題中考慮了ROI的編碼，但是研究得還是非常不夠。

（3）信道自適應(yīng)得多描述編碼。若從信道角度出發(fā)，可以將多描述編碼分為三種類型：針對理想的MD信道，針對丟包率固定的、信道容量固定的Erasure信道，針對信道狀況（信道容量、丟包率等）不穩(wěn)定的刪除信道。而多描述實際應(yīng)用的信道是狀況不穩(wěn)定的刪除信道。為此就需設(shè)計信道自適應(yīng)得多描述編碼，它能根據(jù)信道的狀況來調(diào)節(jié)系統(tǒng)的冗余度，使系統(tǒng)的性能達到最優(yōu)。但是，常見的所描述編碼方法很難做到自適應(yīng)地調(diào)節(jié)冗余度。

（4）多描述解碼器相關(guān)技術(shù)的研究。多描述解碼器相關(guān)技術(shù)的研究可以分為兩個方面：根據(jù)解碼端所采用的差錯掩蓋技術(shù)來指導(dǎo)多描述編碼器的設(shè)計，或者根據(jù)所使用的差錯掩蓋技術(shù)來指導(dǎo)編碼端冗余的添加；多描述編碼的解碼，如何利用兩個描述所提供的信息來得到一個高質(zhì)量的重建圖像

（5）實際編碼系統(tǒng)的構(gòu)造。

現(xiàn)有的多描述編碼器主要是基于JPEG的編碼器，即主要的研究是集中在靜止圖像上的編碼。如何將多描述編碼和視頻編碼結(jié)合起來是一個難題，雖然現(xiàn)在已經(jīng)有了一些新的文獻研究視頻的所描述編碼問題，但多數(shù)方法效果不佳，或者實現(xiàn)起來過于復(fù)雜。

參考文獻

［1］Vivek k Goyal.Multiple Description Coding：Compression Meets the Network［J］.IEEE Signal Processing Magazin，2001；9.

［2］YaoWang，Amy R. Reibman，Shunan Lin.Multiple Description Coding for Video Delivery［J］.Processing of the IEEE， VOL. 93，NO.1， JANUARY，2005.

注：本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。

現(xiàn)代商貿(mào)工業(yè)2008年4期

現(xiàn)代商貿(mào)工業(yè)的其它文章: 城市給水管網(wǎng)改造探析; 樹根樁在復(fù)合地基（深層攪拌樁）工程中的補救應(yīng)用; 燃料電池技術(shù)的研究現(xiàn)狀及展望; 工裝設(shè)計中的一些技巧; ＮＲＦ９０５無線收發(fā)芯片原理及設(shè)計實現(xiàn); 連續(xù)剛構(gòu)橋合攏段施工和技術(shù)要點