[摘要] 隨著多媒體技術的迅速發(fā)展,數(shù)字圖像壓縮編碼技術也受到了越來越多的關注,其在現(xiàn)代多媒體通信中的核心地位日漸突出。本文主要闡述兩種圖像編碼方式:JPEG方式和MPEG方式。
[關鍵詞] 圖像壓縮 編碼 JPEG MPEG
由于數(shù)字圖像信息包含二維或三維空間上的擴展信息或時間變化的信息,所以其數(shù)據(jù)量是非常龐大的。而在現(xiàn)實中能利用的信道和存儲媒體中,受其通信和存儲的容量或速度制約,是無法自由地傳送和存儲龐大的數(shù)字圖像。因此,需要在保持原圖像中包含的本質(zhì)信息的基礎上,對通信和存儲時必需的數(shù)據(jù)進行壓縮。圖像壓縮的目的就是把原來較大的圖像用盡量少的字節(jié)表示和傳輸,并且要求復原圖像有較好的質(zhì)量。利用圖像壓縮,可以減輕圖像存儲和傳輸?shù)呢摀箞D像在網(wǎng)絡上實現(xiàn)快速傳輸和實時處理。本文對當前多媒體中應用最為廣泛的圖像壓縮編碼方式:JPEG、MPEG進行闡述。
一、JPEG——靜態(tài)圖像壓縮編碼方式
對灰度或彩色靜止圖像的壓縮編碼方式就是JPEG標準。JPEG系統(tǒng)可分為基本系統(tǒng)和擴充系統(tǒng)兩種:基本系統(tǒng)由基于DCT(離散余弦變換)和Huffman編碼組成,所有符合JPEG標準的設備必須符合基本系統(tǒng);擴充系統(tǒng)提供不同的選擇,除基本系統(tǒng)之外,還提供其他編碼方式,如,漸進型編碼、算術碼、無失真編碼、分層編碼等。
基于DCT(離散余弦變換)的有損壓縮算法,一般情況下能把數(shù)據(jù)量壓縮到1/10~1/20的程度而重建的圖像質(zhì)量達到人眼難以觀察出來的要求,因此這種算法得到了廣泛的應用。基于DCT的JPEG方式的基本結構如圖1所示。
其基本原理是在Y(亮度信號),Gr(色差信號),Cb(各種圖像)時,利用人眼視覺特性,把Gr、Cb變成Y的1/2×1/2的分辨率后進行編碼。 編碼時首先將輸入圖像分割成8×8相素的矩形塊,并以塊為單位計算DCT。對DCT變換后的數(shù)據(jù),分別進行符合直流、交流成分性質(zhì)的量化,量化時的步幅,與各系數(shù)對應地以量化表的形式給出。然后用預編碼、游程編碼和熵編碼對量化后的系數(shù)進行編碼,對直流分量JPEG并不進行直接編碼,它采用差分編碼方法;對交流分量JPEG用Z形曲折掃描將二維DCT系數(shù)組成“0行程/非0值”,再進行Huffman編碼。編碼后得到壓縮數(shù)據(jù),最后將色彩分量信息、量化表、編碼表和各個色彩分量的壓縮數(shù)據(jù)等混合成一個整體數(shù)據(jù)流,即形成JPEG文件。解碼的過程是編碼的逆過程。解碼時,JPEG解碼器先從數(shù)據(jù)流中獲取解碼所必須的信息(色彩分量信息、量化表和編碼表等),然后將各個色彩分量分別解碼,最后顯示解碼后的圖像數(shù)據(jù)。
JPEG是一種可逆的壓縮方式,從算法過程來看,它的優(yōu)點是:圖像質(zhì)量和壓縮比可調(diào)節(jié),可以根據(jù)需要折中。壓縮時選擇的壓縮比越高,所需要的存儲空間越少,還原后得到的圖像質(zhì)量越差;反之,如果壓縮比選的越低,所需要的存儲空間越大,還原后的圖像質(zhì)量越高。還有,JPEG圖像文件比較小,而圖像文件越小越節(jié)省磁盤空間,從網(wǎng)上下載時也就越節(jié)省時間。在再現(xiàn)照片、自然景觀等方面表現(xiàn)出色。其缺點是對處理文字、簡單卡通圖片、線描繪圖等方面表現(xiàn)不佳。另外它僅能處理靜態(tài)圖片,不能處理活動影象,是一種有損壓縮,壓縮后的圖像無法還原。盡管JPEG也有無損壓縮的幾何算法,但壓縮比越大,丟失的信息就越多。因此,JPEG僅適合壓縮供人欣賞而不是供數(shù)據(jù)分析的圖像。
JPEG 專家組于2000年推出了JPEG 2000編碼標準。JPEG 2000與傳統(tǒng)JPEG最大的不同是它放棄了JPEG所采用的以DCT為核心的編碼方式,而采用以小波變換為主的編碼方式。其壓縮率高于JPEG大約30%左右;可同時支持有損和無損壓縮;能實現(xiàn)漸進傳輸。這些都是JPEG無法做到的。因此,基于小波算法的JPEG 2000將成為新一代的靜態(tài)圖像壓縮編碼標準。
二、MPEG-運動圖像壓縮編碼方式
MPEG是運動圖像壓縮編碼方式。 MPEG方式的運動圖像編碼是基于“可動補償幀間預測(MC)+DCT”的基本結構。其編碼端的基本結構如圖2所示。
其編碼原理:彩色運動圖像輸入圖像可分為亮度信號Y與色差信號Cr,Cb。通常把色差信號的分辨率設為亮度信號分辨率的1/2×1/2。把亮度信號與色差信號分別分割為矩形塊,并以塊為單位進行編碼處理。首先,把幀存儲器中事先存儲前一幀中已經(jīng)過編碼的圖像(解碼圖像),并與輸入塊之間進行運動向量的檢測。其次,評價預測誤差信號的值,檢查有沒有應該傳送的預測誤差信號,并對塊單位進行有效/無效的判斷。對無效的塊,只傳送為識別其為無效塊而分配的代碼,而省略預測誤差信號的傳送。對有效塊,為進行因可動補償而在預測誤差信號中殘留的空間上的冗余度的削減,進一步對塊單位施行DCT。然后對DCT的變換系數(shù)進行量化,此后,經(jīng)過對量化值進行可變長編碼處理,其結果作為編碼數(shù)據(jù)傳送到解碼端。同時,為了得到局部解碼圖像,對量化處理的結果施行逆量化和逆DCT來再現(xiàn)預測誤差信號,并與當前塊的預測信號相加。這個結果與解碼端中的解碼圖像一起,為了在下一個幀的編碼處理中使用而存儲在幀存儲器中。
MPEG 標準主要包括MPEG-1、MPEG-2、MPEG-4:
MPEG-1用于加速CD-ROM中圖像的傳輸。它的設計思想是在1Mbit/秒到1.5Mbit/秒的低帶寬條件下,提供盡可能高的圖像質(zhì)量(包括音頻)。視頻壓縮以混合編碼為基礎。
MPEG-2用于寬帶傳輸?shù)膱D像,它允許數(shù)字圖像的數(shù)據(jù)量達到100Mbit/秒。圖像質(zhì)量達到電視廣播甚至高精度電視(HDTV)的標準。和MPEG-1相比,MPEG-2支持更廣的分辨率和比特率(3~30Mbit/秒)范圍,將成為數(shù)字圖像盤(DVD)和數(shù)字廣播電視的壓縮方式。
MPEG-4是目前最新的圖像壓縮方式標準之一,也是一種高效率的編碼標準,其最低碼率可達5~64kbps。在開發(fā)低碼率編碼的同時,更注重具體視頻對象的交互性和可操作性,并對多媒體應用領域的各種編碼進行兼容。MPEG-4利用自然和人工合成內(nèi)容的合并來編碼,解決了人臉及其動畫的編碼問題。但是,MPEG-4編解碼器沒有自動分割任意視頻運動的功能,不能提供基于對象的操作功能還沒有實現(xiàn)真正意義上的基于內(nèi)容的壓縮編碼。
目前,尚未完善的MPEG-7致力于描述各種類型的音視頻信息,利用元數(shù)據(jù)來描述音視頻對象的同時也就完成了編碼。
三、結束語
圖像壓縮技術研究發(fā)展了幾十年,取得了很大的成績,不斷涌現(xiàn)出許多功能更加齊全的壓縮方法,比如小波圖像壓縮和分形圖像壓縮等。總之,圖像壓縮是一個很有發(fā)展前途的研究領域,這一領域的突破對于通信和多媒體事業(yè)的發(fā)展將具有深遠的影響。期待著更多更好更有效的壓縮編碼方法出現(xiàn)。
參考文獻:
[1]薛文通宋建社等:圖像壓縮技術的現(xiàn)狀與發(fā)展[J].計算機工程與應用,2003.02.65~67
[2]王長杰:淺析靜態(tài)圖像壓縮標準[J].中國現(xiàn)代教育裝備,2007.5.29~30
[3]嚴冰張虹:靜態(tài)圖像編碼方法[J].中小企業(yè)科技,2007.06.128~130
[4]田勇丁學君:數(shù)字圖像壓縮技術的研究與進展[J].裝備制造技術,2007.04.72~74