摘要:多媒體技術把電視式的視聽信息傳播能力與計算機交互控制功能相結合,使計算機多媒體化,具有數字化全運動、播放、編輯和創作多媒體信息功能。多媒體信息經數字化處理后的數據量非常大,如何在多媒體系統有效地保存和傳送這些數據就成為多媒體系統面臨的一個最基本的問題,也是最大的難題之一。多媒體數據壓縮技術有效地解決這一問題。
關鍵詞:數據壓縮;JPEG;MPEG;H.261
中圖分類號:TP311文獻標識碼:A 文章編號:1009-3044(2008)11-20332-02
1 引言
多媒體計算機的主要特性是能處理數字化的聲音、圖像以及視頻信號。而數字化的聲音、圖像以及視頻信號的數據量非常大,例如在VGA分辨率為640×480的256色彩色圖像顯示模式中,一幀畫面所占的數據量約為300KB,如果采用NTSC制式標準視頻30幀/S,則傳輸率約為26.4MB/S,一個雙通道立體聲激光唱盤(CD-A),采樣頻率為44.1kHz,采樣精度為16位/樣本,其1秒鐘的音頻數據量為1.41Mb。處理這樣大的數據量單純靠擴大存儲容量、增加通訊干線的傳輸速率和數量是不現實的, 因此就出現了對多媒體信息數據進行壓縮編碼的技術。
2 多媒體數據壓縮編碼的必要性和可能性
2.1 多媒體數據壓縮編碼的必要性
由于媒體元素種類繁多,構成復雜,即數字計算機所要處理、傳輸和存儲等對象為數值、文字、語言、音樂、圖形、動畫、靜態圖像和電視視頻圖像等多種媒體元素,并且使它們在模擬量和數字量之間進行自由轉換,信息吞吐,存儲和傳輸。數字化信息的數據量十分龐大,無疑給存儲器的存儲量、通信干線的信道傳輸率以及計算機的速度都增加了極大的壓力。如果單純靠擴大存儲器容量,增加通信干線傳輸率的辦法來解決問題是不現實的。通過數據壓縮技術可以大大降低數據量,以壓縮的形式存儲和傳輸,既節約了存儲空間,又提高了通信干線的傳輸效率,同時也使計算機得以實時處理音頻、視頻信息,保證播放出高質量的視頻和音頻節目。
2.2 多媒體數據壓縮編碼的可能性
數據中間常存在一些多余成分,既冗余度。如在一份計算機文件中,某些符號會重復出現、某些符號比其他符號出現得更頻繁、某些字符總是在各數據塊中可預見的位置上出現等,這些冗余部分便可在數據編碼中除去或減少。冗余度壓縮是一個可逆過程,因此叫做無失真壓縮,或稱保持型編碼。 數據中間尤其是相鄰的數據之間,常存在著相關性。如圖片中常常有色彩均勻的背影,電視信號的相鄰兩幀之間可能只有少量的變化影物是不同的,聲音信號有時具有一定的規律性和周期性等等。因此,有可能利用某些變換來盡可能地去掉這些相關性。但這種變換有時會帶來不可恢復的損失和誤差,因此叫做不可逆壓縮,或稱有失真編碼、摘壓縮等。 此外,人們在欣賞音像節目時,由于耳、目對信號的時間變化和幅度變化的感受能力都有一定的極限,如人眼對影視節目有視覺暫留效應,故可將信號中感覺不出的分量壓縮掉或“掩蔽掉”。數據冗余主要有時間冗余、空間冗余、結構冗余、知識冗余、視覺冗余、圖像區域的相同性冗余、紋理的統計冗余等。由于數據冗余的存在,在對多媒體數據進行編碼時,可以將冗余信息去掉,保留相互獨立的信息分量,使得數據壓縮編碼成為可能。
3 多媒體數據壓縮編碼技術的分類
多媒體數據壓縮方法根據不同的依據可產生不同的分類。
第一種分類方法是根據解碼后數據是否能夠完全無丟失地恢復原始數據,可分為無損壓縮和有損壓縮兩種。(1)無損壓縮,也稱為可逆壓縮、無失真編碼等。工作原理為去除或減少冗余值,但這些被去除或減少的冗余值可以在解壓縮時重新插入到數據中以恢復原始數據。典型算法有哈夫曼編碼、香農-費諾編碼、算術編碼、游程編碼等。(2)有損壓縮,也稱不可逆壓縮。這種方法在壓縮時減少了的數據信息是不能恢復的。在語音、圖像和動態視頻的壓縮中,經常采用這類方法。它對自然景物的彩色圖像壓縮,壓縮比可達到幾十倍甚至上百倍。
第二種分類方法是按具體編碼算法來分,可分為預測編碼、變換編碼和統計編碼三種。(1)預測編碼(Predictive Coding)這種編碼器記錄與傳輸的不是樣本的真實值,而是真實值與預測值之差。預測值由預編碼圖像信號的過去信息決定。由于時間、空間相關性,真實值與預測值的差值變化范圍遠遠小于真實值的變化范圍,因而可以采用較少的位數來表示。 (2)變換編碼(Transform Coding)在變換編碼中,由于對整幅圖像進行變換的計算量太大,所以一般把原始圖像分成許多個矩形區域,即子圖像。對子圖像獨立進行變換。變換編碼的主要思想是利用圖像塊內像素值之間的相關性,把圖像變換到一組新的“基”上,使得能量集中到少數幾個變換系數上,通過存儲這些系數而達到壓縮的目的。(3)統計編碼。最常用的統計編碼是哈夫曼編碼,出現頻率大的符號用較少的位數表示,而出現頻率小的符號則用較多位數表示,編碼效率主要取決于需要編碼的符號出現的概率分布,越集中則壓縮比越高。哈夫曼編碼是一種無損壓縮技術,在語音和圖像編碼中常常和其他方法結合使用。
4 多媒體數據壓縮編碼的技術標準
目前,國際廣泛認可和應用的通用數據壓縮編碼標準主要有: JPEG、H.261、MPEG和DVI。
(1)JPEG標準
JPEG是一種基于DCT的靜止圖像壓縮和解壓縮算法,它由國際標準化組織(ISO)和CCITT共同制定。它是把冗長的圖像信號和其它類型的靜止圖像去掉,甚至可以減小到原圖像的百分之一。JPEG壓縮是有損壓縮,它利用了人的視覺系統的特性,去掉了視覺冗余信息和數據本身的冗余信息。在壓縮比為25:1的情況下,壓縮后的圖像與原始圖像相比較,非圖像專家難辨“真偽”。
(2)H.261標準
H.261由國際電報電話咨詢委員會(CCITT)通過的用于音頻視頻服務的視頻編碼解碼器標準(也稱為Px64標準),它主要使用兩種類型的壓縮:幀中的有損壓縮(基于DCT)和幀間的無損壓縮編碼,并在此基礎上使編碼器采用帶有運動估計的DCT和DPCM的混合方式。H.261與JPEG及MPEG標準間具有明顯的相似性,但關鍵區別是它是為動態使用設計的,并提供完全包含的組織和高水平的交互控制。
(3)MPEG標準
MPEG實際上是指一組由ITU和ISO制定發布的視頻、音頻、數據的壓縮標準。它采用的是一種減少圖像冗余信息的壓縮算法,提供的壓縮比可以高達200:1,同時,圖像和音響的質量也非常高。MPEG版本主要有MPEG-1、MPEG-2、MPEG-3、MPEG-4和MPEG-7。
MPEG-1標準制定于1992年,是針對1.5Mbps以下數據傳輸率的數字存儲媒體運動圖像及其伴音編碼設計的國際標準。同時,它還被用于數字電話網絡上的視頻傳輸,如非對稱數字用戶線路(ADSL)、視頻點播(VOD)、教育網絡等。
MPEG-2標準制定于1994年,是針對3~10Mbps的數據傳輸率制定的運動圖像及其伴音編碼的國際標準。它廣泛用于數字電視及數字聲音廣播、數字圖像與聲音信號的傳輸、多媒體等領域。
MPEG-3最初為HDTV(高清晰電視廣播)制定的編碼和壓縮標準,但由于MPEG-2的出色性能已能適用于HDTV,因此MPEG-3標準并未制定。
MPEG-4于1998年11月公布,它主要針對一定比特率下的視頻、音頻編碼,更加注重多媒體系統的交互性和靈活性。
MPEG-7的應用范圍很廣泛,既可應用于存儲,也可用于流式應用。未來它將會在教育、新聞、導游信息、娛樂、等各方面發揮巨大的作用。
(4) DVI標準
DVI視頻圖像壓縮算法的性能與MPEG-1相當,即圖像質量可達到VHS的水平,壓縮后的圖像數據率約為1.5Mb/s。為了擴大DVI技術的應用,Intel公司后來又推出了DVI算法的軟件解碼算法,稱為Indeo技術,它能將為壓縮的數字視頻文件壓縮為五分之一到十分之一。
5 結語
多媒體計算機技術、計算機網絡技術以及現代多媒體通信技術正在向著信息化、高速化、智能化迅速發展。隨著各個領域的應用與發展,各個系統的數據量越來越大,給數據的存儲、傳輸以及有效、快速獲取信息帶來了嚴重的障礙。數據壓縮的概念數據壓縮就是用最少的數碼來表示信號,以便能較快地傳輸各種信號,用現有的通信干線并行開通更多的多媒體業務,因此多媒體數據壓縮技術成為解決這一問題的關鍵技術,越來越引起人們的重視。
參考文獻:
[1] 沈豐.淺談多媒體數據壓縮技術[J].長江科學院院報,1999(05).
[2] 彭波,韋崗.多媒體技術MPEG系列標準新進展[J].廣東通信技術,2000(09).
[3] 丁貴廣,郭寶龍.多媒體數據壓縮標準化的現狀與發展[J].計算機工程與應用,2002(01):104-107.
[4] 于翔.數據壓縮技術分析[J].青海大學學報(自然科學版),2002(05):55-57.