王宇 劉俊 高云



摘要:伴隨社會經濟不斷進步,信息化發展日新月異。豐富的多媒體數據占用空間比較大,傳輸速度較慢。若不對多媒體數據進行有效的壓縮,就難以使用戶通過多種感官與計算機進行實時信息交互,從而不能構成完整的多媒體計算機系統。數據信息的海量性已經成為影響數據存儲、數據傳輸的重大阻礙。計算機多媒體數據壓縮技術的發展,是互聯網與通信技術得以深入發展的關鍵所在。數據壓縮的目的在于通過用壓縮手段減少音頻、視頻、圖像信號中冗余信息,將信息數據以壓縮的形式進行傳輸和存儲。該文對數據的壓縮進行了研究,并通過比較分析不同壓縮算法及其實現原理,對其應用方向和發展前景進行簡單的探析。
關鍵詞:計算機多媒體;數據壓縮;技術分析
中圖分類號:TP3 文獻標識碼:A
文章編號:1009-3044(2020)21-0190-03
開放科學(資源服務)標識碼(OSID):
在今天數字化和信息化進程加速的背景下,數字信息產業的發展已成為備受關注的對象。計算機多媒體技術作為時代新興產物,定義為向計算機輸入媒體信息,計算機輸出數字化后的信息[1]。但隨著網絡的飛速發展,多媒體數據也逐漸呈現出爆炸式增長的勢頭。例如:一幅分辨率為256x512的彩色靜態圖像CRGB),如果每種顏色用8bit表示,則數據量競有384kb之多。若不進行處理,僅由此方法構成圖像、音頻、視頻文件,現有的網絡帶寬或難以承受。多媒體數據具有的豐富性,多媒體計算機需要具有強大的裝置綜合能力和處理多種媒體的功能,具體表現為綜合處理動畫、視(音)頻、圖像等多種形式的媒體。但是由多媒體計算機處理的多種媒體具備非常大的數字量,給傳輸和存儲帶來了很大的難度[2]。如今,阻礙信息傳輸的主要障礙是如何對數據有效的傳輸和處理。
造成多媒體數據量巨大的部分原因是數據中攜帶著大量冗余信息,這無疑成為信息傳播與應用的困擾。如何解決冗余問題,將直接關系到信號能否進行快速的傳輸。由此看來,數據壓縮已成為解決巨大數據信息量問題和多媒體技術發展的必經之路。
1 數據壓縮技術概述
1.1數據壓縮的原理與過程
數據壓縮本質上是數據編碼技術。其基本原理很簡單,就是找出那些重復出現的內容,然后用更簡短的語言表示。數據是信息的載體,在數據的交流中我們想獲得的其實是信息。
多媒體數據的壓縮分為編碼和解碼過程,即原始數據經過一系列處理過程轉化為壓縮后的編碼符號,過程可抽象為編碼器(圖1)。解碼過程則是與編碼過程相反的操作。通過編碼與解碼的操作,可以使信息在處理環節、傳輸環節中以“簡略”的格式表達。不僅提高了通信傳輸效率,也使計算機同時處理兩種以上媒體信息得以實現。
1.2 多媒體計算機數據壓縮的必要性與可行性
多媒體信息結構復雜且種類繁多,對各類多媒體數據進行自由、高效率存儲與傳輸的要求也日益嚴苛。只有通過數據壓縮,才能在不增加帶寬和存儲容量的前提下對音頻、視頻、圖片等媒體數據有效處理和傳輸。多媒體數據通常包含很大的冗余。一份傳輸完整的數據其中信息量是小于其數據量的,壓縮正是利用信息中無關信息量的存在,期望能夠通過不同的編碼與解碼方式使得冗余量所占信息量的比重達到一個可以接受的范圍。音頻、圖像和視頻等數據中的多余信息主要表現在空間、時間和知覺等方面。
以多媒體數據圖像數據作為研究對象,人觀察到的靜態圖像看似規律是并不相同的,但實際圖像數據中的光強、色彩和飽和度有很大部分重合,這就是所謂空間的冗余。而對于動態畫面來講,當長時間停留在某一動作圖像時,在相鄰的幀之間很少有不相同的地方動畫等序列圖片,這種稱之為時間冗余。因此,在實際操作中,我們完全可以依據“部分代替整體”的原則,用少量的數據展示整體。以此來有效地減少圖像數據中的初始數據。
2 數據壓縮算法研究
2.1 數據壓縮算法種類
依據多媒體數據的冗余類型,可使用不同的壓縮方法。按照被壓縮數據解碼后是否已改變原數據,可將壓縮方法分為無損壓縮與有損壓縮。
有損的壓縮在可接受范圍內允許解碼出的數據與原數據存在一定差異,以損失部分信息為代價獲得可觀的壓縮比,也即不可逆編碼。想要達到低數據率的效果,幾乎都需要采用有損壓縮。最終的壓縮比越小丟失的數據則越多,相應解壓后的還原度就越低。所以這種壓縮大多建立在這種壓縮方法大多應用在多媒體技術上。有損壓縮編碼立足于圖像、聲波存在頻帶寬、信息量大的特點,人類視、聽覺無法對其做出敏感的觀測。有損壓縮編碼在壓縮過程中的要求并不嚴格,為了能夠較大程度地減少多余信息,有損編碼甚至允許丟失一部分數據信息。鑒于在壓縮時丟失的信息并沒有影響到人們對原始數據、圖像的理解,而相較無損壓縮具有很高的壓縮比例,因此有損編碼在語言、圖像以及視頻等數據壓縮工作當中受到了普遍的運用[3]。
無損編碼是一種基于信息熵原理的可逆的編碼方法,不會損壞初始數據,這種編碼又稱為熵保持編碼或熵編碼。由于無損壓縮多采用概率統計原理,故壓縮情況多表現為對出現頻率高的數據與頻率低的數據壓縮效果存在差異。因此冗余度理論極限一般為2:1到5:1。雖壓縮比例不夠出色,但能夠保證完整還原、不產生任何損耗。這種方法使用在自然圖像的壓縮上效果并不好,多用于電子表格,文檔數據,珍貴照片等的壓縮。相對于有損壓縮來說,無損壓縮的占用空間大、壓縮比不高等都是限制無損壓縮適用范圍的因素,但隨著硬盤容量成本的降低和用戶追求的提升,其不改變數據無損還原的性質得到開發,將來發展前景廣闊。
2.2 壓縮算法的分析
無損壓縮編碼多為統計編碼(哈夫曼編碼、LZW編碼以及行程編碼等);有損壓縮編碼有:預測編碼(DPCM編碼、ADPCM編碼等)、變化編碼與分析合成編碼(量化編碼、小波變化編碼、分形圖像編碼、子帶編碼等)。
下面我們對幾種常見壓縮算法進行研究分析。
(1)基于哈夫曼編碼(Huffman Coding)的文本數據壓縮算法
哈夫曼編碼(Huffman Coding)是一種無損壓縮算法。雖然壓縮率有限,但可完全無偏差地還原壓縮前數據,用在文本壓縮尤為合適。下圖為哈夫曼編碼方法的UML協同圖。
哈夫曼編碼的步驟是根據給定的權值構造只有根結點的二叉樹,并確定始權值。選取兩棵權值最小的樹做子樹,構造新二叉樹。在森林中刪除這兩棵樹,置新二叉樹根結點權值為其子樹結點權值之和。重復上步驟即可得到哈夫曼樹。此類型編碼方式會對原符號進行評估,為取得更小的代價,用較短編碼表示出現概率高的符號,而出現概率低的使用較長編碼。目的是使編碼后的原符號長度的期望值降低,從而使數據壓縮。
(2)LZW壓縮算法
LZW編碼(Encoding)的主要思想是掃描文本的思想。LZW編碼對每個出現的符號都需要進行判斷,查看其與前向符號能否組成在此之前曾出現過的符號串。對于能組成符號串的情況,繼續向后掃描;反之,則必須將前向符號轉換為一個索引,并且將索引寫入輸出文件中。針對文本中符號串重復越多的情況,可以收到良好的壓縮效果。
對應以上描述,LZW編碼的流程圖可表示為圖3。
其核心思想并不復雜,就是把出現過的符號串映射到記號上,借此通過較短的編碼來表示較長的符號串。這樣就將其用對應的索引來代替原較長的文本寫入輸出文件中,達到壓縮原龐大信息的效果。LZW編碼常應用于文本數據的壓縮,對于重復出現的符號串的較多的文本壓縮效果較好。
3 應用場景與展望
多媒體數據通常在傳輸或存儲前都需要進行壓縮,而根據不同的數據格式和服務質量要求,可對文本數據、音頻數據、圖像數據和視頻進行有損壓縮或無損壓縮。
對于類型為文本的數據,需要保證壓縮前后不能任何內容的偏差,必須使用無損壓縮的方法。并且在保證數據安全性的前提下進行不丟失信息的壓縮,推薦使用算法是哈夫曼編碼和LZW詞典編碼的方式。
對音頻類型的數據壓縮已發展較為成熟,主要表現為波形編碼、參數編碼以及融編碼的形式。波形編碼方式是根據人耳聽覺特性采樣量化音頻信號波形的原理,盡可能匹配原始信號波形,其特點是可在高碼率的條件下獲得較高品質的音頻信號。參數編碼把音頻信號表示成某種模型的輸出,利用特征提取的方法抽取必要的模型參數和激勵信號的信息,并對這些信息進行編碼,最后在輸出端合成原始信號[4]。但追求編碼壓縮率的同時,也意味著損失數據量會較大,不適合高保真語音和高品質音樂。
圖像數據壓縮有靜態圖像壓縮JPEG標準和運動圖像壓縮MPEG標準兩種國際標準,存在多種壓縮數據方式。JPEG標準用于處理單張的靜止畫面,MPEG標準則處理由一連串畫面組成的運動的圖像。靜態圖像壓縮目的是去除部分圖像中對人眼不敏感的部分,是空間信息的壓縮,不會對視覺觀賞產生影響。對靜態圖像文件用JPEG進行壓縮效果十分明顯,當壓縮率達到20:1時人眼基本不可見其失真。
采用數據壓縮算法對數據進行壓縮是一種信息高校傳輸和存儲的技術,目的是讓計算機擁有處理龐大的多媒體數據的能力,從而將網絡的數據傳輸速率帶來的阻礙減小到最低程度。隨著大數據發展浪潮的到來,爆炸式增長的數據給多媒體數據壓縮算法也帶來了新的挑戰。同時,深度學習、人工智能的蓬勃發展也給數據處理帶來了新的思路,勢必會使數據壓縮的技術迸發出新的活力。未來,多媒體數據壓縮的發展將無限可能。
4 結語
根據以上的研究分析,壓縮算法以不同編碼方式的利用為切人點,合理去除數據中存在的冗余問題。在不增大帶寬和存儲容量的前提下,有效降低數據傳輸率,為多媒體設備、音頻應用、動畫制作帶來巨大變革。隨著人們對視頻音頻的高質量需求和更多相關領域的開發,計算機多媒體壓縮必將上升到一個嶄新高度,成為處理數據中不可或缺的數字化技術。
參考文獻:
[1]黃夢.計算機多媒體音像壓縮技術的研究及應用前景探析[Jl,計算機光盤軟件與應用,2014(4):207-207,209.
[2]張華.多媒體計算機圖像數據壓縮的實現[J].計算機光盤軟件與應用,2014,17(1):192,194.
[3]梅剛.多媒體數據壓縮技術有效分析[J].數字技術與應用,2015(5):219.
[4]孟鉑,樊新華.淺析多媒體數據壓縮技術[J].電腦知識與技術,2006(20):129,156.
【通聯編輯:代影】
作者簡介:王宇(1998-),男,安徽淮南人,重慶郵電大學,學生,本科,研究方向為圖像處理;劉?。?978-),男,講師,研究方向為移動互聯網軟件;高云(1999-),男,本科,研究方向為模式識別。