張有魁
【摘要】在目前的Internet環境下,由于網絡的異構性和傳輸速率的不穩定性,媒體流數據在傳輸的過程中會出現延時、丟失等意外狀況,影響了傳輸的質量。針對這個問題,本文分析了Internet環境下多媒體數據傳輸的各種解決方法,討論適合網絡傳輸的視頻編碼解碼方案。對以流媒體解決方案為基礎的網絡多媒體教學系統進行了系統的分析,從而總結出現有網絡多媒體技術在Internet環境下所存在的不足。
【關鍵詞】面向傳輸;流媒體;系統模型
多媒體(MULTIMEDIA) 它由media和multi兩部分組成,是指表示媒體的多樣化。常見的文字、圖像、聲音、動畫,承載信息的程序等都是媒體。多媒體技術是指人類同計算機交互處理多媒體信息的方法。因此,多媒體技術包括音響(audio)信號處理、靜態圖像(image)和電視圖像(video)處理,話音信號處理以及遠程通信技術。這些技術包括軟件和硬件技術。
多媒體即多媒體信息服務,MMS(Multimedia Message Service),是目前短信技術開發最高標準的一種。它最大的特色就是可以支持多媒體功能,借助高速傳輸技術EDGE(Enhanced Data rates for GSM Evolution)和GPRS,以WAP為載體傳送視頻片段、圖片、聲音和文字。不僅可以在手機之間進行多媒體傳輸,而且可以在手機和電腦之間傳輸。其短消息容量平均為3萬字節,最高可達10萬字節。具有MMS功能的移動電話內置媒體編輯器,可以編寫多媒體信息,如果安裝上一個內置或外置的照相機,用戶還可以制作并傳送PowerPoint格式的信息或電子明信片。
一、多媒體研究的關鍵技術
1、數據壓縮
在多媒體系統中,涉及的數據量是巨大和驚人的。以一幅中等分辯率的彩色圖像為例,每秒約需27.6MB字節空間,即使是650MB的標準光盤也需裝入20多秒鐘,而大多數遠程通訊網的速率都在每秒幾兆位。因此,對數據進行有效壓縮是多媒體中的關鍵技術之一。之所以能實現對圖像、聲音壓縮,是由于這些原始圖像和聲音存在著很大的冗余度,包括空間冗余,時間冗余,結構冗余與視覺冗余等。常用的數據壓縮技術分兩大類,一類是無損壓縮,另一類是有損壓縮。現在已形成了一些壓縮的國際標準,如JPEG適用于靜態圖像,MPEG適用于動態圖像,G722已成為電視會議和電話的聲音編碼標準以及多媒體系統的MPC標準等。壓縮和解壓縮的速度是壓縮系統的兩項單獨的性能度量,從目前開發的壓縮技術看,一般來說壓縮的計算量比解壓縮的計算量大。壓縮速度不僅與采用的壓縮方法有關,而且與快速算法的計算量有關。如果能在壓縮方法和快速算法上取得突破性進展,無疑將對多媒體的開發和應用產生很大的影響。
下面是基于Internet視頻流傳輸的體系結構。原始的視頻和音頻信號在經過壓縮之后存儲在存儲設備中,根據接收端的要求,視頻服務器從存儲設備中接收到壓縮后的視頻和音頻信號,然后網絡傳輸質量控制模塊根據網絡狀態和QOS的要求改編位流,改編之后的位流,經傳輸協議打包壓縮成音頻和視頻包后被發送到Internet上。由于擁塞等原因,這些包在傳輸的過程中可能會丟失或者超時,為了改善音頻和視頻傳輸的質量,需要采用連續的媒體分布服務(如緩存技術等)。在數據包到達客戶端以后,首先經過傳輸層,然后再由應用層QOS控制。模塊處理后交給音頻和視頻解碼器進行解碼,為了保持音頻和視頻的同步還必須采用媒體同步機制。從該體系結構中可以看出,關于多媒體數據傳輸的六個關鍵部分是緊密相關的,在這個視頻流體系結構中,它們也是一致的,連續的。
2、多媒體信息特性與建模
多媒體信息特性的主要研究是對媒體的種類、性質及其相互關系、媒體之間的轉換意義、方法及手段、媒體處理的特點等方面進行研究。在此基礎上進而研究多媒體數據建模的方法:信息空間如何構成?時間特性如何表示?面向對象的方法怎樣使用?在媒體之間如何確定相互的關系?對信息的內容如何表示等。雖然各種圖像、聲音等專門技術的研究歷史已有幾十年,但大多數都是從單一媒體角度考慮的,從多媒體統一角度研究,才有可能獲得進一步進展[4]。
3、多媒體信息的組織與管理
信息及數據管理是信息系統的核心之一,多媒體數據量巨大,種類繁多,每種媒體之間差別十分明顯,但又具有種種信息上的關聯,這些都給數據與信息管理帶來了新的問題。如何管理、組織這些數據;如何從各種媒體數據中找出所需要的信息;如何表現這些媒體信息;這些都是傳統的數據庫理論與方法尚沒有很好解決的問題。因此,人們正在探索有效的管理方法如對關系數據庫進行擴充;建構面向對象的數據庫;超媒體信息管理等方法。
4、虛擬現實技術
虛擬現實技術(Virtual Reality)是近年來(下轉第269頁)十分活躍的技術領域,是多媒體發展的更高境界。所謂虛擬現實就是采用計算機技術生成一個逼真的視覺、聽覺、觸覺及嗅覺等的感覺世界。用戶可以用人的自然技能對這個生成的虛擬實體進行交互考察。虛擬現實是一種高度集成的技術,是計算機軟、硬件技術、傳感技術、機器人技術、人工智能及心理學等飛速發展的結晶。主要依賴于三維實時圖形顯示,三維定位跟蹤,觸覺及嗅覺傳感技術,人工智能技術,高速計算與并行計算技術以及人的行為學研究等多項關鍵技術的進展。美國著名計算機圖形專家J.Foley曾指出:虛擬現實或許是人機接口作為計算機設計的最后一個堡壘中最有意義的領域。
二、基于Internet的網絡多媒體教學系統的設計
1、C/S模式與B/S模式
基于Internet的遠程多媒體教學系統中占主導地位的主要有兩種模式:客戶/服務器(Client/Server 簡稱C/S)模式和瀏覽器/服務器(Browser/Server 簡稱B/S)模式,但這兩種模式都有一些無法避免的缺陷。在遠程信息管理系統中廣泛使用的三層C/S模型很好地解決了這些問題,但是這種三層C/S模型不是針對多媒體教學系統的,因此有很大的不適用性。在分析各種系統模型的優缺點后,本文針對多媒體教學本身的特點引入一種適合多媒體本身特點的三層模型。
(1)C/S模式與B/S模式的優缺點
典型的C/S模式是一種兩層的體系結構,B/S模式多媒體遠程教學系統模型是一種三層體系結構,在物理結構上極其相似,C/S模式的遠程多媒體教學系統一般要求要下載一個客戶端程序,而B/S模式的遠程多媒體教學系統則可在客戶端直接通過瀏覽器來進行學習。
C/S模式和B/S模式的遠程多媒體教學系統使用簡單,適用面廣,但C/S模式和B/S模式的遠程多媒體教學系統缺點也顯而易見,其中最大的缺陷是時延過大,造成等待時間過長,甚至沒有回應。其次,在這兩種模式的遠程多媒體教學系統中,當大量的用戶同時登錄學習時,服務器端負荷過大,且占用了大量的帶寬。第三,兩種模式的遠程多媒體教學系統客戶端更新困難,而且C/S模式容易產生“胖客戶”的問題。最后,從安全性的角度看,兩層結構的安全性也不令人滿意。
(2)三層C/S模型的優勢及不足
三層C/S結構是從兩層C/S結構發展而來的。這種結構下的應用都由三個部分組成,即用戶界面部分(表示層),應用邏輯部分(應用邏輯層)和數據訪問部分(數據訪問層)。表示層的功能是與用戶交互的;應用邏輯層進行具體的運算和決定程序的流程等;數據訪問層維護和更新應用程序的數據。把這3個部分分別放置在3個物理空間時,就形成了三層C/S結構。它在管理信息系統(MIS)中應用廣泛。
但這種三層結構的出發點是為了使得一個基于網絡的系統具有更好的代碼重用性、更好的可擴展性和更好的穩定性。因此,它不是針對多媒體系統的,更沒有考慮滿足某種實時性或減少時延等要求。
相對兩層的C/S結構,三層的C/S結構仍有如下優點:
1)使終端服務器承受的負荷變低。
2)增強了終端服務器的安全性能。
2、針對網絡多媒體教學的系統模型
網絡多媒體教學有其自身的特點,多媒體數據不僅數據量相對較大,而且其編解碼過程中耗費的計算量也十分巨大,如果為了減輕服務器負擔而將這部分工作完全放到客戶端,同樣會產生新的問題--客戶端變成“胖客戶”型,而且不易更新。為了解決這個問題,必須結合多媒體教學本身的特點構建適合網絡多媒體數據傳輸的系統構架。
網絡多媒體教學一般具有以下幾個特點:
(1)包含兩類媒體類型:離散的,連續的。
(2)對系統的實時性有一定的要求。
(3)媒體內容具有有限性和可預知性。
(4)客戶終端的集中性。
針對這種特點,一個基于三層模型的網絡多媒體數據傳輸構架被應用于本系統,其框架的各部分功能如下:
1.數據訪問部分(Data):主要分為流媒體服務和數據庫服務兩部分。流媒體服務主要針對音頻/視頻(Audio/Video簡稱A/V)信息進行采集、存儲和播發;數據庫服務主要提供對其他檔案信息(用戶資料、課程資料、輔助教材等)和媒體索引信息的存取分析功能。
2.應用邏輯部分(Business Logic):以數據服務層為數據庫平臺,在此基礎上針對網絡多媒體教學的需求提供相應的中間層組件,把共性的應用邏輯規范化,通過應用服務器對外發布。對于有條件的局域網用戶可增加中間服務器,將最近可能用到的多媒體信息提前分發到中間服務器,可以提高訪問多媒體數據的效率。
3.用戶界面部分(Presentation):是客戶端安裝的操作界面。學生和教師可以根據相應的權限訪問各類教學資源信息。由于大部分的應用邏輯放在了應用服務器或中間服務器上,客戶端的應用程序相對“瘦小”。
綜上所述,在網絡多媒體技術的實際應用方面,流媒體技術占據了主導地位。該技術將多媒體和網絡技術結合在一起,使得多媒體數據,特別是視頻數據在網絡上的實時傳輸成為現實。在研究多媒體的關鍵技術基礎上,又從網絡傳輸這個方面討論了網絡多媒體技術的解決方案,總結出目前Internet環境下網絡多媒體技術的最新發展動向和應用成果。我們發現目前的網絡多媒體應用已經給人們的生產和生活帶來了極大的方便,雖然現有的視頻編解碼系統存在著這樣或那樣對Internet環境的不適應性,但相信在不久的將來,隨著計算機技術的不斷發展,在網絡服務、終端機器的性能提升和更新算法研究進步的基礎上,視頻編解碼技術必將為網絡多媒體的發展做出更大的貢獻。
參考文獻
[1] 鐘玉琢,蔡蓮紅.多媒體計算機技術基礎及應用[M].北京:高等教育出版社,2005.3-26.
[2] 鐘玉琢,賀玉文.基于對象的多媒體數據壓縮編碼國際標準MPEG-4及其校驗模型[M].北京:科學出版社,2005. 32-44.
[3] Wu Dapeng , Hou Y.Thomas, Zhu Wenwu.On End-to-End Architecture for MPEG-4 Video Streaming over the Internet[J]. 2000,10:132-139.
[4] Wang Qi, Wu Feng, Li Shipeng.A New Rate Allocation Scheme for Progressive Fine Granular Scalable Coding[J].IEEE International Symposium on Circuits and Systems(ISCAS),May,2001,2:397-400.
[5] 胡飛,朱耀庭,朱光喜.Internet視頻點播差錯控制[M].北京:計算機研究與發展,2005. 988-993.
作者簡介:
張有愧(1961.4-),男,講師,秦皇島中等專業學校