摘要:介紹了一種從流媒體接收者的角度對流媒體性能進行測量的方法,提出了相應的應用層評價指標。利用已有的商業化流媒體服務軟件,通過改變網絡環境在不同的條件下對指標進行測量,最后通過實驗數據來驗證這些指標的有效性。
關鍵詞:應用層; 流媒體; 性能測量
中圖分類號:TP393.06文獻標志碼:A
文章編號:1001-3695(2007)12-0126-03
0引言
流媒體是指在Internet/Intranet中使用流式傳輸技術的連續媒體,如音頻、視頻、動畫或其他多媒體文件。它的內容可以是預先經過編碼處理、存放在一個或多個服務器上的媒體文件,也可以是實時的音/視頻媒體。傳統的Internet應用需要可靠的數據傳輸,對延遲和抖動不是很敏感,但是在流媒體應用中情況則完全不同。流媒體應用能夠容忍一定程度的包丟失,但是對延遲和抖動卻很敏感。由于各種原因,在以IP協議為核心的互聯網上提供流媒體服務時,流媒體的性能經常隨著網絡和時間的變化而變化,不能滿足用戶的需求[1]。為此,除了采用一些內部機制保證業務質量外,還需要從外部對流媒體業務性能進行測量,了解流媒體應用的瓶頸,從而提高性能。同時,為了推動流媒體新的網絡協議的設計和開發,必須有一套能夠衡量媒體接收端的媒體質量標準。
早些時候,研究者也提出過各自的媒體性能衡量指標,有些是基于傳輸層的[2],通過測量傳輸層的參數進行媒體性能評估;有些關注于接收者觀看時的生理反應或者需要人為參與[3]。實踐證明這些方法均能夠在一定程度上反映流媒體的性能,但這些方法部署起來復雜,而且結果也易受主觀因素的影響。本文引入了一套面向應用層的流媒體性能衡量指標,測量方法相對簡單,并且能夠直觀反映流媒體的接收質量。最后在RealNetworks公司的流媒體系統中,通過改變網絡環境來驗證這些指標的有效性。
1相關工作
1.1主觀評價
國際電信聯盟(ITU)在ITU-R BT.500-11[3]中推薦使用平均主觀得分法(MOS)來評價接收者感知的媒體質量。做法通常是給接收者播放一段視頻(約8~10 s),接收者采用5分制評價。其中5分為很好(excellent),4分為好(good),3分為中(fair),2分為差(poor),1分為不可接收(unsatisfactory)。記錄他們的評分,然后對所有評論者的評分進行統計,得出平均分作為評價結果。MOS為接收媒體質量提供了定量指標,但是對流媒體而言,這種評價方法存在著弊端。MOS的特性使得必須有接收者參與(評分),這將花費大量的人力和時間,并且這種方法不能避免主觀因素的影響。另外在ITU-R BT.500-7標準定義了兩種主觀的評價方法,即雙刺激連續質量分級法(DSCQS)和單刺激連續質量評價方法(SSCQE),不過這些方法已經被ITU-R BT.500-11所取代。
1.2客觀測量
客觀測量基于仿人眼視覺模型的原理對圖像質量進行客觀評估,并給出客觀評價分。近幾年,隨著人們對人眼視覺系統研究的深入,客觀測量的方法和工具不斷被開發出來,其測量結果也與主觀評價較吻合。國際上成立了ITU-R視頻質量專家組(Video Quality Experts Group,VQEG)專門研究和規范圖像質量客觀測量的方法和標準。
VQEG規定了兩個簡單的技術參數,即峰值信噪比(PSNR)和均方差(MSE);此外還有許多圖像質量模型,這些模型在測量圖像質量時都基于人眼視覺特性。一些研究者[4]認為,當發生丟包或者低速率傳輸媒體時,這種測量方法不能很好地工作,而且也不能刻畫應用層的一些關鍵信息,如再緩沖次數、平均緩沖時間、幀率(FPS)等。
2應用層媒體性能測量指標
當前主流的商業流媒體播放產品主要有Real公司的RealPlayer、Microsoft公司的Media Player、Apple公司的QuickTime[5]。它們雖然屬于不同的公司,但是播放流式媒體的基本原理是相同的。圖1給出了以視頻點播和廣播為例考察用戶獲取流媒體服務的典型流程。
接收者和服務器之間需要通過三次交互才能獲得流媒體內容。首先是用戶瀏覽器和Web服務器(流媒體內容的發布點)交互,以獲取具體的流媒體內容定位信息(媒體源文件的URL)。然后,用戶瀏覽器通過內容定位信息獲得具體的媒體源文件。該源文件通常是一個SMIL或者XML格式的媒體同步和控制文件,包含了具體的流媒體內容的位置(URL)和控制方法。在客戶端,該源文件觸發用戶端的媒體播放器,媒體播放器根據源文件的要求安排媒體流,同時根據媒體流的URL請求流媒體內容傳輸。
2.1RealPlayer
大多數的媒體播放器在播放流媒體之前,媒體數據先要在接收端緩沖,其主要作用是平滑媒體數據傳輸波動,提高播放質量。緩沖區的大小和利用百分比決定了播放過程中接收者的接收質量。在播放過程中,如果緩沖的數據不夠甚至傳輸中斷,播放器會進行重緩沖,重緩沖會嚴重影響服務質量、降低收看效果。
RealNetworks公司的RealPlayer是使用較多的幾個流媒體播放器之一,本文選用它作為播放器。首先介紹幾個相關的特性:
a)流技術。RealPlayer能夠從流媒體服務器接收流化的媒體內容。這期間要用到一些相關的傳輸協議,如RTSP等。當然也可以選擇TCP、UDP、HTTP等協議。
b)自適應帶寬。Real System采用Sure Stream,通過測量網絡的當前狀況調整流媒體的比特率來適應網絡,使用戶獲得更好的效果。Microsoft公司的intelligent streaming也可以達到同樣的效果。要達到自適應帶寬的目的,還需要多比特編碼(多層編碼)技術支持。
c)緩沖區初始化。RealPlayer需要初始化播放器緩沖區,消除媒體服務器與播放器之間的網絡延遲帶來的負面影響。設置大的緩沖區可以容忍更大的網絡延遲,同時也增加了播放延遲,因此緩沖區并不是越大越好。
d) 再緩沖。當網絡條件惡化時,RealPlayer有可能耗盡緩沖區內的媒體數據。這時播放器不得不停止播放(沒有數據),等待新的數據填充緩沖區。
2.2性能測量指標
根據以上分析,本文提出了面向應用層的測量指標:
a)緩沖時間,從流媒體數據到達播放器到開始播放的時間。這個時間與緩沖區大小、網絡環境有關。緩沖時間可以衡量媒體流數據傳輸的延遲和延遲抖動等性能,對流媒體播放的性能有直接影響。
b)播放速率。由幀率、畫面分辨率、色彩深度、編碼方式等諸多因素決定,是直接影響性能的重要因素。由于自適應帶寬技術的存在,播放速率還受到網絡環境的影響。
c)再緩沖次數和時間。在播放過程中,緩沖區中的媒體數據耗盡,流媒體數據不能達到播放的要求,需要重新進行緩沖。再緩沖的時間和次數可以描述流媒體在播放過程中的質量,客觀來講,這是影響流媒體性能最重要的指標。
d)幀率。人的眼睛由于生理原因會產生視覺停留,電影膠片就是利用這個原理。但是當每個畫面停留時間過長時,眼睛就會覺察到不是連續的情景,這就意味著用戶看到的是一個個畫面,導致媒體的質量下降。
由于Real流媒體系統的某些特性(減少啟動延遲、編碼方式),本文暫對播放速率、再緩沖次數和幀率這幾個指標進行測量和驗證。
3流媒體性能測量
3.1實驗平臺
以上討論的均是能夠反映流媒體性能的應用層指標。本文通過改變傳輸過程中的網絡環境來研究能否使用這些指標評估流媒體性能。媒體播放器位于應用層,因此本文的應用層測量主要是從這些應用程序中提取流媒體的性能特征。實驗采用RealNetworks公司的流媒體系統,包括流媒體服務器(Helix Server)、流媒體編碼器(RealProducer)、流媒體播放器(RealPlayer)幾部分,如表1所示。
網絡環境改變是利用NistNet[6]來實現的。NistNet是運行在Linux下的IP網絡環境模擬工具,可以把一臺裝有Linux的PC機作為路由器,從而達到改變網絡環境的目的。NistNet能模擬包括可調包分發延遲、擁塞、帶寬限制、包亂序等網絡環境,這些都是影響流媒體性能的重要參數。實驗中通過改變網絡環境來觀察應用層的流媒體性能改變。整個實驗系統的結構如圖2所示。
流媒體服務器安裝在HP ProLiant ML150;NistNet安裝在一臺普通的裝有Red Hat Linux的PC機上,內核為2.4.20-8,作為路由器,啟動了路由功能;流媒體播放器安裝在一臺普通PC機上,操作系統為Windows XP。利用RealProducer Plus編碼器對一段長度為4 min14 s的MV進行兩次編碼作為媒體源,一次編碼是單一比特率450 kbps編碼;一次是使用了SureStream技術的多比特率編碼,分別為64、150、256、384、512 kbps。
3.2網絡環境變化下的流媒體性能
1)改變帶寬帶寬是影響流媒體性能最重要的因素之一,因此實驗的第一個網絡環境變化就是對帶寬的改變。實驗中,選取多比特率編碼的MV作為媒體源。播放60 s時,利用NistNet對帶寬限制到240 kbps,120 s時恢復。其間觀察媒體播放情況,并測量播放速率和幀率;實驗重復20次,選取其中10次作為測量數據。播放速率變化如圖3所示。
從圖中可看出,60 s時,RealPlayer檢測到可用帶寬的改變,通知流媒體服務器改變發送的媒體服務速率,從原來的450降到150 kbps左右。但是流媒體服務器檢測到數據包丟失率較高,便繼續降低發送的媒體服務速率,直到100 kbps。
帶寬不足以播放最優質量流媒體時,媒體服務器除了降低媒體服務速率外,也會定期檢測帶寬。因此在120 s帶寬限制取消時,媒體服務器在140s左右檢測到可用帶寬增加,隨即增加了媒體服務速率。60 s改變帶寬時,緩沖區內已經緩沖了一定帶寬沒有改變時的流媒體內容。因此當帶寬改變后一定時間內播放器仍然在播放之前緩沖的內容,時間長度是由網絡可用帶寬和緩沖區大小決定的。從圖4中可以看出,在90 s時幀率明顯下降,此時播放的內容就是帶寬改變后流媒體服務器發過來的媒體數據;同樣情況也出現在120 s,帶寬恢復后,仍然播放了大約60 s緩沖區內的數據。
在服務速率和幀率下降的過程中,接收端可明顯感覺到畫面質量下降。其中主要表現為畫面分辨率降低、畫面出現暫時停頓和跳躍等現象。由此可知,服務速率和幀率能夠在一定程度上反映流媒體性能。
在測量流媒體再緩沖概率實驗中,為了避免SureStream的影響更改了流媒體源,使用的單一比特450 kbps編碼。為了控制流媒體播放器緩沖區的使用率,限制初始網絡帶寬為480 kbps。實驗中分別對帶寬限速240 kbps/1~10 s,觀察其RP(再緩沖的概率,rebuffering probability),如圖5所示。此時接收端畫面會出現長時間停頓,嚴重影響了流媒體的服務性能,降低了媒體的可觀賞性。
2)改變丟包率和延遲流媒體技術中,丟失的數據包可以通過重發來彌補,但數據重發機制所能達到的效率很大一部分取決于路徑延遲。實驗中綜合考慮丟包率p和延遲的影響,測量應用層流媒體服務質量。
圖6中分別對丟包率p從1%~15%、延遲為0和200 ms,測量了流媒體播放速率。可以看出,丟包率為2%~6%,流媒體播放速率變化較大,并且與延遲的大小并無太大聯系。丟包率的增加最主要的表現是媒體畫面出現了馬賽克,延遲的影響主要在播放前的緩沖階段。實驗中延遲為200 ms時,當丟包率達到9%以上,出現了找不到媒體源的情況;丟包率到15%時,五次實驗均未找到媒體源。這表明延遲太大會影響媒體播放器到服務器之間的消息響應。
媒體服務器采用丟包后重發的機制,因此丟包率對應用層幀率和再緩沖概率影響均不大。實驗中測得的在不同丟包率和延遲下,幀率幾乎沒有改變(圖7),同樣也沒有再緩沖情況發生。
4結束語
本文介紹了一種面向應用層的流媒體性能測量的基本方法,引入了一套相應的評價指標,并利用實驗驗證了其有效性。與其他的流媒體性能評估方法相比,該測量方法與評價指標更能直觀地反映觀看者的感受,并且易于部署,測量具有獨立性,是對現有方法的一種有益補充。
參考文獻:
[1]HILLESTAD O I, LIBAKB, PERKIS A. Performance evaluation of multimedia services over IP networks[C]//Proc IEEE International Conference on Multimedia Expo. 2005:1464-1467.
[2]GOLJA M, HUMAR I, BODNARUK D, et al. WMPStat: a tool for measuring the correlation between application and network layer traffic of streaming video over Internet[C]//Proc of the 12th IEEE Mediterranean[C].[S.l.]:IEEE Press,2004:657-660.
[3]ITU-R BT. 500-11, Methodology for the subjective assessment of the quality of television pictures[S].[S.l.]:ITU,2002.
[4]MASRY M, HEMAI S S. An analysis of subjective quality in low bit rate video[C]//Proc of IEEE International Conference on Image Processing. 2001:465-468.
[5]HESSLER S, WELZL M. An empirical study of the congestion response of RealPlayer, Windows MediaPlayer and Quicktime[C]//Proc of the 10th IEEE Symposium on Computers and Communications.Washington DC:IEEE Computer Society,2005:591-596.
[6][EB/OL].[2006].http://www-x.antd.nist.gov/nistnet/.
[7]SPASOJEVIC M, BHATTI N, ROY S, et al. Understanding the impact of diverse streaming workloads on end-user quality of service[C]//Proc of the 10th International Workshop on Web Content Ca-ching and Distribution.Washington DC:IEEE Computer Society,2005:83-94.
[8]佟雨兵,胡薇薇,楊東凱,等.視頻質量評價方法綜述[J].計算機輔助設計與圖形學學報,2006,18(5):735-740.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”