摘要:隨著數字視頻壓縮技術的迅速發展,互聯網視頻資源日益豐富,圖象質量也千差萬別,從視頻質量的角度,選擇最適合客戶的資源,是我們關心的問題。Agent是一種新的分布式計算方式,是分布式人工智能中的重要技術。文章將Agent與視頻質量評估結合,提出基于Agent技術的個性化網絡視頻選擇模型。
關鍵詞:視頻圖像;質量評估;多Agent系統;個性化
中圖分類號:TP182文獻標識碼:A文章編號:1009-3044(2008)30-0703-02
A Model of Personalized Internet Video Selection Based on Agent Techonology
LIANG Feng
(Educational Technology Center of Anhui RadioTV University,Hefei 230022,China)
Abstract: With the development of digital video compaction technique, the video resources on Internet are growing richer and richer,Image Quality is very different.Therefore, it is an interesting work to select suitable video resources from the Angle of video quality. Agent is a kind of technology belonging to distributed artificial intelligence and it is a new method of distributed computing. This paper combines agent and video quality assessment, and proposes a model of personalized internet video selection based on agent technology.
Key words: video image; quality assessment; multi-agent system; personalization
1 引言
用戶對視頻質量的主觀感受,直接影響互聯網視訊業務的推廣,雖然數字視頻技術取得了迅速的發展,但在目前的技術水平下仍需要在算法和設備的設計中做出某些折衷,如時間分辨率與噪聲敏感度之間的折衷(采集),空間分辨率與圖像尺寸的折衷(傳輸和存儲),亮度的范圍與階數之間的折衷(顯示)[1]。當在其中做出某種選擇后,將會影響到重建圖像的感觀,因此有必要對信源端和接收端圖像質量進行評估。
Agent是近年來計算機科學領域中的一個重要概念,已被廣泛應用于分布式計算等領域。一般的,將Agent看作駐留和流動在環境中得一個實體,可以在特定環境下感知環境,解釋“感知”到的反映環境及自身和其他實體的狀態,并能自主地運行以代表其設計者或使用者實現一系列目標的軟件或軟、硬件合一的實體 [2]。Agent的主要屬性有自治性、反應性、協同性、學習性。此外,一些Agent可能還具有移動性、長壽性、安全性、委派性、時間連續性等。
基于Agent技術構建用戶個性化興趣模型,能夠促進用戶在線獲取視頻的成功率和效率,節省時間、減輕網絡負擔。
本文首先介紹了視頻質量的客觀評估方法和多Agent技術的有關內容,然后提出基于Agent的網絡視頻選擇模型,并對此模型展開分析,最后總結全文并說明下一步需要研究的工作。
2 視頻質量評估方法概述
電視廣播領域圖像質量主觀評價的標準已相當完善,但對于互聯網應用領域圖像質量的客觀測量是近幾年才興起的一個研究熱點。目前國際組織VQEG (Video Quality Experts Group)正在積極研究制定相關的評估標準和方法。一般的,根據對原始圖像的參考程度,圖像質量的客觀評價可分為三種:全參考型(FR,Full Reference)、弱參考型(RR,Reduced Reference)和無參考型(NR,No Reference)三種[3],在全參考質量評價方法中,需要將待評 “失真”圖像與原始圖像進行比較得到評價結果,而理想的原始圖像通常來自高質量的攝錄系統,并且認為沒有任何失真,常用的方法有均方誤差(MSE,Mean Squared Error)、峰值信噪比(PSNR,Peak Signal-to-noise Ratio)、加權均方誤差(WMSE, Weighted Mean Square Error)等。在弱參考質量評價方法中,提取原始圖像的部分信息,然后利用這部分信息與“失真”圖像進行比較分析,典型的RR圖像質量評價算法有特征提取方法、諧波強度法、wavelet域統計模型等。FR和RR的共同點是,它們都全部或部分地借助原始的非失真圖像作為參考,但事實上很多場合都無法或較難獲得原始圖像,無參考質量評價就是在不借助任何參考圖像的前提下,通過對待評估圖像空域和頻域的分析,完成對“失真”圖像質量的評估,目前多數NR圖像質量評價算法主要集中在圖像的模糊程度、鈴振效應和分塊效應等方面。例如,在文獻[4]中,作者提出,通過邊緣檢測算法得到圖像的模糊程度;文獻[5]中,作者提出用塊差分和圖像信號的活躍度來建立局部模糊測度;文獻[6]中,作者提出用圖像邊緣伸展作為局部失真測度;文獻[7]中,提出用小波系數作為JPEG2000壓縮圖像中的模糊和鈴振效應的局部特征。
由于NR型圖像質量評價是真正意義上模擬人來評價圖像質量的方法,因而它的應用范圍也將會非常廣。
3 多Agent系統模型及求解方式
MAS(Multi-Agent System,多Agent系統)是分布式人工智能的一個重要分支。比較成功的MAS模型主要有BDI模型、效用模型、通信模型等。BDI(Belief,Desire,Intention)模型是最經典的Agent模型,它主要考慮單個Agent的構造,并在此基礎上實現MAS的整體功能。BDI模型由信念、愿望、意圖、計劃庫和解釋器五個模塊組成。信念(Belief)是Agent對其所處環境的認識;愿望(Desire)是Agent希望達到的狀態;意圖(Intention)是Agent為達到愿望而計劃采取的行動步驟;行動步驟從計劃庫中提取;而對Agent的總體控制由解釋器實現[8]。BDI模型認為:只要Agent對環境的認識是絕對正確的,有具體明確的愿望,且內部的計劃庫充分完備,那么Agent就可以完成MAS所賦予它的任務,而不需要去求助于其它Agent。這種邏輯理性認為任何一個合理的行為都可以基于當前的信念,通過Agent完備的信息,合乎邏輯地推導出來[9]。這種模型注重邏輯推理,而忽視Agent的社會特性,同時也存在邏輯全知問題。
Agent的效用模型是以利己主義為中心的。效用模型又稱為經濟模型。在MAS的效用模型中,每個Agent有自己的目標,完成自己的目標就會獲得一定的效用。協作的Agent組成的聯盟會帶來單個Agent效用之和的增值。Agent進行協作完成一定任務后會得到額外效用。效用模型的前提是Agent的自利性。它基于經濟學的原理,為每一個行為賦予一個概率,用效用函數表示愿望,一個合理的行為是使期望效用達到最優。
多Agent協調(multi agent coordination)與多Agent協作(multi agent collaboration)是MAS的兩種重要求解方式。在資源緊缺的環境下,若沒有很好的協調,易出現由資源競爭導致的死鎖, D.Connah和P.Wavish從社會心理學的角度給出三種Agent協作風格:樂善好施型、利他主義型和自私自利型。
4 基于多Agent的個性化網絡視頻選擇模型
4.1 模型
本文給出的個性化網絡視頻選擇模型見圖1。模型有3個組成部分:分布式Video資源服務器、客戶和Internet。
Video服務器系統采用統一的視頻泵實現對所有主流媒體格式的支持,包括:MPEG 1/2/4,WMV,ASF,RM,H.263,AVI等,從而能夠大大減輕管理負擔,適應各種網絡狀況和用戶需求,圖像質量客觀測量一般采用部分參考型評估,如原始圖像較難獲得也可采用無參考型評估。每個服務器包括提供VIDEO服務的物理實體和Service-Agent兩個部分;Service-Agent是Server上負責提供具體服務的軟件代理,主要進行多線程并發調度、內存預測預讀調度、節目的分盤存儲,它負責接受客戶請求。Control-Agent是控制Agent,它有一個獨立的IP地址,其主要任務就是考慮動態負載均衡決定如何將此請求分配到真正的服務器上,從而最大限度地提高系統地吞吐量和處理能力,Control-Agent只負責轉發請求,不對HTTP協議作任何解釋,否則將會成為Video服務器系統的瓶頸。
4.2 工作流程
一個視頻服務的整個過程可以由如下步驟實現:
1) Client-Agent獲取用戶信任,建立客戶及其周邊環境的初始狀態模型。
2) 向Control-Agent發出請求。
3) Control-Agent接到請求,Control-Agent在系統中是一直處于活動狀態,未接到請求前不斷感知網絡的狀態、服務器的負荷、資源的分布;一但收到請求立刻開始調度,指定多服務器系統中的某服務器提供服務。
4) Client-Agent接收到視頻流,立刻對圖像進行無參考型評估,根據人類視覺系統(HVS)的特點,檢測圖像的模糊效應,分塊效應和鈴振效應(ringing),是否達到用戶的要求,如果不符合立刻通知Messenger-Agent,停止此次傳送,跳轉到2)請求質量更高的資源。
5) 檢測流媒體網絡傳輸的幾個重要參數是否符合《國家IP網絡技術要求》:延時(<400ms)、丟包(<0.1%)、抖動(<50ms)。如果不符合立刻通知Messenger-Agent,停止此次傳送,跳轉到2)放棄在線觀看的要求,請求下載服務。
6) 通知客戶收看。
7) 服務結束,釋放Client-Agent、Messenger-Agent。
5 結論
因為全參考和弱參考評價需要獲得參考圖像的全部或部分信息,因此在基于互聯網的應用中受到了限制,無參考型圖像質量評價算法具有模擬人來評價圖像質量的意義,因而是一個非常有意義的研究方向。VQEG已將無參考質量評價標準作為未來的工作方向之一。Agent作為一種新穎的知識表示和問題求解方法,已受到普遍關注。本文將Agent技術引入個性化和智能化網絡視頻服務,能夠促進用戶在線獲取視頻的成功率和效率,減輕網絡資源的占用。建立一個精確、統一的HVS模型是下一步的研究工作。
參考文獻:
[1] 王濤.數字圖像質量客觀評價算法研究[D].西安電子科技大學,2006.
[2] Wooldridge M J,Jenning N R.Intelligent Agent[J].theory and practice,1995,10(2):115-152.
[3] Wang Zhou,Bovik Alan C,Sheikh Hamid R,et al.Imagequality assessment:from error visibility to structural similarity[J].IEEETransactions on Image Processing,2004,13(4):600-612.
[4] Marziliano P,Dufaux F,Winkler S,et al.A no-reference perceptual blur metric[C].International Conference on Image Processing,2002:57-60.
[5] Wang Z,Bovik A C,Evans B L.Blind measurement of blocking artifacts in images[C].International Conference on Image Processing,2000:981-984.
[6] Marziliano P,Dufaux F,Winkler S,et al.A no-reference perceptual blur metric[C].International Conference on Image Processing,2002,3:57-60.
[7] Sheikh H R,Wang Z,Cormack L,et al.Blind quality assessment for JPEG2000 compressed images[C].International Conference on Image Processing. 2002,2:3-6.
[8] 史忠植.智能主體及其應用[M].北京:科學出版社,2000.
[9] 程顯毅,石純一.Agent社會理性的研究[J].軟件學報,2001,12(12):1825-1829.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文