桑愛軍, 于 歡,2, 張漢宇
(1.吉林大學 通信工程學院, 吉林 長春 130022; 2.上海無線電設備研究所, 上海 201109 )
隨著人們對安全意識的增強,監控視頻的普及程度越來越高[1-4].如何能夠提高監控視頻的編碼效率,是該領域所面臨的一系列重要挑戰.通常監控視頻[5-7]有以下特點:固定的攝像頭位置,光線變化呈一定規律性,場景變化少.根據這些特點,人們主要采用面向對象的編碼方法[8-11]、基于感興趣區域的編碼優化方法和背景參考圖像的編碼優化方法[12-15]來解決監控視頻中的編碼問題.監控視頻一般工作時間都是持續的,并且時間很長,為了減少監控視頻工作的時間,選擇合適的編碼技術進行編碼在實際應用中有很重要的意義.AVS監控伸展檔次,即AVS-S,在該框架中有背景幀(G幀)和背景預測幀(S幀),其中G幀是幀內預測編碼時所使用的背景圖像,用來顯示場景信息,為S幀提供背景信息;S幀大大提高了監控視頻的編碼效率.該方法主要是通過消除監控視頻中的背景冗余實現的.
本文在AVS-S的編碼框架之下,提出一種新的背景幀更新方法,即迭代更新均值法(iterative update average,IUA),該方法進一步加強了背景信息的完整性和提高了背景幀的質量,提升了監控視頻的編碼效率.
在任意一監控視頻中,取某一像素點在一定范圍的連續幀內的全部像素值組成集合A,則集合A內的所有數據是一組分類數據.分類數據是統計學中一種反映事物類別的數據,是離散數據.集合A中不同性質的數據之間相互獨立,同一性質的數據之間具有相關性,因此可以根據數據之間的關系完成對集合A的分組.分組后集合A中包括眾數組和非眾數組,通過異眾比率可以判定每個數組的性質.
異眾比率是指非眾數出現的頻數占總頻數的比例,即
(1)
其中:V0表示異眾比率;f0為眾數組的頻數;N為總頻數.當V0越小時,非眾數組的頻數在總頻數中占比越小,說明眾數組中的像素值是背景像素值的概率越大;當V0越大時,眾數組的頻數在總頻數中占比越小,說明眾數組中的像素值成為前景像素值的概率越大.保留背景像素值,建立最終的背景模型.
在監控視頻編碼的過程中,背景幀的質量越好,最終的編碼效率越高.而影響背景幀質量的因素有以下兩種:
1)訓練集長度將會影響背景幀的質量.要想提高背景模型的質量和不斷改善建模的效果,就要有充足的可參考實驗數據和足夠長的訓練集長度,G幀更新的方法正好可以滿足這兩點要求.但是由于運動目標出現的不確定性,所以對建模效果也會有不同程度的影響.因此背景模型的質量與訓練集的長度不成正比.
2)前景目標的運動速度將會影響背景幀的質量.在測試視頻中,物體停留在某一像素點區域的時間由物體的運動速度決定,對建模效果也會有不同程度的影響,物體運動越快,影響越小,反之則相反.故要消除慢速運動的物體對背景模型的影響更困難.
迭代更新均值法通過眾數將數據進行分組.根據異眾比率判定該組數據的狀態,并根據像素點狀態的不同選擇不同的處理方法,得到最終的背景模型.
根據對當前像素點的性質進行判定的結果共有三種,分別是僅受光照、受快速運動物體以及慢速運動物體影響的像素點.僅受光照影響的像素點的影響因素為光照的自然變化;快速運動的物體經過像素點停留時間短,對建模效果影響小;慢速運動物體與快速運動物體情況相反.迭代更新均值法對不同性質的像素點采用相對應的處理方法,盡可能減少對建模效果的影響,保留更為準確的背景像素值.
“這種說法屬于偷換概念?!焙笔≈嗅t醫院老年病科學科主任醫師譚子虎介紹說,冬天因為曬太陽少導致人體骨骼出現的鈣流失等問題,完全可以通過春、夏、秋3個季節彌補回來。骨頭變脆是一個長時間漸變的過程。冬天骨折多可能與冬季地面變得堅硬,且與人們衣服穿得比較厚、行動笨拙,在冰雪天容易滑倒有關,中老年人尤其如此。因而,冬天比其他季節更容易讓人滑倒和骨折,但并不能因此就說冬天骨頭會變脆。
1)初始化.創建數據集,其長度為M,數據集用來存放前M幀數據,即
I={It(x,y),It+1(x,y),…,It+M-1(x,y)} .
其中,It(x,y)表示t時刻(x,y)處的像素值,從I中求得眾數,將其記為T.
2)選擇閾值.記μ為均值,σ2為方差,則對應的正態分布為
(2)
根據正態分布的3σ準則,x分布在(μ-3σ,μ+3σ)的概率為0.997 4,故將作為3σ閾值來判定像素點性質,閾值設置為14.
3) 數據判定及分組.當前像素值It(x,y)根據式(3)判定其狀態,若式(3)成立,則Ft(x,y)記為1,否則記為0.其中,Ft(x,y)見文獻[16],為當前像素點狀態判定標志,該標志的值用于后續的背景像素點的判定.
(It(x,y)-T)2<14.
(3)
4)求得當前像素點的背景像素值.若當前滿足式(3)的像素點數大于訓練集長度L的一半時,則將滿足式(3)的所有像素的均值作為背景像素值;若滿足式(3)的像素點數小于訓練集長度L的一半且存在連續30幀,Ft(x,y)的數值均為1,則判定當前位置有運動物體長時間停留;將Ft(x,y)=0的所有像素值的均值作為背景像素值,否則背景像素值為訓練集中該像素點所有像素值的均值.
5)循環步驟1)~4)直至遍歷訓練集所有像素點,得到最終的背景模型.
迭代更新均值法中當前像素點的長度為K,而訓練集的長度為L(K 選擇不同長度的訓練集和判定像素值狀態的數據集,長度分別用L和K表示,本實驗取L為100,200,K為10,50,在此數據條件下觀察背景模型效果.圖1~圖3分別是視頻訓練集Classover,Crossroad和Overbridge在此數據下的實驗仿真結果,圖中方框是不同訓練集、不同訓練長度及不同當前像素點條件下得到的運動目標. 圖1 訓練集Classover下的背景模型 圖2 訓練集Crossroad下的背景模型 圖3 訓練集Overbridge下的背景模型 通過直觀地觀察和客觀的實驗結果分析可以得出,在當前像素點的長度和訓練集長度分別為K=50,L=200條件下,可以獲得最佳的背景模型效果.因此迭代更新均值法中的參數選取為L=200,K=50. 在AVS-S框架中,選取分段加權滑動平均值法(SWRA)、均值法(AV)以及混合高斯背景建模法(GMM)在訓練集長度為200所生成的背景模型,同迭代更新均值法(IUA)所生成的背景模型進行比較,如圖4~圖6所示,圖中方框為不同方法在不同訓練集條件下得到的運動目標.從圖中可看出,IUA所生成的背景模型在主觀質量上要優于其他方法所生成的背景模型,并且SWRA方法生成的背景模型要優于AV和GMM方法.為了更進一步地觀察背景幀質量對監控視頻編碼效率的影響,對編碼效率進行以下數據分析. 本文實驗中全部測試視頻來自PKU-SVD-A,仿真軟件為AVS-S編解碼軟件的官方版本RM09.13-v3.將AVS-S框架下的IUA和SWRA以及AVS基準檔次在不同監控視頻下進行編碼效率對比.碼率與峰值信噪比的關系曲線如圖7所示,生成率失真曲線相關數據以及實驗參數設置見文獻[16].根據圖7可以得出,在三種不同監控視頻下,IUA編碼性能優于其他兩種編碼方法,其中峰值信噪比越大編碼性能越好,碼率是單位時間內視頻傳輸的數據量,單位為Kb/s,碼率值越大,視頻中信息量越大.對三種編碼方式進行數值分析,如表1所示,評價指標為BDBR和BD-PSNR[17].BDBR表示在相等的峰值信噪比下,在率失真曲線中畫一條水平線,得到的兩種方法碼率節省情況,即水平方向分析編碼性能;BD-PSNR表示在相同的碼率下,在率失真曲線中畫一條垂直線,得到的兩種方法峰值信噪比差異,即垂直方向分析編碼性能.客觀分析與直觀觀察結果保持一致,通過表1分別計算三種視頻中得出的BDBR和BD-PSNR平均值,得出本文方法的G幀比SWRA方法平均節省碼率12.402%,平均峰值信噪比提高0.363 dB;同理,與AVS基準檔次相比平均節省碼率43.283%,平均峰值信噪比提高1.186 dB. 圖4 不同方法在訓練集Crossroad下所生成的背景模型 圖5 不同方法在訓練集Overbridge下所生成的背景模型 圖6 不同方法在訓練集Classover下所生成的背景模型 圖7 不同訓練集下編碼性能對比 表1 本文方法與各編碼方法比較 在AVS的編碼框架下,本文提出一種新的G幀更新方法,即迭代更新均值法.該方法可以很好地區分不同運動速度的物體,從而得到視頻中較為完整的背景信息,提高了背景幀的質量,并且在同等碼率和相同峰值信噪比的條件下,G幀更新方法的編碼效率要優于AVS基準檔次方法和分段加權滑動平均值法,是一種更加高效的編碼方法.


3 實驗結果及分析





4 結 論