羅 暉,王世昌,褚紅亮,楊成武
(華東交通大學信息工程學院,江西南昌,330013)
目前,在交通監控中,為實現對交通路況的實時視頻監控,需要布置復雜的通信網絡,以保證交通監控網絡[1]長期穩定、可靠地運行。而無線多媒體傳感器網絡(wireless multimedia sensor networks,WMSN)[2]具備部署快速、組網靈活、感知信息豐富等優點。將WMSN用于交通監控中,不但可以實時獲取路況場景的視頻信息,而且能適應復雜多變的地理環境,其基本網絡體系結構如圖1所示。在監控區域內,視頻傳感器節點負責采集路況視頻信息;簇頭節點冗余部署在視頻傳感器節點周圍,負責處理視頻信息,并通過自組網以多跳中繼方式將視頻信息傳輸給匯聚節點;匯聚節點以無線通信方式將視頻信息發送給交通遠程監控中心。

圖1 交通視頻監控WMSN網絡體系結構Fig.1 WMSN network architecture of traffic video surveillance
在上述交通視頻監控WMSN網絡中,視頻信息數據量巨大,而WMSN傳感器節點的能量、處理能力和存儲資源受限。因此,研究一種高效的視頻壓縮編碼方法就成為了WMSN應用于交通視頻監控的關鍵。
近年來,由Candes和Donoho等人提出的壓縮感知(compressed sensing,CS)[3]理論在信號采集和處理領域引起了國內外學者的廣泛關注。CS理論指出,將一個稀疏或可壓縮的高維信號投影到低維空間上,獲取原始信號的觀測值;同時,借助少量的觀測值,可以通過一定的線性或非線性優化算法重構出原始信號。在CS處理過程中,因為觀測值的個數遠遠少于Nyquist采樣數,所以,如果將CS理論引入到視頻圖像編碼中[4-6],就有望實現更有效的數據壓縮和更準確的數據重構。這為視頻編解碼提供了一種新思路,也為WMSN應用于交通實時監控提供了可能。
假設一維有限長離散信號x∈RN×1,將其表示為N×1的列向量,所選取變換域空間的基函數為:,則x在Ψ 域表示為

式(3)是一個l0范數的優化問題,即NP-難問題,在多項式時間內難以求解,甚至無法驗證其解的可靠性。理論分析表明,在一定條件下,l1最小范數和l0最小范數具有等價性,可以得到相同的解。那么將式(3)l0最小范數轉換為l1最小范數

式中:α是x在Ψ上的表示系數,若它有K個分量不為零,而N-K個分量為零或者非常接近于零,就稱x在Ψ域是K稀疏的或是近似K稀疏,也就是說,x是可壓縮的。
在稀疏條件下,用一個M×N的觀測矩陣Φ作用于信號x,獲取的觀測向量為y,則y=Φx,將式(1)代入,得到壓縮感知數學表達式[7]

式中,Θ是CS算子,在數學上表現為一M×N矩陣,由于M?N,因此,式(2)是個病態方程。但當Θ滿足有限等距性質(restricted isometry property,RIP)[8]時,等價于Ψ 和Φ不相關,通過數學優化方法能夠獲得精確解[9]。因此,重構原始信號等價于求解一個優化問題,其優化目標表示如下

式(4)是一個非線性優化問題,可用貪婪追蹤算法解此優化問題,如正交匹配追蹤(OMP)算法[10],也可以將非凸問題轉化為凸問題尋找信號的逼近,如基追蹤(BP)算法[11]、快速迭代收縮閾值(FIST)算法[12]等。
在交通視頻監控中,監測區域場景一般是固定的,連續視頻幀圖像的背景相同,且視頻圖像存在幀內幀間相關性。基于此特點,將視頻圖像組(group of picture,GOP)中的圖像幀定義為關鍵幀和非關鍵幀再分別進行編碼。
在編碼過程中,將WMSN節點采集的每個GOP的第一幀作為視頻圖像關鍵幀,標記為I幀,其余的視頻圖像幀稱作非關鍵幀,標記為Pj幀。同時,因一個GOP中的視頻圖像背景相似,幀間存在強相關性,借助I幀的圖像信息,并利用幀間差值技術,可以獲得Pj幀的殘差幀視頻圖像ΔPj。
3.1.1 稀疏表示
對于交通視頻圖像,因其內容中車輛等目標圖像的像素存在鄰域相關,且細節豐富。而Symlets小波具有雙正交、近似對稱和緊支撐等特點,其小波系數在保持稀疏性時,能有效刻畫圖像細節信息。因此,可以選取Symlets小波對交通視頻圖像的I幀和殘差幀視頻圖像ΔPj進行稀疏表示。

3.1.2 觀測過程
在CS理論中,對信號進行重構,要求CS算子滿足RIP特性,即觀測矩陣與稀疏基函數相關性非常小。已有理論證明:隨機高斯測量矩陣與絕大多數稀疏基不相關,且存儲簡單,因此,選用隨機高斯測量矩陣作為觀測矩陣對小波稀疏系數進行觀測,可以最終獲得重構視頻圖像所需要的采樣信號。
1)I幀觀測過程。設高斯測量矩陣是,其元素相互獨立并服從0均值、方差為的高斯分布即

經過觀測過程,獲取的采樣觀測值為

對二維圖像的觀測是按列進行的,觀測矩陣的行數,決定了視頻圖像采樣值的多少。設計合適的觀測矩陣,可以獲得最優的觀測值以重構出高質量的視頻圖像。
2)Pj幀觀測過程。稀疏表示已獲得了Pj幀的殘差幀視頻圖像ΔPj,ΔPj與Pj相比較,ΔPj中的像素值更加稀疏,因此,經小波變換后,非零的小波系數非常少,為加快觀測的實時性,由I幀觀測矩陣構造出綜合觀測矩陣ΦP,對GOP中所有Pj幀的ΔPj進行綜合觀測,ΦP表示為

式中:Φ1=Φ2=…=Φj=Φ,Φj對應Pj幀的殘差幀視頻圖像,殘差幀視頻圖像ΔPj按式(5)進行處理后獲得相應的小波系數,進而得到采樣觀測值為

由于非關鍵幀視頻圖像Pj經幀間差值技術處理和小波變換后,小波系數已經變得相當稀疏,且ΦP中的矩陣元素相同,因此,設計的綜合觀測矩陣降低了編碼復雜性。
3.1.3 視頻圖像編碼具體過程
基于以上分析,交通視頻圖像的編碼過程如下:在每個GOP中,I幀經小波變換直接感知觀測;對于Pj幀,先獲取殘差幀視頻圖像ΔPj,再經小波變換后,利用綜合觀測矩陣獲取觀測值,觀測值經量化[13]和熵編碼[14-15]后完成編碼。具體如圖2所示。
在傳統視頻圖像解碼中,視頻解碼就是實現編碼的逆過程。然而基于CS的交通監控WMSN視頻解碼中,重構視頻是一個求解數值優化問題的過程。

圖2 基于CS的WMSN視頻編碼過程Fig.2 WMSN video encoding based on CS
3.2.1 解碼算法
在解碼端,CS重構過程中的優化目標函數為

利用拉格朗日算子將式(10)轉化為無約束的優化問題

利用OMP算法迭代求解式(11),重構I幀和殘差幀視頻圖像ΔPj,算法流程描述如下
輸入:Θ=ΦΨ∈RM×N:CS采樣算子矩陣
y∈RM×M:采樣觀測值
K:視頻圖像幀的稀疏度
中間變量:r∈RM×M:每次迭代產生的殘差
Λt:t次迭代后,選出的所有算子向量索引λt的集合
初始化:r0=y,Λ0=φ,t=I

循環迭代K次,獲得原始視頻圖像的近似表達
3.2.2 視頻圖像解碼具體過程
在視頻圖像解碼中,視頻碼流經過熵解碼和逆量化后,獲得了視頻圖像I幀和殘差幀視頻圖像ΔPj的觀測值。然后,在圖像壓縮感知重構中,通過運行OMP算法迭代處理相應的觀測值,重構出GOP中的I幀圖像和殘差幀視頻圖像ΔPj,進而恢復出視頻流。其解碼具體過程如圖3所示。

圖3 基于CS的交通監控WMSN視頻圖像解碼Fig.3 WMSN video decoding of traffic surveillance based on CS
在交通視頻監控[15]中,Pj幀借助I幀信息完成重構,因此I幀的重構是視頻重構的關鍵。在實驗中,設置GOP中的原始I幀圖像大小為256×256,通過改變觀測次數重構圖像,并對其進行比較,具體仿真結果如圖4所示。圖4(a)是未經處理的原始視頻I幀圖像;圖4(b)是在觀測次數為200時,重構出的I幀視頻圖像,該圖中,在車輛聚集處,車輛之間的間隔不清,路標牌上的字跡模糊,這表明視頻圖像質量較差,其PSNR值僅為27.12 dB;圖4(c)是在觀測次數為300時,重構出的I幀視頻圖像,與圖4(b)相比,其視覺效果更好,能辨出車間距離,字跡更清晰,沒有明顯的模糊效應,而且PSNR值達到32.94 dB。
因此,可以得出結論:在視頻圖像重構過程中,隨著觀測次數的增加,重構出的視頻圖像的質量更高、PSNR值也更大。

圖4 實驗仿真結果圖Fig.4 The result pictures of experimental simulation
從視頻圖像質量的主觀評價角度考慮,圖像質量越高越好,那么需要相應地增大觀測次數。但是,如果觀測次數太大,就延長了重構時間,因此,需要依據交通視頻監控標準設置合適的觀測次數。

圖5 實驗仿真結果圖Fig.5 The result pictures of experimental simulation
對于Pj幀視頻圖像處理過程,采用與I幀相同的CS參數,當觀測次數增加到一定程度時,重構出的Pj幀視頻圖像的PSNR值沒有太大變化,結果如圖5所示。在圖5中,當觀測次數大于300時,PSNR值基本不變。這種現象是因為:殘差幀視頻圖像經Symlets小波變換后,小波系數已經相當稀疏,并且能重構出高質量的視頻圖像。因此,增加觀測次數,重構出的Pj幀視頻圖像PSNR不會顯著變化。
在交通視頻監控過程中,利用監控視頻圖像的幀內、幀間相關性,并采用壓縮感知技術,對視頻圖像中的關鍵幀與非關鍵幀進行編解碼。經實驗仿真分析得出:該方法在恢復原始的視頻圖像過程中,不但大大減少了傳輸數據量,而且重構視頻圖像的PSNR值達到了30 dB以上。
[1]KUMAR P.Framework for real-time behavior interpretation from traffic video[J].IEEE Transaction on Intelligent Transportation Systems,2005,6(1):43-53.
[2]AKYILDIZ I F,MELODIA T,CHOWDHURY K R.Wireless multi-media sensor network:a survey[J].IEEE Transactions on Wireless Communication,2007,14(6):32-39.
[3]DONOHO D L.Compressed sensing[J].IEEE Transaction Information Theory,2006,52(4):1289-1306.
[4]WAKIN M B,LASKA J N,DUARTEM.F,et al.Compressive imaging for video representation and coding[C]//Processing Picture Coding Symposium,special session on Next Generation Video Representation,Beijing,2006:1-6.
[5]ROMBERG J.Imaging via compressive sampling[J],IEEE Signal Processing Magazine,2008,25(2):14-20.
[6]DUARTE M,DAVENPORT M,TAKHAR D,et al.Single-pixel imaging via compressive sampling[J],IEEE Signal Processing Magazine,2008,25(2):83-91.
[7]石光明,劉丹華,高大化,劉哲,林杰,王良君.壓縮感知理論及其研究進展[J].電子學報,2009,37(5):1070-1081.
[8]TONG ZHONG.Sparse recovery with orthogonal matching pursuit under RIP[J].IEEE Transaction,2011,57(9):6215-6221.
[9]CANDES E J,WAKIN M B.An introduction to compressive sampling[J].IEEE Signal Processing Magazine,2008,25(2):21-30.
[10]TROPP J A,GIBERT A C.Signal recovery from random measurements via orthogonal matching Pursuit[J].IEEE Transactions on Information Theory,2007,53(12):4655-4666.
[11]CHEN S B,DONOHO D L,SAUNDERS M A,Atomic decomposition by basis pursuit[J].Siam Journal on Scientific Computing,1998,20(1):33-61.
[12]A.BECK,M.TEBOULLE.A fast iterative shrinkage-thresholding algorithm for linear inverse problems[J].Siam Journal on Imaging Sciences,2009,2(1):183-202.
[13]Y.BAIG,E.M.K.LAI,J.P.LEWIS.Quantization effects on compressed sensing video[C]//17th International Conference on Telecommunications.IEEE,2010:443-446.
[14]THOMAS WIEGAND,GARY J SULLIVAN,AJAY LUTHRA,et al.Overview of the H.264 video coding standard[J].IEEE Transactions on Circuits and Systems for Video Technology,2003,13(7):1-19.
[15]郭厚焜,吳峰,黃萍.基于壓縮感知和字典學習的背景差分法[J].華東交通大學學報,2012,29(1):43-47.