于桐,郭利,王威澄
(1.陸軍工程大學石家莊校區,河北石家莊,050003;2.武裝警察部隊特種警察學院,天津,102200)
傳統的野外條件下的裝備維修搶修,對一線維修人員的素質要求極高,涉及復雜系統維護時,需要后方專家技術人員依據現場的視頻圖像,對裝備現場的維修人員進行技術指導,但野外條件信號穩定度差,傳輸帶寬小,傳輸效率低,數據的穩定傳輸有限制,對數據壓縮效率提出更高要求,支持系統需要使用射頻(RF)天線將其傳輸到后端云服務器中,而傳輸所有RGB 視頻流數據信息消耗的功率占總功率的絕大多數,超過60%的功率消耗于射頻天線傳輸數據中。
傳統的壓縮算法大多通過圖像頻域或空域[1,2]的各種屬性進行壓縮,陳曦在[3]中,提出了基于離散余弦變換(DCT)圖像壓縮算法,其對像素塊適用性較好,但DCT 的固有性質破壞了圖像質量,使色彩再現變得困難。Kasmeera等在[4]中提出了一種在隸屬度數據和霍夫曼編碼的幫助下壓縮加密數據的方法,對靜態JPEG 圖像,壓縮比率較傳統方法更高。Ranjan 在[5]中,提出了一種基于DWT 和熵編碼器的規范霍夫曼編碼方式,通過標準閾值控制編碼使壓縮體積更小,獲得的碼本尺寸較傳統霍夫曼編碼更小。文獻[6,7]中設計了基于具有Hexadata 編碼和算術編碼的兩級DCT的圖像壓縮方法,提出的Hexadata 壓縮算法通過減少高頻矩陣中的系數來提高壓縮效率。
但這些方法的在特定場景下壓縮效率仍不盡如人意,需要開發新的圖像壓縮方法,為維修輔助設備增加額外的功能和更長時間的續航。
本文中提出了一種針對裝備維修現場的圖像特征特點進行優化的壓縮方法,使用本文方法可獲得更高的壓縮效率。裝備維修現場圖像與常規圖像有明顯區別,具體體現在色彩分布均勻,分布結構具有規律性。按照傳統的視頻編碼方式,裝備維修現場圖像會產生大量冗余信息,極為影響壓縮效率,本文使用的圖像壓縮方法如圖1 所示。

圖1 圖像壓縮重構方法
方法主體分為兩步:
第一步:顏色空間轉換,將圖像從RGB 色彩空間轉換至YUV 色彩空間。
第二步:DPCM 編碼,通過差分脈沖編碼來減少數據維度,獲得更高的壓縮效率。
由于在維修現場,鏡頭轉換基本保持緩慢平穩,相鄰幀的色彩通道分布具有相似性,選取連續200 張視頻幀圖像,部分圖像如圖2 所示。

圖2 維修現場圖像
傳統視頻圖像采樣方式均使用基于三維空間的RGB 色彩通道,包括R、G、B 三個原始光譜分量,這三種原始的混合色基本覆蓋了人類視覺的全部色彩空間。在分析圖像的像素結構式,可以發現,單一色彩通道具有較廣的強度分布,極為影響壓縮效率。相鄰兩幀的圖像像素強度分布直方圖如圖3所示。

圖3 像素強度分布
可以看到,相鄰幀間,圖像的像素分布具有相似性,細微差別在人眼觀測情況下可忽略不計,兩相鄰幀圖像第500 行的像素值分布如圖4 所示。

圖4 同列像素值
為了獲得更高的壓縮效率,可使用對RGB 轉碼YUV 操作,一張圖像尺寸為寬為w,高為h,YUV 顏色空間通過對RGB 空間進行計算獲得色差和亮度分量,Y 為亮度,U 表示色差R-Y 信號,V 表示色差B-Y 信號。

通過RGB 采用逐點像素r、g、b 通道存儲的存儲方式后,占用w*h*3 內存。
使用YUV 逐點記錄亮度Y,奇數行記錄U,偶數行記錄V 的方式,共占用w*h*1.5 內存,相對于使用傳統編碼方式,yuv 編碼能夠節約50%數據量。
圖5 中所示為兩個連續幀的YUV 分量的直方圖。可以觀察到,由于相鄰幀的Y,U 和V 分量結構具有相似性,故使用合適的編碼方式可節約更大的空間。

圖5 YUV 強度值
本文使用DPCM 編碼方式,對圖像進行再壓縮,DPCM 通過對每個像素當前實際值和預測值的差值進行提取和編碼,以此消除像素間的冗余,DPCM 原理如圖6。

圖6 DPCM 原理
DPCM 編碼[8]使用線性預測器,預測系數為c,其中為點(i,j)處預測像素值,s(i,j)為點(i,j)處實際像素值,m 為預測級數,將預測級數m 設置為4,可得

為求實際值與預測值的誤差最小,即求解s(i,j)和的均方差最?。?/p>

最優解為系數方程的解:

c為系數向量解,Φ 為自相關系數矩陣,其中:

自相關系數RS(x,y)定義為:

可得均方差最優系數向量解為:

使用兩種經典圖像評價指標峰值信噪比PSNR 和結構相似性SSIM。
(1)峰值信噪比PSNR
由于壓縮重構后的圖像相較于原圖像必然存在信息差。評價信息質量差的公認指標為PSNR[9],PSNR 越高,壓縮后的信息保持度越高,PSNR 定義為:

其中MSE 為兩張圖像之間的均方誤差,MAX 為圖片像素極值,設定為255,MSE 定義為:

其中I(i,j)為圖像I 在點(i,j)處像素值,K(i,j)為圖像K 在點(i,j)處像素值。
(2)結構相似度SSIM
SSIM[9]用于度量x 和y 之間的結構信息,SSIM 定義為:

其中μx、μy為x、y 的均值,為x 和y 的方差,σxy為x 和y 的協方差,c1和c2為常數。
本文選取了幾種傳統壓縮編碼方式與本文使用的壓縮編碼方式進行對比,分別為BMP 編碼、JPEG 編碼、奇異值壓縮(SVD)[10]和本文方法,在lena 標準圖像上對各種方法進行測試,圖為各種方法的視覺成像效果,可以看到,本文方法能在節約大量內存情況下,保留更多的圖像細節,但由于預測編碼的局限性,誤差不可消除,在眼角處出現了陰影型偽像。
在維修現場的圖像上進行測試,圖8 為各種方法的視覺成像效果。

圖8 維修圖像效果
表為各種壓縮編碼方式在維修限產圖像實驗中占用的內存、壓縮比以及重構效果,本文方法在標準圖像上能獲得更好的壓縮率和重構效果。

圖7 各種方法壓縮效果

表1 壓縮率及重構效果
本文嘗試了從壓縮算法的改進設計入手,減少遠程音視頻系統傳輸的數據量,節約設備的整體能源,通過對目標圖像像素結構進行統計分析,經實驗驗證,能夠有效提高壓縮比率,緩解數據傳輸壓力,使輔助維修設備擁有更長的續航時間,添加更多功能。