譚 峰
(大連新聞傳媒集團技術中心,遼寧 大連 116021)
隨著互聯網的發展,視頻通信技術日益成熟,融合了語音、圖像、數據多種信息,實現了音視頻的同步傳輸。視頻通信應用于視頻會議、遠程教學等領域,豐富了人們的交流方式。然而,視頻通信質量容易受到網絡狀態及圖像處理技術限制的影響。在視頻通信過程中,圖像信息傳輸占主要地位,圖像處理技術直接關乎通信質量。目前,視頻通信圖像存在劃塊、模糊等問題,制約了視頻通信的應用。因此,開展視頻通信領域的圖像處理技術研究,對于提高圖像傳輸質量意義重大。
模擬圖像處理技術是基于光學原理和電子原理對模擬圖像進行處理的技術。模擬圖像主要指電視圖像等活動圖像。模擬圖像處理的核心設備是模擬圖像處理器,按照一定算法對輸入的模擬圖像信號進行處理,經過放大、濾波、檢波等處理后輸出優化的模擬圖像信號。模擬圖像處理的特點是處理速度快,可以實現實時處理。其使用光子并行處理的特性,處理速度可以達到光速,滿足對活動圖像處理的實時性要求[1]。模擬圖像處理具有靈活性差、精確度低的特點。其處理精度取決于電子器件的性能,一般可以達到視頻信號本身的精度,但對圖像的處理判斷能力和非線性處理能力較弱,難以實現復雜的圖像分析處理。總體來看,模擬圖像處理技術適用于對活動圖像的實時處理,特別是電視系統中的圖像處理,但在圖像分析處理方面較為薄弱。當前,模擬圖像處理技術已逐漸被數字圖像處理技術所取代,但在需要實時處理的場合仍有應用。
數字圖像處理技術是利用計算機對數字圖像進行處理的技術,也稱為計算機圖像處理。其基本過程是將模擬圖像信號采集并轉換為數字形式,然后在計算機內部對數字圖像數據進行各種算法處理,經過處理后的數字圖像再轉換為模擬圖像輸出。數字圖像處理的特點是處理精度高。它可以實現復雜的非線性處理,并具有強大的分析判斷能力。與模擬圖像處理不同,數字圖像處理可以根據軟件進行自由編程,更加靈活。另外,數字圖像處理技術提高了圖像處理的自動化程度,可減少人工干預。但是數字圖像處理也存在處理速度較慢的缺點,難以對活動圖像做到實時處理。數字圖像的處理與存儲都需要消耗較大計算資源,對計算機硬件的性能提出了更高要求。數字圖像處理技術也受限于圖像采集與轉換中信息丟失的影響,但它在圖像分析、圖像復原等方面表現突出。未來隨著計算機技術的進步,數字圖像處理技術會得到進一步提升與發展。
視頻通信過程中,為實現圖像高效傳輸,需要對圖像進行壓縮處理。圖像壓縮可大幅縮減圖像數據量,減少存儲空間及傳輸負荷。圖像壓縮技術在視頻通信中應用廣泛,其基本原理是消除圖像中的冗余信息,提取最關鍵特征,再對特征數據進行編碼。當前圖像壓縮比較成熟的技術主要有向量量化、分形編碼及小波變換等。例如,分形編碼利用迭代函數系統對圖像進行分解與重建,可取得較高的壓縮比;基于小波變換的壓縮技術則可以有效保留圖像邊緣等重要細節特征。為獲得更優效果,可將不同技術進行組合與改進。
2.2.1 凸集投影法
凸集投影法是一種用于圖像恢復的數學方法。該方法將高質量原始圖像看作希爾伯特空間中的一個向量,圖像壓縮和傳輸過程會導致向量發生變化,圖像質量降低。為恢復圖像,可以先在希爾伯特空間內建立多個封閉凸集S1,S2,…,將原始圖像向量約束在其中,然后計算出與各凸集相對應的投影算子P1,P2,…。常用的約束凸集有量化限制凸集和平滑限制凸集等。接下來,可以選擇恢復圖像的初始估計,并通過迭代使用投影算子對其進行處理,逐步收斂至恢復結果[2]。該方法能有效消除圖像塊效應,保持邊緣細節。例如,在量化限制凸集約束下,采用離散余弦變換(Discrete Cosine Transformation,DCT)和量化間隔控制,在平滑限制凸集約束下,可以抑制高頻噪聲,平滑圖像。經過約10 次迭代,圖像就能基本恢復。凸集投影法數學規整,計算量不大,可獲得較好恢復效果。
2.2.2 貝葉斯方法
貝葉斯方法是一種概率統計方法,可應用于圖像恢復處理。該方法將圖像處理看作隨機過程,運用貝葉斯規則估計后驗概率分布。具體而言,設原始高質量圖像為X,低質量受損圖像為Y,根據貝葉斯公式有P(X|Y)=P(Y|X)P(X)/P(Y)。其中,P(Y|X)表示從原圖像生成受損圖像的條件概率,反映圖像退化過程;P(X)為原圖像的先驗概率分布。求解使后驗概率P(X|Y)最大化的X,就是恢復結果。在模型上,通常采用馬爾可夫隨機場建模,以表征圖像局部與全局特性,如Gibbs 隨機場就可用于描述圖像的平滑特性。該方法通過全面分析圖像特性,結合退化過程建模,能有效恢復高質量圖像,但計算復雜度較高,需設計高效算法。當前研究可通過采樣、稀疏表示及先驗模型學習等方法進行優化,以提升貝葉斯圖像恢復效果。
2.3.1 環路濾波技術
環路濾波技術是視頻通信領域常用的圖像增強方法之一,通過在編碼端和解碼端采用對稱的環路濾波器結構,可以有效消除因壓縮編碼引起的圖像塊效應,提高圖像質量。具體來說,在視頻編碼端,常使用國際標準中的環路濾波器,如H.263 標準中的環路濾波器或MPEG-4 中的去塊濾波器。這類濾波器能夠保證濾波前后圖像信號能量不變,避免引入模糊或鋸齒等失真。編碼端環路濾波可顯著抑制圖像中像素塊狀分布,提升圖像可壓縮性,一般可將壓縮后的峰值信噪比提高0.5 ~1.5 dB。而在解碼端,采用與編碼端對稱的環路濾波器,可以恢復圖像細節,重構邊緣輪廓,有效減少壓縮編碼導致的模糊感,增強圖像質量。相比直接對解碼圖像進行濾波,環路濾波可更好地保持圖像質量。環路濾波計算量較小,結構簡單,可方便硬件實現,從而進行實時圖像增強處理。當前,環路濾波技術已在視頻會議和視頻通話等系統中廣泛應用,對圖像效果提升具有顯著效果。
2.3.2 后續濾波技術
后續濾波技術是視頻通信領域的另一種常用圖像增強方法。不同于環路濾波需要在編碼端進行對應配置,后續濾波完全在解碼端進行,僅基于解碼圖像信號特征來設計濾波器。其主要目的是消除由視頻壓縮編碼引入的塊效應。具體來說,塊效應在頻域主要表現為高頻噪聲,進行全局低通濾波雖可消除塊狀誤差,但也會模糊圖像細節。為解決這一問題,后續濾波技術往往采用自適應濾波,根據圖像不同區域設計不同濾波器,以保留細節。例如,可先采用離散余弦變換將圖像轉到頻域,再利用Walsh 變換得到4×4 塊狀結構,然后根據塊內容自動分割平坦區、紋理區和邊緣區,最后對不同區域分別濾波。這樣可在消除塊效應的同時最大限度地保留邊緣細節。后續濾波無須修改編碼器,僅添加解碼端處理模塊,易于部署。當前,多種國際標準均采用后續濾波技術。它也已在視頻會議系統中廣泛應用。
圖像數字化處理是將模擬圖像信號采集并轉換成數字形式進行處理的技術,在視頻通信系統中有重要應用。數字圖像處理可利用數字信號處理器(Digital Signal Process,DSP)或現場可編程門陣列(Field Programmable Gate Array,FPGA)等硬件進行并行計算,實現復雜算法。例如,在視頻采集端,可使用圖像傳感器獲得模擬信號,再通過模數轉換器(Analog to Digital Converter,ADC)量化成數字信號;經過數字濾波、增強等處理后,再通過數模轉換器(Digital to Analog Converter,DAC)還原為模擬視頻信號進行顯示。另外,在視頻解碼端也需將模擬信號數字化,才能進行各種圖像恢復、去噪等處理。相比模擬信號處理,數字圖像處理可實現更復雜的算法,提高圖像質量。
為降低視頻通信的帶寬需求,視頻壓縮編碼技術必不可少。目前,國際上較成熟的視頻壓縮標準主要有MPEG-4 和H.263。其中,MPEG-4 標準采用基于內容的編碼技術,可實現較高的壓縮率,壓縮效果優異。MPEG-4 標準不僅可應用于窄帶和寬帶環境,還支持多種先進功能,如提高編碼效率、支持多路復用傳輸、內容可擴展性等。其核心思想是基于視頻對象(視頻圖像及音頻等元素)進行編碼,以提取語義信息。具體來說,MPEG-4 標準利用基于分形理論的模型進行面部特征提取,以參數化面部和身體運動,顯著減少數據冗余度。另外還使用視覺感知模型移除視覺冗余,只保留關鍵信息。MPEG-4 使用基于小波變換的方法實現時域與頻域信息整合編碼。這些技術確保在低比特率下也能提供高質量壓縮視頻。
MPEG-4 作為先進的視頻壓縮標準,具有良好的可擴縮性是其重要特征之一。MPEG-4 標準可擴縮算法的目的是讓視頻碼流能夠適應不同的網絡帶寬、解碼能力等條件的變化。其實現的關鍵在于視頻壓縮器要具有可變的復雜度級別,并可以只傳輸解碼端所需的部分碼流。具體來說,MPEG-4 標準采用了層級編碼結構,包含一個基本層和多個可選的增強層。基本層通過低復雜度壓縮編碼保證輸出視頻的基本質量和重要功能,提供最低限度的可視性。增強層則使用更復雜的編碼工具改進視頻質量,提供更好的分辨率、更高的幀率及更低的噪聲等。在解碼端,可以僅選擇解碼基本層,來適應有限的計算資源或網絡帶寬。資源允許時,則可以附加解碼一些增強層,以提升視覺效果。這樣就可以平滑地調節解碼復雜度,實現可擴展性。MPEG-4 編碼器的可擴縮結構如圖1 所示。

圖1 擴展編碼器結構
MPEG-4 標準還定義了多種編解碼工具以支持不同類型的可擴展性,比如信噪比(Signal-to-Noise Ratio,SNR)可擴縮性、時域可擴展性和空域可擴展性等[3]。例如,時域可擴展性通過改變幀率來適應可用帶寬,空域可擴展性則通過改變分辨率進行擴展。綜合運用這些工具,可以實現視頻質量隨比特率平滑提升的可擴縮性。
MPEG-4 中的可擴縮框架,特別是FGS(Fine Granularity Scalability)算法,實現了良好的比特率可伸縮性。但是FGS 算法存在運動補償效果不佳、編碼效率偏低等問題。其中,運動補償問題是由于FGS 只使用基本層重構幀進行運動估計所致,可通過在運動預測中加入增強層信息進行改進。具體來說,可以增加一個直接使用原始視頻序列的參考鏈路,對每一幀視頻生成高質量重構圖像,并作為運動預測的參考,然后進行精細的運動補償,改進方式如圖2 所示。

圖2 MPEG-4 可擴縮編碼改進
這種方法能明顯提升FGS 編碼的運動補償效果。針對FGS 編碼效率偏低問題,可通過優化掃描方式、調整比特分配方案等進行改進。例如,改進后的算法可先編碼低頻系數,再編碼高頻系數,這與視覺系統的特性更加吻合[4]。FGS 算法則可以根據基本層和增強層的復雜度動態調整比特分配。這些改進方法既提升了FGS 算法的編碼效率,也改善了圖像質量,更適合視頻通信場景[5]。
視頻通信技術的發展,改善了人們的音視頻交流方式,但圖像處理仍是提升通信質量的關鍵。針對視頻通信領域的圖像處理技術進行研究,對于進一步提高圖像傳輸質量意義重大。通過分析視頻通信中的圖像壓縮、恢復、增強和數字化處理等核心技術,可以找出現有方法的不足,并提出針對性的改進方案。這將有助于消除圖像的模糊、塊效應等問題,使視頻通信圖像更清晰流暢。如果這些圖像處理技術能夠取得進一步改進,必將大幅提升視頻通信的效果,豐富人們的交流方式。