于前洋
(中國科學院長春光學精密機械與物理研究所,吉林長春130033)
本期《中國光學》成組呈現在讀者面前的16篇論文,計有發展趨勢1篇,方法論1篇,硬件2篇,軟件11篇,像質評價1篇,構成一期覆蓋面較全的視頻圖像處理專集。
文[1]分析了當今自動目標識別(ATA)技術的發展趨勢,提出了對智能圖像處理進行必要的理論研究對高效智能算法和并行硬件系統的理論與應用研究具有指導意義,便于將長春光機所圖像處理的智能化推向一個新高度。文章建議圍繞復雜背景下的ATA扎實開展如下研究:智能傳感器應用的研究,各種先進圖像處理算法的研究,使用傳輸機(如Transputer等)構成并行處理的新系統結構的研究。
文[2]針對目前數字圖像數據量以指數增長,致使后續處理面臨巨大壓力的局面,提出壓縮感知理論(Compressed Sensing,CS),該方法論可為緩解這一壓力提供解決途徑。論文綜述了CS理論及其關鍵技術,著重介紹了CS理論在成像、圖像融合、目標識別與跟蹤等領域的應用與發展狀況,特別是壓縮感知理論使從部分采集數據中“解壓縮”出更大量信息的想法變成可能。這種思路改變了人們對于香濃-奈奎斯特采樣定理的傳統理解,突破了先行產生大量冗余信息,然后再去費勁地壓縮/解壓的怪圈。顯然,隨著其理論進一步完善與發展,壓縮感知必將會有更廣泛而有效的應用。
文[3]是涉及視頻處理器硬件的1篇論文,以TI公司的先進DSP芯片為核心構成,應用價值明顯,工程考慮充分。文[4]為描述2款千兆級像元數的幀頻500 Hz CMOS圖像傳感器研制與測試的文章,其真實地反映了相關研究過程,所測關鍵參數亦有重要參考價值。
視頻圖像壓縮的實時性一直是圖像壓縮算法能否付諸實施的關鍵問題之一。對于多核DSP,關注底層優化是效果顯著但有些辛苦的途徑。文[5]給出了在TMS320C6416上對MPEG-4視頻編碼器進行底層優化的明顯效果,包括利用并行特性進行匯編優化,用兩級高速緩存作內存空間優化,利用EDMA級聯特性開辟雙緩沖區,同時完成編碼和傳輸以改善編碼效率等。實踐表明:采用上述措施后,對768 pixel×576 pixel,25 frame/s的視頻圖像可進行實時編碼壓縮。
有關紅外圖像軟件處理的論文有2篇。文[6]針對紅外和可見圖像對場景中高頻成分的相似特性,提出一種基于矢量邊緣的模型構建法,用來進行異源圖像的快速特征匹配與配準,有助于實現實景中的自動目標搜索。文[7]針對紅外圖像低對比和邊緣模糊的特點,研究了一種結合自適應直方圖均衡化和拉普拉斯變換的方法,采用雙DSP并行處理,適用于紅外圖像的實時增強。實驗證明:增強效果明顯,實時性好,滿足50 frame/s的幀頻要求。
其余8篇軟件論文中,文[8]給出一種目標跟蹤技術,采用粒子濾波進行粗定位,采用SIFT特征匹配精定位,對目標旋轉、遮擋、光照變化有很好的適應性。文[9]提出在圖像融合中,低頻基于區域梯度信息、高頻基于區域特征因子的加權與選擇算法,比基于像素的算法具有更高的融合性能。文[10]提出模式識別中使用彩色圖像的四元數仿射不變矩作為目標的特征描述子,可以實現彩色圖像的高效目標識別。文[11]采用基于小波變換的模極大值的小目標檢測算法,與各向異性擴散濾波相結合,通過對各尺度方向小波系數進行擴散濾波來檢測弱小目標,能夠檢測到不均勻噪聲背景下對比度為2%的弱小目標。文[12]選用Mean-Shift算法對莫爾條紋方向角精確求解,使計算速度和精度得到提高。在對比度為5.4%時,精度達到29',計算時間為15 ms。文[13]提出一種基于加權預測的迭代解盲卷積算法,根據預測值計算方向加速算子,收斂速度比L-R算法提高43.8倍,具有較好的工程實用價值。文[14]提出在電子穩像中,使用運動矢量修正的灰度投影運動估計算法。這種方法可以使運動目標造成的影響只作用在其中的若干局部子塊上,而其他塊不受影響,保證了穩像的準確性。實驗表明,穩像后圖像與參考幀的RMSE值明顯下降。文[15]通過計算立體模板的參數,在已知載機飛行參數和建筑物參數時,可對建筑物目標進行識別,允許參數誤差為10 pixel。該方法適合于具有明顯形狀特征的立體目標的自動捕獲與跟蹤。
文[16]試圖對傳統圖像質量評價的主觀和客觀方法相互沖突做出改進,將局部灰度方差分布作為表征圖像結構信息的一個重要特征,增強了像質評價中人眼敏感細節信息的權重,提高了客觀評價與主觀評價的一致程度。實驗表明:所提出的方法優于傳統的MSE、PSNR以及SSIM方法,使主觀評價中與人眼視覺特性相關的部分得到體現,向與客觀評價的溝通邁出了踏實的一步。
我深信,對視頻圖像處理感興趣的讀者,如能花半小時瀏覽這16篇文章,再花半天時間精讀特別關注的幾篇文章,將會是饒有興趣而又頗有收益的。