魏澤國,趙長偉
(河南科技大學,河南 洛陽 471000)
圖像的顯著區域檢測[1]一直是視覺研究領域的熱點,將人類的視覺系統所感興趣的區域利用計算機作為輔助的檢測工具,感知該區域的運動目標[2]。在計算機中,顯著性理論較為復雜,高級顯著檢測里會涉及到關于人的視覺、神經學、心理學等。在圖像數據加工過程中,“注意”是在整個場景初步形成基礎上的視覺感知,是一種重要的心理調節機制,其變化可以決定注視區的范圍、注視點的具體位置。視覺注意的顯著區域監測對圖像的分析有著重要的意義,如果將這種調節機制引入到檢測領域中,有效的圖像信息就可以進行分配并具備感知選擇的能力。在計算資源時,優先將注意分配到觀察者容易感知的區域,這樣就會提高圖像分析的工作效率,以這種思想基礎上建立的方法被學者們稱為顯著區域檢測。
在傳統的圖像顯著區域檢測中,需要檢測人員注意力高度集中的情況下工作,但是長時間保持這樣工作會使檢測人員注意力大大降低,也會給視力帶來很大的負擔,導致容易錯過圖像中重要的檢測數據[3],所以傳統的顯著區域檢測方法在實際的工作中實用性較差,效率不明顯。近年來,已有相關學者對場館監控圖像顯著區域檢測做出了研究,通過對顯著性檢測方法使用的領域范圍不同,可將現有的方法分為兩種:文獻[4]提出基于多特征的監控圖像顯著區域檢測算法,主要包括對目標邊緣度、對稱性進行計算,但在同一區域中出現相似的目標時,檢測結果偏差較大,因此,該方法的實際運用性較差,使用范圍不廣泛;文獻[5]提出面向社群圖像的顯著區域檢測,利用社群圖像的CNN特征,進行顯著性計算及語義計算,結合二者計算結果,優化顯著區域的空間一致性。該方法計算結果簡便,但得到顯著區域檢測圖像的精準率較差。
針對上述方法存在的問題,提出基于DCT(Discrete Cosine Transform)域的顯著區域檢測,首先,將圖像進行分割成圖塊,實現DCT系數對顏色、紋理等特征進行提取,再將圖像進行閾值分割,獲得顯著區域?;诖?,在視點轉移中根據整幅圖像的特征差異進行全局的顯著度量,以全景判斷圖像中的注視區范圍、注視點位置,計算注視點中最強的位置實現視區追蹤,從而完成顯著圖像的區域監測。
DCT的AC系數分為低頻、中頻、高頻三種類型,低頻系數包含了DCT主要信息;高頻系數能夠反映圖像的邊緣等較次要的信息。利用JPEG的基本原理對每個8*8塊進行DCT,在對圖像進行編碼時,以最小編碼單元(MCU)[6]為基本單位。
將圖像以MCU為基本單位進行分割,然后將分割后MCU進行DCT來得到DCT的亮度塊并進行特征提取。
單塊MCU中包含了8*8的亮度塊4個、8*8色度塊2個A1和A2,圖像中的原始值為aij,DCT塊為B,則DCT如式(1)所示

(1)
據上文所述,以MCU為基礎單位進行分割,如圖1所示。

圖1 MCU分割系數圖
系數圖在進行分割后,其中的低頻分塊都在左上角上集中,高頻分塊都在其余位置上分布。如圖2所示,低頻分量里包含著重要的DCT信息,高頻分量可以忽略掉。F(0.0)表示DC系數值,將所有MCU的b進行提取,得到分量后的DC系數A1和A2,基于此轉換到RGB顏色空間獲得原始尺寸1/8的采樣圖像。
傳統的降采樣方法在檢測當中容易將圖像原始的信息丟失,然而,本文基于DCT實現顯著區域檢測可以有效地保留圖像的原始信息,使檢測后的圖像信息數據更加準確。

圖2 DCT8*8系統塊
利用RGB[5]顏色空間方法提取采樣后圖像的亮度及顏色特征,其中,R、G、B用來分別表示采樣后圖像中紅色,綠色、藍色的顏色通道,I=(r+g+b)/3為提取的亮度特征,分別計算4個寬調諧的顏色通道如式(2)所示

(2)
據上文所述,最后,根據最初形成的人類視覺感官特性,將計算所得的4個顏色通道分解為2對互逆的RGB顏色特征,如式(3)所示

(3)
MCU的紋理特征值如式(4)所示

(4)
將圖像中的DCT塊遍歷后,以歸一化方法降低后文顯著區域檢測的計算復雜度,保留亮度分量中頻和高頻系數,得到相對應的紋理特征有效地保留了原圖像的紋理細節,使接下來的顯著性檢測過程與結果更加真實。
通過對視覺顯著性選擇與分析得到注視區范圍與注視點位置,然后結合人類的視覺效果感知的特性進行進一步的優化,再將圖像塊的顯著性以特征向量[7]的全局對比度估算得到,最后根據在不同特性的融合得到優化后的顯著區域檢測方法,
依靠DCT視覺的顯著性來選擇判斷其中的注視點大小與注視區范圍,是行業學者一直探討的研究內容,為了獲取到新的注視內容,文中提出以下的假設:以全局場景來判斷注視點的位置,并計算注視點在場景中的視覺反差,從而得到全局顯著性;再找到注視點中顯著性最強的位置,得到視點轉移;再根據場景的局部信息確定注視區的大小,計算與周邊的反差得到局部顯著性完成顯著區域檢測。
首先,如圖3的視覺顯著性圖所示,A所占的位置要比圖中其它部分更加明顯,更加能夠引起觀察者的注意力,這就是視覺顯著的突出性。A部分就是突出性最明顯的部分也是圖像中的顯著性區域。以心理學的定義,使人能夠產生新異的刺激、所期待的刺激場景區域都會引起視覺感知的注意,因為,視覺的顯著性可以劃分為兩種:一種是高層視覺效果,由知識決定自上向下的視覺顯著性,另一種是低層視覺效果,由信息數據驅動自上向下的視覺顯著性。

圖3 視覺顯著性
若獲得更多的場景信息必須循環交替地進行視點轉移,因此,使注視內容變化的特點有以下幾種:
1)轉移性:注視點由強到弱的順序由一個位置轉移到另一個位置;
2)縮放性:注視區擴大或者縮小;
3)排斥性:同一時間內只能存在一個注視內容。
圖像中顯著性主要由分布性和對比性綜合來決定,圖像的顯著對象內部區域關聯性為分布性;圖像的顯著性和非顯著性之間存在的差異性為對比性,其中,影響對比性的重要因素是亮度和顏色的差異。
3.2.1 分布性計算
在計算圖像分塊特征對比性同時,還應該考慮顯著性區域和背景區域的空間分布不同。顯著性區域的空間分布密集、內部的特征趨于相似,顯著性就會較高;背景區域的空間分布位置比較分散,與前者相比,含有高方差的空間分布,顯著度不明顯,不易引起視覺注意,因此,圖像分布的空間方差如式(5)所示

(5)
其中,圖像分塊xi的空間特征分布的質心和圖像分塊xi與xj的空間特征距離如式(6)、式(7)所示

(6)

(7)
圖像分塊xi特征值相對于圖像分塊xj的特征值相似權值[8]如式(8)所示

(8)
其中,Zx為歸一化算子。
3.2.2 對比性計算
圖像分塊的周圍環境差異決定了圖像分塊的顯著性,周圍環境與圖像的分塊差異越大越可能是高顯著的區域。如果將該圖像分塊與其它圖像分塊進行對比更容易引起觀察者的視覺注意,那么圖像分塊的顯著性如式(9)所示

(9)


(10)
假設,xi和xj圖像分塊的中心位置以si和sj替代,?2取值為20。因為帶有亮度與顏色特征的圖像分塊在整幅圖像中也是突出的,所以需要計算圖像分塊在全局圖像中的特征顯著性,如式(11)所示

(11)

C1(xi)=LC(xi)*GC(xi)
(12)
3.2.3 實現顯著區域檢測
在不影響顯著檢測的前提下量化[9]特征空間,統計特征向量的概率,頻率最低的部分向量利用相近的向量進行替換,從而降低全局對比度計算的復雜度,最后構建符合人眼視覺特性的高斯函數,對全局對比度進行優化,完成圖像顯著區域檢測。

DCT差值之和估計可以通過與其余(N-1)個特征向量計算,如式(13)所示

(13)
其中,特征向量Fi和Fj之間的距離以D(Fi,Fj)表示,因此,Fi的對比需經過(N-1)次計算求得,而遍歷所有特征向量需計算N*(N-1)次。
需要將運算次數明顯降低可以通過量化和統計特征空間內特征向量的分布規律計算求得,具體步驟如下:

2)對所有量化后特征向量進行統計,根據頻率值降序后排序,保留前90%的特征向量,頻率最低的10%被距離最近的特征向量替換。
3)對比性估計,假設最終保留的特征向量為n(< (14) 其中,k∈(1,n)且n小于N,特征向量Vk的頻率為fk,此時的計算次數為n*(n-1),由于n遠小于N,因此計算次數明顯下降。 在計算機視覺中,高斯差分函數是一種基于人眼視覺特性,將一個原始灰度圖像的模糊圖像從另一幅灰度圖像進行增強的算法,通過函數計算以降低模糊圖像的特征向量,然后從一幅圖像中減去另一幅可以保持在兩幅圖像中所保持的頻帶中含有的向量空間信息,這樣的話,原始圖像中被保留下來的頻率之外的其它頻率信息利用函數計算進行去除,從而實現了圖像的顯著區域檢測。其算法如式(15)所示 (15) 其中,Sif(Vk)為高斯差分函數計算[10]后對應的顯著區域,而m1=n*θ,θ為確定顯著檢測的范圍, 如圖4所示,為式(15)計算得到的顯著區域檢測結果對比,可以看出,圖像不僅前景區域與背景區域有明顯的差異,而且前景區域有更好的突顯性,使顯著區域檢測對比更加明顯。 圖4 顯著區域檢測圖像對比 為了驗證本文所提方法的有效性,實驗主要內容包括對顯著圖像的精準度-召回曲線,以主觀質量為基準。 對于單一圖像,如圖5所示,與對比圖相比,顯著圖中的顯著區域的像素點顯著值更高且之間有著較高的一致性,而且背景的差異性越強背景區域的亮度也越低。 圖5 對比度與顯著性圖像對比 將所選的圖像進行實驗,每幅圖像在等到相應的對比度和顯著性后,分別對兩種圖像進行分割,分割過程中閾值[11]區間為[0,255]并取整,基于此計算相應的精準度召回率,如圖6所示,將最后所得的結果平均得到精準度召回率對比曲線。由于文獻計算對比度時,沒有考慮人眼的視覺特性,只考慮了圖像的顏色和亮度,召回率的精準度低于顯著圖。 圖6 精準度-召回率對比圖 在顯著圖中,顯著前景為色彩明顯區域,而色彩偏暗區域為背景區域。一般情況下,不同的顯著性檢測方法準確性會從主觀和客觀兩個方面進行對比。 為進一步驗證本文方法有效性,將與文獻[4]方法、文獻[5]方法進行對比試驗。最終結果如表1所示,統計了兩種方法單張圖像顯著區域監測平均消耗的時間。 表1 單幅圖像平均計算時間 結果顯示,文獻[4]方法提取圖像特征后進行的顯著性檢測,耗費時間為1.740s,效率低,文獻[5]方法的計算時間為0.794s,效率較低,而本文方法對圖像中顯著區域能夠在獲得良好的檢測結果同時,單幅圖像平均計算時間為0.259s,實際工作效率高,能夠高效完成場館監控圖像顯著區域檢測。 針對傳統顯著區域檢測方法的不足,本文提出一種基于DCT域視覺的顯著區域檢測方法,首先對DCT域視覺系數進行提取,獲得顯著區域,通過計算得出顯著區域范圍與注視點位置,完成圖像的顯著區域檢測。實驗證明,本文所提方法成本低,可以實時對出現在顯著區域的目標進行檢測,并且在生活中實時性效果高、有著良好的檢測效率。但不可否認的是,該方法仍有不足之處,本文所選擇的特征描述形式與視覺感知都還存在一定的差距,接下來會進一步考慮如何引入更多有效的視覺特征,并結合實際應用建立有效性更強、更完善的顯著區域檢測系統。


4 實驗結果與分析



5 結論