宋亞玲,歐聰杰
(華僑大學 信息科學與工程學院,福建 廈門361021)
Shannon 熵作為描述系統信息量的一種量度,是通信與信號處理領域的基石[1]。在圖像的閾值分割處理上,以Shannon 熵函數為優化目標的方法因其簡潔、高效的特性吸引了廣泛的關注[2]。針對不同的圖像屬性,現已發展出交叉熵、模糊熵、倒數熵等不同的理論分支,均有廣泛成功的應用[3~5]。近年來,隨著對圖像成像規律的深入研究,Albuquerque M P 等人首次在Shannon 熵的基礎上引入Tsallis熵并應用于圖像分割[6]。Tsallis 熵具有非廣延性并通過一個附加參數q 來描述,在參數q 趨近于1 時,它將自然退化為Shannon 熵[7],因此,以它為目標函數所構造的分割方法要比Shannon 熵具有更大的靈活性和普適性[8],近年來已被廣泛應用于醫學影像處理[9],儲糧蟲害檢測[10]等各個領域。對于一幅數字圖片,任意兩個像素點的灰度之間存在的可能關聯,將在很大程度上影響整個圖像的統計性質。因此,采用更一般化的Tsallis 熵對圖像進行統計分析與閾值分割具有數理上的合理性。
近年來的大量研究均顯示采用Tsallis 熵的確可以提高圖像的分割質量[8~10],本文考慮圖像內部灰度值的長程關聯,分析q 參數所產生的影響。同時,針對一些特定的圖片給出有效的分割方案。
假設一幅具有n 級灰度階的圖像大小為M×N 像素點,則{pi=ki/(MN),i=1,2,…,n}為該圖像的灰度分布,其中,ki為圖像中灰度值為i 的像素點數量,則該分布所對應的Tsallis 熵定義如下

其中,q 即為前述的附加參數。由式(1)可知在q→1時Sq將還原為Shannon 熵。目前有多種基于Tsallis 熵的圖像閾值分割方法,均能體現q 參數對閾值結果的調節作用。但很多時候該參數的取值依靠經驗判斷,并無明確的取值界限,這里以Albuquerque 法[6]為例分析這個問題。
設一幅圖像的分割閾值為t(t∈[1,n]),則圖像灰度分布被該閾值分割為兩個部分,A 和B,它們的Tsallis 熵分別如下

其中

最佳的閾值t*由下列判據給出[6]

式(5)說明閾值的選取遵循熵極大化的原則,因此

式(6)即為q 參數取值的下限,是開區間,因為

則不同圖像的灰度分布(具有相同的灰度階n)在q=0 時將得到相同的Tsallis 熵,基于Tsallis 熵的所有閾值分割法都將失效。另外,由式(1)得

式(8)說明q 的取值過大同樣無法準確區分圖像灰度分布中所包含的信息。隨機選擇四幅常見的測試圖片(如圖1(a)所示),對比在不同q 參數下由式(5)得到的各自分割閾值,如圖1(b)所示。

圖1 q 參數的有效范圍Fig 1 Effective range of parameter q
圖1 (b)在q→0 的情況下,互不相關的圖片的分割閾值趨向于一個固定的值,這與圖像的隨機性相違背。此外,在2 <q <5 區間還可看出:四幅圖片的分割閾值幾乎不再對q 參數的變化做出響應,此時算法已然失效。在q >5 之后,因子pqi 將趨于無窮小量,此時任意一個微小的計算誤差都將對閾值選取造成顯著影響,由此產生隨機震蕩的偽閾值。為充分保證Tsallis 熵的有效性,在本文選擇的q 參數范圍定為0.1≤q≤1.5。
自然界圖片種類繁多,因此,式(5)無法全部適用。例如:在某個固定背景下的影像系列,因為目標的出現具有隨機性,不會與固定的背景之間產生像素上的關聯。同時,目標類的像素點和背景類的像素點各自之間的灰度關聯性仍然存在,而且這兩種關聯性的強弱未必相同,故這兩部分的熵可分別表示如下

其中,q1,q2分別為目標類A 與背景類B 的像素點各自灰度關聯的強度。因此,構造目標函數如下

即對A,B 兩部分的熵進行比較,選擇的最優閾值是讓較小的那個熵極大化,則另一個熵即使沒有最大化,也不會太小,從而實現兩部分熵極大化的一種均衡。
為了驗證上述算法的有效性,針對特定類型的圖片進行分割實驗。這種圖片應具有如下特征:1)所要提取的目標具有任意性;2)背景與目標各自的成像因素具有獨立性。基于此,紅外成像的圖片序列是比較合適的類型。圖2 分別展示了Kapur 法[2]、Albuquerque 法[6]以及本文的方法所得的結果。
為進一步定量闡述分割效果,引入錯分類誤差因子ME,定義如下

圖2 閾值分割結果(其中,(d)q=0.1 和(e)q1=0.6,q2=0.4)Fig 2 Threshold segmentation results,where(d)q=0.1(e)q1=0.6,q2=0.4

其中,OGT和OT分別為基準圖和分割結果中目標像素的集合,BGT和BT分別為基準圖和分割結果中背景像素的集合。
圖3 顯示了Albuquerque 法在不同q 參數取值下的輸出結果,這里采用圖2(a),(b)作為原圖和基準圖。可以看出:閾值僅在參數接近于1 時產生一次較明顯的跳躍,然而相應的誤差也隨之明顯增加,分割失敗。

圖3 Albuquerque 法產生的閾值t 隨q 參數的變化關系,以及相應閾值結果所對應的MEFig 3 Threshold t generated by Albuquerque method varies with parameter q,as well as corresponding ME
實際上,圖2(a)是紅外成像視頻幀序列中的一個單幀,通過與基準圖的對比,找到一組恰當的(q1,q2)用于實現對目標的提取。在短時拍攝過程中,可以認為目標與背景的紅外輻射強度穩定,第一幀圖像的(q1,q2)取值對于后續幀幅同樣有效。圖4 的視覺效果證明了這一點,定量測試數據如表1 所示。

圖4 紅外視頻后續幀幅的分割結果對比Fig 4 Segmentation results comparison of subsequent frames of infrared video

表1 針對圖2 與圖4 的定量數據Tab 1 Quantitative datas of fig 2 and fig 4
本文通過對Tsallis 熵性質的分析確定q 參數的合理取值范圍,將紅外成像圖片的目標與背景視為兩個相互獨立的集合,提出了一種包含兩個可調節參數q1和q2的新的閾值分割方法,實現目標與背景的自動分割。實驗結果表明:該方法在處理目標與背景無明顯關聯的圖片序列時更加有效。
[1] Shannon C E.A mathematical theory of communication[J].The Bell System Technical Journal,1948,27:379-423.
[2] Kapur J N,Sahoo P K,Wong A K C.A new method for gray-level picture thresholding using the entropy of the histogram[J].Comput Vision Graphics Image Process,1985,29:273-285.
[3] Sezgin M,Sankur B.Survey over image thresholding techniques and quantitative performance evaluation[J].Journal of Electronic Imaging,2004,13:146-165.
[4] Sarkar S,Das S,Chaudhuri S S.A multilevel color image thresholding scheme based on minimum cross entropy and differential evolution[J].Pattern Recognition Letters,2015,54:27-35.
[5] 吳一全,殷 駿,畢碩本.最大倒數熵/倒數灰度熵多閾值選取[J].信號處理,2013,29(2):143-151.
[6] Albuquerque M P,Esquef I A,Mello A,et al.Image thresholding using Tsallis entropy[J].Pattern Recognition Letters,2004,25:1059-1065.
[7] Tsallis C.Possible generalization of Boltzmann-Gibbs statistics[J].J Stat Phys,1988,52:480-487.
[8] Lin Q,Ou C.Tsallis entropy and the long-range correlation in image thresholding[J].Signal Processing,2012,92:2931-2939.
[9] 李積英,黨建武,王陽萍.融合量子克隆進化與二維Tsallis 熵的醫學圖像分割算法[J].計算機輔助設計與圖形學學報,2014,26(3):465-471.
[10]吳一全,王 凱,曹鵬祥.蜂群優化的二維非對稱Tsallis 交叉熵圖像閾值選取[J].智能系統學報,2015,10(1):103-112.