何子博
(東北林業(yè)大學 哈爾濱 150040)
圖像分割是圖像處理的常用技術,其目的是根據(jù)給定的灰度、顏色或紋理等標準將圖像分割成若干均勻的區(qū)域[1]。隨著計算機處理能力的不斷提高,彩色圖像承載著越來越多人類所感知的色彩信息,彩色圖像分割成為近年來的一個研究熱點。它廣泛應用于圖像壓縮[2]、網(wǎng)絡視頻傳輸[3]、醫(yī)學圖像診斷[4]和目標跟蹤[5]等領域。圖像分割需要解決兩個問題:1)選擇合適的顏色空間;2)選擇合適的分割策略。由于顏色空間的選擇取決于具體的圖像和分割策略,目前還沒有適合所有彩色圖像的顏色空間[6]。
為了解決彩色圖像分割問題,現(xiàn)有研究已經(jīng)提出了許多方法。一些研究者傾向于使用更復雜的特征選擇過程或更復雜的聚類技術,然后通過復雜的優(yōu)化方法來提高最終分割結果。如基于有損數(shù)據(jù)壓縮的分割[7]、小波域隱式馬爾可夫模型[8]、基于均值漂移(Mean-shift)的分割[9]等,一些研究者還使用信息融合策略來獲得更好的性能,將與不同顏色空間的簡單方法相關聯(lián)的結果融合在一起,而不是考慮復雜的分割理論或模型。例如,文獻[10]提出了一種基于局部直方圖和k均值聚類融合多顏色空間的FCR方法,并將該模型應用到RGB、HSV、YIQ、XYZ、LAB、LUV顏色空間中,實現(xiàn)了六種分割結果的融合,最終得到最佳分割結果。然而局部直方圖聚類建模運行時間過長,且聚類數(shù)量固定,不能滿足不同圖像的自適應要求。
本文在文獻[10]的基礎上,提出了一種高效的自適應多顏色空間融合方法。通過選擇灰度分量、V(HSV)分量、I(YIQ)分量、Cr(YCbCr)分量、B(LAB)分量和U(LUV)分量六種不同的顏色分量,提出了一種用于確定每個分量聚類數(shù)目的峰值搜索算法,并初始化聚類中心實現(xiàn)Sugeno模糊C均值聚類算法(SFCM)聚類,最后提出了區(qū)域合并方法來合并先前的分割結果。該方法在Berkeley自然圖像數(shù)據(jù)庫中進行了測試。結果表明,該方法簡單、高效、抗噪聲能力強。與FCR相比,該方法能得到更好的結果和更快的速度,且在視覺評價和定量性能測量方面均優(yōu)于其他分割方法。
FCM算法是計算機視覺和模式識別中最常用的聚類技術。盡管FCM在圖像分割領域得到了廣泛的應用,但它仍然存在以下問題:1)算法的性能依賴于初始聚類中心;2)聚類前必須確定聚類數(shù)目;3)計算復雜度高;4)不考慮空間信息。針對上述問題,本文利用直方圖技術求出初始聚類中心,然后確定聚類數(shù)目。在計算復雜度方面,本文只對每個顏色空間的一維分量進行聚類,因此可以快速簡單地求出聚類結果。本文使用SFCM[11]來考慮空間信息并獲得初始分割結果。經(jīng)過初始分割可以得到六個不同顏色空間分量(灰度分量、V分量、I分量、Cr分量、B分量、U分量)的結果。
如何確定初始聚類中心一直是聚類研究的熱點問題。良好的初始聚類中心不僅可以獲得較好的聚類結果,而且可以使聚類速度更快。隨機選擇初始聚類中心可能導致算法目標函數(shù)的優(yōu)化陷入局部極值,從而影響聚類結果的精度。本文利用直方圖技術尋找聚類中心,以灰度分量為例,提出了一種峰值搜索算法。具體步驟如下:
步驟1:將灰度分量量化為0~255個強度級別,計算頻率并創(chuàng)建直方圖。設g(i)為灰度分量直方圖,xi為g(i)中與強度級別相關的像素個數(shù),灰度分量的直方圖可以表示為

步驟2:平滑直方圖。對于g(i)使用大小為1×5的一維高斯濾波器平滑處理兩次,平滑的結果取決于高斯標準協(xié)方差σg。直方圖越平滑,σg越大,平滑處理后可以得到一個新的直方圖Tg(i)。
步驟3:搜索初始峰值。本文搜索梯度值從正到負變化的轉折點,將這些轉折點作為初始峰值,得到初始峰值集合P1。
步驟4:刪除小峰值。如果集合P1中的峰值小于閾值T1,則從P1中刪除,因此,可以得到一組新的峰值集合P2。
步驟5:刪除相鄰峰值并生成最終峰值。如果P2中的兩個峰值足夠接近,則這兩個峰值所表示區(qū)域的灰度值相似。因此,當兩個峰值之間的距離小于閾值T2時,刪除較小的峰值,可以得到最終峰值P3。
傳統(tǒng)的FCM算法是通過模糊隸屬度為每個聚類分配像素。設X=(x1,x2,…,xn)表示n個像素被劃分為c個聚類的圖像,其中xi表示多光譜(特征)數(shù)據(jù)。分類結果可以用模糊隸屬度矩陣U={μik}表示,其中μik表示第k像素對第i個聚類中心的隸屬度,并滿足如下條件:

FCM算法是一種迭代優(yōu)化,其成本函數(shù)最小化的定義為

隸屬度μik和聚類中心vi迭代更新為

傳統(tǒng)的FCM算法中,接近中心點的像素分配高隸屬度值,而遠離中心點的像素分配低隸屬度值。傳統(tǒng)的FCM算法在圖像分割缺乏空間信息,這是由于圖像噪聲和偽影會影響FCM分割的性能,因此將空間信息融合到FCM中可提高分割的性能。本文利用模糊隸屬函數(shù)直接將空間信息納入模糊隸屬函數(shù):

其中,p和q是控制各自貢獻的兩個參數(shù)。變量hik包含空間信息:

其中,Nk表示以圖像像素k為中心的局部窗口。根據(jù)迭代更新式(4)和(5),隸屬度μik和聚類中心vi迭代更新。
本文利用上述灰度分量的初始分割方法,從六個不同的顏色空間分量中得到六個不同的初始分割結果。由于聚類數(shù)目不同,本文將它們記為Ki(1≤i≤6)(例如,K1代表灰度分量的聚類數(shù)目,K2代表V分量等)。再次使用SFCM算法對以上六個不同聚類的結果進行融合,得到一個新的結果Ifusion。
對于每個初始分割結果的Ki(1≤i≤6)個聚類數(shù)目,考慮以像素為中心的固定大小(NW×NW)平方鄰域。設Wx為像素位置x的鄰域,計算Wx中每個像素類標簽的標準化局部直方圖:

其中,h(Wx)為六個分割結果中像素位置x的特征向量,nj為Wx中類標簽在j的像素數(shù)目。對上述的六個不同的分割結果進行相同的處理過程,可以得到每個像素在同一位置的六個特征向量位置。將它們串聯(lián)并歸一化,可得到維數(shù)為的類標簽h*(Wx)的融合局部直方圖,將其作為最終聚類輸入的特征向量。
本文再次采用SFCM算法將h*(Wx)劃分為N個類:

其中,ceil(A)表示將A的元素四舍五入到最接近的整數(shù)。通過融合得到分割結果Ifusion,其中類標簽局部直方圖中兩個特征向量之間的距離由Bhattacharya距離計算:

聚類分割通常具有許多離散的小區(qū)域,然而同一聚類中像素之間的空間連通性難以保證。這些小區(qū)域一方面保留了圖像的細節(jié),另一方面又很大程度上影響了分割的質量。為了生成合理的分割,需要一種簡單有效的區(qū)域合并策略。本文提出了一種基于LUV顏色空間的區(qū)域合并方法。具體步驟如下。
步驟1:經(jīng)過八個鄰域分割后重新標記區(qū)域,不相鄰和顏色均勻的區(qū)域用不同的標簽標記;
步驟2:重新貼標簽后搜索相鄰區(qū)域;
步驟3:計算重新貼標簽區(qū)域的L、U、V分量的平均值;
步驟4:合并小區(qū)域。如果區(qū)域的大小小于閾值T3,則合并LUV顏色空間中最小歐氏距離的相鄰區(qū)域,且其大小大于閾值T3;
步驟5:合并大區(qū)域。如果區(qū)域的大小小于閾值T4(T3<<T4),則計算LUV顏色空間中歐氏距離及其大小大于閾T4的相鄰區(qū)域。搜索最小距離dc,如果dc 本文所提出的算法在T6570 2.10GHz雙核處理器上進行驗證,使用Matlab r2011a在Berkeley分割數(shù)據(jù)庫[12]中測試自然圖像的分割結果,該數(shù)據(jù)庫還包含從人類受試者獲得的基準分割結果。經(jīng)過大量的實驗表明,當參數(shù)σg,T1,T2選擇為3,0.001s(s表示圖像大小),15,窗口大小Nw×Nw選擇為5×5,T3,T4,T5選擇為0.003s,0.05s,50時,效果最好。本文將從以下幾個方面來分析所提出算法的性能:不同顏色分量的選擇,算法對噪聲的魯棒性,并將該算法與其他方法進行定性和定量的比較。 定量比較基于以下性能指標:概率指標PRI[13](概率越高越好)、Vol[14]、GCE[15]和BDE[16](距離越小越好)。這些指標具體定義如下: 1)PRI(概率隨機指數(shù)):用于計算分割和真實圖像值中標簽一致的像素對比例,對多個真實圖像值分割求平均值來解釋人類感知的尺度變化。 2)Vol(信息變化):將兩個分割之間的距離定義為給定另一個分割的平均條件熵,并且粗略地測量一個分割中不能由另一個分割解釋的隨機性數(shù)量。 3)GCE(全局一致性誤差):測量一個分割可被視為另一個分割的細化程度。以這種方式相關的分割可認為一致性,因為它們可以表示以不同比例尺度分割的相同自然圖像。 4)BDE(邊界位移誤差)測量兩個分割圖像之間邊界像素的平均位移誤差。將一個邊界像素的誤差定義為該像素與另一個邊界圖像中最近像素之間的距離。 文獻[10]指出,不同顏色分量的選擇對分割結果有顯著影響。為了與FCR算法[17]進行比較,本文選擇了六個分量進行融合。采用自適應直方圖和SFCM聚類技術對隨機選取的圖像進行了HSV、YIQ、YCbCr、LAB、LUV顏色空間和灰度分量的定量檢測。 表1給出了Berkeley分割數(shù)據(jù)庫中100個隨機選擇圖像上的14個分量的PRI、Vol、GCE和BDE性能,每個指標的最優(yōu)性能都用粗體標記,次優(yōu)性能用下劃線標記。 表1 14個分量的性能測量 由表1可見,在PRI指標中,V(HSV)分量最好,灰度分量次之;在Vol指標中,B分量最好,I分量次之;在BDE指標中,Cr分量最好,V分量次之。同時,還可以觀察到某些分量在一個指標中呈現(xiàn)最佳,但在其他指標中則可能表現(xiàn)最差。例如,分量具有最佳的GCE指標,但PRI、BDE表現(xiàn)較差。因此,需要同時考慮分量的不同性能度量來選擇最佳分量。在分析中,本文選擇了灰度、V(HSV)、I、Cr、B、U作為六個不同的融合分量。 文獻[10]指出SFCM算法對噪聲的敏感性較低。由于所提出的算法是基于SFCM的聚類算法,因此可認為該算法對噪聲具有較強的魯棒性。為了進行測試,將高斯噪聲(均值為0,方差為0.03)添加到兩個隨機選取的圖像中進行分割。圖1給出了原始圖像、噪聲圖像和分割結果。 圖1 噪聲圖像分割 圖1 表明,即使在高斯噪聲的情況下,仍然可以清晰地得到分割結果的正確部分,證明了所提算法對噪聲的魯棒性。其原因可以歸結為,1)所提出的算法采用了考慮空間信息的SFCM聚類,可以得到較好的噪聲圖像聚類結果。2)該方法采用不同分段融合后的區(qū)域融合技術,可以有效地去除小噪聲。 本文在Berkeley分割數(shù)據(jù)庫中測試了300個圖像,并將其與Mean-shift(均值漂移)[9]、NCut[18]、FH[19]、CTM[20]和FCR[17]方法進行了比較。圖2給出了隨機選擇兩個圖像的FCR、Mean-shift、CTM以及所提出方法的分割結果。 圖2 本文方法與FCR,Mean-shift,CTM的比較 從圖2中可以明顯發(fā)現(xiàn),F(xiàn)CR和Mean-shift存在著過度分割問題。對于某些圖像,這兩種方法只能生成小塊區(qū)域,不能生成正確的目標,特別是Mean-shift方法。本文所提出的方法可以得到更好的結果,接近于人類的感知,并且具有較少的過度分割問題。 表2給出了不同方法下Berkeley分割數(shù)據(jù)庫中300張圖像的性能指標平均值。每個指標的最優(yōu)性能用粗體標記,次優(yōu)用下劃線標記。 表2 性能指標比較 從表2可以看出,本文的方法在幾個不同的內部參數(shù)方面優(yōu)于其他方法,表2中給出的分割算法在PRI和BDE指標方面均優(yōu)于其他方法,在Vol指標方面次之,在PRI、Vol和BDE指標方面明顯優(yōu)于 FCR。 表3給出了同一平臺中隨機選擇的100個圖像的平均運行時間。可見,本文的方法比FCR算法更快。 表3 本文方法與FCR運行時間比較 本文提出了一種高效自適應的多顏色空間融合方法。結果表明,該方法能較好地分割各種彩色圖像。在初始分割中使用直方圖和SFCM聚類技術,不僅能快速定位初始聚類中心,而且能解決聚類數(shù)目固定的問題。采用有效的融合和區(qū)域融合策略,使分割結果更接近人類的感知。將該方法應用于Berkeley分割數(shù)據(jù)庫,并在視覺評價和定量性能指標方面均優(yōu)于其他方法。5 實驗結果與分析
5.1 選擇不同的顏色分量

5.2 噪聲的魯棒性

5.3 性能比較



6 結語