于月娜 梁光明 劉任任
1(湘潭大學信息工程學院 湖南 湘潭 411100)2(國防科技大學電子科學與工程學院 湖南 長沙 410000)
宮頸癌是一種發病率很高的婦科惡性腫瘤疾病,已經嚴重影響到了婦女的健康[1],目前在國內外病理學研究領域中都很重視對于該疾病的研究。宮頸細胞形態學研究是為了準確檢測宮頸細胞的數量、形態種類、分布密度,為宮頸癌前病變檢測提供有力的依據。其中,在宮頸細胞形態學研究中細胞分割效果的好壞在很大程度上影響特征的提取和分類的準確性。
目前已提出許多的宮頸細胞分割算法,如用支持向量機方法分割[2],采用可變形模板的分割[3],分水嶺分割算法[4]、GVF Snake[5]與粗糙集[6]方法分割等。這些方法都在一定程度上改善了宮頸細胞圖像的分割效果,但是還存在細胞分割不完整、準確率不高等缺陷,特別是在復雜背景下對于重疊細胞和粘連細胞的分割沒有得到有效解決,并且效率不高,不能滿足實際應用。
本文主要研究如何提高宮頸細胞分割的準確率和分割效率,滿足實際應用,提出了一種基于圖割的分層次高效宮頸細胞分割方法。對獲取宮頸細胞圖像進行灰度變化處理求得灰度直方圖,對直方圖結合OTSU求解最佳分割閾值,根據最佳分割閾值對圖像進行初次分割去除背景,可以得到單個細胞目標;而對粘連、重疊、較為復雜的細胞圖像再利用圖割算法進行二次分割獲取單個目標細胞。實驗結果表明,本文所提出的算法不僅有較好的分割效果而且效率也很高。
在圖像分割領域,首次談到圖割的概念和基本理論是在20世紀80年代末的文獻[7]中。基于圖割的分割是通過文獻[8-9]的交互式分割方式進行的,具體理論是把圖像分割問題轉換成為圖論方法中加權圖的切割問題,分割的過程是求解能量最小化的過程,進而達到圖像最理想的分割效果。圖割算法對于彩色圖像具有良好的分割效果,但是其速度相對較慢,對于采集的宮頸細胞圖像直接用圖割算法對其進行分割,效率低下,不能滿足實際應用的需求。
本文提出一種基于圖割的分層次高效分割方法,首先對一整張宮頸細胞圖像做去背景處理,直接得到單個簡單的宮頸細胞,然后利用圖割算法重點分割粘連、重疊的宮頸細胞,這樣在保證分割準確率的前提下可以大大提高宮頸細胞圖像整體的分割效率。基于圖割算法的分層次高效分割宮頸細胞方法的流程為:
Step1輸入圖像I,用直方圖結合OTSU算法分割I,去除I背景,輸出圖像M;
Step2輸入圖像M,用形態學算法對M進行開閉運算,輸出圖像G;
Step3輸入圖像G,對G用圖割算法進行二次分割,輸出單個細胞。
2.1.1 灰度直方圖處理
基于灰度直方圖的圖像分割方法[10-11]是圖像分割中很直觀、應用較為普遍的圖像分割方法,其原理就是利用灰度直方圖分析計算得到圖像閾值從而進行分割的方法,如圖1所示。直方圖就是一個圖像灰度級的函數,灰度級是圖像中的橫坐標,圖像中該灰度級概率密度是縱坐標。當圖像的灰度值直方圖包含有雙波峰、單波谷時,只需要確定波谷的灰度值T,就能夠將背景與物體區分開來。

圖1 基于直方圖分割原理
在宮頸細胞圖像中目標與背景有明顯的差異,其灰度直方圖呈現典型的前景背景雙峰情形,可選取直方圖的波谷為閾值可以分割背景與前景。但當圖像受到噪聲或者其他的干擾時,直方圖就會出現兩個或者多個波谷,這樣選取波谷為閾值進行分割會造成分割不準確,影響分割效果。為了得到更精確的分割結果,本文在研究直方圖分割算法的基礎上,提出了直方圖結合OTSU新的分割方法,對全局閾值分割法進行了改進,避免分割的不準確。
2.1.2 OTSU求解最佳閾值
最大類間方差法[12]簡稱OTSU,是日本大津(Nobuyuki Otsu)提出的一種自適合于雙峰情況的自動求取閾值的方法。該方法存在主要缺陷是需要通過遍歷灰度范圍內所有像素點來計算求解類間方差,再進行比較,得到最大的類間方差和圖像分割的最佳閾值,其計算量很大,效率較低,難以滿足實際應用的需求。
對此,本文結合直方圖處理對算法進行了改進。根據灰度直方圖求出波谷處像素值,依次求出各波谷處像素值對應的最大類間方差值,對應類間方差最大的波谷處像素值即為最佳分割閾值K,這樣在避免了誤分割的同時提高了分割準確度與效率。
根據最佳分割閾值K對圖像進行分割,設目標細胞的像素值為C,分割表示為:

(1)
這樣處理后就可以去掉圖像中的背景。
2.1.3 形態學后處理
形態學處理是較為常用的圖像分割定位方法;形態學[13]處理主要方法有膨脹和腐蝕以及開運算和閉運算,假設A和B都是Z2中的集合。
B對A的開運算:
A°B=(AΘB)⊕B
(2)
B對A的閉運算:
A·B=(A⊕B)ΘB
(3)
由于噪聲的影響,宮頸細胞圖像在閾值化后所得到的邊界通常都很不平滑,細胞區域具有一些噪聲孔,而背景區域上會出現一些小的噪聲點。本文對去除背景后的圖像用4×4的橢圓結構元素進行先閉運算后開運算,可以去除細小的點,平滑邊界區域,得到更好的分割效果。
經過對圖割分割基本原理[14]的學習與研究,分析討論得出基于圖割的宮頸細胞圖像的二次分割算法流程,如圖2所示。

圖2 基于圖割的宮頸細胞圖像分割算法流程圖
在此分割算法中,最基本也是最重要的是通過建立數學模型構造一個能量函數,將分割問題轉換成數學尋優問題,進而應用數學方法求解該能量函數的最優解。在求解能量函數最優解的同時也是能量最小化的求解過程,通過能量函數最小來滿足全局能量的最小化,從而實現圖像最優分割結果。
在宮頸細胞圖像二次分割中,能量函數為:
(4)
利用圖割算法對去背景的宮頸細胞圖像進行二次分割,主要對粘連在一起的宮頸細胞進行分割,能夠將圖像目標形狀和灰度、紋理相融合,這樣可以更好地分割目標細胞,得到更好的分割效果。
本文對158幅宮頸細胞圖像進行了分割實驗。圖3-圖5列出了本文算法和分水嶺算法以及GVF Snake模型對其中一幅宮頸細胞圖像的分割效果圖。通過效果圖可以看出本文提出的算法對于宮頸細胞的分割有很好的分割效果。

圖3 本文算法分割效果

圖4 分水嶺分割算法分割效果

圖5 GVF Snake算法分割效果
分水嶺分割算法其基本思想為:首先對需要分割的圖像進行坐標和灰度級變換處理,使其以數學描述的方式呈現出來;然后根據距離變換原理進行圖像變換;最后找到不同區域間的分界線也就是分水嶺線。在具體分割過程中主要是通過找到分割線完成對圖像的分割。分水嶺算法存在明顯的缺點是極其容易受到噪聲的影響造成分割輪廓的偏移,同時還會有過分割的現象出現。
GVF Snake模型基本思想是:把梯度場向圖像邊緣通過迭代的方式進行擴算形成GVF力場;然后定義動態輪廓能量函數,通過求解能量函數的局部最小值來實現動態輪廓逐步接近圖像真實輪廓。但是GVF Snake模型存在著明顯的不足是無法檢測到凹型輪廓或具有較高曲率的凸型輪廓和物體內部輪廓;同時,整個運算過程較為復雜,涉及的參數也難以確定。
本文算法在速度和準確率上也有較大的提高。定義準確率為:R=N/M,N是分割后檢測的宮頸細胞像素點,M是實際宮頸細胞像素點,R值越小,表示算法分割準確率越高。本文對158幅圖像分割結果進行了統計,其準確率為95.24%,分割時間平均為0.89秒。同時統計了前人研究的支持向量機方法分割[2]、分水嶺算法分割[4]、GVF Snake模型[5]、距離變換方法[15]等對本文158幅宮頸細胞圖像分割的準確率與分割時間,其與本文算法的對比柱狀分布圖如圖6所示。

(a) 不同算法分割時間對比柱狀圖

(b) 不同算法分割準確率對比柱狀圖圖6 不同算法分割時間與準確率對比柱狀圖
通過對比分析,發現本文算法在速度和準確率上均有較大的提高。
本文提出一種新的基于圖割算法的分層次高效分割宮頸細胞方法。對獲取宮頸細胞圖像進行灰度變化處理求得灰度直方圖,對直方圖結合OTSU求解最佳分割閾值,根據最佳分割閾值對圖像進行初次分割去除背景,可以得到單個細胞目標;而對粘連、重疊、較為復雜的細胞圖像再利用圖割算法進行二次分割獲取單個目標細胞。該算法分割準確率高速度快,非常適合在實際應用中分割復雜的宮頸細胞圖像。