張 琦,安建成,劉奕麟
(太原理工大學 軟件學院,山西 太原 030024)
乳腺鉬靶X光檢查目前已成為檢測早期乳腺癌癥狀如微小鈣化點以及腫塊存在的最有效以及最常用的工具。然而,由放射科醫師進行視覺分析易受視覺等主觀因素的影響而導致漏診等現象,因此,許多計算機輔助診斷(CAD)系統[1]應運而生以支持醫師的診斷工作。所謂乳腺腫塊分割,是指將乳腺腫塊與背景分割開,分割乳腺腫塊作為腫塊分類及檢測的先前步驟,分割的精度的高低對腫塊分類及檢測有直接影響,乳腺腫塊分割是乳腺癌CAD系統的關鍵。
目前,用于乳腺鉬靶X圖像的分割方法有很多。閾值分割方法[2]只考慮圖像的灰度信息,沒有考慮圖像的空間信息,此外,閾值分割方法對噪聲較敏感,因此較難得到準確的分割結果;基于邊緣分割算法[3]對噪聲也十分敏感,對分割效果產生很大的影響;此外,基于區域的分割算法[4]也是一種常用的分割算法,但由于分割算法以及種子點的選擇對分割效果有很大的影響,所以使用區域分割算法得到的分割效果不很理想。
基于圖的分割算法[5,6],如馬爾科夫隨機場分割算法,引入圖像不確定性描述與先驗知識的聯系,將圖像的空間信息考慮其中,將圖像分割問題轉化為最優化問題,具有良好的分割性能。通常點對MRF模型引入簡單的先驗模型易于實現,但是,這種模型由于難以估計模型參數,先驗信息不足,常造成過分割現象。
為了解決MRF分割算法的過分割問題,本文提出一種基于SLIC改進的MRF分割算法。采用SLIC算法對圖像進行預分割處理,得到大小均勻、形狀規則、邊緣保持良好且內部具有較高一致性的超像素塊,然后使用超像素區域替代待分割圖像像素,建立一個基于區域的MRF模型,進行圖像分割操作。通過引入SLIC算法對待分割圖像的局部區域建模,解決MRF分割算法的過分割問題。
SLIC分割算法是由Achanta等[7]提出的基于梯度下降的超像素生成算法。SLIC算法通過對比灰度值與距離,將相似度較高的像素通過迭代聚類,把圖像分割為大小不一但均勻、形狀不同但比較規則的超像素。本文使用SLIC算法,將乳腺區域分割為均勻的類正六邊形超像素塊,分割得到的超像素很好地保持了原圖像的邊緣細節等信息,每個超像素塊均具有局部區域代表性。

為避免后續聚類過程中,由于初始化得到的聚類中心處于圖像邊緣導致較大誤差,在原聚類中心3*3鄰域中最小梯度位置作為新的聚類中心替代原聚類中心。由于乳腺鉬靶X圖像為灰度圖像,SLIC算法使用像素灰度G與位置X、Y坐標構成的3維特征向量V=[g,x,y]對每一個像素點進行描述。
本文根據乳腺鉬靶X圖像的特殊性,采用了一種較為完善的相似性衡量標準,公式如下
(1)
(2)
(3)
其中,dg為像素i與像素j的灰度值差異,dxy為兩像素間的空間距離,m作為平衡因子對灰度值差異以及空間距離在相似度計算中所占的比例起到平衡作用,Ds為兩像素的相似度。
在以聚類中心為中心的2S*2S鄰域范圍內,高效搜索與其匹配的像素點,對每個聚類中心進行聚類,由于搜索范圍沒有在整幅圖像展開,使像素聚類速度較快。完成圖像預分割的同時,對每個超像素塊分配一個標號,并生成對應的鄰接矩陣。
由于乳腺本身即乳腺組織與胸肌、腫塊等其它組織具有相似的密度,在乳腺鉬靶X圖像中表現為這些組織的亮度比較大,成像過程中不可避免造成噪聲干擾[8],因此在進行圖像分割之前對圖像預處理去除這些干擾項有利于得到更好的分割效果。本文采用形態學濾波方法濾去圖像中存在的軟組織、背景噪聲以及標簽等干擾,增強感興趣區域的紋理特征,增強圖像的清晰程度,為接下來圖像分割奠定了良好的基礎。
使用SLIC算法對乳腺鉬靶X圖像預分割處理的步驟為:
(1)對原圖像進行預處理;
(3)在初始聚類中心3*3鄰域范圍內搜索最小梯度位置作為新聚類中心;
(4)在聚類中心2S*2S范圍內進行相似度匹配,進行聚類;
(5)不斷迭代(3)、(4)直至聚類中心不變,將乳腺鉬靶X圖像預分割為大小均勻的類正六邊形超像素塊,并標號,生成相應的鄰接矩陣。
根據醫學圖像的特殊性,一般對圖像進行處理時,需要對整幅圖像提取超像素,但在乳腺鉬靶X光圖像中乳腺腫塊分割只對乳腺部分進行分析,乳腺以外區域可以忽略不進行處理。針對乳腺鉬靶X圖像的這一特性,本文通過灰度判斷,選擇性的提取超像素,減少像素點的計算有效提高了算法效率。圖1為預分割的效果。

圖1 預分割結果
MRF分割算法[9]是一種基于圖的分割算法。首先需要建立起馬爾科夫隨機場模型,該模型的建立將概率論與圖論有機的結合在一起。根據Gibbs分布與MRF的等價性,通過計算MRF的最大后驗概率對圖像的像素點進行標簽,生成原乳腺圖像對應的標記場,實現圖像分割。基于MRF的圖像分割算法將圖像分割過程轉化為根據某概率對圖像中的像素點進行標記的過程。
結合實際應用需求,通常采用低階的MRF實現圖像分割過程。但常用的MRF模型先驗信息不充分,導致模型參數估計不準確,常導致過分割現象。
本文采用基于SLIC算法改進的MRF分割算法,很好地保留了圖像的邊緣信息,彌補了MRF分割算法過分割缺點的同時,有效提高圖像分割效率。針對使用的SLIC算法得到的分割結果,本文定義了一個較傳統鄰域系統更加適用于預分割結果的鄰域系統構建MRF模型。
針對馬爾科夫隨機場中相鄰像素之間的概率的依賴關系,MRF模型引入“鄰域系統”這一概念,圖2為像素點x的一階鄰域系統。

圖2 一階鄰域系統及子團
由于通過SLIC算法預分割將原乳腺鉬靶X線圖像分割為類正六邊形的超像素,針對得到的超像素形狀特征,本文提出一種基于類正六邊形的一階領域系統,根據SLIC分割算法得到的鄰接矩陣得出超像素塊之間的相鄰關系,構建MRF鄰域系統。圖3為本文使用的基于正六邊形超像素x的鄰域系統模型及其子團。

圖3 本文鄰域系統及子團
鄰域系統定義了圖像中每個超像素受哪些超像素影響。假設Nx為超像素x的鄰域系統,則滿足如下性質:
(1)x?Nx,即超像素x不屬于自身鄰域系統;
(2)y∈Nx?x∈Ny,即超像素間鄰域關系是相互存在的。
根據執行SLIC分割算法后得到的鄰接矩陣可得到超像素的索引集合X,可將超像素x的鄰域定義為與x的距離小于整數值為k的超像素組成的集合,定義公式如下
(4)
其中,dist(x,y)表示超像素x與y之間的歐式距離。
本文構建如圖3所示的一階領域系統,即六鄰域系統。
同時,在MRF中,中心超像素x與其鄰域系統Nx中的若干像素構成子團(Clique),是Nx的一個子集,同時,子團中的超像素滿足上述鄰域系統的性質(2),互為對方超像素的鄰域系統中的一部分。
令Y=yxx∈X,yx∈L為定義在集合X上的一組隨機變量,yx是標簽集合L=l1,l2,…,lm的一個取值,其中m定義標簽的類別數,則稱Y為隨機場。y1=l1,y2=l2,…,ym=lm為隨機事件,簡化為y=l,則稱Py=l=y1=l1,y2=l2,…,ym=lm為隨機場Y的聯合分布概率。對于隨機場Y若滿足以下兩條性質:
(1)Pyi=li>0,即非負性;
(2)Pyi=liyj=lj,i≠j=P(yi=li|yj=lj,j∈Ni)即馬爾科夫性。
那么,稱Y是以Nx為鄰域系統的馬爾科夫隨機場。
采用MRF分割算法實現圖像分割可以看作求解馬爾科夫隨機場最大后驗概率的過程,即將給定原圖像X對應為標記圖Y的過程,圖4為X與Y的對應關系。

圖4 聯合場分布(上面為觀察場X,下面為標簽場Y)
根據Bayes規則,圖像的后驗概率分布模型P(Y|X)表示為
(5)
其中,P(X|Y)是特征場分布模型,P(Y)是先驗分布模型。
基于最大后驗估計算法(MAP)準則,全局最優標記結果

(6)
由于直接利用MRF完成圖像分割,要求得聯合分布概率P(Y),但是直接得到P(Y)很困難,因此求解聯合分布概率成為直接使用MRF的難點。Hammersley等提出了MRF的局部特性與Gibbs分布的全局性存在等價性[10],解決了這一難題。
根據Hammersley-Clifford定理可知,當且僅當馬爾科夫隨機場在鄰域系統上滿足Gibbs分布時,MRF的馬爾科夫性與Gibbs隨機場的全局性等效。由此得到先驗概率如下
(7)
其中,Z為配分常數;T為溫度系數,是一個常數;c為子團,C為鄰域系統中所有子團的集合;Vc(Y)為能量函數,是子團c的勢。
那么,先驗概率可寫為

(8)
為了描述超像素鄰域間的相互關系,本文使用的多級邏輯模型(multilevel logistic,MLL),MLL模型的勢能函數Vc(Y)表示為
(9)
其中,yi與yj分別為超像素塊i,j的標簽,i,j互存在于對方的鄰域系統,即子團中各點標簽均相同時,取值θ,否則取值為-θ。
對于單超像素子團的勢能,勢能的值與超像素的標簽有關
Vcyi=βi
(10)
βi為標簽為yi的超像素具有的勢能。
通常認為每個超像素i服從參數為θi=μyi,σyi的高斯分布,則
(11)
則P(X|Y)可記為
PXY∞explnPXY
(12)
則后驗概率P(Y|X)可寫作

(13)
綜上所述,MRF分割算法將圖像分割問題轉化為求解式(6)最大后驗概率問題。根據統計物理學可知,可以進一步將分割問題轉化為能量優化問題,即求解最小后驗能量的過程

(14)
其中,U(X|Y)為圖像的似然能量;U(Y)為平滑能量。
后驗能量可寫為

(15)
考慮到計算效率的問題,本文使用條件迭代法逐元求解使得后驗能量函數最小的標簽,更新原超像素標簽,直到收斂。
MRF分割算法首先對圖像中每個超像素隨機初始化標簽操作。為了得到更好的分割效果,本文采用K-means聚類算法對超像素塊進行預標簽,相比傳統MRF分割算法中通過隨機初始化標簽超像素,進而不斷迭代得到分割的最優解,采用K-means預標簽后所得到的分割效果更精確,效率更高。
綜上所述,本文所提出乳腺鉬靶X圖像分割算法步驟如下:
(1)對圖像進行預處理;
(2)采用SLIC算法對圖像進行預分割處理,將圖像分割為內部一致性較高的類正六邊形超像素;
(3)取每個超像素區域中所有像素的像素值求得平均像素值,描述超像素區域;
(4)使用K-means聚類算法實現圖像中超像素標簽初始化;
(5)求解不同標簽下超像素的后驗能量函數U(Y|X)的值;
(6)比對每個超像素求得的各個后驗能量函數值,取其中最小值,將其對應的標簽值作為新的標簽值更新該超像素標簽;
(7)重復步驟(5)、步驟(6),不斷迭代直至超像素標簽值不再改變,迭代終止,完成圖像分割。
本文使用的實驗環境是Intel Core i7-3770處理器,主頻3.40 GHz,內存8 GB,實驗平臺MATLAB 2015b。
將本文提出的分割方法應用于DDSM圖像庫中的150例含有腫塊的乳腺鉬靶X圖像中進行分割實驗。為得到分割效果的定量評價,本文的乳腺癌腫塊均經過醫師標注,作為實驗圖像中腫塊分割的標準,并將本文的分割算法以及區域增長、分水嶺、Snake分割算法得到的分割結果與手動標注結果進行比較。
使用本文提出的算法對含有乳腺腫塊的乳腺鉬靶X圖像進行腫塊分割,分割結果如圖5所示。

圖5 乳腺鉬靶X圖像腫塊分割結果對比
圖5中的圖像從上到下依次為:圖5(a)行為3例原始乳腺鉬靶X圖像并將ROI區域標注出來,圖5(b)行為手動標注結果,圖5(c)~圖5(e)行分別為使用區域增長、分水嶺、Snake分割算法得到的實驗結果,圖5(f)行為使用本文分割方法的實驗結果。
圖5表明,本文分割結果優于另外3種分割結果。區域增長、分水嶺、Snake分割算法由于受周圍其它組織的干擾,分割得到的腫塊邊緣較專家手動分割結果存在較明顯的誤分割,相比較,本文算法得到的分割結果與專家手動分割結果更相近,分割結果更精確,由此得出,本文分割算法在乳腺腫塊分割方面取得較好的效果。
為了更加客觀地反映本文分割算法的分割效果及效率,本文采用量化指數Jaccard相似系數[11]和方差作為評價準則對分割結果進行定量分析。
通過式(16)求得Jaccard相似系數對分割結果的分析評價
(16)
其中,SL與ST分別表示實際分割得到的乳腺腫塊區域與手動分割得到的乳腺腫塊區域,N(S)表示腫塊區域S中所包含的像素數量。由上式可知,Jaccard相似系數即腫塊面積重復率,J值越大,實際分割與手動分割結果重復率越高,分割算法在乳腺腫塊分割的應用越好。
如表1所示,給出了區域增長、分水嶺、Snake以及本文所提算法的平均Jaccard 相似系數及方差。
由表1可知,與其它3種傳統分割算法相比,本文的方法得到的分割結果重復率較高,方差較小,由此可知,本文方法在乳腺鉬靶X圖像中的應用取得了較好的分割效果。

表1 不同分割算法的定量分析
本文提出一種基于SLIC算法改進的MRF分割算法,并應用于乳腺鉬靶X圖像腫塊分割。本文方法首先采用適用于乳腺圖像的SLIC算法對圖像預分割,將圖像分割為邊緣保持良好的超像素區域,然后將圖像像素替換為包含局部特征的超像素執行MRF分割算法,通過這一改進,有效解決了低階MRF隨機場引入簡單的先驗模型時導致的過分割問題。實驗結果表明,本文方法可以高效地實現較準確的乳腺腫塊分割,在乳腺鉬靶X圖像應用中,滿足實時應用需求。