汪友明 張菡玫
(西安郵電大學(xué) 西安 710121)
乳腺癌是一種女性多發(fā)性的惡性疾病,它嚴(yán)重威害了女性的健康。近年來由于環(huán)境破壞、壓力增大和不良生活習(xí)慣等原因,導(dǎo)致女性乳腺癌發(fā)病率逐年增加[1]。為了協(xié)助醫(yī)生發(fā)現(xiàn)乳腺超聲圖像中的病變組織,研究人員提出了一種運(yùn)用不同的圖像處理和分析的技術(shù)作為診斷乳腺癌的輔助工具[2]。
診斷和識(shí)別乳腺腫瘤主要有特征提取和識(shí)別兩個(gè)步驟,目前在特征提取這個(gè)方面,已經(jīng)研究出了基于灰度共生矩陣(GLCM)、Tamura 紋理分析、Gabor 濾波器和局部二值模式(LBP)[3~5]等幾種方法。在識(shí)別方面,已經(jīng)研究出了K-means 聚類、支持向量機(jī)分類(SVM)、模糊C均值分類(FCM)[6~8]等方法。灰度共生矩陣(GLCM)一般為稀疏矩陣,計(jì)算所有的特征值就是在計(jì)算矩陣,因此計(jì)算量增大,就會(huì)產(chǎn)生大量的冗余信息,浪費(fèi)大量的存儲(chǔ)空間[9],為此需要減少灰度共生矩陣的計(jì)算量。并且由于GLCM 和人類視覺模型不相符,對(duì)全局信息的利用貧乏,難以對(duì)紋理尺度間像素的遺傳或依賴關(guān)系進(jìn)行研究[10],為此需要利用Tamura 紋理[11]來模擬人類的視覺特性并進(jìn)行紋理特征的提取,并在此基礎(chǔ)上進(jìn)行紋理識(shí)別。
本文提出了一種基于改進(jìn)灰度共生矩陣和Tamura 相結(jié)合的算法,實(shí)現(xiàn)了乳腺腫瘤圖像的識(shí)別。利用相結(jié)合的方式提取圖像紋理特征,并減少紋理特征提取時(shí)大量的冗余信息,然后計(jì)算其與各訓(xùn)練樣本的馬氏距離,采用最小距離準(zhǔn)則進(jìn)行分類[12]。實(shí)驗(yàn)結(jié)果表明,所提算法可以提高乳腺腫瘤圖像識(shí)別的精確度和程序計(jì)算速率。
1)各向異性擴(kuò)散濾波算法[13]:能更好地濾除乳腺腫瘤圖像中的斑點(diǎn)噪聲,并且能更好地保持邊界信息,適用于對(duì)乳腺腫瘤圖像進(jìn)行去噪處理。各向異性擴(kuò)散濾波模型通過設(shè)置擴(kuò)散方程的大小來對(duì)腺腫瘤圖像進(jìn)行去噪處理,即在圖像的邊界部分設(shè)置較小的擴(kuò)散系數(shù)實(shí)現(xiàn)圖像平滑,更好地保持邊界信息。
2)限制對(duì)比度直方圖均衡[14]:通過波降噪后的圖像將其分成許多個(gè)不重疊的部分,對(duì)每個(gè)部分進(jìn)行直方圖均衡化,最后通過雙線性插值獲得圖像灰度值,它對(duì)于低對(duì)比度圖像特別適用,且易于實(shí)現(xiàn)。
3)L0 梯度濾波算法[15]:對(duì)圖像做平滑處理,是為了去除圖像中沒有意義的細(xì)節(jié)部分并且更明顯地保留邊界信息。使用L0 范數(shù)進(jìn)行平滑濾波,具有兩個(gè)優(yōu)點(diǎn):1)可去除圖像中不重要的一些細(xì)節(jié)結(jié)構(gòu)部分;2)可以增強(qiáng)圖像的某些明顯的圖像邊界部分。
對(duì)于上述預(yù)處理得到的去噪、增強(qiáng)后的圖像,將圖像分成子塊,提取每塊的特征進(jìn)行分類。紋理是在圖像空間中若相隔一定距離的兩像素之間一定會(huì)存在某種灰度關(guān)系,即圖像中灰度的空間相關(guān)特性[16]。

設(shè)f(x,y)是大小為M×N的圖像,灰度級(jí)為Ng,則滿足一定空間關(guān)系的灰度共生矩陣為其中I(l,m) 表示像素的灰度,P為Ng×Ng的矩陣,若兩點(diǎn)像素間距離為d,兩者與坐標(biāo)橫軸的夾角為θ,則可得到各種間距及角度的灰度共生矩陣P(i,j,d,θ)。d為生成灰度共生矩陣的步長(zhǎng),θ為生成的方向,為了能夠生成不同方向的共生矩陣,可以從0°、45°、90°、135° 四個(gè)角度獲取結(jié)果。
改進(jìn)的灰度共生矩陣具體方法如下:1)首先為減少計(jì)算量壓縮影像灰度級(jí)數(shù);2)提取ROI區(qū)域的長(zhǎng)和寬作為圖像的長(zhǎng)和寬進(jìn)行計(jì)算;3)由于共生矩陣是描述4 個(gè)不同方向的圖像特征,將對(duì)應(yīng)的4 個(gè)方向的各個(gè)矩陣元素進(jìn)行累加,得到一個(gè)均值矩陣作為最終的共生矩陣。

1)將圖像的灰度等級(jí)化,劃分為K個(gè)等級(jí),其中f(x,y)為像素點(diǎn)(x,y)的初始灰度,f1(x,y)為等級(jí)化后的像素值[17]。經(jīng)過參數(shù)對(duì)比驗(yàn)證確定最合適的灰度級(jí)。
2)在原始的圖像中除了對(duì)腫瘤的感興趣區(qū)域以外,背景區(qū)域和非感興趣區(qū)域也很多,為了解決這一問題,將盡可能多的腫瘤區(qū)域視為感興趣區(qū)域,并且盡量排除非感興趣區(qū)域,用來確定最終的ROI 區(qū)域。接著將ROI 區(qū)域的長(zhǎng)和寬做為圖像的長(zhǎng)和寬進(jìn)行計(jì)算,這樣減少了圖像的大小,減少特征提取的計(jì)算量。
3)在構(gòu)造共生矩陣時(shí),為了滿足圖像的旋轉(zhuǎn)不變性,選擇4 個(gè)方向分別計(jì)算灰度共生矩陣,即0°、45°、90°、135°這4 個(gè)方向分別構(gòu)造矩陣;其中x=0,1,2,…Lx-1;y=0,1,2,…Ly-1;i,j=0,1,2,…L-1。

在構(gòu)造的矩陣中,將對(duì)應(yīng)的4 個(gè)方向的各個(gè)矩陣元素進(jìn)行累加,并且除以4 得到一個(gè)均值矩陣,最后以得到的這個(gè)均值矩陣作為最終的共生矩陣。進(jìn)一步地,從GLCM 中可得出以下5 種參數(shù),作為典型紋理特征[18]:
能量:

熵:

對(duì)比度:

逆差矩:

相關(guān)度:

式中μx和δx分別為的均值、均方差;μy和δy分別為的均值、均方差。
基于人類對(duì)紋理的視覺感知,Tamura 提出了6個(gè)重要的視覺紋理特征:粗糙度、對(duì)比度、方向性、線性度、規(guī)整度和粗略度[19]。

1)粗糙度:式中S(x,y)=2k是對(duì)于每個(gè)像素,使評(píng)價(jià)灰度差E值達(dá)到最大的k值來設(shè)置窗口最佳尺寸。

2)對(duì)比度:式中α4=μ4/σ4,μ4是四次矩,σ4是方差。

3)方向性:式中p代表某個(gè)峰值;ωp代表谷間該峰值的范圍;?p是該峰值的位置。

4)線性度:其中PDd是距離點(diǎn)n×n局部方向的共生矩陣。5)規(guī)整度:其中r 是歸一化因子,每一個(gè)σxxx表示Fxxx的標(biāo)準(zhǔn)偏差。

6)粗略度:

針對(duì)乳腺腫瘤圖像中的高斑點(diǎn)噪聲、圖像對(duì)比度低、邊緣信息模糊等問題,本文實(shí)驗(yàn)對(duì)比分析了各向異性擴(kuò)散濾波模型、限制對(duì)比度直方圖均衡、L0 梯度濾波在乳腺超聲圖像方面的降噪和圖像增強(qiáng)效果。
圖1、圖2 和圖3 從左到右依次為原始圖像、3×3 模版濾波后的圖像、5×5 模版濾波后的圖像、7×7 模版濾波后的圖像、9×9 模版濾波后的圖像。由圖像可以得出窗口大小為5×5 時(shí)的各向異性擴(kuò)散濾波能更好地濾除斑點(diǎn)噪聲,對(duì)圖像進(jìn)行去噪處理。
限制對(duì)比度直方圖均衡:當(dāng)模版越大時(shí),去噪增強(qiáng)就越大,越容易丟失重要的細(xì)節(jié)部分,經(jīng)過多個(gè)模版對(duì)比,在5×5時(shí),圖像增強(qiáng)效果最好。

圖1 各向異性擴(kuò)散濾波效果圖

圖2 限制對(duì)比度直方圖均衡效果圖

圖3 L0梯度濾波效果圖
L0 梯度濾波算法:效果的達(dá)成主要依賴于控制平滑度的參數(shù)λ和控制迭代次數(shù)的參數(shù)β,經(jīng)過多次實(shí)驗(yàn)對(duì)比,最好的參數(shù)為λ=0.02,β=2.0。
紋理特征提取的實(shí)驗(yàn)對(duì)象是:共含160 幅乳腺腫瘤超聲圖像,其中惡性腫瘤100 例,良性腫瘤60例。手工從原始數(shù)據(jù)中提取的與之相對(duì)應(yīng)的160幅乳腺腫瘤ROI區(qū)域,通過給出的各特征參數(shù)的定義進(jìn)行乳腺腫瘤超聲圖像的紋理特征提取。為了更好地分析良、惡性腫瘤各特征參數(shù),分別提取良、惡性腫瘤各特征參數(shù)的均值和標(biāo)準(zhǔn)差,如表1、表2、表3和表4所示。
通過把改進(jìn)的GLCM 特征值和Tamura 特征值融合在一個(gè)矩陣,增加特征值維度來實(shí)現(xiàn)改進(jìn)的GLCM 和Tamura 兩種方法的融合,并將單一GLCM、Tamura、改進(jìn)的GLCM 和GLCM+Tamura 作為特征提取的對(duì)比算法。通過上述步驟,共獲得160幅圖像作為樣本,從中隨機(jī)抽取100 幅作為訓(xùn)練樣本,剩下60 幅作為測(cè)試樣本。分類時(shí),首先提取測(cè)試樣本的紋理特征,然后計(jì)算其與各訓(xùn)練樣本的馬氏距離,采用最小距離準(zhǔn)則進(jìn)行分類。采用分類正確率、誤識(shí)率和拒識(shí)率作為算法性能的評(píng)價(jià)指標(biāo),三個(gè)指標(biāo)之和應(yīng)為1,即C+R+E=1[20]。

表1 良性腫瘤圖像的改進(jìn)灰度共生矩陣參數(shù)

表2 惡性腫瘤圖像的改進(jìn)灰度共生矩陣參數(shù)

表3 良性腫瘤圖像的Tamura紋理參數(shù)

表4 惡性腫瘤圖像的Tamura紋理參數(shù)
實(shí)驗(yàn)中對(duì)GLCM 紋理特征(S1)、Tamura 特征(S2)、改進(jìn)的GLCM 紋理特征(S3)、GLCM 紋理+Tamura 紋理特征(S4)和改進(jìn)GLCM 紋理+Tamura紋理特征(S5)進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果如表5所示。

表5 不同的特征提取方法的分類結(jié)果
由表5 可以看出,S3 的平均分類正確率比S1得到提高、誤識(shí)率降低,運(yùn)行速率明顯減少,表明改進(jìn)的灰度共生矩陣減少了大量的冗余信息,明顯提高了程序的運(yùn)行速率和圖像識(shí)別的精確程度。
由表5可以看出,S4的平均分類正確率比單一的S1 和S2 高、誤識(shí)率低,表明GLCM 與Tamura 相結(jié)合的算法可以更好地識(shí)別圖像信息,從而獲得更好的圖像分類結(jié)果。
由表5可以看出,S5的平均分類正確率比單一的S3 和S2 得到提高、誤識(shí)率降低,比S4 的精確度也略有提高,表明改進(jìn)的GLCM 與Tamura 相結(jié)合的算法可以更好地識(shí)別圖像信息,減少不必要的干擾圖像分類結(jié)果的冗余信息,從而獲得更好的圖像分類結(jié)果。
本文提出一種改進(jìn)的灰度共生矩陣(GLCM)與Tamura 相結(jié)合的紋理特征提取算法,減少紋理特征提取時(shí)大量的冗余信息,提高紋理描述能力和程序計(jì)算速率,更好地識(shí)別乳腺腫瘤圖像。并采用最小距離準(zhǔn)則對(duì)所獲取的特征向量進(jìn)行分類,實(shí)現(xiàn)乳腺腫瘤圖像的精確分類。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的GLCM與Tamura相結(jié)合的算法提高了分類識(shí)別率,是一種有效的、運(yùn)行速率快的、正確率高的乳腺腫瘤圖像識(shí)別方法。