劉 研,黃劍華,唐降龍,張英濤,劉 博
(哈爾濱工業大學計算機科學與技術學院,哈爾濱150001,snacly@163.com)
乳腺癌是常見的女性惡性腫瘤[1],多普勒超聲作為一種無痛,快捷、易操作、在活體上可重復實施、能顯示腫瘤全貌以及生理病理特性的檢查方法,可用于術前評估腫瘤血管的生成、抗血管生成和預測預后,具有廣泛的臨床意義[2].目前的乳腺超聲分類方法主要是對腫瘤的紋理特征以及形態特征進行提取,進而利用分類器進行分類.文獻[3-4]采用自相關系數和均方差系數提取紋理特征并用SVM分類器對乳腺X超聲圖像進行分類,其結果證明二維超聲圖像中的腫瘤的紋理特征的對腫瘤良惡性分類具有較好的效果.文獻[5]采用了灰度自相關矩陣提取紋理特征,并且應用了逐步回歸方法進行分類.但是,上述方法只考慮了超聲圖像中的灰度信息,因此可能會受到設備儀器的影響而出現噪聲干擾產生虛假紋理.而顏色特征則充分利用了圖像的色彩信息,側重于圖像整體信息的描述,不受圖像旋轉和平移變化的影響,歸一化可不受圖像尺度變化的影響.
文獻[6]闡述了一種基于HSV模型來提取血流特征并用SVM進行分類的方法,取得了良好的分類效果.由于不同類別的多普勒圖像序列具有其特有的血流特征,而且提取動態圖像序列特征比單一靜態特征所提取的信息更為全面,因此本文設計了一種分類系統,針對乳腺超聲圖像中的灰度信息和彩色信息進行特征提取并將其結合,最后通過SVM進行分類從而驗證系統的有效性.
紋理特征的提取首先要確定腫瘤所在位置的感興趣區域(ROI),并將ROI圖像從整個圖像中進行分離.本文確定ROI區域的方法為人工選取,用一矩形框將腫瘤所在區域進行定位,進而對區域內圖像進行紋理特征的提取.灰度共生矩陣是圖像灰度的二階統計度量,其作用是描述紋理中灰度基元之間的空間聯系[7].
設f(x,y)為一幅二維數字圖像,其大小為M×N,灰度級別為CON,則滿足一定空間關系的灰度共生矩陣為

式中:#(x)為集合x中的元素個數,若(x1,y1)與(x2,y2)間距離為d,兩者與坐標橫軸的夾角為θ,則可以得到各種間距及角度的灰度共生矩
本文用能量、對比度、熵和逆差矩等作為統計分量.其中,各種特征信息定義為:
1)能量(角二階矩).

2)對比度(或稱主對角線慣性矩).

3)熵.

4)逆差矩.

5)相關.


在實際應用中,由于灰度共生矩陣的計算量大小是根據圖像灰度級和圖像大小而確定.為了減小計算復雜度,本文將對原圖像進行灰度級量化,以將原影像的灰度級壓縮到較小的范圍,從而減少共生矩陣的維數.但灰度級的壓縮會導致圖像的清晰度降低,所以首先要對圖像進行直方圖均衡化處理(圖1)且增強對比度,從而最大程度地保留原圖像的紋理特征.

圖1 對原始圖像進行直方圖均衡化處理
血流特征分為血流動力學特征和形態學特征.由于二維多普勒超聲儀器的限制,擬將對血流的動力學特征進行提取,其過程主要包括對血管位置的檢測以及特征提取兩個環節.
血管檢測的目的是確定血管在圖像中所處的位置.由于在各幀圖像中,血管區域顯示為具有特定顏色的彩色點(其中,不同的顏色可以表示血流的方向和流速),而彩色和灰度圖像的RGB分量間的差值不同,灰度圖像的RGB各分量的值比較接近,而彩色圖像的RGB各分量的值之間的差距則相對較大,因此可以通過閾值化方法來確定血管區域.首先計算在各點的RGB分量之間的差值,然后設置一個閾值T,對RGB分量之間的差值進行閾值化,從而取得該幀血管位置的圖像(Tgray).設置方法為

在進行對提取出的像素點進行歸一化后,通過提取關鍵像素的坐標來獲得對應的彩色點在整個圖像中的坐標值.圖2為血管位置的確定過程.

圖2 血管位置確定過程
特征的提取和分析是計算機輔助診斷的關鍵環節.通過提取幾個對腫瘤的供血有重要影響的動力學特征對腫瘤進行分析.動力學特征主要包括血流豐富程度、心臟收縮期流速峰值、舒張期末速率、平均速率、腫瘤內動脈的阻力指數以及搏動指數、最大流速變化率等.臨床診斷表明,惡性腫瘤的收縮期流速峰值(Vmax/m·s-1),腫瘤內動脈的阻力指數(RI),搏動指數(PI)和平均流速(Vmean/m·s-1)要明顯高于良性腫瘤.
在彩色多普勒中,血流的速度可以用HSV模型中的V分量來映射.V值越高表明血流速度越高,相反V值越低表明血流速度越低.根據這一特性,首先將RGB模型轉化為HSV模型,然后求得血管所在區域中各個像素點的V值,并提取血流豐富程度、收縮期流速峰值、腫瘤內動脈的阻力指數以及搏動指數等.其具體定義為:
1)收縮期流速峰值(Vmax/m·s-1):即一個彩色多普勒序列中V值的和最大的幀.

2)舒張期末速率(Vmin/m·s-1).

3)平均流速(Vmean/m·s-1).

4)腫瘤內動脈的阻力指數(RI).

5)搏動指數(PI).

最大流速變化率 (Varmax/m·s-1)反映了當前樣本血流變化的大小,從而反映出動脈供血的多少.動脈數量多,Varmax相對則大;反之,Varmax相對則小.

式中:V為HSV模型中每個彩色點的亮度.C為一常量系數.N為在一個搏動周期中所代表的幀數.根據臨床所描述的病理意義,惡性腫瘤中動脈的數量,血流流速、阻力指數以及搏動指數要相對高于良性腫瘤.因此,通過對各樣本中血流變化率來判斷腫瘤中血流的豐富程度,可以彌補單純提取紋理特征所造成的提取信息不全、受噪聲等因素干擾的缺點.
本文應用了支持向量機分類器[8],在有監督學習的模式下對65個多普勒序列(30個良性,35個惡性)樣本進行分類實驗.為了克服訓練樣本數量較小這一缺點,這里采用leave-one-out方法對分類效果進行訓練和評估.
在本實驗中,所有的圖片均來源于哈爾濱醫科大學第二附屬醫院專家診斷,且這些病例經過活體切片的確認.所用超聲診斷儀為GE VIVID-7,探頭為線陣,工作頻率為5~14 MHz.該樣本集中包括30個良性病例以及35個惡性病例.每個樣本均被分離成若干個ROI序列,并對每個樣本提取了相同的幀數進行特征提取.由于血流信號不穩定,造成部分相鄰幀彩色區域的缺失.本文將彩色信號出現頻率>30%的區域設為血流區域.
該分類系統中設置了下列重要參數:多項式核函數參數(degree),算法終止條件(eps),多項式,徑向基函數和Sigmoid函數的參數(gamma),多項式和Sigmoid函數的參數(coef0),懲罰性因子(C),為了能使系統達到最佳分類狀態,采用交叉項驗證方法來調整參數.
這里采取的訓練方式為:
1)從k個良性樣本和惡性樣本中各選取一個樣本,并用其余k-1個樣本進行訓練.
2)從其余k-1個樣本中選取一個良性或者惡性樣本,進行分類.
3)從其余k-1個樣本中再選取一組良性和惡性的樣本,并重復步驟1.
由于所提取的血流特征中各特征之間數量級差距較大,為達到良好的分類效果,分類前將體征進行歸一化處理.這里參數設置為degree=3.0,eps=0.01,gamma=1,coef0=1,C=256時,可使分類效果達到最佳狀態.為評價診斷的系統性能,采用精確性、敏感性、特殊性、錯誤正比率、錯誤負比率和接受特性曲線等6個指標來進行評估.

式中:TP為被正確分類的惡性腫瘤的數量.TN為被正確分類的良性腫瘤的數量.FP為被錯誤分類的良性腫瘤的數量.FN為被錯誤分類的的惡性腫瘤的數量.實驗結果如表1所示.

表1 本系統與文獻[3]、文獻[7]系統仿真結果
在對于紋理間粗細和疏密相差較小的圖片進行分類時,本系統的分類效果相對于文獻[3]中系統的分類效果得到了明顯的提高,相對于文獻[7]中系統的效果也有所提高.圖3所示為單用紋理特征而錯分的樣本,而利用本文所提出的系統則可以正確地識別.

圖3 文獻[3]系統錯分樣本
對類似圖3中的被錯分紋理間粗細和疏密相差較小或受噪聲干擾的樣本,本系統均能正確識別.整體對比實驗數據如表2所示.

表2 試驗對比結果
接受特性曲線ROC法可用于描述相對于特殊性余數(1-特殊性)的敏感性,被廣泛用于醫學診斷中,圖4為文獻[3],[7]中系統與本文所提出系統的ROC曲線.對于曲線的曲線下面積(AUC)分別計算可得,文獻[3]中AUC=0.8226,文獻[7]中AUC=0.9113,而本文中的AUC=0.9523.
從實驗可以看出,應用多普勒特征與紋理特征相結合進行腫瘤的良惡性分類,可彌補超聲圖像所帶來的干擾,從而得到更加的分類效果.

圖4 系統的分類效果比較
1)本系統將多普勒血流特征與腫瘤紋理特征相結合,可以彌補單純靠紋理特征分類而受到的干擾,進而提高分類精度.
2)實驗結果表明,加入血流特征后系統的分類精度要比單純提取特征的分類精度提高15.38%,敏感性提高11.42%,特殊性提高19%,錯誤正比率提高 16.33%,錯誤負比率提高14.46%.可以看出本系統可以明顯彌補單純提取紋理特征的不足.
[1]陳菲,吳鳳霞.超聲在乳腺癌中的應用[J].醫學綜述,2009,15(2):279-281.
[2]FANELLI M,LOCOPO N,GATTUSO D,et al.Assessment of tumor vascularization:Immunohistochemical and non-invasive methods[J].Int J Biol Markers,1999,14(4):218-231.
[3]HUANG Yu-Len,CHEN Dar-Ren.Support vector machines in sonography application to decision making in the diagnosis of breast cancer[J].Journal of Clinical Imaging,2005,29(3):179-184.
[4]SIVARAMAKRISHNA R,POWELL K A,LIEBER M L,et al.Texture analysis of lesions in breast ultrasound images[J].Computerized Medical Imaging and Graphics,2002,26(5):303-307.
[5]CHANG R F,WU W J,WOO K M,et al.Improvement in breast tumor discrimination by support vector machines and speckle-emphasis texture analysis[J].Ultrasound in Med&Biol,2003,29(5):679-686.
[6]ZHANG Ying-tao,CHENG H D,GUO Yan-hui,et al.Classification of breast masses using color doppler flow imaging[C]//Proceedings of the 11th Joint Conference on Information Sciences.Atlantis:Published by Atlantis Press,2008:554-558.
[7]HARALICK R M,SHANMUGAM K,DINSTEIN I.Textural features for image classification[J].IEEE Transactions on Systems Man and Cybernetics,1973,3(6):610-621.
[8]STAELIN Carl.Parameters Selection for Support Vector Machines.HPL2002-354(R.1)[R/OL].Development Company,2002[2003-11-10].http://www.hpl.hp.Com/techreports/2002/HPL-2002-354R1.pdf.