中南林業科技大學計算機與信息工程學院 黃 溆 陳愛斌
血細胞自動識別中特征提取方法綜述
中南林業科技大學計算機與信息工程學院 黃 溆 陳愛斌
運用計算機模式識別技術識別血細胞圖像,是醫學圖像領域應用的一個重要研究課題,在血細胞識別過程中,細胞的特征提取是至關重要的一環。本文從形態學特征、顏色特征、紋理特征等幾個方面綜述了血細胞自動識別中幾種細胞特征的提取方法。
血細胞;特征提取;紋理特征
白血病是一種目前致病機理尚不明確的血液類疾病,俗稱“血癌”,嚴重危害患者生命健康。白血病細胞具有惡性、無限增生性,類似于癌細胞,可迅速的浸潤到機體的各個組織器官,引發不良癥狀,甚至在外周血中發生質變。目前白血病的臨床診斷主要采用人工顯微鏡的觀察與識別,但該方法不僅費時費力,且無標準化界定,受觀察者主觀影響較大,因而存在很多檢測上的不足。近些年來,隨著計算機軟硬件技術的不斷發展和創新,圖像處理以及模式識別等先進技術已經被廣泛應用于醫療機構,并為臨床診斷提供了更具有科學性和標準化的依據[1]。計算機自動識別技術可提供具有客觀性和準確率的檢查結果,有利于臨床盡快診斷、盡早治療。然而要得到好的識別效果不僅依賴于原始圖像,還需要對細胞圖像中的特征進行準確和可靠的提取,它是細胞圖像識別很關鍵的一步。
白血細胞圖像有很多的特征。Landeweerd[2]等對外周血細胞進行了識別分類,采用15個特征參數,包括:形態參數4個,光密度參數4個,色度參數5個,紋理參數2個。Seigneuri[3]認為胞核面積,胞核凸度,平均胞漿色調,核輪廓的規則度,及平均胞漿亮度是對骨髓涂片的7類正常粒系細胞進行分類的5個最有效參數。Beksac[4]則提出兩個新特征:胞漿中的顆粒數及胞核中的核仁數。Pavlova[5]進一步證明了運用HSV彩色空間系統對白細胞自動識別的重要性,還提取出了兩種新的特征:外周血中各類細胞在色調,飽和度直方圖的分布特征。Danielal[6]基于灰度共生矩陣計算了細胞的5個紋理特征,例如:嫡、能量、慣性和局部同一性等。寧旭[7]提取了細胞的形貌指標以及細胞的形態色度特征,主要對周長、面積、等效直徑、平均灰度、平均光密度、積分光密度、平均色差、特征灰度等特征進行了分析,對正常和異常皮膚淋巴細胞進行了分類。根據這些已有的研究,本文對血細胞圖像的特征提取的方法進行了分類綜述。
由于細胞的種類很多,并且某些類別差別細微,要識別它們需要選取較多的特征,提取特征的方法各異。
現在對于細胞特征的提取根據圖像的特征可用作標志的屬性,通常可分為形態學特征、顏色特征和紋理特征,其中顏色特征和紋理特征屬于內部特征,需借助分割圖(掩模圖像)從原始彩色圖像上測量。形態特征屬于外部特征,可從分割圖像上直接測量。圖像的特征也常分為圖像的統計特征和圖像的視覺特征兩類。圖像的統計特征是指一些人為定義的特征,通過變換才能得到,如圖像的直方圖、矩、頻譜等。圖像的視覺特征是指人的視覺可直接感受到的自然特征,如區域亮度、紋理或輪廓等細胞圖像的特征。下面我們按第一種特征提取的分類方法進行具體的綜述。
某些白血病骨髓細胞間存差異不明顯等特性,給識別帶來了困難和阻礙,因此需要綜合選取多種形態或特征來全面分析,以免造成誤診。目前常見的主要選取的形態學特征包含一下幾種。
2.1.1 周長
在細胞分割的數字圖像中,多利用歐式距離定義來計算細胞邊界曲線的長度[8]。一般將水平或垂直方向上的相鄰兩個像素點的距離定義為1,則最小正方形的對角線距離為。在計算機分割圖像運算中,細胞的曲線周長實際上就是將細胞邊界所在像素點相連,并將每兩個相鄰點的距離疊加,最終的總合即為周長值。
2.1.2 面積
最簡便和準確的方式,是將細胞區域內的所有像素點進行計數累加來獲得細胞區域的面積特征,根據一些研究已經證實[9],訪方法可獲得與原始模擬區域面積基本一致的結果。
2.1.3 緊湊性
區域致密性又被稱為緊湊性,也是一種重要的表現細胞圖像形態學特征的指標。當圖像越接近圓形時,細胞圖像的致密性越高,當然也要同時參考細胞邊緣的光滑程度,為此,可以用下式度量:

式中,A表示該細胞區域的面積;P表示該細胞區域的邊界周長[10]。F為1,區域為圓形,而邊界的彎曲頻率或程度越高,邊緣曲線越復雜,則F值在小于1的基礎上趨向于0。一般情況下,淋巴細胞多呈現為橢圓形,F值相對較大;中性桿狀細胞的細胞核圖像邊緣彎曲形態呈帶狀,致密性相對較小;單核細胞的細胞核圖像表現為明顯的不規則邊界,其致密性也相對較小。
2.1.4 矩形度
細胞矩形度反映物體對其外接矩形的填充程度,用物體的面積與其最小外接矩形的面積之比來描述,即

式中,A0是物體的面積,AMER是MER(物體最小外接矩形的面積)的面積。R的值在0和1之間,當物體為矩形時,R取得最大值1,圓形物體的R取值為4∏;細長的、彎曲的物體R的取值變小。
2.1.5 細胞核的分葉數
細胞核的分葉數是細胞分類的一個重要指標,中性桿狀粒細胞、淋巴細胞、幼單核細胞、單核細胞的細胞核的分葉數為1,中性分葉核粒細胞的分葉數為2~5,嗜酸性粒細胞一般為兩葉,嗜堿性細胞可分3~4葉或分葉不明顯,常融合成堆集狀。
顏色特征主要通過顏色直方圖表示,即對圖像中各顏色分布情況的一種數學統計值的表達。直方圖橫向軸為顏色值,縱向軸為同色值的像素點在整個細胞圖像范圍內所占的數量比例。顏色直方圖在計算機操作及計算方面相對簡單,其平移、尺度、旋轉等具有不變性,因而適用于大部分圖像數據處理類計算機系統。
除此以外,顏色矩也是一種較常見的顏色特征表達方法,利用矩來表示細胞圖像中各顏色分布情況。但目前細胞涂片的圖像處理中,多采用一階矩——均值、二階矩——方差、三階中心矩——偏斜度表示。這些低階矩的分辨能力相對較弱,因而常將其與其它細胞圖像特征結合應用來應用于臨床。
紋理指的是細胞圖像中具有不規則性、但整體宏觀方面又存在一定關聯性和關系的一種分割圖像特征,它的優點在于不依賴于顏色和亮度的影響,可直接反映出細胞分割圖像的同質屬性。也就是說,紋理特征其實是細胞本身的內在共通特性。紋理特征含有細胞本身的表面結構組織信息,同時關注細胞周圍的環境影響,因而常被應用于圖像的檢索處理當中。紋理特征的提取多通過將細胞圖像像素點間的方向性以及距離性共生矩陣處理后,再由矩陣中將具有含義的統計量提取出來。灰度共現矩陣法是目前涂片圖像紋理特征提取的重要方法之一[11],對于更加清晰的顯示出紋理的粗糙程度具有較好的表現力,同時可更精細的反映出紋理的重復方向。相對于粗紋理的區域,近點像素間存在相近的灰度值,而細紋理區域內,各陣元值相對均勻。
血液細胞識別中,細胞的特征提取對血液病診斷有至關重要的作用。因為細胞的特征很多,所以采用的方法也很多。本文從圖像處理識別領域出發,綜述了提取細胞涂片圖像的幾類特征,著重描述了細胞圖片的形態學特征的提取,如:周長、面積、緊湊性、矩形度、細胞核的分葉數;同時還對細胞的顏色特征和紋理特征的提取進行了一些描述。
[1]黃曉偉.白血病細胞圖像的分割與特征提取[D].福建師范大學碩士學位論文,2007,4:3-12.
[2]Landeweerd GH,Gelsema BS Brener JF,etal.Patern recognition of Nucleated cells from the peripheral blood[J].Patern Recognltion.1983,16(2):131-140.
[3]Seigneurin D,Gauvain C,Brugal G.A semiquantitative analysis of human bone marrow granulocytic linage using the SAMBA 200 cell image processor[J].The normal maturation sequence.Analyt Quant Cytol,1984,6(3):168-178.
[4]Beksac M,Beksac MS,TiPi VB,etal.An artifi cial intelligent diagnostic system on differential recognition ofHematoPoietic cells from micro-scopic images[J].Communications in Clinical Cytometry,1998,30(3):145-150.
[5]Pavlova PE,Cyrrilov KP,Moumdjiev IN.Application of HSV colour system in identi fi cation by colour of biological objects Computerized medical imaging on the basis of microscopic images[J].257-264.and Graphics 1996,20(5).
[6]Daniela Mayumi Ushizima Sabino,Luciano da Fontoura Costa,Rizzatti,Marco Antonio Zago.Imaging.A texture approach to Edgar Gil leukocyte recognition[J].Real-Time 2004,10(4):205-216.
[7]寧旭,唐建民.細胞形貌特征提取與分類識別技術研究[J].激光雜志2005,26(4):95-97.
[8]蔣英,李暉,黃曉偉.白血病圖像分割方法的適應性分析與改進算法[J].激光生物學報,2007,6(6):28-29.
[9]T.Markiewicz S,Osowski B,Marianska,etal.Automatic recognition of the blood cells of myelogenous leukemia using SVM[C].Proceedings of International Joint Conference on Neural Networks,Canada,2005:2496-2501.
[10]張麗霞,陳金寶.實驗診斷學彩色圖譜[J].上海:科學技術出版社,2002:133-137.
[11]Nilsson B,Heyden A.Segmentation of complex cell clusters in microscopic images application to bone marrow samples [J].Cytometry part A,2008,66(1):24-31.
[12]Park J,Keller J M.Snakes on the watershed.IEEE Transactions on pattern analysis and machine intelligence,2010,23(10):1201-1204.
[13]周穎穎,周振宇,孫寧,鮑旭東.基于改進LBP特征的白細胞識別[J].生物學工程研究,2009,24(4):242-246.
湖南省科技計劃項目(編號:2010FJ3139)。
黃溆(1986—),男,碩士研究生,主要研究方向:圖像處理。
陳愛斌(1971—),男,博士,教授,主要研究方向:圖像處理、模式識別。