趙曉晴,劉景鑫,張海濤,胡笑含,李大軍,李慧盈
1. 吉林大學 計算機科學與技術學院,吉林 長春 130012;2. 吉林大學中日聯誼醫院 放射線科,吉林 長春 130033;3. 吉林大學第一醫院 放射線科,吉林 長春 130021;4. 吉林省人民醫院 消化內二科,吉林 長春 130021
計算機輔助診斷已經成為現代生物醫學工程領域研究的一大熱點,該手段不僅可以達到檢驗檢測結果的高度客觀性,而且能夠大大減輕醫師的勞動強度,進一步提高病理檢測的效率和診斷的準確性。血液中的白細胞是人體免疫系統抵御病菌的侵襲、治愈機體的受傷部位、抵御和消滅病原以及微生物的入侵方面機制的一道保障防線。利用圖像分割算法對白細胞顯微圖像進行處理分析,自動識別白細胞,根據分割結果對其進行分類,并統計各類白細胞數目等信息診斷是否有疾病以及患病程度,所以對白細胞分割計數具有醫學檢驗意義。
計算機圖形圖像處理技術被廣泛應用于醫學領域,為了更精確地提取圖像特征信息,國內外學者提出了很多種改進方法。Ghosh等[1]根據白細胞核的形狀特征,運用貝葉斯分類器對白細胞進行分類,其原理是利用數字圖像處理中的數學形態學將血液細胞顯微圖像中的白細胞及其細胞核進行識別、提取和分類。Xie等[2]集合隨機游動原理和神經網絡原理提取細胞核結構,并且利用白細胞的形態特征對其進行分類。Chen等[3]提出了一種輪廓感知的全卷積神經網絡(Full Convolutional Neural Network,FCN)[4]——DCAN,用于從組織學圖像中分割腺體,以改善腺癌的自動診斷。它們還用輪廓模擬了損失,使得他們贏得了2015年MICCAI腺體分割挑戰[5],證實了強化學習輪廓的優勢。李舒等[6]結合醫學專業知識分析白細胞特征,同時對血液細胞中的細胞核、細胞質和細胞膜進行分割,從而達到各個成分的分離,并且進一步實現了白細胞復原。最近,Xu等[7]提出了一種三分支網絡來分割結腸組織學圖像中的單個腺體。Mask R-CNN[8]被認為是自然圖像實例分割中較好的技術,它使用Faster R-CNN[9]對對象邊框進行分類,然后在每個框內應用FCN[4]分割單個圖像。
目前,針對急性淋巴細胞白血病(Acute Lymphoblastic Leukemia,ALL)患者血液細胞顯微圖像的白細胞提取及粘連白細胞分割技術仍需進一步完善。本文提出了一種基于色彩空間轉換的目標檢測方法,提取圖像中的白細胞,并使用基于距離變換的分水嶺算法分析圖像信息以分離粘連細胞,進一步優化分割結果。
提取白細胞作為ALL顯微圖像分割的第一步,就是將圖像中的紅細胞和血小板置為背景,白細胞置為前景。在血涂片中,白細胞與紅細胞在顏色上存在差異,與血小板在大小上存在差異,利用該特點檢測并提取白細胞。
1.1.1 中值濾波
在提取白細胞之前需要對圖像進行中值濾波[10],在盡量保留白細胞邊緣細節特征的條件下對顯微圖像中的噪聲進行抑制,以提高后續圖像分析和分割的有效性和可靠性。中值濾波作為非線性數字濾波器技術,需要檢查輸入信號中的采樣并判斷它是否代表了信號,使用奇數個采樣組成的觀察窗實現這項功能,即選取像素點的灰度值由其周圍像素點灰度的中值來代替[11-12],見算法1。通過運用數理統計學中的中間值方法,對原始圖形進行非線性信號處理,以降低噪聲對圖像的干擾,增大信噪比。
算法1中值濾波算法為:
Input: image X of size m×n, kernel radius r
Output: image Y as X
for i = r to m - r do
for j = r to n - r do
initialize list A[]
for a = i-r to i+r do
for b = j-r to j+r do
add X(a, b) to A[]
end for
end for
sort A[] then Y(i ,j) = A[A.size/2]
end for
end for
1.1.2 圖像色彩空間轉換
在計算機視覺和圖像處理領域,色彩空間指的是組織色彩的特定方式。一個色彩空間由顏色模型和映射函數構成,顏色模型能代表像素的值,而映射函數將顏色映射到可以被代表的所有顏色的集合。RGB是應用最廣泛的色彩空間,其模型結構如圖1所示。

圖1 RGB色彩空間模型
HSV色彩空間是基于人類對顏色的感知而提出來的顏色空間。H、S、V、分別代表色調(Hue)、色彩飽和度(Saturation)和明度(Value),它是一種將RGB色彩空間中的點在倒圓錐體中的表示方法。HSV色彩空間圓錐模型如圖2所示。

圖2 HSV色彩空間模型注:圓錐組成的子集代表HSV顏色空間中的每一個元素,在圓錐的頂點處,V=0,H和S無定義,代表黑色;圓錐的頂面中心處V=255,S=0,H無定義,代表白色。
彩色圖像一般用RGB三個分量表示,同時與亮度有關,當圖像亮度發生變化,三個分量隨之變化,因此RGB色彩空間更加適合于顯示系統,并不適合于血液細胞顯微圖像處理。而HSV則與人眼的色彩感知相近,本文采用HSV顏色空間,對亮度和色彩分別進行處理,其中亮度與圖像的色彩信息無關,而色調和飽和度則與人的感知密切相關。實驗中的色彩空間轉換方法,算法如下:
1. if R=max, H=(G-B)/(max-min)
if G=max, H=2+(B-R)/(max-min)
if B= max, H=4+(R-G)/(max-min)
2. H=H×60
if H<0, H=H+360
3. V=max(R, G, B)
4. S=(max-min)/max
根據算法2對血液細胞顯微圖像進行色彩空間轉換,并提取兩個色彩空間中的R、G、B、H、S、V六個分量,如圖3所示。RGB空間的三個分量沒有完全地將紅細胞、血小板和白細胞區分開,而HSV空間的三個分量更適合于血液細胞的邊緣檢測和分割。

圖3 RGB和HSV色彩空間分量提取結果注:a是濾波后的原始圖像;b~d是R、G、B分量提取結果;e~g是H、S、V分量提取結果。
1.1.3 白細胞檢測
由于HSV顏色空間的三個分量對血液細胞顯微圖像更為敏感,實驗基于HSV色彩圖像檢測并提取白細胞,見算法3:基于cv2.inRange函數濾除紅細胞;基于cv2.bitwise_and函數將RGB圖像中的背景和紅細胞置黑,突出白細胞和血小板;基于cv2.threshold函數二值化提取結果;基于cv2. findContours函數標記前景輪廓,并依照面積升序排列輪廓;濾除面積小于6000像素點的血小板,以進一步突出白細胞。
圖像中的白細胞呈紫色,所以將(H,S,V)三元組的閾值設置為(125,43,46)~(155,255,255),該色帶區間的像素點突出了白細胞和血小板。將提取結果二值化后進行前景輪廓標記,并以面積為依據升序排列輪廓。遍歷所有輪廓,面積大于6000像素點的前景視為白細胞,進行提取,否則視為血小板。
分水嶺算法是一種數學形態學圖像分割方法[13],最初用來處理簡單的二值圖像,隨后被用作灰度圖像分割。分水嶺算法的計算速度較快,對微弱邊緣有較好的分割效果,所以本文采用分水嶺算法分割粘連細胞[14],并將其與距離變換[15]結合使用。
1.2.1 距離變換
距離變換是針對二值圖像的一種變換。在二維空間中,一幅二值圖像可以認為僅僅包含目標和背景兩種像素,目標像素值為1,背景像素值為0。距離變換的結果不是另一幅二值圖像,而是一幅灰度級圖像,即距離圖像,圖像中每個像素的灰度值為該像素與距其最近的背景像素間的距離。
距離變換算法有歐式距離和非歐式距離兩類,由于非歐式距離往往不滿足精度要求,實驗中采用歐式距離變換算法。二維數組AM×N=[aij]可以表示一個大小為M×N的二值圖像,其中目標點的像素為aij=1,背景點的像素為aij=0。假設背景像素集合是B={(x,y)|aij=0},目標像素集合是F={x,y|aij=1},則對A集合里面所有像素點(i,j)按照公式(1)進行計算就是實驗中采用的距離變換。公式(2)解釋了歐式距離計算方法。

1.2.2 分水嶺分割算法
分水嶺算法是把數字圖像映射為地形地貌圖,地形圖中的海拔高度用原圖像中的像素點的灰度值來表示,利用邊界點將其劃分成山和盆地,然后使用浸水模型[16]對圖像進行分割:首先找出圖像中所有的局部極小值點;然后從極小值點開始將地表勻速浸入水中,隨著水量的增加,積水盆地開始慢慢向外擴張,在積水盆地交集處構建水壩,預防兩個積水盆地匯合在一起,當整個地形完全被水浸沒后,這時的水壩就形成了分水嶺?;诰嚯x變換的分水嶺分割算法如算法4:使用cv2.cvtColor函數將目標圖像變換成灰度圖像;閾值化處理;使用cv2.morphologyEx函數進行重建的開閉操作,消除細小邊界;距離變換;使用cv2.watershed函數求出基于距離變換的分水嶺分割結果。
基于距離變換后的分水嶺算法對粘連細胞的分割有較好的效果,但過分割現象仍然存在,如圖4所示。

圖4 基于距離變換的分水嶺算法對粘連細胞的分割結果注:a~c分割結果較好;d中出現了過分割現象。
實驗算法在Ubuntu 16.04操作系統下,基于Pycharm Community IDE,采用Python 3.0語言進行編寫和測試。實驗數據來源于意大利米蘭大學提供的公開血液樣本顯微圖像數據集——ALL_IDB1,該數據集針對急性淋巴細胞白血病。
研究所使用的血液細胞顯微圖像大小為1712×1368,根據圖像尺寸選取(25,25)、(27,27)、(29,29)三種結構元素進行中值濾波。濾波后的顯微圖像如圖5所示。以圖中標記處為例,圖c處理結果較為理想,保留了細胞邊界的細節特征,同時濾除了血涂片制作過程中產生的噪聲,所以實驗中采用(27,27)結構元素進行濾波預處理。

圖5 中值濾波預處理結果注:圖a是原始血液細胞顯微圖像;圖b~d是分別是結構元素(25,25)、(27,27)、(29,29)的濾波結果。
將急性淋巴細胞白血病血液細胞顯微圖像轉換至HSV顏色空間后,進行白細胞檢測與提取結果如圖6所示。HSV色彩空間的血液細胞顯微圖像中的白細胞和紅細胞在顏色上有顯著差異,對于周圍只有紅細胞和血小板的白細胞分割結果較好,但是不能準確地分割粘連白細胞,見圖6d標記處。

圖6 白細胞提取過程注:a是濾波后圖像;b是轉換至HSV色彩空間后的結果;c是白細胞檢測結果;d是過濾背景后的圖像;e是白細胞提取后的結果。
采用基于距離變換的分水嶺算法分割粘連白細胞,并標記細胞邊界,分割結果如圖7所示。

圖7 粘連細胞分割結果注:第一行是濾除背景的粘連細胞圖像,第二行是分割并標記邊界后的細胞圖像。a~c分割結果較精確;圖d~f在標記處產生過分割。
本文提出了使用色彩空間變換方法,將RGB色彩空間的ALL血液細胞顯微圖像轉換至HSV色彩空間,根據顏色閾值檢測并提取白細胞,并采用基于距離變換的分水嶺算法分割粘連細胞,得到了較為精確的結果,但是仍然存在過分割現象。
在未來的工作中,將會研究適用于大數據處理的深度學習技術,通過該技術提取高維數據中的特征信息[17-18]。希望能夠研究一種更加快速的血液細胞顯微圖像分割方法,能夠達到較好的分割結果,同時減少過分割現象,從而應用于現代醫學影像處理。