張翼 龐寶川
(1.文華學院,湖北武漢 430074;2.武漢蘭丁醫學高科技有限公司,湖北武漢 430074)
病理圖像的分割,是指利用圖像處理與計算機視覺的方法,將顯微圖像中的不同細胞、細胞核或組織結構分割開,并標示其位置、勾勒其輪廓,為后續的特征提取與識別診斷提供依據。復雜紋理背景上的粘連和部分重疊目標的識別與分離一直是模式識別與圖像處理領域最為困難的問題之一。本文通過構造適合于病理圖像分割的混合概率圖模型,分別利用無向圖與有向圖對于因果和相互作用統計關系的描述與刻畫能力,對細胞核位置、輪廓對于區域及邊緣信息的概率依賴關系進行統計建模,設計與實現基于上述構造的概率圖模型的病理圖像分割算法,實現病理圖像中細胞核的準確識別與輪廓勾勒[1]。

圖1 混合概率圖模型框架Fig.1 Framework of mixed probability graph model
“概率圖模型”分割算法將圖像中的像素、目標標記、邊緣、灰度、顏色等視為隨機變量,通過對這些隨機變量間的統計關系建模,從而將圖像分割問題轉化為概率優化與推理問題。概率圖模型主要分為無向圖模型與有向圖模型兩大類。無向概率圖模型能夠表示隨機變量之間的相互作用關系。有向概率圖模型提供了描述隨機變量間因果關系的系統性框架,它通過有向圖結構描述隨機變量間的條件依賴與獨立關系[2]。
在混合概率圖模型設計中,通過構造合適的概率圖模型來研究病理圖像中細胞核位置與輪廓對于不同區域與邊緣信息依賴關系的表示理論、方法與分析模型?;旌蠄D模型中,將圖像中的各種觀測(如像素的局部特征、邊緣等),以及圖像中的分割目標的標記及信息(如細胞核的位置與大小、像素的前/背景標記等)看作隨機變量。并通過有向圖與無向圖的結構來表示它們之間的條件依賴與獨立關系,其基本框架如圖1所示。
混合圖模型主要包括兩個部分:基于無向圖的像素級分割和基于有向圖的目標級細胞核檢測與分割。其中,陰影節點表示觀測節點: Mx表示圖像觀測或者由圖像提取的局部特征向量; Me表示邊緣觀測,即由圖像通過邊緣檢測算法得到的響應值。模型中無向圖部分的作用主要是在給定像素 x 的局部觀測 Mx的情況下,對像素的前景或背景標記 y 進行估計,同時利用相鄰像素間標記的關系,對標記進行約束,從而實現像素級的分割。有向圖部分的作用是在給定邊緣 e 的觀測值 Me的情況下,對細胞核(即目標) c 的位置進行檢測,從而將不同細胞核分離,實現目標級的分割[3]。
本文采用無向圖條件隨機場(CRF)模型來實現病理圖像的像素級分割。C R F 模型的基本思想是在給定圖像觀測 x 的情況下,直接對標記隨機變量 y 的后驗概率分布建模,如式(1)所示:

其中, V 表示圖像中所有需要標記的像素集合,稱為圖像域; i 表示像素坐標; y 為這些像素的聯合標記,iy 表示像素 i 的前/背景標記,對于細胞核像素 yi= 1,否則yi= 0; x 表示圖像觀測或者局部特征向量, xi表示像素i 的圖像觀測或特征向量。 gi,j(·) 表示像素對 (i, j )的特征向量, λ 表示它的權向量。 Z 為歸一化項,也稱為配分函數(Partition Function):

式(2)中包含兩項。其中 φ( yi, xi)表示圖像觀測或局部特征向量對于圖像標記的影響,它以參數函數的形式給出給定像素 i 的局部特征ix 條件下,標記取值iy 的似然率。通過提取不同的顏色、紋理、染色體分布等局部特征值作為圖像觀測 x ,可以描述像素標記與上述局部特征的依賴關系,從而實現細胞核像素先驗知識的數學化表示。這里, φ(yi, xi)表示圖像觀測 xi對于像素級標記 yi的影響,利用訓練數據訓練多層感知器,并得到相應的輸出f ( xi),再利用logistic函數給出它與 yi之間的關系:

利用弧形邊緣檢測器,不僅能夠檢測到邊緣的強度,還可以檢測到邊緣對應的方向與曲率半徑。這些強度、方向與曲率半徑共同構成的邊緣場景信息,對于推理細胞核的位置、將不同的細胞核區分開、實現目標級的病理圖像分割具有重要的作用。該模型可以表示與估計有向圖部分的局部條件分布和,從而將邊緣場景信息表示與嵌入到分割模型中弧形邊緣檢測器如圖2所示。

圖2 弧形邊緣檢測器Fig.2 Arc edge detector

其中,邊緣基元與該細胞核中心距離為 r ,邊緣基元方向和基元與細胞核中心連線的夾角為 θ ,邊緣基元的曲率半徑為 R 。即假定對于某種特定曲率半徑 R 的邊緣基元,該邊緣與細胞核中心的位置關系成 (θ , r) 的聯合高斯分布。
利用上述多元聯合高斯分布及加法模型,由不完整的多曲率邊緣信息,推理得到細胞核中心位置。
6.管理上的不平衡。隨著社會市場領域不斷伸展,干部職工舍家撇業,常年野外施工付出較多,特別是在遠離親人的艱苦環境情況下,個別黨員干部出現了心里失衡,感覺勞動付出與得到的實際報酬不匹配,為了找回心里的平衡,個別人在經濟上就出現了問題。

其中, p( e) 表示檢測到的邊緣 e 的概率, 為指示函數, ρe為對應的閾值。 H( c) 為細胞核中心的強置信度。通過Logistic函數,可以轉換為其相應的后驗概率值
通過上述概率建模思路,將基于無向概率圖的像素級分割模型和基于有向圖的目標級分模型結合起來,構造混合概率圖模型,刻畫圖像中區域與邊緣等場景信息,并以統一的框架加以表示與描述,以解決病理圖像分割中的場景信息表示與利用等核心問題。
接下來解決如何由訓練數據,估計得到最優的權向量λ的值。本文采用最大似然率準則(MLE)估計參數 λ 的值。
假定所有訓練數據是獨立同分布的,則 λ 的對數似然率可以表示為:

其中, z(k)為訓練數據 k 的對數配分函數,K 表示訓練數據數量。利用上述對數似然率,可以采用直接法或梯度下降法等常見最大似然率準則求取最優的λ。由M LE 準則知:

則利用隨機梯度下降法,以及如下梯度,可以實現參數 λ 的估計:


根據觀察可以看出,邊緣基元與細胞核中心的相對空間位置關系應具有旋轉不變性,也即最可能的細胞核應處于邊緣基元的軸向上。
根據以上推導,結合混合概率圖模型中的不同場景信息的參數表示方式,進一步給出由訓練數據優化與估計上述參數的算法,以解決病理圖像分割中的先驗信息提取與嵌入、區域場景信息的利用等核心問題。
利用像素級標記 y 與目標級標記 c 的關系,將CRF部分與B N 部分相關聯,建立統一的混合模型,才能實現多目標的細胞核檢測與分割。像素級標記 y 與目標級標記 c可以表示為一種自然的因果關系:像素級標記iy 完全依賴于目標級標記ic ,也即像素標記為前景是因為它屬于某個細胞核。若將iy 和 cj看作隨機變量,則它們的關系可以用條件分布描述。一種方法是將該條件分布看作Bernoulli分布,用如下的形式表示:

圖3 病理圖像分割結果Fig.3 Pathological image segmentation results

該條件分布定義的基本思想是當某像素屬于某細胞核時,其屬于前景的概率也較大。模型參數可根據實際情況進行調整。有研究表明,只要參數不處于極端情況,實際推理結果對于該參數的具體值不是非常敏感,可以看作是一種定性的定義[5]。
利用上述混合圖模型,推理得到像素級標記和目標級標記的最可能值,實現目標級的分割。由于本文所構造的混合圖模型由有向圖與無向圖兩部分構成,難于用傳統的概率圖推理方法進行直接推理。一種方法是將兩部分統一轉換為因子圖,并利用和積算法等推理方法進行參數的最大后驗估計,實現最優標記。根據因子圖,可以將本文提出的混合圖作如下分解:

從而實現像素級標記 y 與目標級標記 c 的同步推理,實現細胞核的分離與位置的準確檢測;同時,還能夠實現細胞核的真實邊緣 e 的最大后驗估計,從而實現細胞核輪廓的準確勾勒。
采用本文提出的概率圖模型針對H&E 染色的病理樣本顯微圖像進行分割實驗,以驗證該方法的有效性。實驗樣本采用H&E 染色的乳腺腫瘤病理圖像,原始顯微病理圖像如圖3(a)所示??梢钥闯鰣D3(a)第二幅圖的細胞核存在大量的粘連,甚至部分重疊的情況,這也為實現不同細胞核的準確分割與輪廓勾勒帶來難度。利用傳統方法對圖3(a)中的原始顯微病理圖像進行分割,其結果如圖3(b)所示,利用本文方法對圖3(a)中的原始顯微病理圖像進行分割,其結果如圖3(c)所示。由對比可知,傳統方法在應對細胞核粘連和重疊情況下,分割的準確率較低,而通過本文中的概率圖模型方法分割的準確性較高。綜上所述,基于概率圖模型的病理圖像分割方法能夠在復雜的紋理背景下,估計細胞核對于不同區域與邊緣依賴關系,從而提高了分割的準確性。