王 進,馮友紅
(1.南通大學附屬海安市人民醫院醫學裝備科,江蘇南通 226600;2.南通大學附屬海安市人民醫院影像科,江蘇 南通 226600)
近年來,隨著我國醫療事業的不斷發展,醫學影像的自動化、智能化檢測技術受到了更多的關注。深度學習技術與醫學圖像分析的結合已成為智能醫療領域的研究熱點之一,并具有廣闊的應用前景。一方面,醫學影像的智能化識別可以降低醫務工作者的工作壓力,提升醫療檢測效率,緩解看病難的社會矛盾;另一方面,醫學影像的自動化檢測可提升其識別水平,防止由于醫務人員精力、認知水平不足造成誤診,以此提升患者的醫療體驗[1-4]。但現階段,醫學影像仍無法應用到臨床。這是因為當前積累針對特定疾病的醫學影像數據不足、結構混亂、缺乏統一的數據接口,無法直接應用于現有的圖像處理與識別算法[5-11]。
基于以上分析,該文對醫學影像的檢測技術進行研究。文中以X光片檢測肺部結節為例,對相關的圖像處理、機器學習方法進行研究。從圖像特征提取、醫學圖像重構等方面對研究成果進行了細致的介紹,同時結合實際的公開數據集進行了算法的仿真與驗證[12-16]。
該文在研究醫學影像檢測技術時,使用的是X光片。為了更優地完成醫學檢測,需要在這些圖像上完成特征提取,然后將獲得的特征輸入到機器學習算法中。文中在進行特征提取時,主要基于圖像的紋理特征。紋理特征不僅可以表現圖像不同區域的像素信息,還能準確地反映圖像像素的分布模式,刻畫圖像細節。使用的相關紋理特征,如圖1 所示。

圖1 使用的醫學影像紋理特征
對于灰度值為I(i,j),尺寸為M×N的圖像,圖1中使用的各個特征的計算方法如下:
1)灰度統計特征
文中使用的灰度統計特征主要包括圖像灰度的平均值、標準差和中值。這些統計特征可以較好地刻畫圖像的灰度信息。這些特征的計算方法如下:

2)灰度差異特征
對于醫學影像檢測,人體的某種病變在X 光中通常表現為高亮的斑點,然后再向外擴展,即存在病理區域R1 與過渡區域R2。對這兩個區域的灰度均值、方差差異進行統計:

3)基于灰度共生矩陣的紋理特征
對于灰度值為I(i,j),尺寸為M×N的圖像,其歸一化后的灰度共生矩陣計算方法如下:

根據灰度共生矩陣,可計算在該矩陣下的相關紋理能量,如式(8)所示,對比度如式(9)所示,熵如式(10)所示,相關性如式(11)和式(12)所示。


4)尺度特征和基于Hessian 矩陣的紋理特征
對于尺寸為M×N的圖像,其Hessian 矩陣的計算方法如下:

Hij是像素點(i,j)沿著不同方向的二階導數,即:

此外,文中仍用式(8)的行列式作為特征。
5)基于多尺度高斯微分濾波器的紋理特征
多尺度高斯微分濾波器由灰度圖像與二階高斯濾波器的一階偏導數在不同尺度、不同方向卷積獲得,具體方法如下:

其中,σ、θ是不同方向的尺度,根據該文的定義可獲得54 維的特征。在文中,其定義如下:

對于醫學圖像的檢測,通常面臨訓練樣本少的難題。在文中,由于當前的公開數據集中樣本規模較小。以JRST 為例,其樣本數量只有247 張。而上文中提取的特征共有74 個,樣本數量與特征數量較為接近,容易造成分類器模型訓練的過擬合,影響模型性能。因此需要結合現有的醫學影像數據集,進行醫學圖像的重構。文中使用的重構算法為卷積稀疏編碼,其基本原理如圖2 所示。

圖2 卷積稀疏編碼示意圖
在卷積稀疏編碼前,首先對圖像完成稀疏化處理并作為輸入;然后采用不同的卷積核對其進行卷積,提取圖像的不同特征;隨后進行特征融合,獲得輸出圖像。
該網絡前向計算的公式如下:

網絡的損失函數定義如下:

通過卷積稀疏編碼,可學習到有效特征,獲得醫學圖像檢測的分類器。文中使用的卷積稀疏編碼的目標函數如下:

經卷積稀疏編碼后,可對醫學影像進行重構,獲得更多的訓練、測試樣本。從而避免了由于深度學習算法輸入特征和樣本數量比例畸形所造成的訓練中的過擬合現象。在獲得足夠的訓練、測試樣本和輸入特征后,使用代價敏感支持向量機作為分類模型。該模型適用于樣本數量較少的應用場景,其優化函數如下:


其中,C+、C-為模型的正則化稀疏,通過這兩個稀疏,可以得到對于正負樣本的懲罰力度。

該文以肺部結節的檢測識別為例,對相關理論算法進行驗證。算法所需的仿真環境如表1 所示,其所使用的數據集來自JSRT 開源數據集。

表1 該文使用的仿真環境
在JSRT 數據集中,共有胸部的X 光片247 張。其中,肺部結節的胸片154 張。5 個不同類別的胸片如表2 所示。在154 張肺部結節的胸片中,有100 例為惡性腫瘤病例,所有的結節平均直徑為18.4 mm。該數據集的部分圖像如圖3 所示。

表2 該文使用的數據集

圖3 JSRT中的部分圖像
為了評估卷積稀疏編碼模型在肺部結節檢測時的性能,文中使用靈敏度和特異度作為評價指標。這兩個指標的定義方法如下:

其中,TP表示圖像為真結節并被算法判定為真結節;FP表示圖像為假結節但被算法判定為真結節;TN表示圖像為假結節并被算法判定為假結節;FN表示圖像為真結節但被算法判定為假結節。因此模型的Sens 和Spec 越高,表示算法的性能越優。
在分類器的選擇上,文中使用支持向量機(SVM)算法,對JSRT 中所有圖像統計的74 維紋理特征按照2∶1的比例劃分為訓練集和測試集。為了評估卷積稀疏編碼的性能,在實驗一中直接將數據輸入到CSVM 算法中;在實驗二中將數據集利用卷積稀疏編碼算法,按照1∶5的比例重構后輸入到SVM算法中。實驗一、實驗二的結果如表3和表4所示,肺部結節的部分識別結果如圖4 所示。可以看出,文中的算法可以區分出假陽性肺結節和金標準肺結節。

表3 未引入卷積稀疏編碼的計算結果

表4 引入稀疏編碼后的計算結果

圖4 肺部結節檢測示意圖
在實驗統計時,將JSRT 中的明顯可見和比較明顯作為易識別組,難檢測作為難識別組,非常難檢測和完全不可見作為極難識別組。這樣不僅保證了不同類別間數據規模的一致性,且使得統計結果更具有可讀性。
對比表3、表4的數據可以看出,引入卷積稀疏編碼后,所有組別的Sens 和Spec 均有所改善。在極易識別組的模型指標上,卷積稀疏編碼對結果的影響較小。隨著肺結節識別難度的增大,卷積稀疏編碼對于模型指標的改善逐漸增大。最終從所有數據的Sens 和Spec 來看,引入卷積稀疏編碼后達到了0.788 和0.769,提升了2.8%和3.8%。
近年來,深度學習算法在圖像處理領域已有了廣泛的應用。該文以醫學影像的智能化檢測為應用場景,對相關的深度學習算法和圖像處理技術進行了研究。實驗結果表明,文中算法在肺部結節的識別分類上取得了較優的分類效果。在未來,隨著計算機技術和醫療檢測設備的繼續進步,計算機輔助醫學檢測將會得到更多的研究與關注,臨床醫學將不斷向自動化、智能化發展。