景柏楊,焦雄
(太原理工大學生物醫學工程學院,山西太原 030024)
隨著現代計算機技術與醫療手段的發展融合,醫學圖像處理技術成為發展最快的交叉領域之一,在疾病診療中發揮著不可替代的作用。醫生、技師可以通過搭載圖像處理技術的平臺,從不同角度觀察患者病灶區的形態、范圍,結合自身臨床經驗,更加精準地對病灶區進行診斷,從而有效提高診斷效率和精確度。
目前,國內外已有很多研究人員對醫學圖像平臺進行了開發研究,這些平臺大多以ITK(Insight Toolkit)和VTK(Visualization Toolkit)開發工具包為底層技術支持,實現對影像數據的全方位展示,輔助醫生對癌變區域進行分割、配準、重建等。例如,德國腫瘤研究中心研發了開源醫學影像交互平臺Medical Imaging Interaction Toolkits,極大地便利了臨床醫生;美國賓州大學放射系醫療小組開發的3DVIEWNIX系統提供了醫學圖像預處理、二維和三維可視化、圖像分割等功能,但該系統運行于Unix上,而且沒有對外界免費開放。國內的醫學圖像處理研究以中國科學院自動化研究所田捷教授實驗室開發的圖像處理平臺為代表,該平臺主要包括圖像處理算法層與圖像分析軟件平臺應用層。Medical Imaging ToolKit(MITK)為該平臺的算法層,為整個系統提供算法支持,采用面向對象的設計方法,語法簡單直觀且易于調用;3D Medical Image Processing and Analyzing System(3DMed)為該平臺的用戶交互界面,是面向最終用戶(臨床醫生、科研科教人員等)的集成化醫學圖像顯示層。科研人員將MITK提供的三維重建、分割、配準、可視化等功能集成于3DMed提供的用戶交互端中,形成一個簡明易用的醫學圖像處理與分析系統。對國內研究人員的相關工作進行粗略匯總,如表1所示。

Table 1 Statistics of domestic medical image processing platform表1 國內醫學圖像處理平臺統計
由表1可知,現有圖像處理平臺重點關注圖像顯示、分割、配準以及三維重建功能的開發。事實上,圖像特征對于后續處理工作也發揮著重要影響,真實貼合病灶區的數據特征更能準確反映疾病狀況。為此,本文設計一個圖像處理平臺,主要實現對病灶區的特征提取,彌補了現有平臺的欠缺,為醫務工作者提供更有針對性的診療數據。
國內現有醫學圖像處理與分析平臺大多采用C/S(客戶機/服務器)架構設計,其交互性強、響應速度快。然而在該架構下,每臺客戶機均需安裝相應的客戶端程序,導致后期的二次開發和維護比較繁瑣。此外,以往的主機/終端和C/S架構已無法滿足當前全球網絡開放、互聯和信息共享等需求。
現如今,軟件平臺的更新換代越來越頻繁,基于B/S(瀏覽器/服務器)模式的平臺優勢凸顯。在軟件系統升級時,系統管理人員只需要維護管理服務器,而且不論用戶規模有多大都可以隨時升級系統,還實現遠程維護與共享。B/S模式將系統功能實現的核心部分集中于服務器上,使得系統的開發、維護和使用均得到了簡化。B/S的優勢在于不需要對客戶機進行專門的維護與升級,適用于客戶機位置不固定或需要依靠互聯網進行數據交換的應用系統。目前,B/S模式已被廣泛應用于網絡商用系統中,使用者只需在訪問端安裝一個瀏覽器,輸入網址即可訪問平臺進行相關操作。用戶從瀏覽器端通過交互界面向服務器提交Http請求,服務器接收請求后,解析URL地址并定位模板文件,根據地址和模板文件生成向瀏覽器端發送的響應HTML文件。隨后,瀏覽器端接收響應HTML文件進行解析,整理相關資料后,將數據傳入用戶交互界面進行顯示。在B/S系統架構中,流轉的數據信息均存儲于數據庫中,為整個系統提供數據支持。圖1為B/S模式的架構。

Fig.1 B/Sarchite cture圖1 B/S架構
通過前后端技術聯動,融合相關圖像處理算法搭建一個醫學圖像處理平臺,實現對醫學圖像的三維顯示、放大、縮小、旋轉等基本操作,對ROI進行特征提取。
采用Python技術進行平臺設計,采用Django的MVT(Model-View-Template)模式,其中Model負責數據處理,View負責接收請求,Template負責構造要返回的Html頁面。該模式具有高耦合、低內聚的特性,便于平臺后續開發維護。系統架構如圖2所示。
系統功能設計如圖3所示,該模塊主要實現圖像數據上傳、格式轉換、特征提取、放大縮小等功能。其中特征提取主要分為3個部分,分別為一階統計量、二階統計量、高階統計量。一階統計量實現圖像數據直方圖的提取,基于圖像形狀和大小特征提取等基本信息進行計算;二階統計量提取圖像灰度共生矩陣、灰度行程矩陣、灰度大小矩陣等相關參數;高階統計量實現圖像的小波變換(Wavelet)、拉普拉斯變換(Laplace Transformations)等操作。

Fig.2 The proposed system design architecture圖2 系統架構

Fig.3 System function design圖3 系統功能設計
功能實現流程如圖4所示,通過前端展示的Button按鈕綁定某個路徑,該路徑可訪問到能進行特征提取運算的Python文件,在Python文件中設定好輸出結果的形式。點擊按鈕,觸發相應的算法進行特征提取。

Fig.4 Flow of function realization圖4 功能實現流程
3.3.1 平臺基礎功能展示
以乳腺癌為例進行平臺功能展示。如圖5所示,圖像顯示分為4個界面,左上部分為影像數據的三維顯示,相關人員可通過滑動鼠標進行器官全貌三維展示。左下、右上以及右下顯示區域分別為不同角度的二維影像角度展示,可輔助使用者較為準確地把握病灶區域的輪廓大小。圖像數據顯示等基本操作主要依賴Cornerstone工具實現。Cornerstone是包括但不限于Dicom格式的交互式醫學影像輕量級js組件。該組件支持DICOMweb中的WADO-URL和WADO-RS接口,以實現網頁抓取。其采用網頁多線程解碼加速圖像顯示,有助于互聯網應用JPEG等壓縮方式傳輸圖像。其還能靈活嵌入不同的前端框架,便于后續開發維護。
平臺的功能選擇界面如圖5中左側選擇框所示,選用按鈕控件實現不同功能的事件綁定。點擊上傳影像按鈕,將需要計算特征的影像數據上傳至平臺,然后點擊選擇框中的按鈕進行操作。操作界面直觀簡潔,使用者可輕松選擇自己需要的功能。

Fig.5 Interface of platform圖5 平臺界面
如圖6所示,使用者將光標放置在感興趣部位,通過點擊鼠標左鍵可使感興趣部位放大,從而更加直觀地看到病變部位的影像。

Fig.6 Magnify the Dicom圖6 影像放大
窗位窗寬效果如圖7所示。使用者可根據需要左擊鼠標上下調節不同的窗位、左右滑動調節窗寬,可使病灶區呈現出不同的亮度。

Fig.7 Changing window width and window level圖7 變換窗位窗寬
為從不同方位展示病灶區形態,使用者可滾動鼠標滑輪旋轉顯示界面,具體如圖8所示。

Fig.8 3D rotating display圖8 三維旋轉展示
角度標注功能如圖9所示。使用者可點擊鼠標右鍵啟動ROI區域勾畫,明辨病灶區角度。標注出來的病灶區域可通過相關圖像處理算法進行分割提取,進而輸入到平臺中進行病灶特征計算。

Fig.9 Angular dimension圖9 角度標注
3.3.2 影像數據直方圖繪制
影像灰度分布信息是圖像處理過程中較為重要的一項指標,可通過點擊繪制直方圖獲取影像灰度分布信息,便于研究人員對圖像進行更為精準的評估。圖10為圖5右半部分展示框中右上圖像的灰度直方圖。

Fig.10 Information of histogram圖10 直方圖信息
3.3.3 圖像特征提取
圖11為不同類別特征提取按鈕的展示。將分割好的病灶區上傳至平臺后,點擊對應類別特征的按鈕進行病灶區特征的提取。操作完成后,特征信息直接輸出為csv格式的文件,可保存在用戶指定的路徑中。

Fig.11 Different category feature extraction buttons圖11不同類別特征提取按鈕
為了檢驗平臺提取到特征的可用性,進行基于圖像特征的分類計算。以圖5展示的乳腺癌圖像為例進行病灶區特征提取,將提取好的特征輸入到機器學習模型中進行計算驗證,若基于特征數據的分類模型得到的AUC(Area Under ROCCurve)值在0.7~1.0之間,則說明該特征可用于進行下一步分析計算。
選擇用于癌癥研究的醫學圖像開放數據庫(The Cancer Imaging Archive,TCIA),該數據庫包含常見腫瘤醫學圖像及相應的臨床信息,圖像模態包括MRI、CT等,選取其中的CBIS-DDSM數據集。該數據集以患者為單位進行影像數據存儲,每例患者均包含兩種位置下的圖像數據,分別為常規軸位(CC)與外側斜位(MLO)。從數據集中隨機抽取10例良性腫瘤患者和10例惡性腫瘤患者的鈣化數據,綜合20個病例兩種不同的攝影位置,本實驗共包含21例良性鈣化病灶和24例惡性鈣化病灶。
4.2.1 特征提取
獲取病灶區圖像數據,上傳至平臺進行由Dicom格式到jpg格式的轉換。然后進行圖像數據特征提取,可提取的特征信息如表2所示。45例病灶輪流進行表中特征的提取,對輸出的數據進行規范化處理。

Table2 feature in formation statistics表2 特征信息統計
4.2.2 模型選擇
本實驗采用兩種機器學習分類驗證模型進行計算,分別為邏輯回歸模型和隨機梯度下降模型,這兩種模型均能在較短時間內檢測出所提特征的可用性。
(1)邏輯回歸雖含有回歸二字,卻是一種用于解決分類問題的機器學習方法,用于估計某事件發生的可能性,常用于數據挖掘、疾病診斷、經濟預測等領域。該模型具有訓練速度快、內存資源占用少的優點,適用于二分類問題。二項邏輯斯蒂回歸模型是一種分類模型,其最終表現形式為一種概率模型,如支持向量機、K鄰近算法等。二項邏輯斯蒂回歸概率模型表示為:

x
為輸入,Y
為輸出,w
為參數權值向量,b
為偏置。對于給定的輸入x
,求出上兩式的結果,將實例x
分類到概率較大的那一類。參數w
的估計一般采用極大似然估計法。(2)隨機梯度下降是一種簡單但非常有效的算法,多用于支持向量機、邏輯回歸等凸損失函數下線性分類器的學習。其計算代價小,可用于大規模數據集。隨機抽取一組數據值w
代入到損失函數中可得到一個初始點,使這個初始點按照負梯度方向運動,表示為:
α
為學習率,可防止梯度過大從而一次性邁過最低點;g
為梯度。迭代上一步,直至找到最優解。將整理好的數據輸入到模型中進行計算,對所有數據進行10折交叉驗證,采用精確度、查準率、召回率、F1值對模型進行評價。
模型測試結果顯示,如圖12所示,邏輯回歸模型得到ROC曲線的AUC值可達0.89,具體評價指標見圖13;如表14所示隨機梯度下降模型得到ROC曲線的AUC值為0.82,具體評價指標見圖15。兩種模型預測的AUC值均可達到0.8以上。

Fig.12 ROC curve of logistic regression model圖12 邏輯回歸模型ROC曲線

Fig.13 Evaluation result of logistic regression model圖13 邏輯回歸模型評價結果
通過查閱文獻,科研工作者利用提取好的特征經模型計算分析后得到的準確度結果匯總如表3所示。將本文模型測試結果與表3數據進行比較,可以看出本文模型提取出的特征數據可以進行后續相關計算,并得到較為可信的預測結果。

Fig.14 ROC curve of stochastic gradient descent model圖14 隨機梯度下降模型ROC曲線

Fig.15 Evaluation result of stochastic gradient descent model圖15 隨機梯度下降模型評價結果

Table3 Statistics of accuracy results表3 準確度結果匯總
圖像處理在疾病診斷中發揮著越來越重要的作用,特征提取作為圖像處理的基礎工作之一,對后續工作有重要影響。如今,醫學圖像處理與分析平臺層出不窮,如何更加明晰地展現病變部位,使其更加貼近機體的真實面貌,為醫生的準確診斷提供參考依據意義重大。同時,隨著醫學成像設備的發展,所獲取的圖像數據越來越大,如何實時處理和顯示這些數據,對醫療圖像系統開發人員是巨大挑戰。
本文設計開發的圖像處理平臺采用較為靈活的B/S架構,便于后續升級與維護。在功能方面,該平臺可將病灶區全貌展現出來,方便提取特征信息。經模型驗證,平臺提取出的特征信息可正常進行下一步操作。當然平臺也存在不足之處,例如當傳輸影像數據過多時,處理數據的速度會降低。后續會根據實際需要融入數據輸出前處理的功能,融合更為先進的圖像處理算法,以構建動態的三維圖像重建與顯示,開發高效率、高精度圖像分析處理平臺。