李彩紅 張慧娥 申海杰



摘要:隨著醫療成像設備的發展研制,結合機器學習算法在醫學圖像處理中的應用,大大促進了醫學圖像處理的研究[5],為醫學病理的診斷提供了充足的依據。本文以 K-means 算法為基礎,將心臟 CT 圖像經過 K-means 算法處理得到聚類后的圖像;在此基礎上,選擇實驗中K-means 算法輸出結果中灰度值的最大值作為閾值,利用閾值法實現心臟 CT 圖像的分割。
關鍵詞:機器學習;K-means閾值法
中圖分類號:TP18? ? ? ? 文獻標識碼:A? ? ? ? 文章編號:1009-3044(2019)01-0212-02
機器學習通過算法,使得機器能從大量歷史數據中學習規律,從而對新的樣本做智能識別或對未來做預測。機器學習算法分監督算法、無監督算法、半監督算法。K-means 算法是一種經典的無監督聚類方法,具有強大的搜索力,該算法的主要思想是通過迭代把數據集劃分為不同類別,使評價聚類性能的準則函數達到最優,從而使生成的每個聚類內部緊湊,類間獨立[1]。
CT掃描技術是醫生進行心臟疾病診斷的重要手段之一。CT 中心臟圖像的分割是病變區域提取、特定組織測量以及實現心臟三維立體重建的基礎??焖贉蚀_地實現心臟 CT 圖像的分割是醫學圖像分割領域中的一個重難點。
近年來機器學習算法在醫學圖像處理中發揮著重要的作用,是醫學圖像處理的常用算法之一[2]。本文基于 K-means 算法,將原始心臟CT圖像經過算法處理得到聚類后的圖像,再用閾值法實現心臟圖像的分割。
1 K-Means均值聚類算法
K-means算法是很典型的基于距離的聚類算法,采用距離作為相似性的評價指標。其原理為:首先隨機選定初始點為距離中心,并通過計算每一個樣本與距離中心之間的距離,找出最小距離把樣品歸入最近的聚類中心,接著,修改中心點的值為本類所有樣品的均值,再計算各個樣品到距離中心的距離,重新歸類,直到距離中心不再改變。根據原理,可定義準則函數為:
[K=i=1kxj∈Si(xj-ui)2]
函數假設對象屬性來自空間向量,并且目標是使各個群組內部的均方誤差總和最小。假設有k個群組Si, i=1,2,...,k。ui是群組Si內所有元素xj的重心,或叫中心點。
算法思路:
輸入:群組的數目k;包含n個對象的數據集D。
輸出:k個簇的集合。
方法:
1)從D中任意選擇k個對象作為初始中心;
2)重復選擇;
3)根據群組中對象的均值,將每個對象指派到最相似的群組;
4)更新群組均值,即計算每個群組中對象的均值;
5)計算準則函數;
6)直到準則函數不再發生變化。
2 閾值分割
閾值處理是一種區域分割技術, 它適用于物體與背景有較強對比的景物分割。 它主要是利用圖像中要提取的目標物體和背景在灰度上的差異, 選擇一個合適的閾值, 通過判斷圖像中的每一個像素點的特征屬性是否滿足閾值的要求來確定圖像中該像素點應該屬于目標區還是應該屬于背景區域, 從而產生二值圖像[3]。
閾值化分割分為兩個步驟:首先是確定合適的或者是最佳閾值,然后是將圖像的像素的灰度跟閾值進行比較,進而確定每個像素所屬的類。其難點和關鍵就是確定合適的閾值[4]。本實驗中K-means 算法的輸出為聚類后的CT 圖像和灰度值,選擇輸出灰度值中的最大值作為閾值。
3 圖像處理實驗及結果
3.1實驗流程
通過MATLAB程序將心臟CT圖像轉為double類型,輸出原灰度圖,應用k-means算法將圖像聚類,從k-means算法輸出的灰度值中選最大值為閾值進行二值化分割,得出分割后圖像。
3.2實驗過程
對心臟切片圖像進行多次聚類,通過對比聚類結果得出,聚類數目為3時效果最好,故令輸入的聚類數目k=3,得到圖像聚類圖,圖1和圖2分別為原圖和聚類后圖像,從K-means算法結果中選擇最大的灰度值作為閾值,去除灰度值低于心臟的區域,得到圖3分割效果圖。
4 總結
實驗證明機器學習算法應在醫學圖像分割上是可行性。后續可改進算法,結合形態學方法做更精細的分割研究。
參考文獻:
[1] 李蘇梅,韓國強基于K-均值聚類算法的圖像分割方法[J].計算機工程與應用,2008,44(16):163-167.
[2] 安強強,張峰,李趙興,等.基于機器學習的圖像分割[J].自動化與儀器儀表,2018(6):29-31.
[3] 劉利雄,馬忠梅,趙恒博,等.一種基于主動輪廓模型的心臟核磁共振圖像分割方法[J].計算機學報,2012,35(1):146-153.
[4] 李志剛.心臟CT圖像分割算法研究[D].哈爾濱:哈爾濱工程大學,2014:20-56.
[5] 史穎歡.醫學圖像處理中的機器學習方法及其應用研究[D].南京:南京大學,2013:38-76.