摘要:基于內容的圖像檢索(Content-Based Image Retrieval,CBIR)技術是根據圖像對象的內容及上下文聯系在大規模多媒體數據庫中進行檢索。將CBIR應用于醫學上,是從醫學圖像本身提取灰度、形狀、紋理等底層視覺特征和高層語義特征,構成描述圖像內容的特征向量,并以特征向量作為建立索引和匹配準則的客觀依據檢索所需圖像。CBIR技術可以幫助醫務人員在海量醫學圖像數據庫中快速尋找具","Introduction":"","Columns":"醫學信息學","Volume":"","Content":"
摘要:基于內容的圖像檢索(Content-Based Image Retrieval,CBIR)技術是根據圖像對象的內容及上下文聯系在大規模多媒體數據庫中進行檢索。將CBIR應用于醫學上,是從醫學圖像本身提取灰度、形狀、紋理等底層視覺特征和高層語義特征,構成描述圖像內容的特征向量,并以特征向量作為建立索引和匹配準則的客觀依據檢索所需圖像。CBIR技術可以幫助醫務人員在海量醫學圖像數據庫中快速尋找具有類似病理特征并診斷醫學圖像,提高疾病診斷的準確率。
關鍵詞:CBIR;醫學圖像;蟻群算法;神經網絡算法
隨著現代醫學的迅猛發展,CT、MRI等醫學圖像設備在臨床工作中應用日益廣泛,醫學數據庫中的圖像也隨之迅速增長[1]。據統計目前一個擁有現代化的醫療影像設備的大型醫院,每天影像檢查產生的數據量多達4GB左右,為管理如此海量的醫學數據,許多醫院開始著手建設衛生信息系統(HIS)和圖像歸檔機通訊系統(PACS)。怎樣在這類系統的海量醫學圖像數據庫中進行醫學圖像的檢索是現代醫學領域的研究熱點之一。
1什么是CBIR
傳統的基于文本的圖像檢索(Text-Based Image Retrieval,TBIR)技術是先通過人工方式對圖像進行文字標注,再用關鍵字來檢索圖像,這種方式耗時并且主觀,無法滿足大規模圖像數據的檢索需要。基于內容的圖像檢索(Content-Based Image Retrieval,CBIR)技術是根據圖像對象的內容及上下文聯系在大規模多媒體數據庫中進行檢索。
2神經網絡的特點
神經網絡是在現代神經學的研究基礎上發展起來的一種模仿人腦信息處理機制的網絡系統,它具有自組織、自學習和極強的非線性處理能力,能夠完成學習、記憶、識別和推理等功能,它已在控制、模式識別、圖像和視頻信號處理、人工智能、自造應濾波等方面獲得了應用。醫學上,神經網絡這一智能的診斷方法,能夠排除各種人為因素,得到準確客觀的診斷結果,對醫學圖像數據若用傳統的線性處理模式通常不太好處理, BP神經網絡是眾多神經網絡中應用最廣泛的一種多層前饋神經網絡,圖1所示為三層BP神經網絡。
3蟻群算法
蟻群算法[6](Ant Colony Optimization,ACO)是由意大利學者Dorigo等人于20世紀90年代初期通過模擬自然界中螞蟻集體尋徑的行為而提出的一種基于種群的啟發式隨機搜索算法。蟻群算法作為一種新型的智能仿生模型,近幾年在圖像分割、圖像特征提取、圖像匹配、影像紋理分類、圖像檢索等領域都取得了研究成果[8]。
4神經網絡算法和蟻群算法在醫學圖像檢索中的應用
CBIR檢索過程是一個逐步求精的過程,其在醫學上的應用可以看成是用戶(放射學者、醫師等)和醫學圖像數據庫之間的一個交互過程。其基本原理是:對醫學圖像數據庫中的每幅圖像先進行特征分析,提取圖像的特征;建立醫學圖像數據庫的同時,建立與圖像庫相關聯的特征庫;在進行圖像檢索時,對給定的查詢例圖,先提取特征向量,再將該特征向量與特征庫中的特征向量進行匹配,根據匹配的結果在醫學圖像數據庫中搜索,即可檢索出所需的圖像。本文結合神經網絡算法結合蟻群算法,將其應用于醫學圖像檢索,見圖2。
4.1醫學圖像預處理 在醫學方面,圖像預處理的主要目的是消除圖像中無關的信息、增強有關信息的可檢測性并最大限度地簡化數據,從而提高醫務人員對圖像判讀的準確性及效率。本課題中圖像預處理方法由圖像增強、圖像分割組成。
4.1.1圖像增強 圖像增強[2]是進行圖像檢索的先行步驟,可以用公式 來表示,其中 是輸入圖像, 是增強后的圖像, 是對輸入圖像所進行的操作。本文主要采用直方圖均衡化方法來進行圖像增強,直方圖均衡化是將一已知灰度概率密度分布的圖像,經過某種變換變成一幅具有均勻灰度概率密度分布的新圖像。與其他方法相比,直方圖均衡化方法適用范圍廣,易于實現,可達到較好的增強效果,暗區中的圖像能清楚的顯示出來,能夠展示更多診斷信息。
4.1.2圖像分割 醫學圖像分割是根據醫學圖像的某種相似性特征將圖像劃分為若干個互不相交的\"連通\"區域的過程。醫學圖像中,大多數情況下都需要對醫學圖像作分割,來突出需要的目標物體,如病灶。采用sobel算子計算醫學圖像邊緣和閾值,在此基礎上修改閾值使邊緣更加精確,以此實現圖像分割。
4.2神經網絡算法(如圖3所示)的實現。
基本步驟如下:①確定問題:對問題做出詳細的調研,明確目標,然后考慮如何引入粗糙集從而更好地解決問題。②對數據進行收集,即采集經過圖像預處理之后得到的特征數據。③數據處理:把要處理的數據建立成一張二維決策表,每一行描述一個對象,每一列描述對象的一種屬性。在本步中,如果無法得到完備的數據表,就有必要將信息表進行完備化操作;如果初始數據是連續值,還要經過連續屬性離散化操作。④根據粗糙集理論[5]對數據進行屬性約簡,利用屬性重要度去掉數據表中的冗余條件屬性,并消去重復的樣本。⑤根據上步中得到的訓練數據樣本設計BP神經網絡,根據約簡結果確定神經網絡的輸入層單元數和隱含層節點數。采用一個 的3層BP神經網絡。隱藏層神經元的傳遞函數設計為S型正切函數,輸出層神經元的傳遞函數設計為S型對數函數。⑥用約簡后形成的學習樣本對神經網絡進行學習,得到神經網絡的權值。然后將測試樣本輸入網絡進行測試,輸出最終結果。本算法中,規定BP神經網絡的訓練指標為0.01,訓練次數C<5000次。
4.3蟻群算法的實現(如圖4所示)。
目前,CBIR方面現已有了大量研究,但CBIR的系統很少用于臨床,如遵義醫學院附屬醫院在進行醫學圖像檢索時,更常用的方式還是傳統的基于文本的圖像檢索方式,其最大的原因是CBIR方式檢索速度慢,響應時間長。為此,如何保證醫學圖像數據檢索的有效性和準確性是目前CBIR迫切需要解決的問題之一。本文將BP神經網絡和蟻群算法結合起來,借助蟻群算法易于與其他算法相結合的優勢,利用蟻群算法對粗神經網絡算法的參數進行優化的同時,結合醫學圖像的特殊性,提出將神經網絡算法和蟻群算法結合起來應用于CBIR中具有一定的現實意義。
參考文獻:
[1]蔣歷軍.應用網格和水印技術對基于內容的肝臟CT圖像檢索的研究[D].上海交通大學,2009.
[2]岡薩雷斯.數字圖像處理(MATLAB版)[M].北京:電子工業出版社,2012.
[3]史元春,徐光祐,高原.中國多媒體技術研究:2011[J].中國圖象圖形學報,2012.
[4]H Zhang, JE Fritts, SA Goldman.Image segmentation evaluation: A survey of unsupervised methods[J].Computer Vision and Image Understanding, 2008.
[5]蔣世忠,易法令,湯浪平,等.基于圖割與粗糙集的MRI腦部腫瘤圖像檢索方法[J].中國組織工程研究與臨床康復,2010.
[6]張小冬.蟻群算法在醫學圖像識別中的研究與應用[D].揚州大學,2009.
[7]李旭超,劉海寬,王飛,等.圖像分割中的模糊聚類方法[J].中國圖象圖形學報,2012.
[8]Veenman C,Reinders M,Backer E.A Cellular Coevolutionary Algorithm for Image Segmentation [J].IEEE Transaction on Image Processing, 2003.
[9]Rahman MM, Bhattacharya P, Desai BC. A framework for medical image retrieval using machine learning and statistical similarity matching techniques with relevance feedback [J]. IEEE Transactions on Information Technology in Biomedicine,2007.
[10]Marco Dorigo, Christian Blum.Ant colony optimization theory: A survey [J]. Theoretical Computer Science,2005.
編輯/申磊