周顯國
吉林省人民醫院 信息中心,吉林 長春 130021
基于梯度方向直方圖特征和支持向量機的醫學影像分類方法
周顯國
吉林省人民醫院信息中心,吉林長春130021
隨著計算機技術和數據庫技術的發展,圖片存檔及通信系統(Picture Archiving and Communication Systems,PACS)在醫院得到了普遍的應用,醫院每天會產生大量的醫學影像數據[1]。如何檢索醫學影像,使海量的醫學影像為科研和臨床診斷服務,成為當前醫學影像領域研究的熱點。現有PACS只能提供基于文本的、按照病人名字和流水號進行檢索的手段,不能滿足臨床醫生按照圖像內容檢索出一些相似的歷史病歷或檢索出圖像內容滿足某一圖像語義的影像用于診斷的需要[2]。
基于內容的圖像檢索技術主要是根據圖像的一些低級視覺特征[3],如顏色、紋理、圖像對象的形狀以及他們之間的空間關系等作為圖像的索引,計算示例查詢圖像和圖像數據庫中圖像的相似距離,按照相似度匹配進行檢索。其主要目的是要克服基于文本圖像檢索技術的局限性。基于內容的圖像檢索技術具有如下特點:
(1)直接從圖像的內容中提取線索。這一特點使得基于內容的圖像檢索技術突波了傳統的基于關鍵詞檢索的局限,可直接對圖像本身進行分析并提取特征,使得檢索能夠更加接近目標。
(2)提取特征的方法多種多樣。從圖像中可以提取的特征包括顏色、紋理、形狀、邊緣和目標輪廓等。
(3)基于內容的圖像檢索是一種近似匹配。在檢索中,可以采取逐步求精的算法,每一層中間結果都是一個集合,不斷減小集合的范圍,直到定位到近似目標[3]。
法國國家計算機科學及自動控制研究所DALAL等于2005年提出了一種解決人體目標檢測的圖像描述子,即梯度方向直方圖(Histogramof Oriented Gradient,HOG),該方法使用HOG特征來提取人體的外形信息和運動信息,形成豐富的特征集[4]。
梯度方向直方圖特征是在尺度不變特征變換(ScaleInvariant Feature Transform)的基礎上發展而來的,能很好地刻畫圖像的邊緣方向特征。因此本文采用它作為醫學圖像檢索系統的描述子。支持向量機具有訓練方便、容易使用、泛化能力較好的優點,因此本文采用它作為醫學影像分類系統的分類器[5]。
近年來,由于HOG特征能很好地描述圖像的邊緣方向特征,因此廣泛應用在計算機視覺的其他領域中,如目標識別與跟蹤、圖像檢索、人體行為分析和遙感圖像分類等。該特征的計算方法,見圖l。

圖1 HOG特征計算示意圖
具體的計算步驟如下:
(1)計算圖像中每個像素點梯度方向,一般可以采用[-1,0,1]和[-1,0,1]T獲取水平方向和垂直方向上的梯度分量d x和d y。
(2)對于每個像素,根據d x和d y可計算出梯度的方向角θ=a r ct a n(d y/d x),將該角度的范圍轉化到[0,π],然后每20°角量化為一個方向區間,共9個區間0,1,2,...,8。
(3)選取一個16×16大小的圖像塊,根據量化后的區間,以每個像素的梯度幅值作為權重,計算16×16圖像塊中每個8×8圖像子塊的梯度方向直方圖特征,并將2×2=4個直方圖特征串聯起來。
(4)對每個16×16的直方圖特征(4x9=36維)進行歸一化,設直方圖特征為v∈R36,vi表示直方圖的第i維特征,v'i表示歸一化后的值,一般可以有如下的三種歸一化方式[5]:

(5)將每個16×16塊的直方圖特征串聯起來,作為最終的直方圖特征。
另外,在計算直方圖特征的時候,也可以采用三線性插值和高斯加權,從而使得構建出來的特征更加魯棒[6]。
支持向量機(Support Vector Machine,SVM)是一種根據結構風險最小化原則,在使訓練樣本分類誤差極小化的前提下,盡量提高分類器的推廣能力的機器學習方法,目前已廣泛應用在分類、回歸等應用中。其分類函數如下:
張衡誕生于南陽郡漢水流域白河之畔的西鄂縣(今河南南陽市石橋鎮),是中國東漢時期偉大的天文學家、地震學家和發明家。他提出渾天說,發明渾天儀,開啟了中國航天遙測技術;他探索地震起因,發明了世界上最早的地動儀。

其中αi表示支持向量的權重,yi表示樣本的類別標簽,其值為+1或者-1,K(X,Xi)為核函數,常見的核函數有:線性核函數K(X,Xi)=(X,Xi);多項式核函數K(X,Xi)=(a+XtXi)d;徑向基函數K(X,Xi)=e x p(-C||X-Xi||);Sigmoid函數K(X,Xi)=1/(1+e x p(-XtXi))。
關于支持向量機的訓練,目前常用的方法是序列最小優化算法(Sequential Minimum optimal,SM)。
4.1數據集與實驗參數設置
本文采用的數據集為mageCLEF,該數據集包括訓練集和測試集,共有2000張圖片,分為31類,其中測試圖片999張,訓練圖片1001張。
實驗中,將所有的圖片都歸一化到64×128,然后進行HOG特征提取,HOG特征向量的維度是3780維,具體的參數如下:塊的大小是16×16,梯度計算采用[-1,0,1]和[-1,0,1]T,方向角量化為9個區間,歸一化方式采用L1-norm,直方圖建立的過程中采用了三線性插值的方法[6]。
實驗中采用的分類器是libsvm,是一個簡單、易于使用和快速有效的SVM模式識別與回歸的軟件包,不但提供了編譯好的可在Windows系列系統的執行文件,還提供了源代碼,方便改進、修改以及在其他操作系統上應用。該軟件對S V M所涉及的參數調節相對比較少,提供了很多的默認參數,利用這些默認參數可以解決很多問題;還提供了交互檢驗功能。核函數分別采用線性核、多項式核、徑向基函數和Sigmoid函數,各個核函數的參數均使用工具箱的默認值。
4.2性能評估
ImageCLEF共包含31個類,采用線性核函數獲得了較好的結果,其相應的混淆矩陣,見表1。

表1 基于線性核函數的醫學圖像分類混淆矩陣
各個核函數的總體分類性能比較,見圖2。其中,線性核函數的分類性能最好,平均的分類正確率為36.74%,多項式核、徑向基函數和S i g mo i d函數的分類性能相當,約10%左右。

圖2 各個核函數的性能比較
本文利用HOG特征和支持向量機對醫學圖像進行分類,并比較了不同核函數的性能,實現了從低層視覺特征到對象語義的映射,為臨床不同語義層次的檢索提供了條件。由于分類之間的類內差異性大,類間差異性小,因此難以獲得較好的分類性能。未來擬考慮采用貝葉斯網絡融合對象語義提取高層語義的多層語義建模方法,對多類別的圖像進行分類。
[參考文獻]
[1] 張驪峰,章魯.醫學影像數據庫的索引及檢索技術的研究[J].國際生物醫學工程雜志,2007,30(3):159-163.
[2] 張九妹,杜建軍,姚宗,等.利用基于內容的圖像檢索技術的眼底圖像計算機輔助診斷系統[J].中國生物醫學工程學報, 2012,31(5):785-789.
[3] 王惠鋒,孫正興.基于內容的圖像檢索中的語義處理方法[J].中國圖象圖形學報,2001,6(10):945-952.
[4] 余勝,謝莉.基于邊緣梯度方向直方圖的圖像檢索[J].科技視界,2012,(20):26-27.
[5] 申海洋,李月娥,張甜.基于邊緣方向直方圖相關性匹配的圖像檢索[J].計算機應用,2013,(7):194-197.
[6] 李博,楊丹,張小洪.一種新的基于梯度方向直方圖的圖像配準方法[J].計算機應用研究,2007,24(3):312-314.
作者郵箱:zxg2004zxg@126.com
[中圖分類號]TP399
[文獻標志碼]B
doi:10.3969/j.issn.1674-1633.2014.02.044
[文章編號]1674-1633(2014)02-0132-02
收稿日期:2013-05-03修回日期:2013-09-18
Classif i cation Method for Medical Images Based on HOG Features and SVM
ZHOU Xian-guo
Information Center, Jilin Province People's Hospital, Changchun Jilin 130021, China
[摘要]本文闡述了基于內容的圖像檢索技術的特點,采用梯度方向直方圖(HOG)特征來描述圖片的邊緣特征,利用支持向量機(SVM)對多類別的圖片進行分類,并比較了幾種核函數對分類效果的影響,指出基于HOG特征和支持向量機的分類方法可以輔助醫護人員進行醫學影像檢索。
[關鍵詞]PACS;醫學影像分類;梯度方向直方圖特征;支持向量機
Abstract:This paper introduces the characteristics of content-based image retrieval technology, and describes the edge features of medical images with histogramof oriented gradient features. Then these images are classif i ed with support vector machine. The effect of several kernel functions on classif i cation results is also discussed in this paper. This paper points out that the classif i cation method based on HOG and SVMcan help medical staff retrieve medical imags.
Key words:PACS; medical image classif i cation; histogramof oriented gradient; support vector machine