摘要:圖像特征提取是圖像識(shí)別、圖像數(shù)據(jù)挖掘、基于內(nèi)容的圖像檢索等的基礎(chǔ)性工作,是目前圖像領(lǐng)域研究的熱點(diǎn)。該文以醫(yī)學(xué)肝臟CT圖像為例,對(duì)其灰度直方圖特征提取進(jìn)行了Matlab分析與實(shí)現(xiàn),并給出了實(shí)現(xiàn)代碼。實(shí)驗(yàn)結(jié)果表明,正常異常肝臟圖像的灰度直方圖特征有明顯差異。
關(guān)鍵詞:灰度直方圖;特征提取;matlab;醫(yī)學(xué)圖像
中圖分類號(hào):TP391.9文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)32-9032-03
Gray-scale Histograms Feature Extraction Using Matlab
LIU Yi-xin1, GUO Yi-zheng2
(1.Department of Computer, Jinshan Vocational Technical College, Yangzhong 212200, China;2.Department of information science and technology, Nanjing Normal University Taizhou College, Taizhou 225300, China)
Abstract: The feature extraction of image is a foundational work for image recognition, image data mining, content-based image retrieval (CBIR), etc. And it is a hot topic in the research of image now. This paper analysised and implemented CT liver image gray-scale histograms feature extraction using Matlab. The experiments proved that these features are different prominently between normal liver and abnormal liver.
Key words: gray-scale histograms; feature extraction; matlab; medical image
圖像特征是用于區(qū)分圖像內(nèi)容的最基本屬性,它們可以是原圖中人類視覺可鑒別的自然特征,也可以是通過對(duì)圖像測(cè)量和處理人為定義的某些參數(shù)。所謂特征提取是對(duì)研究對(duì)象固有的、本質(zhì)的及重要的特征或?qū)傩赃M(jìn)行量測(cè)并將結(jié)果數(shù)值化,或?qū)?duì)象分解并符號(hào)化,形成特征矢量或符號(hào)串、關(guān)系圖的過程[1]。
醫(yī)學(xué)圖像內(nèi)容豐富且結(jié)構(gòu)復(fù)雜,提取有效特征來描述這些圖像內(nèi)容是醫(yī)學(xué)圖像分析和理解的重要內(nèi)容。對(duì)于醫(yī)學(xué)圖像特征提取算法,大體可以分為三大類:顏色(灰度)特征提取[2]、紋理特征提取[3]和形狀特征提取[4]。其中顏色特征是醫(yī)學(xué)圖像的重要特征之一,且廣泛應(yīng)用于圖像處理系統(tǒng)中。在醫(yī)學(xué)圖像中,大部分是灰度圖像,而不是彩色圖像,因此與顏色特征相對(duì)應(yīng)的是灰度特征。醫(yī)學(xué)圖像灰度特征,是利用灰度具有一定的穩(wěn)定性,對(duì)大小、方向都不敏感,能表現(xiàn)出相當(dāng)強(qiáng)的魯棒性。
基于灰度直方圖的特征提取是醫(yī)學(xué)圖像顏色特征提取中的一個(gè)典型算法。任何一幅圖像的灰度直方圖都包含了豐富的信息。圖像的灰度直方圖是表示一幅圖像灰度分布情況的統(tǒng)計(jì)特性。圖像的灰度直方圖簡稱直方圖,是圖像處理中一種十分重要的分析工具。圖像灰度直方圖特征是醫(yī)學(xué)圖像的基本而重要的特征數(shù)據(jù)。本文對(duì)基于灰度直方圖的特征提取進(jìn)行了Matlab分析與實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,正常異常肝臟圖像的灰度直方圖特征有明顯差異,為圖像分析與理解、圖像檢索、圖像識(shí)別和圖像挖掘等后繼研究奠定了一定的理論基礎(chǔ)。
1 灰度直方圖的定義
一幅數(shù)字圖像的灰度直方圖就是一個(gè)灰度級(jí)的離散函數(shù),可以用式(1)來表示圖像灰度直方圖的定義[5]。
(1)
其中i表示灰度級(jí),L表示灰度級(jí)種類數(shù),ni表示圖像中具有灰度級(jí)i的像素的個(gè)數(shù),N表示圖像總的像素?cái)?shù)。公式描述的是圖像中具有該灰度級(jí)的像素的個(gè)數(shù)占圖像總像素的百分比,即圖像中具有灰度級(jí)i的像素出現(xiàn)的頻率。其橫坐標(biāo)是灰度級(jí),縱坐標(biāo)是該灰度出現(xiàn)的頻率。
圖像的灰度直方圖提供了該圖像外觀的一個(gè)全局描述,所提取的特征具有RST不變性,即旋轉(zhuǎn)、比例和位移不變性,缺點(diǎn)是不能有效地表示圖像的空間信息,如圖1表示的是一幅醫(yī)學(xué)圖像的直方圖示例。
2 基于直方圖的統(tǒng)計(jì)特征
一般不是直接將醫(yī)學(xué)圖像的直方圖作為特征,需要通過用一些統(tǒng)計(jì)量來反映圖像的直方圖,這些統(tǒng)計(jì)量通常稱為直方圖的統(tǒng)計(jì)特征。常用下列幾種統(tǒng)計(jì)量來反映圖像的直方圖特征:
1) 均值(mean):均值反映的是一幅圖像的平均灰度值。
(2)
2) 方差(variance):方差反映的是一幅圖像的灰度在數(shù)值上的離散分布情況。
(3)
3) 歪斜度(skewness):歪斜度反映的是圖像直方圖分布的不對(duì)稱程度,歪斜度越大表示直方圖分布越不對(duì)稱,反之越對(duì)稱。
(4)
4) 峰態(tài)(kurtosis):峰態(tài)反映的是圖像的灰度分布在接近均值時(shí)的大致狀態(tài),用以判斷圖像的灰度分布是否非常集中于平均灰度附近。峰態(tài)越小,表示越集中;反之,表示越分散。
(5)
5) 能量(energy):能量反映的是灰度分布的均勻程度,灰度分布較均勻時(shí)能量較大,反之,較小。
(6)
6) 熵(entropy):熵也反映了直方圖灰度分布的均勻性。
(7)
3 灰度直方圖特征提取的Matlab實(shí)現(xiàn)
以圖2所示的肝臟CT圖像為例。眾所周知,灰度圖像在計(jì)算機(jī)中的表示是一個(gè)M*N的二維矩陣,這里M=N=512。一個(gè)像素就對(duì)應(yīng)著矩陣中相應(yīng)位置的一個(gè)灰度值,由于灰度級(jí)是256,因此灰度值范圍在0~255之間,最小灰度值0代表黑,最大灰度值255代表白。
對(duì)于肝臟CT圖像,純黑對(duì)應(yīng)背景區(qū)域,純白對(duì)應(yīng)骨骼組織,這兩部分對(duì)于圖像的特征提取沒有意義,因此公式中i的取值為1~254。以提取基于直方圖的均值特征為例,程序如下。
tic
filename='1.bmp';
pi=imread(filename);
pix=double(pi);
s=double(zeros(254,1));
for i=1:512
for j=1:512
for k=1:254
switch pix(i,j)
case k
s(k)=s(k)+double(1);
otherwise
end
end
end
end
sum=double(0);
for k=1:254
sum=sum+s(k);
end
h=double(zeros(254,1));
for u=1:254
h(u)=s(u)/sum;
end
junzhi=double(0);
for i=1:254
junzhi=junzhi+i*h(i);
end
filename
junzhi
toc
上述代碼運(yùn)行結(jié)果如下,可見,圖2所示的肝臟CT圖像,其基于直方圖的均值特征 ,程序運(yùn)行時(shí)間0.938000秒。
filename = 1.bmp
junzhi =129.0577
Elapsed time is 0.938000 seconds.
現(xiàn)在隨機(jī)抽取10幅正常肝臟CT圖像(如圖3所示)和10幅異常肝臟CT圖像 (如圖4所示)。比較其均值特征,如圖5所示,由曲線圖清晰可見,正常肝臟CT圖像與異常肝臟CT圖像在均值特征上差別明顯,正常肝臟CT圖像均值在129.2879左右,異常圖像的均值在115.2091左右。值得注意的是,結(jié)果并非表明用這一個(gè)特征就可以完全區(qū)分正常肝臟與異常肝臟,細(xì)看曲線圖可知,異常肝臟CT圖像中第一幅圖就無法使用均值判斷其正常異常與否,僅僅使用均值就會(huì)誤判。現(xiàn)實(shí)生活中,肝臟CT圖像因拍攝位置、拍攝儀器等多方面原因,要想理想判斷其正常還是異常,使用一個(gè)或一類特征是遠(yuǎn)遠(yuǎn)不夠的。
圖3 隨機(jī)抽取的10幅正常肝臟CT圖
圖4 隨機(jī)抽取的10幅異常肝臟CT圖
4 總結(jié)
本文對(duì)基于灰度直方圖的醫(yī)學(xué)肝臟CT圖像特征提取進(jìn)行了Matlab分析與實(shí)現(xiàn)。特征的提取很重要,特征提取的好壞直接影響到圖像識(shí)別、基于內(nèi)容的圖像檢索、圖像挖掘、圖像分析與理解等后繼工作的成敗。由于醫(yī)學(xué)圖像與普通圖像存在很大的不同,醫(yī)學(xué)圖像具有灰度分辨率高、所含信息量大、數(shù)據(jù)的巨量性、異構(gòu)性、噪聲顯著性等特點(diǎn),單一的特征提取方法都還不能很好的表達(dá)醫(yī)學(xué)圖像的內(nèi)容,尋找適合醫(yī)學(xué)圖像的特征提取方法仍是一個(gè)需要深入探索的領(lǐng)域。
參考文獻(xiàn):
[1] 郭依正. 基于多特征融合的醫(yī)學(xué)圖像識(shí)別研究[D].鎮(zhèn)江:江蘇大學(xué),2007.
[2] Yong Rui . Image Retrieval: Current Techniques, Promising Directions and Open Issues [J]. Journal of Visual Communication and Image Representation, 1999,10(3):39-62.
[3] MANJUNATH BS, MA M X. Texture Feature for Browsing and Retrieval of Image Data [J]. IEEE-PAMI, 2000, 18 (8): 837-842.
[4] 胡小鋒,趙輝.Visual C++/MATLAB圖像處理與識(shí)別實(shí)用案例精選[M].人民郵電出版社,2004:119-121.
[5] 金華.基于密度聚類的醫(yī)學(xué)圖像分割和特征提取方法研究[D],碩士學(xué)位論文.鎮(zhèn)江:江蘇大學(xué),2005.