摘要:在數(shù)字符號圖像骨架的識別中,對于數(shù)字符號圖像骨架的多樣性和復(fù)雜性,尚缺乏一種準(zhǔn)確和通用的識別方法,對此提出了基于形態(tài)學(xué)的數(shù)字符號圖像骨架的特征值提取方法。該方法定義了骨架中的端點、節(jié)點等概念,利用數(shù)學(xué)形態(tài)學(xué)的方法識別圖像骨架。計算機(jī)仿真表明,該方法不僅具有通用性,而且具有很高的準(zhǔn)確性。
關(guān)鍵詞:數(shù)字符號;圖像骨架特征值;數(shù)學(xué)形態(tài)學(xué);識別方法
0 引言
圖像骨架特征提取是圖像處理的重要內(nèi)容。圖像骨架往往反應(yīng)了圖像的重要特征,提取骨架的特征值,是要使目標(biāo)圖像更加準(zhǔn)確地被反應(yīng)出來,特征值提取的好壞,會直接影響圖像識別的正確率。但是,由于圖像的復(fù)雜性和不確定性,對圖像骨架的特征值提取,會受到骨架結(jié)構(gòu)特征的影響。
圖像識別方法已初步形成三大類:統(tǒng)計識別、結(jié)構(gòu)識別、人工神經(jīng)網(wǎng)絡(luò)識別等。具體到統(tǒng)計決策識別,句法結(jié)構(gòu)識別和人工神經(jīng)網(wǎng)絡(luò)識別這三種方法它們各具優(yōu)缺點。結(jié)構(gòu)法采用分而治之的方法,把一個復(fù)雜的任務(wù)分解為若干個復(fù)雜程度較低的子任務(wù)。這種方法對細(xì)節(jié)特征敏感,容易區(qū)分相似文字,文字變形后適應(yīng)性好。缺點是需要進(jìn)行筆劃抽取,在圖像質(zhì)量不佳的情況下,結(jié)構(gòu)特征難以抽取,且不穩(wěn)定。
本文主要研究數(shù)字儀表表盤數(shù)字的識別。數(shù)字圖像的骨架結(jié)構(gòu)比較簡單,圖像都是在比較好的室內(nèi)條件下拍攝,經(jīng)過圖像的前期處理后,數(shù)字符號圖像骨架都能比較好地反應(yīng)數(shù)字符號的特征,因此,采用結(jié)構(gòu)法識別對數(shù)字圖像符號,可以盡可能地發(fā)揮方法的優(yōu)點。結(jié)構(gòu)識別我們將通過數(shù)學(xué)形態(tài)學(xué)方法。實現(xiàn)。
1 基于數(shù)學(xué)形態(tài)學(xué)的特征值提取方法介紹
形態(tài)學(xué)圖像處理是以幾何學(xué)為基礎(chǔ)的,其基本思想是:利用一個稱作結(jié)構(gòu)元素的“探針”收集圖像的信息,當(dāng)探針在圖像中不斷移動時,便可考察圖像各個部分間的相互關(guān)系,從而了解圖像的結(jié)構(gòu)特征。
本文主要是利用形態(tài)學(xué)對圖像骨架的端點進(jìn)行識別。本文定義了圖像骨架端點:表示8連同域中,只用—個像素與其相鄰,我們稱之為端點。如2,5,7,6,9的端點數(shù)是2;而3,4的端點數(shù)是3,表示8連同域中,只用—個像素與其相鄰,我們稱之為端點。

在考察分析圖像時,要設(shè)計一種收集圖像信息的探針,稱為結(jié)構(gòu)元素s。它是E(n),或其子空間E(m)(ffKn)中的一個集合。結(jié)構(gòu)元素可以設(shè)置為一定的幾何形狀,如菱形、正方形、圓形、線段等的集合。設(shè)計者通過對圖像的分析和理解,選擇合理的結(jié)構(gòu)元素,在圖像中不斷移動結(jié)構(gòu)元素便可以考察圖像中各個部分之間的關(guān)系,從而分析圖像中圖像背景、目標(biāo)圖像等各種區(qū)域之間的關(guān)系。結(jié)構(gòu)元素s在形態(tài)學(xué)運算中的作用類似于在信號處理時的“濾波窗口”或一個參考模板。
根據(jù)本文的定義,我們可以選取8連同域中,只用一個像素與其相鄰的結(jié)構(gòu)元素。這樣的結(jié)構(gòu)元素有8個。這樣我們可以對端點進(jìn)行統(tǒng)計和定位。
2 數(shù)字符號圖像的特征值提取
為了使數(shù)字能夠區(qū)分出來,本文采用了以下幾個特征表示參數(shù):歐拉系數(shù)(Enul),斜率(K),端點數(shù)(N),端點集中區(qū)域(D)。
在對數(shù)字圖像處理后的細(xì)化二值圖像的辨識上,上面給出的幾個特征參數(shù)是本文所述數(shù)字圖像識別技術(shù)的亮點之一。借助于這些參數(shù)克服了以前數(shù)字匹配識別、特征提取識別等方法容錯能力和通用性較差的弊端。通過對數(shù)字符號骨架圖的分析我們可以對圖像特征作如下的區(qū)分:
(1)小數(shù)點、1和其他數(shù)字的區(qū)分
小數(shù)點和1在分割原始圖像的時候,它們的水平寬度是小于其他的數(shù)字的,從而,我們可以把小數(shù)點和1與其他的數(shù)字進(jìn)行區(qū)分。1和小數(shù)點的區(qū)別在于它們的水平投影是不同的。因此,我們可以區(qū)分小數(shù)點、數(shù)字1和其他數(shù)字。
(2)歐拉系數(shù)區(qū)分
歐拉系數(shù)是用來表示骨架途中圓形環(huán)與骨架整體數(shù)目之差的值。例如2,3,5,7的歐拉系數(shù)是1;而4,6,9的歐拉系數(shù)是0;8的歐拉系數(shù)是-1。
(3)端點數(shù)區(qū)分
定義端點如4.3節(jié)中,表示8連同域中,只用一個像素與其相鄰,我們稱之為端點。如2,5,7,6,9的端點數(shù)是2,而3,4的端點數(shù)是3。
(4)端點分布域
首先把單個數(shù)字分成上左、上右和下左、下右四個域。端點分布域是指端點落在我們分好的一個域中。如6和9的區(qū)份是:6的端點是分布在上域中,而9的端點分布在下域中。這樣我們就可以很容易區(qū)分6和9的區(qū)別了。2和5的區(qū)分是:2的端點分布在上左和下右兩個區(qū)域,5的端點分布在上右和下左兩個域中,這樣我們就能區(qū)分2和5了。
(5)2和7的區(qū)分
由于7的寫法不一樣,因此,我們只能用垂直面投影法來區(qū)分2和7。顯然,7的投影上部分像素點與下部分像素點的比值是不一樣的。
1 2 3 4 5 6 7 8 90
1 2 3 4 5 6 7 8 9 0
圖1儀表數(shù)字的數(shù)字與字體顯示形式
從上面的分析中,我們發(fā)現(xiàn)最常見的上面的兩種數(shù)字顯示形式(圖1所示),都符合上述的區(qū)分方法。
3 試驗仿真及結(jié)果
本文所采用的數(shù)字圖像是對儀表表盤的數(shù)字和漢字進(jìn)行識別時候的圖像。
圖3是圖2經(jīng)過細(xì)化后的得到圖像。在利用上述的方法進(jìn)行識別的時候都能得到滿意的識別結(jié)果,識別率達(dá)到98%以上;而且我們通過圖1可以看出,在工業(yè)現(xiàn)場遇到的數(shù)字的形式也是多樣的和復(fù)雜的。這說明本文的方法具有兼容性強(qiáng),準(zhǔn)確率高的特點。通過使用matlab試驗進(jìn)行識別顯示,運算的速度也比其他的方法快,具有一定的實用性。
參考文獻(xiàn):
[1]張晉陽等.手背靜脈圖像骨架特征提取的算法[J].計算機(jī)應(yīng)用,2007.27(1):152-154.
[2]楊志平.數(shù)學(xué)彬態(tài)學(xué)在空間格局圖像骨架提取中的應(yīng)用[J].地球信息學(xué),2003.32(5):411~413.
[3]黃鳳崗,楊國,宋克歐.柔性形態(tài)學(xué)在圖象邊緣檢測中的應(yīng)用[J].中國園像圖形學(xué)報,2000.5(A).4:254~287.
[4]徐志平.基于交叉視覺皮質(zhì)模型二值圖像形態(tài)學(xué)算法[J].計算機(jī)輔助設(shè)計與國形學(xué)學(xué)報,2007.19(8):990~994.
[5]戴汝為,郝紅衛(wèi),肖旭紅.漢字識別的系統(tǒng)與集成[M].浙江科學(xué)技術(shù)出版社,1998.
[6]趙春暉,張兆禮,梅曉丹.現(xiàn)代圖像處理技術(shù)及Matlba實玩[M].人民郵電出版社,2001.