劉 磊,張 燕
(電子科技大學(xué)成都學(xué)院,四川 成都 611731)
隨著工程矢量圖繪制技術(shù)的迅速發(fā)展,當(dāng)前矢量工程圖紙已經(jīng)逐漸普遍,在這些圖紙中人們通過(guò)豐富多樣的特征符號(hào)描述,符號(hào)識(shí)別作為模式識(shí)別的關(guān)鍵分支,已經(jīng)成為了機(jī)器理解圖紙內(nèi)容的關(guān)鍵流程,其結(jié)果能夠廣泛使用在圖形檢索、圖紙糾錯(cuò)與三維重建等領(lǐng)域[1]。例如利用工程矢量圖符號(hào)識(shí)別技術(shù)將工程電路圖有效的讀取到數(shù)據(jù)庫(kù)中,并通過(guò)對(duì)電路圖進(jìn)行數(shù)據(jù)抽取、數(shù)據(jù)變化和數(shù)據(jù)重構(gòu)等操作完成電路圖的信息重構(gòu),以方便對(duì)維修人員進(jìn)行維修指導(dǎo)和快速培訓(xùn)等任務(wù)。
現(xiàn)實(shí)中的工程矢量圖紙內(nèi)符號(hào)的描述存在多樣性,代表同一種類、同一語(yǔ)義甚至同一符號(hào)時(shí),具有視覺(jué)表達(dá)或圖元組成上相似但不完全一致現(xiàn)象。這會(huì)導(dǎo)致同一種符號(hào)在不同的排列上有著不同的語(yǔ)義,或不同的矢量圖符號(hào)在相同的排放順序下,存在視覺(jué)表達(dá)類似的情況,這種情況就會(huì)影響到在觀察或使用矢量圖進(jìn)行繪制或比照時(shí)產(chǎn)生誤差,因此需要一種能夠精確識(shí)別矢量符號(hào)的方法,來(lái)獲取符號(hào)的位置與形狀。
針對(duì)上述問(wèn)題,提出基于自適應(yīng)匹配的矢量圖符號(hào)模糊識(shí)別。引入自適應(yīng)匹配算法,獲取符號(hào)特征,并轉(zhuǎn)換特征空間,將符號(hào)特征與模板進(jìn)行匹配,獲得符號(hào)的尺寸,優(yōu)化符號(hào)匹配精度,最后根據(jù)自適應(yīng)匹配方法模糊識(shí)別矢量圖中的符號(hào)。
矢量圖內(nèi)的符號(hào)模糊性主要來(lái)源與符號(hào)的多樣性描述,現(xiàn)實(shí)使用中不同的繪制準(zhǔn)則、繪制習(xí)慣以及統(tǒng)一繪圖者在多次繪制同一種圖形時(shí)的細(xì)節(jié)差別,都會(huì)使符號(hào)最后的視覺(jué)表示或圖元構(gòu)成出現(xiàn)差異,本文把這樣的現(xiàn)象描述成符號(hào)的模糊性。在符號(hào)目標(biāo)與其背景回波的矢量圖像內(nèi),雜波的出現(xiàn)會(huì)導(dǎo)致符號(hào)目標(biāo)距離產(chǎn)生模糊,同時(shí)最終干擾對(duì)目標(biāo)符號(hào)的識(shí)別能力,必須對(duì)模糊進(jìn)行有效的抑制。
擬定{X(n)|n=0,1,…,N-1}代表目標(biāo)和背景回波組成的矢量圖像,在圖內(nèi)擬定一種坐標(biāo)和寬度都能夠產(chǎn)生變化的滑動(dòng)窗口θ,并通過(guò)以往的算法對(duì)目標(biāo)的徑向長(zhǎng)度與坐標(biāo)進(jìn)行計(jì)算,在窗口θ與目標(biāo)符號(hào)重疊[2-4]時(shí),使用M來(lái)表示其寬度,可以得到雜波水平和度量目標(biāo)能量的三個(gè)量,即雜波平均電平δt,符號(hào)平均電平δi與觀察窗口平均電平δc,其分別通過(guò)以下方程進(jìn)行計(jì)算

(1)

(2)

(3)
式中,只有符號(hào)目標(biāo)和δt的回波能量[3-4]不具有關(guān)聯(lián),目標(biāo)特征在進(jìn)行模糊提取時(shí)對(duì)信號(hào)的預(yù)處理需要和符號(hào)種類不存在關(guān)聯(lián),所以能夠通過(guò)以下公式抑制雜波

(4)
以此,來(lái)剔除因符號(hào)目標(biāo)距離模糊導(dǎo)致的異常目標(biāo),引起的相關(guān)匹配結(jié)果出現(xiàn)誤差,博里葉轉(zhuǎn)換的輸入信號(hào)與幅度在線性位移中不具有任何關(guān)聯(lián),所以可以用在計(jì)算不變特征量上。因此,將{Y(n)n=0,1,…,N-1}轉(zhuǎn)變至頻域內(nèi)完成特征模糊提取,即
(n)=FFT{Y(n)},n=0,1,…,N-1
(5)
特征空間轉(zhuǎn)換是符號(hào)識(shí)別中的重要步驟,即將原始描述空間映射到低維的特征空間里,實(shí)現(xiàn)對(duì)空間的維數(shù)壓縮,隨后把所有統(tǒng)計(jì)內(nèi)存在關(guān)鍵特征[5-6]的符號(hào)儲(chǔ)存起來(lái),實(shí)現(xiàn)高速、高效的分類。基于離散度準(zhǔn)則的特征空間轉(zhuǎn)換,將初始的N維空間轉(zhuǎn)換成C-1維空間,完成特征維數(shù)的大幅度壓縮。
擬定存在一組已知種類的N維空間樣本x1,x2,…,xm,共m種,其中m1種屬于第1類樣本,擬定成X(1),mc種屬于第C類樣本,擬定成X(c);變換矩陣是W=(wij)N·(C-1),變換完成之后的特征矢量是
y=WT·x
(6)
其中,y代表C-1維的特征矢量,x為N維矢量,為了搜索變換矩陣W,能夠?qū)⒛繕?biāo)函數(shù)J(W)進(jìn)行最大化處理即

(7)
其中,Sw代表類內(nèi)離散度,映射了所有類符號(hào)目標(biāo)樣本之間的離散度[7],Sn代表類間離散度,映射所有類樣本間的離散度。J(W)的最大化就代表類樣本經(jīng)過(guò)一種線性變化,將類間樣本距離最大化,同時(shí)使類內(nèi)樣本距離最小化。類內(nèi)離散度Sw擬定成:

(8)
式中

(9)
其中,Mt代表所有類符號(hào)目標(biāo)樣本的均值[8]矢量

(10)
類間離散度Sn擬定成:

(11)
式中

(12)
模板匹配算法適合于矢量圖符號(hào)這種小樣本的匹配,其把目前待分類的符號(hào)樣本和模板庫(kù)內(nèi)的模板進(jìn)行匹配,獲得待分類符號(hào)樣本和模板之間的距離,為了確保分類器組合的需求,需要把匹配的距離轉(zhuǎn)變成識(shí)別可信度。
1)在線模板匹配距離與離線模板匹配距離
因?yàn)榉?hào)對(duì)應(yīng)點(diǎn)之間的模式距離和模板之間的相似度具有較好的識(shí)別效果,本文使用這兩種距離用作在線模板匹配與離線模板匹配上,式(15)擬定了兩種符號(hào)A,B對(duì)應(yīng)點(diǎn)之間的平均歐式距離[9]定義

(13)
式中,A,B代表存在N種采樣點(diǎn)xAi-xBi與yAi-yBi,其分別是A與B內(nèi)的第i種點(diǎn)的位置。
由于符號(hào)的距離矩陣?yán)锎嬖诜?hào)的隨機(jī)一像素點(diǎn)距離和矢量圖黑色像素點(diǎn)最近距離,運(yùn)算一幅矢量圖中某一點(diǎn)至另外一幅矢量圖上黑色像素點(diǎn)[10]的最小距離,能夠從疊加一幅矢量圖至另一幅矢量圖的距離矩陣上直接獲得,能夠加快相似度的運(yùn)算效率。
2)匹配距離到識(shí)別可信度的轉(zhuǎn)換
為了便于模板匹配算法與之后構(gòu)建的分類器能夠順利融合,把模板匹配獲得的距離轉(zhuǎn)化成識(shí)別可信度,擬定d1(A,B)=ds(A,B),d2(A,B)=H(A,B),首先把匹配距離進(jìn)行歸一化處理即

(14)
式中,dMaxi代表第i種模板匹配[11]算法相應(yīng)的最大匹配距離,dMini代表第i種模板匹配算法相應(yīng)的最小匹配距離。
基于上述的符號(hào)分類與模板匹配后,本文給出了基于自適應(yīng)匹配的矢量圖符號(hào)識(shí)別算法,首先通過(guò)匹配交互學(xué)習(xí)符號(hào)樣列組建符號(hào)庫(kù),隨后通過(guò)匹配到的符號(hào)在復(fù)雜的圖紙內(nèi)搜索與之相同或類似的符號(hào)[11-12]實(shí)例,大致流程如下所示:
步驟1:針對(duì)原型符號(hào)B與待識(shí)別圖G,對(duì)其中的所有基元結(jié)構(gòu)進(jìn)行提取,組成B與G的集合LSB與LSG。
LSB={lsB,i,i=1,2,…}
LSG={lsG,j,j=1,2,…}
(15)
步驟2:對(duì)隨機(jī)lsB,i∈LSB,計(jì)算LSG內(nèi)的所有局部鄰域結(jié)構(gòu)lsB,i和lsG,j的距離D(lsG,j,lsB,i)。


(16)



(17)
式中,rlsB,k代表符號(hào)內(nèi)核lsi距離最近的結(jié)構(gòu)的主基元,縮放因子初始化成該主基元尺寸和整體原型符號(hào)包圍盒半徑尺寸的比值。


(18)


(19)
假如,在計(jì)算完成之后,匹配的結(jié)果并沒(méi)有被合并,那么直接將其作為第i步結(jié)果內(nèi)的一類。
3)迭代2),直至前后兩次的匹配結(jié)果不會(huì)出現(xiàn)變化。
步驟5:挑選候選結(jié)果,在步驟4內(nèi),匹配結(jié)果是C1,C2,…的類通過(guò)圖內(nèi)的若干架構(gòu)形成,通過(guò)步驟4與步驟3能夠看出,在前Ci內(nèi)的所有元素都和符號(hào)內(nèi)的某種局部結(jié)構(gòu)相同,并且這些元素空間的距離是非常近的,這就能夠認(rèn)為其代表另一種候選結(jié)果,這一步評(píng)測(cè)該結(jié)合在多大幾率上覆蓋了待識(shí)別符號(hào)的局部結(jié)構(gòu),本文經(jīng)過(guò)合并和Ci內(nèi)各元素相似的待識(shí)別符號(hào)內(nèi)的結(jié)構(gòu)得到該類在符號(hào)結(jié)構(gòu)集合內(nèi)的相似子集BCi?LSB,即

(20)
假如BCi的元素總量不超過(guò)待識(shí)別符號(hào)的結(jié)構(gòu)集合元素總量的一般,那么評(píng)定類Ci只和符號(hào)的很小一部分類似,剔除該類,通過(guò)挑選后,剩下的所有類就是符號(hào)識(shí)別的結(jié)果。
本次實(shí)驗(yàn)以電路圖為實(shí)驗(yàn)樣本,樣本來(lái)源于矢量電路圖在線編輯器(https://fangyong2006.iteye.comblog728058),為全面驗(yàn)證所提方法的矢量圖符號(hào)識(shí)別性能,利用電路圖在線編輯器設(shè)計(jì)兩種電路圖,分別為帶有矩形外框的矢量電路圖和無(wú)矩形外框的矢量電路圖。利用本研究提出的基于自適應(yīng)匹配的矢量圖符號(hào)模糊識(shí)別方法分別對(duì)兩個(gè)實(shí)驗(yàn)樣本進(jìn)行符號(hào)識(shí)別。
本節(jié)實(shí)驗(yàn)的目的為測(cè)試所提方法能否準(zhǔn)確識(shí)別帶有矩形外框的矢量電力圖內(nèi)的字符。由于實(shí)驗(yàn)樣本矢量電路圖內(nèi)的個(gè)別字符存在兩層矩形框,增大了識(shí)別難度,增強(qiáng)實(shí)驗(yàn)結(jié)果的可靠性。

圖1 帶矩形外框電路圖字符識(shí)別結(jié)果
通過(guò)圖2能夠看出,本文方法能夠較為完成的識(shí)別出大量矩形塊中的字符。這是因?yàn)楸疚姆椒ㄏ韧ㄟ^(guò)提取特征后依靠模板與符號(hào)樣本的坐標(biāo)位置進(jìn)行匹配分類,不會(huì)因?yàn)榉?hào)種類多而產(chǎn)生識(shí)別缺失問(wèn)題。
為進(jìn)一步測(cè)試所提方法的應(yīng)用有效性,以無(wú)矩形外框電路圖為實(shí)驗(yàn)樣本(如圖2(b)),具體實(shí)驗(yàn)結(jié)果如下:

圖2 所提方法矢量圖電路符號(hào)識(shí)別結(jié)果
通過(guò)圖2可以看出,在無(wú)矩形框的矢量電路圖的符號(hào)識(shí)別中,本文方法能夠較為完整的識(shí)別出矢量圖內(nèi)的符號(hào)。這是因?yàn)楸疚姆椒ㄔ谶M(jìn)行模糊識(shí)別之前,會(huì)對(duì)整體的矢量圖進(jìn)行模板匹配,通過(guò)這種匹配后的矢量圖不會(huì)因?yàn)檫吙虻奶蕹绊懙阶R(shí)別結(jié)果的精確性。
1)為提高矢量圖的實(shí)用性與利用率,本文提出基于自適應(yīng)匹配算法的矢量圖符號(hào)模糊識(shí)別方法。將已知特征待分類符號(hào)樣本與模板庫(kù)內(nèi)模板匹配,并獲取樣本與模板間的距離,完成矢量圖符號(hào)識(shí)別。且通過(guò)實(shí)驗(yàn)證明了所提方法識(shí)別效果較為理想。
2)但研究方法仍存在以下弊端:在識(shí)別矢量圖符號(hào)時(shí),矢量圖內(nèi)會(huì)存在部分冗余痕跡,例如繪圖人員無(wú)意間的筆畫,而該方法并不能識(shí)別出這種冗余痕跡,這就導(dǎo)致在觀看整體矢量圖時(shí),會(huì)因?yàn)槿哂嗪圹E的影響,導(dǎo)致整體的視覺(jué)效果降低。因此下一步需要研究的課題即:在該方法內(nèi)添加濾波器,對(duì)冗余痕跡進(jìn)行剔除。