李 波,王江晴,魏紅昀,孫陽光,王新年,徐 凌
(中南民族大學 計算機科學學院,湖北 武漢,430074)
?
一種女書手寫字符規(guī)范字形自動生成方法
李 波,王江晴,魏紅昀,孫陽光,王新年,徐 凌
(中南民族大學 計算機科學學院,湖北 武漢,430074)
中國女書是具有鮮明民族特色的文字,目前國內(nèi)還沒有公認的女書規(guī)范字庫。針對手寫體文字規(guī)范化字體生成過程多采用人工修正方式、效率低下的現(xiàn)狀,該文設(shè)計了一種女書手寫字符規(guī)范字自動生成方法?;谑謱懳淖謽颖?,提取其單像素骨架,并結(jié)合字符輪廓信息進行骨架畸變點校正;然后提取骨架特征點和筆段,根據(jù)筆段連通性和交角情況建立筆段關(guān)聯(lián)矩陣;基于筆段關(guān)聯(lián)矩陣由筆段恢復筆畫,獲取筆畫路徑關(guān)鍵點序列;最后基于三次Bezier曲線重繪字符筆畫并均勻加粗,形成筆畫粗細一致、平滑無毛刺、無畸變的規(guī)范字體。實驗結(jié)果表明,該方法自動便捷,效果良好,效率優(yōu)于人工方式,經(jīng)改進后可以推廣到其他手寫字符的規(guī)范化過程。
女書;規(guī)范化;筆段
中國五千年的歷史,沉淀了厚重的各民族語言文化,發(fā)展形成了豐富的各民族的語言文字。漢字和部分主要少數(shù)民族現(xiàn)階段已經(jīng)建立了公認的規(guī)范標準字庫[1],然而,還有部分少數(shù)民族雖然留下了大量的本民族的手寫體文字手稿,但是該民族文字還沒有形成公認的標準規(guī)范字庫。
對于手寫體字符規(guī)范化的方法,已經(jīng)有不少研究者開展了大量研究工作,提出了很多卓有成效的規(guī)范化算法[2-4]。對于部分少數(shù)民族文字的標準化字庫建立工作,也已有研究人員做出了相關(guān)研究工作[5]。
然而,對于絕大多數(shù)手寫體文字而言,目前還沒有形成一套對手寫體文字行之有效的自動化規(guī)范處理、生成標準規(guī)范字形的方法,如漢字等文字的規(guī)范字庫建立,往往通過由書法家書寫樣本,然后人工修字方式為主,效率較低,需要花費大量的時間。同時,已發(fā)現(xiàn)的少數(shù)民族文字手稿中存在較多的斷筆、抖筆和不當連筆等錯誤筆跡問題,字符手寫體中存在毛刺、粗細不均等問題,這些問題都需要尋找有效的解決方法。
關(guān)于自動生成規(guī)范字形的問題,已經(jīng)有部分研究者做出了一些有益探討。例如,基于書寫規(guī)則用計算機快速生成漢字字形[6];以現(xiàn)有的某種特定字形為基礎(chǔ),通過改變漢字的部分結(jié)構(gòu)特征,獲得新字形[7-8];基于動態(tài)描述庫的漢字字形自動生成方法[9];基于形態(tài)學的字形自動生成方法[10];在這些文獻中,多數(shù)是針對字符輪廓進行處理的,如文獻[11-12],這些工作從不同角度探討了字形自動生成方法,但也不盡完善;同時,基于骨架信息進行標準字形生成的研究工作很少。
在字符規(guī)范化中,筆段提取[13-16]是一項基礎(chǔ)工作,而筆畫信息恢復[17-19]一般是提取靜態(tài)結(jié)構(gòu)信息特征用于字符識別的用途,在規(guī)范化中應(yīng)用鮮有所見,如文獻[19]提出在提取筆段后,基于TSP問題思想進行遍歷,從而尋找字符的書寫路徑,從而恢復字符的筆畫信息,但是文中未提到如何對字符骨架進行畸變校正,且算法的遍歷時間可能較長。本文將筆段提取和靜態(tài)筆畫信息恢復用于手寫字符的規(guī)范化中來,基于字符骨架,并結(jié)合字符輪廓特征,根據(jù)字符筆段關(guān)聯(lián)關(guān)系,建立筆段關(guān)聯(lián)矩陣,由筆段恢復筆畫,尋找筆畫的最優(yōu)書寫路徑,基于Bezier曲線自動重繪筆畫,從而建立標準字形。
不同語言文字的標準規(guī)范字體可能差異較大,如漢字就有多種字體,本文針對女書文字特點,擬定的規(guī)范字形要求是: 字體邏輯結(jié)構(gòu)良好;筆畫平滑無毛刺;筆畫粗細一致。
本文提出了一種自動生成手寫體字符規(guī)范字體的方法流程,相對于常規(guī)人工修字過程,效率明顯提高。本文提出的規(guī)范化字體生成方法總體流程如圖1 所示。

圖1 女書規(guī)范化字體生成流程
2.1 字符骨架提取 本文的待處理女書字符樣本是聘請國內(nèi)女書傳人精心書寫,然后經(jīng)過掃描成為待處理樣本。
骨架是對相應(yīng)平面區(qū)域作簡化的一種等價表達形式。對于字符骨架的提取,一般需要保證3個方面的特征: 單像素、連通性、中心線。目前的字符骨架提取算法中,絕大多數(shù)的算法都存在一定的缺陷,例如,常見的是迭代細化算法,基于逐次消去邊界點的思想,這些算法往往不能滿足單像素、或者連通組元被破壞,另外,容易產(chǎn)生一些毛刺。而目前已有的骨架提取算法還有一個共性問題,即在十字交叉點處往往產(chǎn)生畸變。
本文基于文獻[20]的思想,利用兩組條件對滿足條件的邊界點進行標記并去除,獲得初步骨架結(jié)果。但是上述算法獲得的骨架結(jié)果可能造成一些骨架處不是單像素,因此,本文基于索引表思想[21]繼續(xù)進行骨架的單像素化,定義一個256維數(shù)組來進行處理。這里需要分析已有骨架點處周圍相鄰像素的情況,對于存在非單像素骨架的區(qū)域,需要進行冗余像素的去除。
經(jīng)過上述處理過程,可以獲得單像素的骨架。
2.2 關(guān)鍵特征點提取
本文需要獲取的一些關(guān)鍵特征點有端點、三交叉點。
從細化后的文字骨架上提取端點、三交叉點時可用交叉數(shù)提取,像素(i, j)的交叉數(shù)定義如式(1)所示。
定義1 像素(i, j)的交叉數(shù)定義
(1)
式(1)中,nk為當前點p的8個鄰域像素點,nk∈{0,1},則有:
若SN≠2,則像素(i, j)為特征點;
若SN=1,則像素(i, j)為端點;
若SN=3,則像素(i, j)為三交叉點。
在單像素骨架的基礎(chǔ)上,通過判斷像素的鄰域像素情況,可以判斷出端點像素和三交叉點像素,從而可以確定整個字符骨架的這兩類特征點。
2.3 基于輪廓凹點確定畸變處的三叉點對
一般說來,通過對細化過程的分析發(fā)現(xiàn),細化算法本身無法根除對于十字交叉點處的畸變,因此只有在后續(xù)過程中作相應(yīng)處理。
從圖2可以發(fā)現(xiàn),骨架發(fā)生畸變的位置主要在十字交叉點處,即筆畫的交叉處。三叉點對的位置區(qū)域反映了手寫字符十字交叉區(qū)域即可能的畸變區(qū)域。一個十字交叉點往往會畸變?yōu)閮蓚€三交叉點對。本步驟所提取的特征點有端點和三交叉點對。

圖2 骨架畸變點
本文確定畸變處三交叉點對的步驟為:
a) 提取原始字符的輪廓;
b) 對輪廓求取凹點;
c) 尋找輪廓的凹點對,該凹點對所在區(qū)域可以對應(yīng)字符中的交叉筆畫區(qū)域。
輪廓上的特征點反映筆畫的信息,要確定筆畫,必須找到相交兩筆畫的交點,而凹點可以有效反映筆畫相交信息。
本文基于文獻[22]算法求取凹點并確定凹點對。相交筆畫所形成的輪廓必定是凹多邊形,而兩個筆畫的交點必定出現(xiàn)在凹點處,如圖3所示。

圖3 相交筆畫凹點示意圖
一般輪廓凹點對區(qū)域?qū)?yīng)骨架的三叉點對區(qū)域,因此可將輪廓中的凹點對區(qū)域和骨架圖像結(jié)合起來, 確定骨架中的三叉點對(圖4)。一般筆畫交

圖4 基于輪廓凹點對判斷骨架三叉點對
叉處畸變點成對出現(xiàn),可以取畸變點的中點作為代替點。
2.4 手寫字符筆段關(guān)聯(lián)關(guān)系判別
2.4.1 筆段的連接關(guān)系
根據(jù)文獻[23]所述,本文先引入以下定義。
定義2 無向圖中,兩個節(jié)點之間存在多于一條的邊,稱為平行邊。
定義3 設(shè)圖P,其中P(G)={v1,v2,…,vm},則稱矩陣A(G)=(aij)。

定義4 筆段是在字符中從一個特征點開始,按八連通原理逐點搜索到另一個特征點得到的點序列。筆畫是由一個或幾個筆段構(gòu)成。筆段中相鄰兩點之間的微小子段稱為筆段元。

圖5 骨架筆段
如圖5所示,手寫字符中2個相鄰特征點間的曲線即為筆段。如果筆段的起點和終點都是端點,那么它就是一個單獨的筆畫。這里,特征點包括端點和交叉點。對于交叉筆畫處畸變點成對,取畸變點對的中點作為代替點,如圖5中(b)圖,取B′代替B和C,取M′代替M和N。(c)圖中L、M特征點有兩條平行邊,分別標為1、2以示區(qū)別。
建立字符的無向圖結(jié)構(gòu),確立筆段間的連接關(guān)系。圖6表示了圖5中(b)各連通分量的關(guān)聯(lián)關(guān)系。

圖6 筆段關(guān)聯(lián)無向完全圖
2.4.2 筆段的夾角關(guān)系
字符的筆段連接關(guān)系判斷出來后,還需要判斷筆段的方向,一般而言,筆段的方向情形比較復雜,有直筆段、彎曲筆段等。手寫女書筆段基本分類如表1所示。

表1 手寫女書筆段分類
設(shè)筆段相鄰兩點x坐標和y坐標的增量為Δx和Δy,其組成的線段(本文稱為筆段元,如圖7所示)
與x軸的夾角為θ,線段的長度為l,則有式(2)和式(3)。

(2)
(3)
根據(jù)θ的值可以判斷該筆段元線段的走筆方向,然后根據(jù)筆段元合并算法合并生成筆段。

圖7 筆段組成示意圖
一般而言,有以下幾種筆段處理情形:
(1) 畸變點校正后的新筆段: 采用畸變?nèi)纥c對的代替點和原筆段端點連線的斜率,如圖8(a)所示。

(a) 畸變點筆段;(b)筆段方向計算;(c) 筆段為半圓等情形圖8 幾種筆段處理情形
(2) 一般情形: 采用筆段元的方向角對一定閾值誤差內(nèi)進行統(tǒng)計; 本文提出筆段合并中的“誤差容忍最大合并原則”,即小的筆段在方向誤差允許范圍內(nèi),盡可能和鄰近筆段合并為較大筆段。
首先進行相同或相近方向的筆段元的合并,即把相鄰的具有相同或相近方向的線段合并成較長的組合線段;對于相鄰筆段元,設(shè)合并方向角閾值為,按照式(4)進行統(tǒng)計計算。

(4)
其中,diff=|β(i+1)-β(i)|,β(i)為筆段中第i個筆段元的方向角。
上式對筆段中方向角變化較大的筆段元起到了過濾效果,對于字符在細化中可能產(chǎn)生的畸變起到一定校正作用,如圖8(b)中BC段,該段斜率變大了,實際上是受細化算法的影響所致。
(3) 撇捺、半圓等特殊筆段: 以方向變化較大點(不妨稱為方向突變點)為界,將筆段分為若干亞筆段,保存亞筆段的方向,如圖7所示。
為后續(xù)計算筆段間角度考慮,如果遇到方向突變點(設(shè)置一個合適閾值),則需要保存當前亞筆段方向,繼續(xù)計算和合并方向突變點后的亞筆段的方向,如圖8(c)所示。
根據(jù)筆段元合并后情況,最終獲得筆段方向。
設(shè)兩筆段的方向(以斜率表示)分別是k1和k2,則筆段夾角可以基于直線夾角計算公式求得。
若兩筆段垂直,即k1k2=-1,此時夾角為90°;若兩筆段不垂直,設(shè)兩筆段夾角為a,則根據(jù)式(5)可計算筆段夾角。
(5)
記下校正后點線的連線關(guān)系和角度,遍歷骨架,求出端點和交叉點,記錄筆段信息,在前節(jié)筆段關(guān)聯(lián)關(guān)系基礎(chǔ)上,完善筆段關(guān)聯(lián)矩陣,如圖9所示。

圖9 連通分量3的筆段關(guān)聯(lián)矩陣示意
2.5 手寫字符筆畫信息恢復
通過筆段關(guān)聯(lián)矩陣記錄了筆段連通關(guān)系和角度,然后恢復筆段為筆畫,并獲取筆畫的路徑關(guān)鍵點序列。對于字符骨架中的每個連通域部分,根據(jù)骨架連通性進行遍歷,遍歷中首先選擇一個尚無遍歷的端點開始。
根據(jù)一般經(jīng)驗,在實際書寫過程中,書寫者的筆畫一般遵循筆畫曲率最小的原則。因此,本文在由筆段恢復筆畫時,在筆段交叉點處,優(yōu)先選擇筆段夾角最小的筆段合并。根據(jù)筆段關(guān)聯(lián)矩陣確定待合并筆段,算法如下:
(1) 對字符的一個連通域組件,按一定順序選取初始筆段;
(2) 根據(jù)筆段關(guān)聯(lián)矩陣,尋找當前筆段直接相連接的筆段;
(3) 在交叉點處選擇連接筆段中夾角最小的筆段,作為待合并筆段;
(4) 合并筆段,判斷合并筆段后,筆畫末端是否為端點,如果為端點則筆畫合并結(jié)束,轉(zhuǎn)(6);否則轉(zhuǎn)(2);
(5) 上一筆畫合并完成后,判斷是否所有筆段均已參與合并,是則轉(zhuǎn)(6);否則轉(zhuǎn)(2);
(6) 對于每一筆畫,選擇并確定該筆畫路徑關(guān)鍵點序列。
部分筆段合并如圖10所示(其中,k為斜率,s為起點,e為終點)。

圖10 部分筆段合并示意圖
下面討論筆畫路徑關(guān)鍵點序列確定問題。
基于確定的筆畫路徑方向,每一筆畫中選擇四點,其中包括兩個筆畫端點;如果有三交叉點對,取其中點代替;如果候選點不足四個,則在筆畫路徑中按一定間距取一個骨架點作為候選點,以上候選點作為自動連線點。當在筆畫關(guān)鍵點序列中,候選點多于四個時,優(yōu)先保留端點、畸變校正點、方向變化點。需要說明的是,由于Bezier曲線的特點,在筆畫出現(xiàn)轉(zhuǎn)折部分時,宜以轉(zhuǎn)折點為界,分亞筆段來分別保存兩個筆畫路徑關(guān)鍵點序列,即以亞筆段為單位來繪制。
連線的方向需要自動判斷,本文針對手寫字符的實際情況,首先按照連通域進行劃分,對于連通域部分,根據(jù)一般書寫習慣,按照從左到右、從上到下的書寫順序,選擇左上的端點,根據(jù)像素點連通性,在交叉點處根據(jù)筆段交角最小原則確定筆畫方向。
2.6 基于筆畫路徑關(guān)鍵點序列的Bezier曲線擬合
對筆畫路徑關(guān)鍵點序列采用三次Bezier曲線來自動連線繪制。對于骨架筆畫,每一筆畫中選擇四個關(guān)鍵點,對這四點采用三次Bezier曲線來連線。
Bezier曲線由多項式混合函數(shù)推導出來,通常n+1個頂點定義一個n次多項式,其數(shù)學表達式為式(6)。
(6)
其中Pi為已知的第i個點,很明顯當t從0到1變化時,會得到一系列的點,而且得到的每一個點與所有給定的點都相關(guān)。從式(6)可知,當t=0和t=1時,會通過兩個點,即P0和Pn,這就是兩相鄰特征點。
在具體的計算中,最終得到的是貝塞爾曲線上的一系列點的xy坐標,所以式(6)變換成xy坐標的形式為式(7)。
(7)
本文對每一筆畫采用四個點,即采用三次貝塞爾曲線來模擬繪制字符筆畫。在筆畫轉(zhuǎn)折點處,如半圓,必須以亞筆段為單位來繪制。
2.7 筆畫均勻加粗
Beizier曲線繪制完成后,可以生成比較光滑的、無毛刺的字符筆畫,但是還是單像素的字符,還需要對筆畫進行一定的加粗。
對筆畫的加粗,可以考慮形態(tài)學膨脹方法,但需要確定結(jié)構(gòu)元素,并且,結(jié)構(gòu)元素如果設(shè)計的不好,可能還會產(chǎn)生毛刺,使得筆畫外輪廓變得不平滑。在上一步驟中,基于貝塞爾曲線獲得的筆畫是平滑而無毛刺的,因此,本文基于文獻[24]的思想,作適當改進: 先求取單像素筆畫的外輪廓,再選擇合適的線條寬度將外輪廓繪制出來。
將加粗的字符按照一定比例進行歸一化。由此,即獲得了規(guī)范化的字體。
實驗基于課題組收集的國內(nèi)女書傳人書寫的80張手寫體樣本,實驗平臺采用VC++6.0和OpenCV1.0。部分實驗結(jié)果示例如圖11所示。
在圖11中,(c)為字符骨架的特征點, (d)為筆畫路徑關(guān)鍵點選取后,基于Bezier曲線來自動繪制。(d)圖的是在骨架底圖上繪制的,也便于對比,每一筆畫關(guān)鍵點由兩個端點(圖中的粗紅點和粗藍點)和中間兩個細紅點組成。Bezier曲線重繪采用黃色曲線表示??梢钥闯觯乩L的筆畫與原骨架線并未完全重合,一方面,骨架往往受細化算法影響,和原字符形態(tài)相比有些畸變;另一方面,骨架往往不是平滑的曲線段,因此,Bezier曲線重繪在一定意義上對骨架起到了校正作用。當然,Bezier曲線重繪由于是若干點來擬合原曲線,因而會存在一定誤差。該誤差可以通過對擬合點的優(yōu)化、選取、控制來減小。
本文算法生成的字符樣本具有以下特點,如圖11(g)所示,字符的基本框架結(jié)構(gòu)與書法家手寫的字符保持一致;基本消除了通常情況下因細化算法造成的形態(tài)畸變;字符筆畫輪廓平滑無毛刺;字符筆畫粗細均勻一致。

圖11 女書字符規(guī)范化字體生成結(jié)果

圖11(續(xù))
在80張手寫樣本中,生成的規(guī)范字體正確的樣本有61張,還有13張樣本生成的規(guī)范字體基本正確,有六張樣本存在一些問題。對于存在部分問題的生成字形樣本,后續(xù)可以通過人工進行少量的字形修改完善。字體失真的原因在于如前述分析,Beizer重繪的筆畫與原骨架線并未完全重合,骨架往往受細化算法影響,存在一定程度畸變,有些畸變很難完全校正。經(jīng)過分析,實驗的結(jié)果還有以下問題需要完善和改進: (1)輪廓凹點對和三叉點對的問題: 對于不太規(guī)整、接近行草風格的字符,凹點判斷可能不準確;(2)少數(shù)字符在骨架提取過程中,由于骨架提取算法的問題,因而可能會產(chǎn)生不正確的筆段,如多余筆段、毛刺等,如圖12所示。這些會影響筆段的后續(xù)處理;(3)Bezier曲線繪制中,對于筆畫

圖12 骨架提取后的部分問題(圖中紅框中為書寫的多余筆畫產(chǎn)生的骨架)
路徑關(guān)鍵點序列,還可以進行優(yōu)化選擇,繪制過程中可以對Bezier曲線進行控制,改變筆畫形態(tài),產(chǎn)生其它字符變體。這些問題有待于今后進一步改進完善。
本文的方法可以對大量樣本進行初步處理,生成初始的標準字形庫,然后對少量問題字形樣本進行人工處理,可以大大減少以往單純?nèi)斯ば拮稚蓸藴首謳斓墓ぷ髁俊?/p>
本文提出了一種女書手寫體字符的規(guī)范化字體自動生成方法,可以有效解決傳統(tǒng)字體規(guī)范化過程中的修字效率低下的問題,且生成的字體保持良好結(jié)構(gòu)、筆畫輪廓光滑、粗細均勻一致。該方法也可以擴展應(yīng)用到其他手寫體文字的規(guī)范化過程中。
[1] 吐爾根·依布拉音,袁保社.新疆少數(shù)民族語言文字信息處理研究與應(yīng)用[J],中文信息學報, 2011,25(6):149-156.
[2] 王慶,趙榮椿,馮大淦.手寫體漢字的規(guī)范化處理及評價[J].數(shù)據(jù)采集與處理,2001,16(2):227-232.
[3] TORU Wakahara. Adaptive Normalization of Handwritten Characters Using GAT Correlation and Mixture Models[C]//Proceedings of the 17th IEEE International Conference on Pattern Recognition(ICPR’04),2004.
[4] LIU C L, Nakashimz K, Sako H et al. Handwritten digit recognition: investigation of normalization and feature extraction techniques[J]. Pattern Recogn., 2004, 37(2):265-279.
[5] 柳洪軼,王維蘭,聯(lián)機手寫藏文識別中字丁規(guī)范化處理[J],計算機應(yīng)用研究,2006,9:179-181.
[6] 潘志庚,馬小虎,石教英.動態(tài)漢字庫自動生成算法[J].自動化學報,1996,22(5): 561-567.
[7] 岳華,蔡士杰,顧進等.漢字黑體字形衍生系統(tǒng)的設(shè)計與實現(xiàn)[J].中文信息學報,1994,8(3):14-23.
[8] 潘志庚,馬小虎,張明敏.基于Fourier級數(shù)描述器的多種漢字字形自動生成系統(tǒng)[J].軟件學報,1996,7(6):332-338.
[9] 吳琴霞,栗青生,基于動態(tài)描述庫的漢字字形自動生成技術(shù)研究,科學技術(shù)與工程[J], 2013,15:4426-4432.
[10] 劉文予,萬菲,朱光喜.基于形態(tài)學的新的漢字字形自動生成方法[J].計算機學報,1999,22(3): 235-240.
[11] 武港山,葉曉璐,蔡士杰等.等線體和圓頭體曲線輪廓字形的自動生成系統(tǒng)[J].中文信息學報,1994,8(4):1-8.
[12] 馬小虎,楊亦鳴,黃文帆等.甲骨文輪廓字形生成技術(shù)研究與通用甲骨文字庫的建設(shè)[J].語言文字應(yīng)用,2004,8(3):105-111.
[13] 劉峽壁,賈云得.漢字筆段形成規(guī)律及其提取方法[J].計算機學報,2004,27(3):389-395.
[14] 林民,宋柔.一種筆段網(wǎng)格漢字字形描述方法[J],計算機研究與發(fā)展. 2010, 47(2):318-327.
[15] 林民,宋柔.漢字的筆段網(wǎng)格字形描述及字形比對算法[J],計算機輔助設(shè)計與圖形學學報,2009,21(9):1299-1307.
[16] ZHANG Xiwen, SONG Jiqiang, DAI Guozhong, et al. Extraction of line segments and circular arcs from freehand strokes based on segmental homogeneity features[J]. IEEE Transactions on Systems, Man, and Cybernetics, 2006,36(2):300-311.
[17] YU Qiao, MIHIHIKO Nishiara, MAKOTO Yasuhara. A Framework Toward Restoration of Writing Order from Single-Stroked Handwriting Image[J], IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006,28(11):1724-1737.
[18] Takayuki Nagoya,Hiroyuki Fujioka. Recovering Dynamic Stroke Information of Multi-Stroke Handwritten Characters with Complex Patterns[C]//Proceedings of the 2012 International Conference on Frontiers in Handwriting Recognition. 2012: 724-729.
[19] Tan Jun, Lai Jianhuang. A Novel Approach for Stroke Extraction of Off-line Chinese handwritten characters based on Optimum paths[C]//Proceedings of the 2012 International Conference on Frontiers in Handwriting Recognition, 2012:786-790.
[20] Zhang T Y, Suen C Y. A fast parallel algorithm for thinning digital patterns[J]. Communications of the ACM, 1984,27:236-239.
[21] 楊威,郭科,魏義坤.一種有效的基于八鄰域查表的指紋圖像細化算法[J],四川理工學院學報(自然科學版),2008,21(2):61-63.
[22] 程立,王江晴,李波,等.基于輪廓的漢字筆畫分離算法[J],計算機科學, 2013,40(7):307-311.
[23] 梁應(yīng)仙,姜嵐.圖的矩陣表示方法的雙向推廣[J],沈陽大學學報,2001,13(2):88-91.
[24] Satoshi Suzuk, Keiichi Abe. Topological Structural Analysis of Digitzed Binary Images by Border Following[J],Computer Vision, Graphics,And Image Processing N, 1985:32-46.
Automatic Font Normalization for Handwritten Women’s Script
LI Bo, WANG Jiangqing, Wei Hongyun, SUN Yangguang, WANG Xinnian, XU Ling
(Computer Science College, Central-South University for Nationalities, Wuhan, Hubei 430074, China)
The Women’s Script is a unique written language found in China, which has no generally accepted normalized font yet. To deal with the low efficiency of traditional manual font normalization, this paper proposes a new automatic font normalization method for handwritten Women's Script. Firstly, the feature points and stroke segments of a handwritten character are extracted to establish the correlation matrix about connectivity and angle between the segments. Secondly, the strokes are restored by stroke segment correlation matrix, and the writing order of stroke is analyzed. Finally, the new normalized font is constructed by Bezier curve fitting based on the key points sequence in stroke path. Experimental results show that thismethod can improve efficiency to a great extent compared with the manual methods, generating fonts of smooth contours, undistorted strokes and with uniform thickness. Furthermore, this method can be applied in normalization for other kinds of handwritten scripts.
Women’s Script; normalization; stroke segments

李波(1975—),博士,副教授,主要研究領(lǐng)域為數(shù)字圖像處理與模式識別。E?mail:libo_hust@126.com王江晴(1964—),博士,教授,主要研究領(lǐng)域為智能算法、圖像處理與模式識別。E?mail:wjqing2000@aliyun.com魏紅昀(1976—),碩士,講師,主要研究領(lǐng)域為自動檢測、模式識別、離散事件動態(tài)系統(tǒng)。E?mail:hywei2005@163.com
1003-0077(2015)02-0142-08
2014-03-24 定稿日期: 2014-06-05
湖北省自然科學基金(2012FFC13401,2012FFB07404,2011CDB420)
TP391
A