艾海提?伊敏,木特力甫?馬木提,阿力木江?艾沙,吐爾根?依不拉音,庫爾班?吾布力+
1.新疆大學(xué) 信息科學(xué)與工程學(xué)院,烏魯木齊 830046
2.新疆大學(xué) 圖書館,烏魯木齊 830046
3.新疆大學(xué) 網(wǎng)絡(luò)與信息中心,烏魯木齊 830046
手寫簽名是人生過程當(dāng)中慢慢形成的一種個(gè)人自身行為,它與其他生物特征相比具有容易得到,共享方便,接受使用率高等優(yōu)勢(shì)。因此將簽名識(shí)別當(dāng)作一種身份認(rèn)證的方法,在現(xiàn)代社會(huì)的各行業(yè)各領(lǐng)域中普遍使用,并且發(fā)揮了重要的作用[1],比如銀行服務(wù)窗口存取款,簽收快件,通訊卡,簽訂合同等。但是隨著各類信息處理技術(shù)的發(fā)展而產(chǎn)生的個(gè)人信息暴露問題越來越多,為了預(yù)防個(gè)人信息的暴露問題,各地的研究者特別關(guān)注簽名識(shí)別,并紛紛提出了新的簽名識(shí)別算法或者對(duì)以前提出的簽名識(shí)別方法進(jìn)行改進(jìn),提高簽名識(shí)別技術(shù)的可靠性。整個(gè)簽名識(shí)別領(lǐng)域根據(jù)簽名數(shù)據(jù)獲取方式的不同主要分為在線(online)簽名識(shí)別與離線(offline)簽名識(shí)別[2-3]。在線簽名識(shí)別一般用電子屏幕或其他電子設(shè)備來收集數(shù)據(jù),離線簽名識(shí)別是簽名者把自己的簽名寫在一張紙上,使用掃描儀進(jìn)行掃描或者使用拍照設(shè)備拍照來收集數(shù)據(jù)。
離線簽名識(shí)別技術(shù)是模式識(shí)別技術(shù)的一個(gè)重要分支,主要目的是把測(cè)試簽名樣本與已知的訓(xùn)練簽名樣本進(jìn)行對(duì)比,以其相似程度來判斷待測(cè)試簽名是否屬于真實(shí)簽名者自己的簽名[3-4]。離線式簽名識(shí)別系統(tǒng)的總體結(jié)構(gòu)包括測(cè)試模塊和訓(xùn)練模塊兩部分。離線簽名識(shí)別系統(tǒng)的總體結(jié)構(gòu)模塊如圖1所示。

Fig.1 Overall structure of off-line signature recognition system圖1 離線式簽名識(shí)別系統(tǒng)的總體結(jié)構(gòu)圖
目前,手寫簽名識(shí)別和鑒別方法具有很好的實(shí)用前景和使用價(jià)值,在國內(nèi)外已成為研究熱點(diǎn)。手寫簽名識(shí)別技術(shù)到目前為止歷過了30多年的研究和發(fā)展。盡管大多數(shù)簽名識(shí)別研究集中在英文、漢文、阿拉伯文、拉丁文、波斯文、印度文等使用范圍較大的語種,但對(duì)于住在中國新疆維吾爾自治區(qū)的少數(shù)民族所使用的維吾爾文來說也有相關(guān)的研究工作與成果。
首先簡(jiǎn)介國內(nèi)外其他文種的一些研究成果。2012年,Pal等人在文獻(xiàn)[5]中,從每幅英文簽名和漢文簽名中分別提取梯度特征、背景特征、擴(kuò)展的背景特征、澤尼克(Zernike)矩特征,在分類器部分采用支持向量機(jī)(support vector machine,SVM)進(jìn)行分類,獲得了97.7%的總正確率。2013年,Bhattacharya等人在文獻(xiàn)[6]中,對(duì)每幅英文簽名圖像采用像素匹配技術(shù)(pixel matching technique,PMT)提取像素點(diǎn),在分類匹配過程中使用常用的SVM分類器和ANN(artificial neural network)進(jìn)行分類識(shí)別匹配,每個(gè)算法獲得了0.11%與0.16%的錯(cuò)誤接受率。2014年,Jaiswal等人在文獻(xiàn)[7]中,從每幅簽名圖像提取全局特征和局部特征,使用神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別,最終得到95%的識(shí)別率。2015年,Pham等人在文獻(xiàn)[8]中,從荷蘭簽名數(shù)據(jù)和中文簽名數(shù)據(jù)上提取對(duì)噪聲魯棒性比較好的強(qiáng)度直方圖特征和基于形狀的幾何特征,用相似性度量方法來進(jìn)行相似性評(píng)分,最后荷蘭簽名數(shù)據(jù)上得到97.67%的準(zhǔn)確率,中文簽名數(shù)據(jù)上得到80.04%的準(zhǔn)確率。2016年,Serdouk等人在文獻(xiàn)[9]中,從每幅中文簽名與英文簽名上提取了梯度局部二值模式特征,還在簽名的拓?fù)浣Y(jié)構(gòu)基礎(chǔ)上提取最長運(yùn)行特征,使用AIRS分類器進(jìn)行分類匹配,最終從中文簽名和英文簽名中分別得到3.54%和12.52%的平均錯(cuò)誤率。
針對(duì)維吾爾手寫簽名的識(shí)別研究工作開始得較晚,但仍然有相關(guān)的研究結(jié)果。2012年,Ubul等人在文獻(xiàn)[10]中提出了基于修改的網(wǎng)格信息特征的維吾爾文手寫簽名識(shí)別系統(tǒng),每幅簽名圖像中提取64維和120維網(wǎng)格信息特征,在分類決策過程中分別使用歐氏距離、貝葉斯分類器和KNN(Knearest neighbor)分類器進(jìn)行分類識(shí)別,分別獲得了86.45%、89.26%、93.53%的識(shí)別率。2012年,Ubul等人在文獻(xiàn)[11]中找出有些對(duì)維吾爾文手寫簽名識(shí)別精度的影響,從每幅二值化簽名圖像中提取32維局部中心點(diǎn)特征和3維全局基線特征,細(xì)化簽名圖像中提取16維方向特征,在分類匹配部分采用歐氏距離與卡方距離進(jìn)行分類識(shí)別,最好的識(shí)別率分別是95.0%、90.5%和22.0%。2013年,古麗熱娜·阿布里孜等人在文獻(xiàn)[12]中提出了多分辨幾何特征的識(shí)別方法,從每幅簽名圖像上提取16維方向特征和32維局部中心點(diǎn)特征,分別采用歐式距離和卡方距離度量方法進(jìn)行分類,最好識(shí)別率達(dá)到了95.5%和90.5%。2016年,庫爾班·吾布力等人在文獻(xiàn)[13]中提出一種基于密度特征的簽名識(shí)別方法,對(duì)每幅簽名圖像提取4個(gè)方向的密度特征,使用距離度量法進(jìn)行分類識(shí)別,取得96.0%的識(shí)別率。
本文研究了離線手寫簽名識(shí)別率不高的問題,提出了一種高維特征的識(shí)別方法。主要研究?jī)?nèi)容包括:第2章對(duì)維吾爾文簽名進(jìn)行預(yù)處理操作;第3章基于簽名筆墨的結(jié)構(gòu)特征提取和選擇合適維吾爾文手寫簽名的局部中心點(diǎn)特征和ETDT特征,然后將特征互相組合;第4章使用KNN對(duì)待分類簽名樣本特征向量和訓(xùn)練簽名樣本特征向量之間的距離進(jìn)行排序操作,然后使用距離度量法和相似性度量法來進(jìn)行分類匹配和識(shí)別;第5章進(jìn)行相關(guān)的實(shí)驗(yàn)與數(shù)據(jù)分析;第6章對(duì)全文進(jìn)行總結(jié),并且分析未來研究趨勢(shì)。
本文使用的維吾爾文手寫簽名數(shù)據(jù)庫包括年歲有差異的150個(gè)人(每人20個(gè)),總共3 000幅簽名樣本圖像。這些樣本簽名都是通過使用掃描儀(掃描精度為300 dpi)掃描,然后以BMP(256位位圖)格式和規(guī)定的序號(hào)分別存儲(chǔ)在計(jì)算機(jī)上,采集成簽名圖像庫。
預(yù)處理的主要目的是給特征提取階段提供樣本圖像所包含的有效信息,除去無效信息和噪聲干擾。因此,對(duì)簽名圖像進(jìn)行預(yù)處理操作是必要的。簽名圖像的預(yù)處理過程如圖2所示。

Fig.2 Preprocessing flow diagram圖2 預(yù)處理流程圖
通過各種預(yù)處理操作而得到的簽名圖像依然存在簽名圖像本身具有的有效信息。進(jìn)行預(yù)處理操作后的效果圖如圖3所示。

Fig.3 Signature image before and after preprocessing圖3 預(yù)處理前后的簽名圖像
特征提取的主要目標(biāo)是從通過各種預(yù)處理而得到的簽名圖像所包括的所有信息中提取有效的信息,同時(shí)使用這種有效的信息來描述整個(gè)簽名樣本,并且充分地反映個(gè)人的書寫風(fēng)格。特征選擇的另一個(gè)目標(biāo)是為了快速地處理。總體來說,應(yīng)該選擇一些簽名樣本本身具有的有效特征信息集合。該過程也直接影響到簽名識(shí)別率的高低。選用一個(gè)全面符合維吾爾文字符規(guī)則與手寫風(fēng)格的有效特征是維吾爾文手寫簽名識(shí)別研究的關(guān)鍵技術(shù)之一。由于簽名者在同一時(shí)間在不同情緒下的簽名也存在一定的差異,在縱與橫方向上的遷移量不小,尤其是對(duì)于習(xí)慣連筆簽字的簽名者來說更明顯,因此為了表達(dá)這種手寫風(fēng)格,分別提取了局部中心點(diǎn)特征[11-12]和ETDT特征[14]。
下面將提取局部中心點(diǎn)特征的過程分為幾個(gè)步驟來介紹:首先將每一個(gè)整體的簽名圖像按如圖4所示分割為具有相同尺寸的4×16個(gè)小矩形窗口;第二步通過對(duì)每個(gè)小矩形窗口的簽名印痕部分各自進(jìn)行水平方向的投影計(jì)算和垂直方向的投影計(jì)算,找出該小矩形窗口的簽名印痕所包含的黑像素點(diǎn)數(shù)目。第三步按照每一個(gè)小窗口的投影計(jì)算找出對(duì)應(yīng)的中心點(diǎn),然后把找出來的64個(gè)中心點(diǎn)的水平與垂直坐標(biāo)單獨(dú)當(dāng)作特征,這樣就可以構(gòu)成總128維特征。于是隨意一個(gè)人的局部中心點(diǎn)特征向量表達(dá)為:

式中,m=1,2,…,10,…,32(m是一個(gè)人對(duì)應(yīng)的全部訓(xùn)練樣本);c是特征的維數(shù),文中取值為128;n是參與訓(xùn)練的人對(duì)應(yīng)的符號(hào)。對(duì)全部參加訓(xùn)練的人簽名來說,全部高分辨圖像層的特征向量為:

式中,k為參與訓(xùn)練的總?cè)藬?shù)。假定子圖像的大小為w×h(w和h分別表示子圖像的寬度和高度),那么小窗口中的簽名曲線段T(x,y)的水平投影和垂直投影分別為TS[y]和TC[x]。

在上面的公式中,簽名圖像的黑像素點(diǎn)以heixiangsu來表示。按下面的公式來計(jì)算每個(gè)小窗口中所包含的簽名曲線段的中心點(diǎn),公式如下:

式中,Zh和Zv各自表示為中心點(diǎn)的橫坐標(biāo)與縱坐標(biāo);TS[y]表示每個(gè)小窗口的水平方向投影計(jì)算出的黑像素點(diǎn)數(shù)目,TC[x]表示垂直方向投影計(jì)算出的黑像素點(diǎn)數(shù)目。圖4是128維局部中心點(diǎn)特征提取和局部中心點(diǎn)示意圖。

Fig.4 Sketch of 128 dimensional local central point feature extraction圖4 128維局部中心點(diǎn)特征提取示意圖
圖5是局部中心點(diǎn)特征提取流程圖。
ET特征主要描述簽名樣本的外部形狀信息,DT特征正好相反,主要描述簽名樣本的內(nèi)部形狀信息。組合起來的ETDT特征可以完全描述簽名的外部?jī)?nèi)部形狀信息所包含的特征。

Fig.5 Flow chart of local central point feature extraction algorithm圖5 局部中心點(diǎn)特征提取算法流程
ET特征:將一幅簽名圖像按列分為列數(shù)相同的L個(gè)塊,對(duì)于每個(gè)塊,按照從上到下的順序,累加每列中從上邊緣開始到第一個(gè)由白點(diǎn)變黑點(diǎn)之間的白點(diǎn)數(shù)目,然后除以每塊的總點(diǎn)數(shù)來進(jìn)行歸一化。以此類推,可以從下到上進(jìn)行同樣的處理,總共得到L×2個(gè)特征向量。再把一幅簽名圖像按行分為行數(shù)相同的H個(gè)塊,對(duì)于每個(gè)塊,按照從左到右的順序,累加每行中從左邊緣開始到第一個(gè)由白點(diǎn)變黑點(diǎn)之間的白點(diǎn)數(shù)目,然后除以每塊的總點(diǎn)數(shù)來進(jìn)行歸一化。以此類推,可以從右到左進(jìn)行同樣的處理,總共得到H×2個(gè)特征向量。ET特征如圖6所示。

Fig.6 ET feature圖6 ET特征
圖6中,條形面積表達(dá)各個(gè)方向與各個(gè)塊中的ET特征點(diǎn)數(shù)。從圖6可知,ET特征描述的是簽名樣本的外部形狀信息。
DT特征:首先將一幅簽名圖像按列分為列數(shù)相同的L個(gè)塊,對(duì)于每個(gè)塊,按照從上到下的順序,累加每列中從第一個(gè)黑變白點(diǎn)開始到第二個(gè)白變黑點(diǎn)之間的白點(diǎn)數(shù)目,然后除以每塊的總點(diǎn)數(shù)來進(jìn)行歸一化。以此類推,可以從下到上進(jìn)行同樣的處理,總共得到L×2個(gè)特征向量。再把一幅簽名圖像按行分成為行數(shù)相同的H個(gè)塊,對(duì)于每個(gè)塊,按照從左到右的順序,累加每行中從第一個(gè)黑變白點(diǎn)開始到第二個(gè)白變黑點(diǎn)之間的白點(diǎn)數(shù)目,然后除以每塊的總點(diǎn)數(shù)來進(jìn)行歸一化。以此類推,可以從右到左進(jìn)行同樣的處理,總共得到H×2個(gè)特征向量。ET特征如圖7所示。

Fig.7 DT feature圖7 DT特征
圖7中,條形面積表達(dá)各個(gè)方向與各個(gè)塊中的ET特征點(diǎn)數(shù)。從圖7可知,ET特征描述的是簽名樣本的內(nèi)部形狀信息。
本文中L=16,H=12。將ET和DT特征組合形成(L×4+H×4)=112維的特征向量。
在數(shù)據(jù)分析和分類的過程中,需要知道個(gè)體與類別之間差異的大小,從而評(píng)估個(gè)體的相似性。提取的簽名特征也需要分析,因此利用什么樣的分類法進(jìn)行特征匹配是一個(gè)很重要的模式匹配識(shí)別問題。在理論方面,可以采用任何一種分類器進(jìn)行分類,但是分類器的選用同樣對(duì)識(shí)別結(jié)果有一定的影響。因此,得到符合維吾爾文手寫簽名的特征之后,必須使用某種判別規(guī)則,把已提取的有效特征信息向量和待測(cè)試簽名的本身信息互相進(jìn)行匹配,并獲得這次匹配的識(shí)別率。
本文首先使用KNN分類器將待分類簽名樣本表達(dá)成和訓(xùn)練簽名樣本一致的特征向量,再按照K的取值對(duì)待測(cè)試樣本和每個(gè)訓(xùn)練樣本的距離進(jìn)行排序,選擇距離最小的K個(gè)樣本作為近鄰樣本[15]。采用KNN分類器得到待測(cè)試樣本和訓(xùn)練樣本的距離還需要使用距離度量方法來計(jì)算[16-17]。本文為了達(dá)到識(shí)別目的而使用了常用的距離度量方法(絕對(duì)距離、歐式距離、卡方距離)和相似性度量(cosine度量)[18-19]來計(jì)算訓(xùn)練樣本和測(cè)試樣本之間的距離與相似性。距離度量與相似性度量方法的區(qū)別如圖8所示。

Fig.8 Distance measurement and similarity measurement圖8 距離度量與相似性度量
從圖8可知,距離度量方法計(jì)算的是向量空間中各個(gè)點(diǎn)之間的絕對(duì)距離,與它們所在的坐標(biāo)位置直接有關(guān)。而cosine相似度方法計(jì)算的是向量空間中各個(gè)向量之間的夾角,與它們互相形成的夾角有關(guān)。余弦相似度方法比距離度量方法主要反映在方向上的差異,而不是位置或長度上,并且不受坐標(biāo)軸旋轉(zhuǎn)、放大、縮小的影響。
假設(shè)某個(gè)測(cè)試樣本的特征向量為:

假設(shè)訓(xùn)練樣本的特征向量為:
式中,N是互相獨(dú)立的特征所包含的特征維數(shù)。計(jì)算它們之間的距離而所使用的距離度量方法如下:
(1)絕對(duì)距離分類器

(2)歐式距離分類器

(3)卡方距離度量

(4)cosine相似性度量

式中,xi是測(cè)試樣本X的各維元素;yi是訓(xùn)練樣本Y的各維元素;W是特征向量維數(shù)。使用距離度量方法計(jì)算這些特征向量之間的距離時(shí),如果計(jì)算出來的距離越近,那么可以判斷測(cè)試樣本數(shù)據(jù)的類別。使用cosine相似性度量方法時(shí),如果計(jì)算出來的夾角余弦值越小,兩個(gè)特征向量不相似或不互相重疊,反而兩個(gè)特征向量很相似。
本實(shí)驗(yàn)所采用的維吾爾文手寫簽名數(shù)據(jù)庫包含性別、年齡有差異的150個(gè)人,每個(gè)人具有20個(gè)簽名,構(gòu)建3 000幅簽名樣本庫。本文分別選取2 400幅和1 500幅簽名樣本作為隨機(jī)訓(xùn)練集,剩余的600幅與1 500幅簽名樣本作為隨機(jī)測(cè)試集。對(duì)于提取的每一幅簽名圖像的局部中心點(diǎn)特征和ETDT特征單獨(dú)進(jìn)行實(shí)驗(yàn),并對(duì)兩種特征組合形成新的高維融合特征再進(jìn)行實(shí)驗(yàn)。在分類匹配步驟中,主要利用KNN分類器在不同的K值下以不同的距離度量和相似性度量方法來實(shí)現(xiàn)訓(xùn)練簽名樣本與測(cè)試樣本特征向量間相似性度量排序,查找與訓(xùn)練樣本特征向量距離最近的測(cè)試簽名。每次從{1~10}中選取偶數(shù)的一個(gè)單位作為K的值,同時(shí)對(duì)上述的每個(gè)距離相似性度量算法進(jìn)行20次實(shí)驗(yàn),然后把20次實(shí)驗(yàn)結(jié)果的平均值作為算法的最后識(shí)別率。通過大量的統(tǒng)計(jì)運(yùn)算獲取不同K值下的簽名平均識(shí)別率。單一特征使用不同的距離度量和相似性度量方法的實(shí)驗(yàn)結(jié)果如表1和表2所示。

Table 1 Recognition rates using different classifiers for local center point feature表1 局部中心點(diǎn)特征使用不同分類器的識(shí)別結(jié)果

Table 2 Recognition rates using different classifiers for ETDT feature表2 ETDT特征使用不同分類器的識(shí)別結(jié)果
從表1和表2可知,無論采用哪一種距離度量算法,隨著實(shí)驗(yàn)中所使用的訓(xùn)練樣本數(shù)目的增加,實(shí)驗(yàn)識(shí)別率也逐漸提高。除此之外,當(dāng)K=1時(shí),局部中心點(diǎn)特征使用絕對(duì)距離度量的識(shí)別率高于其他距離度量算法,最高平均識(shí)別率達(dá)到了96.4%。ETDT特征使用cosine相似性度量算法的識(shí)別率高于其他距離度量算法,最高平均識(shí)別率達(dá)到94.1%。為了進(jìn)一步驗(yàn)證這些特征的效率,再對(duì)這兩個(gè)特征融合進(jìn)行同類分類實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表3所示。
從表3可得,針對(duì)使用單一簽名特征進(jìn)行識(shí)別正確率不夠高的情況,融合特征的識(shí)別率達(dá)到了優(yōu)異的結(jié)果。特征組合形成的高維融合特征互補(bǔ)彼此的缺點(diǎn),因此有效地提高了系統(tǒng)的穩(wěn)定性。對(duì)于融合特征而言,使用絕對(duì)距離和cosine距離的分類效果最好,分別達(dá)到了97.1%和96.1%的識(shí)別率。而且本文提取的ETDT特征和cosine相似性度量在維吾爾文離線手寫簽名識(shí)別技術(shù)研究中初次采用,即已得到較好的識(shí)別結(jié)果。

Table 3 Recognition rates using different classifiers for combined feature表3 融合特征使用不同分類器的識(shí)別結(jié)果
為了進(jìn)一步驗(yàn)證本文算法在維吾爾文手寫簽名識(shí)別中是否有效,而采用另外一批簽名數(shù)據(jù)進(jìn)行對(duì)比實(shí)驗(yàn)和分析。首先選取與其他研究者相同數(shù)目的維吾爾文手寫簽名樣本,50個(gè)人的總共1 000幅簽名樣本圖像。再從中分別隨機(jī)選取800幅簽名樣本作為訓(xùn)練集,其余的簽名樣本圖像作為隨機(jī)測(cè)試集。然后提取與前面相同維數(shù)的特征,使用同樣的距離度量法進(jìn)行分類識(shí)別。最后按照實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比分析,證明了本文提取的特征的有效性。采用另外一批簽名數(shù)據(jù)庫的實(shí)驗(yàn)結(jié)果如表4所示。
從表4可知,分別選取800幅簽名樣本作為訓(xùn)練集,提取相同特征,即在不同K值下用4種距離相似性度量算法實(shí)現(xiàn)分類識(shí)別。在對(duì)比實(shí)驗(yàn)中,單一特征使用絕對(duì)距離和cosine距離進(jìn)行實(shí)驗(yàn)時(shí),得到的最好識(shí)別結(jié)果與選取2 400幅簽名樣本作為訓(xùn)練集進(jìn)行實(shí)驗(yàn)相比分別提高了2.3%和2.1%。兩種特征互相組合形成的高維融合特征使用絕對(duì)距離和cosine距離進(jìn)行實(shí)驗(yàn)時(shí),得到的最好識(shí)別結(jié)果與選取2 400幅簽名樣本作為訓(xùn)練集相比分別提高了2.3%和1.74%。對(duì)比實(shí)驗(yàn)結(jié)果體現(xiàn)出本文算法的有效性及可靠性。基于高維局部中心點(diǎn)和ETDT特征互相組合的融合特征來說,使用絕對(duì)距離和cosine相似性度量的算法比其他距離度量算法在維吾爾文離線簽名識(shí)別中具有顯著的優(yōu)越性。

Table 4 Recognition results using another batch of Uyghur signature databases表4 采用另外一批維吾爾文簽名數(shù)據(jù)庫的識(shí)別結(jié)果
除此之外,為了更進(jìn)一步驗(yàn)證本文方法在另一批簽名數(shù)據(jù)庫上是否效率,在公開簽名數(shù)據(jù)庫GPDS中使用本文方法。從GPDS公開數(shù)據(jù)庫中選取50個(gè)人的手寫簽名樣本(總1 000個(gè)樣本)進(jìn)行識(shí)別實(shí)驗(yàn)。為了提取同樣維數(shù)的特征,首先對(duì)GPDS簽名進(jìn)行歸一化操作,然后提取128維局部中心點(diǎn)特征和112維ETDT特征,最后采用本文的度量方法對(duì)兩種特征單獨(dú)進(jìn)行識(shí)別實(shí)驗(yàn)。本實(shí)驗(yàn)中同樣選取800幅簽名樣本作為隨機(jī)訓(xùn)練集,其余的簽名樣本圖像作為隨機(jī)測(cè)試集,最好的平均識(shí)別率達(dá)到了94.25%。實(shí)驗(yàn)結(jié)果再次證明本文算法采用另外一批簽名樣本作為實(shí)驗(yàn)數(shù)據(jù)的時(shí)候,對(duì)最終的識(shí)別率沒有太大的影響,是比較穩(wěn)定的,并更適應(yīng)于維吾爾文手寫風(fēng)格的變化。
本文方法與不同方法進(jìn)行性能對(duì)比,使用以前研究者的數(shù)據(jù)庫(總1 000個(gè)簽名樣本)進(jìn)行實(shí)驗(yàn),并在原來的簽名數(shù)據(jù)庫基礎(chǔ)上擴(kuò)展簽名數(shù)據(jù)再進(jìn)行實(shí)驗(yàn)。本文方法與維吾爾文手寫簽名識(shí)別研究工作進(jìn)行比較,對(duì)比結(jié)果如表5所示。
本文提出了一種新的維吾爾文手寫簽名識(shí)別方法。在特征提取部分,從每個(gè)簽名樣本上提取128維局部中心點(diǎn)特征和112維ETDT特征,將得到的兩種特征組合形成新的高維特征。選用KNN分類器對(duì)維吾爾文手寫簽名的訓(xùn)練樣本集特征向量和測(cè)試樣本集特征向量進(jìn)行排序,分別使用絕對(duì)距離、歐式距離度量法和cosine相似性度量法來進(jìn)行分類判別實(shí)驗(yàn)。為了比較其他類似的研究結(jié)果,選用相同數(shù)目的簽名樣本進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果再次證明了本文方法是一種有效的維吾爾文手寫簽名識(shí)別方法。

Table 5 Comparing recognition rates of the proposed method with the related work表5 本文方法和相關(guān)工作的比較結(jié)果
[1]Xu Shasha,Wei Jincheng,Qiu Xiaochu.Off-line Chinese signature verification based on the improved support vector machine[J].Electronic Design Engineering,2012,20(2):17-19.
[2]Zois E N,Alewijnse L,Economou G.Offline signature veri-fication and quality characterization using poset-oriented grid features[J].Pattern Recognition,2016,54(C):162-177.
[3]Y?lmaz M B,Yan?ko?lu B.Score level fusion of classifiers in off-line signature verification[J].Information Fusion,2016,32:109-119.
[4]Wang Jian,Ma Shuyue.Center based off-line signature verification[J].Application Research of Computers,2012,29(3):1149-1151.
[5]Pal S,Pal U,Blumenstein M.Off-line English and Chinese signature identification using foreground and background features[C]//Proceedings of the 2012 International Joint Conference on Neural Networks,Brisbane,Jun 10-15,2012.Piscataway:IEEE,2012:1-7.
[6]Bhattacharya I,Ghosh P,Biswas S.Offline signature verification using pixel matching technique[C]//Proceedings of the 1st International Conference on Computational Intelligence:Modeling Techniques and Applications,Kalyani,Sep 27-28,2013.Amsterdam:Elsevier Science Publishers,2013:970-977.
[7]Jaiswal S G,Kasetwar A R.Off-line signature verification using global&local features with neural networks[C]//Proceedings of the 2014 International Conference on Advanced Communication Control and Computing Technologies,Ramanathapuram,May 8-10,2014.Piscataway:IEEE,2014:1525-1531.
[8]Pham T A,Le H H,Do N T.Offline handwritten signature verification using local and global features[J].Annals of Mathematics and Artificial Intelligence,2015,75(1):231-247.
[9]Serdouk Y,Nemmour H,Chibani Y.New off-line handwritten signature verification method based on artificial immune recognition system[J].Expert Systems with Applications,2016,51(C):186-194.
[10]Ubul K,Adler A,Abliz G,et al.Off-line Uyghur signature recognition based on modified grid information features[C]//Proceedings of the 11th International Conference on Information Science,Signal Processing and Their Applications,Montreal,Jul 2-5,2012.Piscataway:IEEE,2012:1056-1061.
[11]Ubul K,Adler A,Yadikar N.Effects on accuracy of Uyghur handwritten signature recognition[C]//Proceedings of the Chinese Conference on Pattern Recognition,Beijing,Sep 24-26,2012.Berlin,Heidelberg:Springer,2012:548-555.
[12]Abliz G,Ubul K,Moyidin K,et al.Research on off-line Uyghur signature recognition technology based on multiresolution geometric features[J].Computer Engineering and Applications,2013,49(16):168-171.
[13]Ubul K,Ablikim R,Yadikar N.Off-line Uyghur signature recognition technology based on density feature[J].Computer Engineering and Design,2016,37(8):2200-2205.
[14]Fang B,Leung C H,Tang YY,et al.Offline signature verification with generated training samples[J].IEE Proceedings-Vision,Image and Signal Processing,2002,149(2):85-90.
[15]Xiao Huihui,Duan Yanming.Improved theKNN algorithm based on related to the distance of attribute value[J].Computer Science,2013,40(S2):157-159.
[16]Rodrigues B,Chaudhari A,Sakhare P,et al.Prototype for signature verification system using Euclidean distance[C]//Proceedings of the 2015 International Conference on Green Computing and Internet of Things,Delhi,Oct 8-10,2015.Washington:IEEE Computer Society,2015:1624-1627.
[17]Angadi S A,Gour S.Euclidean distance based offline signature recognition system using global and local wavelet features[C]//Proceedings of the 5th International Conference on Signal and Image Processing,Jeju Island,Jan 8-10,2014.Washington:IEEE Computer Society,2014:87-91.
[18]Pirlo G,Impedovo D.Cosine similarity for analysis and verification of static signatures[J].IET Biometrics,2013,2(4):151-158.
[19]Foroozandeh A,Akbari Y,Jalili M J,et al.Persian signature verification based on fractal dimension using testing hypothesis[C]//Proceedings of the 2012 International Conference on Frontiers in Handwriting Recognition,Bari,Sep 18-20,2012:313-318.
附中文參考文獻(xiàn):
[1]徐莎莎,魏金成,邱曉初.基于改進(jìn)的支持向量機(jī)的脫機(jī)中文簽名驗(yàn)證[J].電子設(shè)計(jì)工程,2012,20(2):17-19.
[4]王劍,馬書月.基于幾何中心靜態(tài)手寫簽名的識(shí)別算法研究[J].計(jì)算機(jī)應(yīng)用研究,2012,29(3):1149-1151.
[12]古麗熱娜·阿布里孜,庫爾班·吾布力,卡米力·木依丁,等.基于多分辨幾何特征的維吾爾文脫機(jī)簽名識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(16):168-171.
[13]庫爾班·吾布力,熱依買·阿不力克木,努爾畢亞·亞地卡爾,等.基于密度特征的維吾爾文離線簽名識(shí)別[J].計(jì)算機(jī)工程與設(shè)計(jì),2016,37(8):2200-2205.
[15]肖輝輝,段艷明.基于屬性值相關(guān)距離的KNN算法的改進(jìn)研究[J].計(jì)算機(jī)科學(xué),2013,40(S2):157-159.