999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于全局和局部特征的中文筆跡鑒別方法研究

2013-08-13 05:06:58陳冀川
電視技術 2013年5期
關鍵詞:特征提取特征方法

王 巖,于 明,陳冀川,于 洋,閻 剛

(河北工業大學信息工程學院,天津 300401)

作為司法鑒定和身份驗證的重要手段,筆跡鑒別獲得了廣泛的關注。隨著計算機的普及和發展,不依靠專家的計算機筆跡鑒別更是作為模式識別領域的一個研究熱點。目前,對外文筆跡的鑒別研究已經取得了一定的進展,但是對于中文的筆跡鑒別,由于漢字結構的復雜性和數目繁多,研究起步較晚,所以方法比較單一并且識別率較低。現有的中文筆跡鑒別方法按照特征提取技術的不同分為全局鑒別法和局部鑒別法。

全局鑒別法基于書寫人筆跡的走向和形狀不同,鑒別不依賴于書寫的文本。朱勇等人首次使用Gabor濾波器提取筆跡圖像的全局紋理特征[1]。He等人借鑒這種方法進行中文筆跡的特征提取[2]。此后,He等人又采用小波變換對筆跡進行特征提取[3],為了克服小波變換平移變化和缺乏方向選擇等問題,又提出基于輪廓波變換的方法[4],但是依然會導致平移變化,對筆跡的鑒別效果并不十分理想。

局部鑒別法基于手寫筆跡的局部特征,尤其是特定字符的筆跡特征。劉成林等人用簡化Winger進行筆跡鑒別[5],計算量和存儲量小,但只是對相同單字進行比較,對于大樣本或相同字少的樣本鑒別率較低。吳賽等人[6]根據“橫”、“豎”、“撇”、“捺”筆畫在書寫中出現的不同情況來提取起收筆特征,但這種方法只適合于簡單漢字的特征提取。

近年的研究表明,全局和局部特征提取都是必要的,全局特征描述的是筆跡的整體風格,局部特征表征筆段的細節變化。Srihari等人[7]通過提取大量的局部和全局特征來確定書寫者,融合全局紋理特征和局部特征可以提高鑒別率。受此啟發,本文提出一種新筆跡鑒別方法,首先利用改進的Gabor變換提取中文筆跡的全局特征,在此基礎上通過聚類把特征集分成兩類,分別為有效類和無效類,之后在有效類中提取筆跡的矩特征作為局部特征,局部特征與筆跡鑒定專家對筆跡特征的感知非常接近,最后經歐式距離分類得出較高的鑒別率。

1 筆跡特征的提取

為了得到更有效的筆跡特征,本文把筆跡的全局和局部特征通過串聯方式結合到一起。在全局特征提取階段采用一種改進的Gabor變換,提取的特征經過聚類后,即可以根據筆跡風格的不同把筆跡樣本分成兩類,這樣就可以舍棄類別不同的筆跡樣本即無效類,保留相似的樣本類,即有效類,大大減少了計算量。接下來,在相似的樣本中繼續提取筆跡局部細節特征,本文采用矩法進行局部特征提取,最后通過歐式距離進行分類比對,如圖1所示。

圖1 筆跡鑒別的特征提取

1.1 改進Gabor的全局特征提取

筆跡圖像的紋理有很強的頻譜特性和方向性,Gabor變換可以同時進行頻率和方向選擇,是一種常用的筆跡全局特征提取方法。Gabor變換的濾波函數取高斯函數,公式為[8]

Gabor變換的參數選取問題是難點,已有文獻證明,由于漢字本身有較強的方向性,主要分布于垂直、水平和對角方向,對于筆跡圖像紋理來說只需要通過選取不同的方向和頻率即可得到有效的特征。本文以“維”字為例,經預處理后,取4 個頻率,對應于 v=0,1,2,3,σ =,濾波選0°,45°,90°和 135°等 4 個方向進行改進 Gabor特征提取,結果如圖2所示。

圖2 Gabor變換提取漢字的4個方向特征

從0°,90°和135°方向3幅圖中可以看出相位的不同并沒對結果有很大的影響,基本所提取的特征相同。出現這種問題的原因是,Gabor變換是各向同性的,在各個方向均會得到完全的采樣,會丟失很多諸如筆跡圖像的直線或邊緣等與方向相關的重要特征。

鑒于此,本文采用一種改進的Gabor變換進行特征提取,它是由Geusebroek等提出的一種各向異性高斯濾波法[9],公式為

u-v坐標與x-y坐標的變換關系為

這種方法在不同方向選取不同的高斯尺度,很好地避免了Gabor變換的缺陷,同時它速度快,能在時域直接變換,不用像Gabor那樣變換到頻域的優點。依然以“維”字為例進行實驗,所采用的參數與Gabor變換相同,結果如圖3所示。

圖3 改進的Gabor變換提取漢字特征

很明顯地看出,在同等條件下,本文所采用的改進的Gabor變換對中文筆跡的特征提取效果要遠遠好于常用的Gabor變換,這樣也證明的了前面分析的正確性。

1.2 K-means聚類

聚類把數據分為多個類或者簇,在類內的數據對象有很高的相似性,類間的對象差別很大,鑒于此,考慮到可以把上一步提取的特征集通過聚類分成幾類,進行鑒別時,對相似度很差的無效類可以直接舍去,只需要找到其中與待檢筆跡最相似的有效聚類,進行進一步的局部特征提取和匹配,這樣極大地降低了計算量,最終提高特征提取和分類器的效率。

在聚類現有的若干算法中,K-means算法作為一種代表性的劃分方法,有很高的效率和伸縮性,具有簡單、快速的有點,因此本文采用K-means進行全局特征聚類。對于大小為N個筆跡文本組成的特征集,其算法流程如下:

1)首先選取任意k個筆跡作為初始類中心;

2)根據每個筆跡與各個類中心的相似度,給它賦予最相似的類;

3)重新計算每個類的中心;

4)重復以上步驟,直到筆跡的重新分配不再變化。

1.3 矩法局部特征提取[10]

上面幾步過后,相似的筆跡被分成一類,在接下來的匹配中,只研究與檢測樣本特征相似的類中筆跡樣本的局部特征,即通過提取單個字符進行特征比較。

漢字筆跡的字形、字位傾斜和重心偏向等特征是字符重要的筆跡特征,這些特征能夠很好地反映出書寫人的書寫風格,并且有明確的物理意義。矩法在計算機視覺領域是定量表示這些整體形狀特征的重要方法,非常適合對字符進行局部特征提取。在多種矩的形式中,幾何矩是應用最廣泛的,其中的二、三階幾何矩的值明顯對應于筆跡的形狀特征,因此選用能表達更復雜形狀特征三階矩進行字符特征提取。

對于一個大小為M×N的筆跡圖像,p+q階幾何矩的計算公式為

物體中心表示為X=m10/m00,Y=m01/m00,坐標原點為重心時,中心距表示為

三階中心矩 U30,U03,U21,U12可按式(5)進行計算。

對三階中心矩進行變化,提取8個能表征字符形狀的歸一化特征,分別是長寬比、字位方向、慣性比、伸展度、水平偏度、垂直偏度、水平伸展均衡度和垂直伸展均衡度。

2 實驗結果與分析

為了驗證所提出算法的有效性,本文采集15人的筆跡,每人10個筆跡樣本圖片進行測試,紙張選用A4打印紙,以200dpi的精度將每幅圖像進行掃描,存儲于計算機中作為筆跡樣本庫,如圖4所示。

圖4 筆跡樣本

在對樣本進行特征提取之前,為消除紙張背景、行間距、字間距和標點等因素對鑒別效果的影響,需要先對筆跡圖像進行預處理。本文采取文獻[8]的預處理方法,先通過RGB法設置一定閾值去除紙張背景以及字間分隔線,二值化后,分別進行水平和垂直方向投影,去除行或字之間的空白間距以及標點。最后將縮放成16×16的單字粘貼成128×128的圖像,形成預處理后的筆跡紋理圖,如圖5所示。

圖5 經預處理后的筆跡紋理圖

把每人的5份筆跡共75份作為訓練樣本,另外5份筆跡共75份作為測試樣本進行Gabor全局特征提取,考慮到紋理特征的尺度與濾波器頻率成反比,大尺度的紋理不能反映筆跡的特點,因而低中心頻率的Gabor濾波器在筆跡鑒別中用處不大,因此只對濾波器取4,8,16,32,64這5 個頻率,選取0,π/8,π/4,3π/8,π/2,5π/8,3π/4,7π/8這8個相位,總共40個通道,這些通道的均值和方差作為筆跡特征,這樣,每個紋理圖像就得到80個特征向量。

聚類實驗證明,K-means的k值為2時鑒別效果最好,因此通過聚類把樣本分為兩類,一類為與待檢筆跡相似度高的類,稱為有效類,另外一類為相似度低的類,稱為無效類,另外,K-means算法由于是隨機選取聚類中心,聚類結果會受到影響,所以運行100次求其平均。在此,舍棄無效類,只需要對有效類進行局部特征提取,用矩法提取每份樣本中字符的特征,構建新的特征集,實驗表明,聚類后減少了局部特征提取和分類器的計算量。最后用歐式距離作為分類器對特征值進行度量,在整個過程中,把待檢筆跡樣本與其他人的樣本進行比較,計算二者之間的歐式距離,按照距離從小到大排序,若待檢樣本與距離最小的書寫人屬于同一人,則鑒別正確,否則錯誤(此為首選正確率)。分別與Gabor變換、改進Gabor變換和矩法相比較,在圖6中,依次比較了這幾種方法的前10選正確率,可以看出,所提出的方法在中文筆跡鑒別性能上明顯好于另外幾種方法。

圖6 不同方法的筆跡識別率比較

3 小結

提出了一種新的中文筆跡鑒別方法。首次提出把筆跡的全局特征和局部特征融合起來,不僅考慮到了筆跡的整體書寫風格,還利用了單個字符的局部統計特征,實驗證明,在取得較高的識別率的同時也提高了分類器的效率。另外,本方法有一定的魯棒性,根據不同筆跡的細節特征,適當調整Gabor濾波器的窗口大小,還可以對其他語言的筆跡進行識別。此方法對于大樣本的中文筆跡鑒別同樣適用。

[1]朱勇,譚鐵牛,王蘊紅.基于筆跡的身份鑒別[J].自動化學報,2001,27(2):229-234.

[2]HE Z Y,TANG Y Y.Chinese handwriting-based writer identification by texture analysis[C]//Proc.the 3rd International Conference on Machine Learning and Cybernetics.Shanghai:IEEE,2004:3488-3491.

[3]HE Z Y,YOU X,TANG Y Y.A Contourlet-based method for writer identification[C]//Proc.Conf.Systems,Man and Cybernetics.Hawaii,USA:[s.n.],2005:364-368.

[4]HE Z Y,YOU X,TANG Y Y.Writer identification of Chinese handwriting documents using hidden Markov tree[J].Pattern Recognition,2008,41(4):1295-1307.

[5]劉成林,戴汝為,劉迎建.簡化的Winger分布及在筆跡鑒別中的應用[J].計算機學報,1997,20(11):1018-1023.

[6]吳賽,劉俊,張憲榮.基于基本筆畫起收筆特征的手寫漢字的筆跡鑒定[J].上海大學學報,2004,10(3):248-251.

[7]SRIHARI S,CHA S,ARORA H,et al.Individuality of handwriting[J].Journal of Forensic Sciences,2002,47(4):1-17.

[8]劉宏,李錦濤,崔國勤,等.基于SVM和紋理的筆跡鑒別方法[J].計算機輔助設計與圖形學學報,2003,15(12):1479-1485.

[9]GEUSEBROEK J M,SMEULDERS A W M,WEIJIE J V D.Fast anisotropic Gauss filtering[J].IEEE Trans.Image Processing,2003,12(8):938-943.

[10]鄢煜塵.基于信息融合的中文筆跡鑒別研究[D].武漢:武漢大學,2009.

猜你喜歡
特征提取特征方法
如何表達“特征”
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
一種基于LBP 特征提取和稀疏表示的肝病識別算法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
基于MED和循環域解調的多故障特征提取
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 午夜国产精品视频| 日韩成人在线网站| 亚洲区第一页| 91国内视频在线观看| а∨天堂一区中文字幕| 欧美五月婷婷| 亚洲视频色图| 日本国产精品一区久久久| 亚洲成a∧人片在线观看无码| 亚洲综合专区| 国产swag在线观看| 国产另类视频| 免费人成视网站在线不卡| 国产成人精品在线| 欧美一区二区精品久久久| 中文字幕不卡免费高清视频| 国产高颜值露脸在线观看| 久久精品嫩草研究院| 毛片免费在线视频| 国产va视频| 午夜福利网址| 亚洲色欲色欲www网| 亚洲熟女偷拍| 波多野结衣在线一区二区| 亚洲一区二区黄色| 2020国产精品视频| 久久久久久尹人网香蕉| 在线播放91| 亚洲无码精品在线播放| 国产第一福利影院| 亚洲成a∧人片在线观看无码| 中文字幕久久波多野结衣| AV在线天堂进入| 国产精品一区二区无码免费看片| 91在线激情在线观看| 伊人色综合久久天天| 亚洲天堂免费观看| 日韩在线欧美在线| 在线a视频免费观看| 丝袜无码一区二区三区| 国产麻豆另类AV| 99视频只有精品| 久久久久久久久久国产精品| 亚洲综合色婷婷| 99re在线免费视频| 亚洲成a人片77777在线播放 | 美女免费精品高清毛片在线视| 亚洲色精品国产一区二区三区| 美女视频黄又黄又免费高清| 中文国产成人精品久久| 亚洲高清在线播放| 欧美一级黄色影院| 欧美、日韩、国产综合一区| 色婷婷亚洲十月十月色天| 无码福利视频| 露脸国产精品自产在线播| 激情成人综合网| 香蕉久久国产超碰青草| 国产黄网永久免费| 亚洲性影院| 国产精品亚洲一区二区三区z| 成人免费午夜视频| 免费观看成人久久网免费观看| 中文字幕佐山爱一区二区免费| 亚洲系列无码专区偷窥无码| 亚洲区欧美区| 中文字幕 欧美日韩| 第一页亚洲| 欧亚日韩Av| 亚洲第一中文字幕| 精品人妻无码中字系列| 亚洲成A人V欧美综合| 精品国产自在在线在线观看| 无码有码中文字幕| 中文字幕人成人乱码亚洲电影| 伊人久久大香线蕉综合影视| 青青草原国产精品啪啪视频| 亚洲国产日韩视频观看| 成人国产精品视频频| 国产黄在线观看| 久久精品人人做人人爽| 国产91丝袜|