王琴雪
公安部第三研究所 上海 200020
書寫人識別是生物特征識別和手寫文檔分析的研究熱點之一,隨著計算機技術突飛猛進的發展和數字化采集設備的輕量化與普及化,如何利用計算機強大的計算能力和儲存能力,在一定范圍內替代專業人員實現筆跡鑒別成為人工智能和生物特征識別的新興研究方向之一。
在這樣的背景下,利用計算機自動分析自然書寫筆跡的書寫風格來確認書寫人身份的書寫人識別研究應運而生。與傳統基于人工的筆跡鑒別相比,由計算機自動完成的書寫人識別具有鑒別快、效率高、不受人為主觀因素影響等諸多特點,在金融、保險、公安、司法等領域具有廣泛的應用前景。此外,書寫人識別涉及圖像處理,特征提取和模式分類等多個方面,其理論方法的研究可以促進模式識別和計算機視覺的發展和進步。
在應用需求的推動下,針對離線筆跡數據的書寫人身份識別技術需要進一步深入的研究。本文以文本無關筆跡特征提取和字對相似度計算為出發點,提出一種蘊含筆畫邊緣方向和結構信息的邊緣共生特征來表達書寫人筆跡風格,以實現書寫人筆跡的判別。邊緣共生特征以邊緣像素為中心的一定尺寸的窗口作為處理區域,通過統計窗口內共生邊緣像素對的出現頻率來生成特征向量。該特征在多個公共數據庫和競賽數據集上都取得良好的識別準確率,特別是其在中文公共數據庫上取得了優于已有方法的識別性能,表明邊緣共生特征能夠有效反映中文筆跡的書寫風格差異。
與通常的模式識別系統類似,文本無關中文書寫人識別系統分為訓練與識別兩個階段,也包括特征提取、特性分析、分類匹配等基本模塊,如圖1所示。

圖1 文本無關書寫人識別系統流程框圖
我們提出的用于描述筆畫輪廓局部結構的邊緣共生特征,邊緣共生特征是一種基于分布直方圖的空間分布特征,該特征的設計思路受到來自邊緣鉸鏈特征[1]和微結構網格特征[3]的啟發,邊緣鉸鏈特征考慮與中心邊緣像素相連通的相鄰兩條邊緣,并使用雙邊緣的方向聯合分布直方圖來作為筆跡的特征。但由于漢字筆畫相互交叉,結構復雜,簡單的基于邊緣方向的描述可能過于簡單不夠細致;微結構網格特征則關注于邊緣點對在網格中的絕對位置信息,并記錄邊緣像素對的位置分布直方圖來表示筆跡的書寫風格。本文提出的邊緣共生特征則融合了兩者的特點,通過記錄中心邊緣像素周圍共生的邊緣像素對的方向分布作為區分不同筆跡的特征。這樣既記錄了邊緣像素和中心邊緣像素的連線與水平軸的角度信息,又可以保存共生邊緣像素對的相對位置信息。由于邊緣共生特征記錄的是像素對的相對位置信息,它有著比于微結構網格特征更加緊湊的特征向量。在窗口大小相同的情況下,邊緣共生特征所需的儲存空間更小。
邊緣共生特征是從邊緣圖像上提取得到的。因此,將筆跡圖像轉化為邊緣圖像是實現特征提取的前提條件。在廣義的圖像處理中,灰度值不連續的位置就是邊緣。而就筆跡圖像本身而言,所謂的邊緣其實就是筆跡中筆畫的輪廓。邊緣的灰度不連續性使其可以通過求導的方式被檢測出來。不過由于二階以上的求導對噪點的十分敏感,且需要較高的額外計算開銷,通常不會被采用。因此,一階求導和二階求導是較為常用的手段,常用的有 Roberts 算子、Prewitt 算子、Sobel算子和 Laplacian 算子等。就筆跡圖像本身的特點而言,雖然不同數據庫的筆跡圖像會略有不同,但整體都比較干凈,不存在失真、變形、模糊和非均勻光照的情況。筆畫區域內部的深淺均勻,灰度值變化率很小,且筆畫區域和背景區域的灰度值變化明顯。圖2是邊緣檢測的示例,使用 Sobel 算子獲取的邊緣圖像中筆畫輪廓平滑清晰,滿足邊緣共生特征提取的要求。因此,我們選擇 Sobel算子用于筆畫的邊緣檢測,以獲得筆跡圖像的邊緣圖像。

圖2 邊緣檢測示例

對于給定的查詢筆跡,我們計算它與數據庫中所有參考筆跡的相似距離D(Q, Ri)。然后按照相似距離從小到大進行排序,就可以獲得該查詢筆跡的候選人名單。其中排名第一的候選人為查詢筆跡最可能的書寫人。
為驗證本識別方法的性能,我們采用S-TOP-N 和H-TOP-N作為評價指標,在4個主要的公共數據庫[1,13]以及ICFHR2012 拉丁文和希臘文書寫人鑒別競賽[11]和ICDAR2013書寫人鑒別競賽[12]提供的數據集(以下簡稱ICFHR2012 數據集和ICDAR2013數據集)上展開全面的性能測試,并與已有方法進行比較。

圖3 中文不同窗口尺寸提取的邊緣共生特征的性能

圖4 西文不同窗口尺寸提取的邊緣共生特征的性能
在邊緣共生特征提取時,窗口尺寸決定了能夠記錄的筆畫局部結構的范圍。窗口過大會導致記錄的局部結構出現冗余,筆畫方向信息不明確;而窗口過小又使得采集到的局部結構不夠完整,不能很好地反映書寫人特點。因此,窗口尺寸對最后生成特征的區分能力有直接的影響。為了獲得最佳的實驗效果,我們使用HIT-MW和CASIA-2.1中文數據庫的訓練數據集來確定中文環境下最合適的窗口尺寸,而使用ICDAR2013數據集來確定英文/希臘文(以下簡稱西文)的最合適的窗口尺寸。圖3顯示了中文使用不同窗口尺寸提取的邊緣共生特征獲得的書寫人識別準確率。由圖可見,窗口尺寸是一個較為穩定的參數,無論多大的特征提取窗口,識別準確率都在90% 以上。并且準確率隨著窗口尺寸的增大而提高。而當窗口尺寸為15×15,邊緣共生特征取得最優性能,在HIT-MW和CASIA-2.1數據庫的訓練集中分別達到97%和96.7%的S-TOP-1準確率。圖4則顯示了西文使用不同窗口尺寸提取的邊緣共生特征的獲得的書寫人識別準確率, 雖然整體識別準確率比中文環境下的識別效果要差一些,但它也反映出相同的規律,識別率隨著窗口的增大而增加,當窗口尺寸為15×15,首選準確率達到最高值(93.2%)。通過對中西文筆跡樣本的觀察,我們發現其字符/詞組的大小比較穩定,中文字符高度主要集中在60 到90 個像素之間,英文詞組高度主要集中在40 到80 個像素之間。因此,我們把不同文種的特征提取窗口尺寸都設置為15×15,確保邊緣共生特征發揮出最好的鑒別性能。
我們提出了基于邊緣共生特征的文本無關書寫人識別方法,邊緣共生特征統計共生邊緣像素對來表示筆畫輪廓的局部結構。該方法在多個不同文種的公共數據庫和競賽數據集上進行了測試,并與多種方法進行了比較。實驗結果表明,本章提出的方法在中文書寫人識別中,取得了令人滿意的結果。
表1和2中給出了本章方法與已有方法在 HIT-MW 中文數據庫和CASIA-2.1中文數據庫上的性能比較。在中文數據庫的試驗中,邊緣方向特征取得了比已有方法更好的實驗結果。

表1 本方法與已有方法在HIT-MW中文數據庫的性能比較

表2 本方法與已有方法在CASIA-2.1中文數據庫的性能比較

表3 本方法與已有方法在 IAM英文數據庫的性能比較

表4 本方法與已有方法在ICFHR2012 數據集(英文) 的性能比較

表5 本方法與已有方法在ICFHR2013 數據集(英文) 的性能比較
表3至5分別為本文方法與已有方法在IAM英文數據庫[13]、ICFHR2012 數據集[11]和ICDAR2013數據集[12]上的STop-1、S-Top-5 和S-Top-10 的性能比較。通過分析實驗結果,我們發現邊緣共生特征雖然沒有取得最好的識別準確率,但是在不同文種的多個數據庫和數據集中均有穩定的表現,與已有方法的最優結果都非常接近。
本文提出了基于邊緣共生特征的文本無關書寫人識別方法,邊緣共生特征統計共生邊緣像素對來表示筆畫輪廓的局部結構。該方法在多個不同文種的公共數據庫和競賽數據集上進行了測試,并與多種方法進行了比較。實驗結果表明,本章提出的方法在中文書寫人識別中,取得了令人滿意的結果;在西文書寫人識別中,本章提出的邊緣共生特征的鑒別性能非常穩定,接近于目前主流方法的最佳水平。