摘 要:提出了一種基于字符的凹凸性、彎曲度和交點數等形狀特征的車牌字符識別方法,它無須對字符作歸一化、細化、傾斜校正這些預處理,也不需要樣本圖像,降低了字符畸變所產生的誤識和拒識,減少了處理時間,提高了識別率。實驗結果表明這是一種高效的車牌識別算法,是對現有車牌識別技術的有益補充。
關鍵詞:車牌識別; 細化; 形狀特征; 凹凸性; 彎曲度
中圖分類號:TP391.43文獻標志碼:A
文章編號:1001-3695(2010)06-2398-03
doi:10.3969/j.issn.10013695.2010.06.115
Highperformance license plate recognition method based onshape feature of characters
HU Jinrong1, 2, ZHOU Jiliu1, WANG Ling2, ZHENG Xiuqing2
(1.College of Computer, Sichuan University, Chengdu 610064, China; 2.College of Computer Science, Sichuan Normal University, Chengdu 610068, China)
Abstract:This paper proposed a simple and highperformance method of license plate recognition, which based on the shape feature of characters: convex and concave, bending and intersection. It didn’t need the normalization, thinning and orientation correction to the characters. Preprocessing to characters increased the rejection rate and error rate of license plate recognition because of the distortion resulted by the thinning and orientation correction. Experiments show that this method can improve the recognition rate and speed rapidly.
Key words:license plate recognition; thinning; shape feature; convex and concave feature; bending
車牌字符識別是模式識別理論在漢字、英文字母、數字字符識別上的具體應用,是車牌識別系統的核心。它將經車牌定位、分割后的字符作為輸入,提取字符的特征,構建合理分類器,輸出字符識別結果[1]。車牌識別系統需全天候在室外工作,受空氣粉塵的影響、光照條件的變化以及其他不可預測的干擾,導致采集到的車牌圖像已被噪聲污染,車牌字符模糊、大小粗細不一和傾斜角度各異等難以處理的情況,因此,提取具有良好區分度和魯棒性的字符特征是車牌字符識別過程中的關鍵。到目前為止,用于字符識別的特征已有很多種了,如字符的輪廓特征、字符在水平或垂直方向的投影分布、字符的寬高比、字符的連通區域、字符的筆順和筆畫密度、字符的重心位置、字符的過線特征等[2~4]。這些特征大多屬于字符圖像的點特征,在提取之前需對字符進行歸一化、細化、傾斜矯正等處理,以確保特征的區分度和魯棒性。這一過程不僅繁瑣耗時,也因細化等造成的字符畸變而使字符的有效信息丟失,拒識率和誤識率偏高。
人眼根據對字符結構、輪廓的直觀度量來進行字符識別,即根據字符的形狀特征來辨認和區分每個字符,若能精確表征和提取字符的形狀特征,就能準確快速地區分不同的字符。因此,經過對字符形狀特征的研究,提出了兩種字符特征,即字符的凹凸性和彎曲度,這不同于字符的局部特征,它們是一種基于字符整體形狀的特征,在提取前不需要對字符作歸一化、細化、傾斜校正的預處理,避免了因細化、傾斜校正造成字符形變所帶來的拒識、誤識和處理時間。另外,在本文所提出的凹凸性和彎曲度特征的基礎上,結合交點數特征,新設計了一種基于字符形狀特征的車牌字符分類器,該分類器根據字符的凹凸性、彎曲度、交點數特征對字符進行由粗到細的分類,它不需要樣本圖像,識別效率高。
1 字符形狀特征
與一般的字符識別相比,車牌字符識別有其自身的特點。首先是字符集小、字符結構簡單,除去車牌上的漢字字符,共有25個大寫英文字母(字母“I”除外)以及0~9這10個阿拉伯數字,字母“O”與數字0的形狀相同,要分類的字符類別較少,并且是機器印刷體;受攝像機分辨率和成像角度的限制,字符將會發生向左或向右的傾斜畸變,且字符的分辨率較低;另外,受室外環境變化(光線、粉塵等)的影響大,使得采集到的車牌字符已被污染,變得模糊,大小和粗細不一;再就是車牌識別系統的實時性要求高于一般的字符識別。
車牌字符識別的關鍵之一是提取具有良好區分度和魯棒性的字符特征。如前所述,已有的特征大多屬于字符圖像的點特征,在提取這些特征之前需對字符進行歸一化、細化、傾斜矯正等預處理。其中,字符細化通過提取字符的骨架,消除因為光照變化等因素所引起字符粗細不一的情況,雖然近年來有許多研究人員對細化算法所提取目標的骨架中存在著偽分支、毛刺、斷裂這些缺陷和運行耗時問題進行了改進,但這些問題仍然存在[5~8]。又由于車牌字符受噪聲污染的影響,經閾值處理后的車牌字符本身就存在著毛刺和空洞,再對車牌字符進行細化處理,上述缺陷就表現得更加明顯,不僅復雜、繁瑣和耗時,而且由于毛刺、分叉、斷裂對字符的影響,使得經細化處理后字符在形狀上發生嚴重的形變。圖1(b)(d)(f)分別為(a)(c)(e)的細化結果,由于字符本身的毛刺和空洞,細化后的字符中存在著較強的毛刺與偽分支,讓字符的形狀發生了變化,影響了字符識別的準確率。
1.1 凹凸性提取
不同于局部的點特征,凹凸性是字符的整體特征,是對字符結構和輪廓的一種度量,在提取前,無須對字符進行歸一化、細化、傾斜矯正處理。凹凸性也可用于手寫數字識別[9,10]。本文凹凸性的提取過程如下:
a)背景賦值。它是從字符圖像的所有背景點(即白色點,這里指二值圖像中像素值為1的點)出發,向右、右下、下、左下、左、左上、上、右上八個方向(圖2)發出八條射線,判斷射線是否與字符的前景點(黑色點,像素值為0)相交,有幾條射線相交,則將該背景點的值賦為幾。如圖2,給字符“U”任一背景點賦值。
b)凹凸性提取。凹凸性包括字符圖像結構中的圈和凹區域,圈是指賦值背景后字符圖像中像素值為8且周圍值為0的區域;凹區域是指賦值背景中像素值為5、6、7的區域。
c)凹區域模式。在字符凹凸性基礎上,將字符圖像賦值背景中的凹區域作進一步劃分,具體定義描述如下:
上凹區tC:任意背景點左邊、右邊、下邊均可以找到字符的凹區域;
下凹區bC:任意背景點左邊、右邊、上邊均可以找到字符的凹區域;
左凹lC:任意背景點右邊可以找到字符的凹區域;
右凹rC:任意背景點左邊可以找到字符的凹區域;
左上凹ltC:任意背景點上邊可以找到字符,而下邊不能找到字符的左凹區;
左下凹lbC:任意背景點下邊可以找到字符,而上邊不能找到字符的左凹區;
右上凹rtC:任意背景點上邊可以找到字符,而下邊不能找到字符的右凹區;
右下凹rbC:任意背景點下邊可以找到字符,而上邊不能找到字符的右凹區。
圖3為凹凸域模式。
本文的凹凸性特征提取方法簡單高效,特征不受字符大小、粗細變化的影響,魯棒性強。
1.2 彎曲度提取
通過字符的凹凸性特征已能對字符進行粗分類,但有些字符(如字符“D”與“O”,字符“8”與“B”等)的凹凸性相同,還需要使用其他的字符特征進行細分類。通過對字符形狀進一步的研究,字符“O”的左輪廓彎曲程度明顯強于字符“D”的左輪廓,這一結論也適用于字符“8”與字符“B”,因此,可以用彎曲度這一字符形狀特征對字符進行細分類。字符彎曲度r定義為:
定義1 字符彎曲度r是字符圖像左(右)輪廓點中最左(右)邊點L到字符左(右)輪廓上、下端點所構成線段的歐式距離DTB和該線段DLP的比值,如式(1)。在提取字符彎曲度時,首先掃描字符圖像得到其左(右)輪廓線并同時求出左輪廓線的上端點T(Tx,Ty)、下端點B(Bx,By)與最左(右)點L(Lx,Ly),再計算點T到點B的距離DTB,點L到線段TB上的投影點P,并計算點L到點P的距離DLP。
R=DLPDTB=(Lx-Px)2+(Ly-Py)2(Tx-Bx)2+(Ty-By)2(1)
1.3 交點數提取
當字符的凹凸性和彎曲度相同時,進一步采用字符的交點數特征進行分類。交點數特征是指在水平或垂直方向上掃描字符時與字符相交的次數,如字符“D”在水平與垂直方向上的交點數均為2,字符“B”在水平方向上的交點數為2、垂直方向上的交點數為3。
2 基于字符形狀的分類識別
在本文所提出的凹凸性和彎曲度特征的基礎上,結合交點數特征,新設計了一種基于字符形狀特征的車牌字符分類器,該分類器根據字符的凹凸性、彎曲度、交點數特征對字符進行由粗到細的分類,它不需要樣本圖像,識別效率高。
首先根據凹凸性(圈和凹區域的位置)對數字字符2~9和25個英文大寫字母共33個字符(在車牌字符集中,字符“I”不會出現,“0”與“O”形狀相同,字符“1”可根據其寬高比來識別)進行粗分類,然后再根據彎曲度、交點數進行細分類。設計出的分類器如表1所示。其中:CN為圈數目,hPN為水平方向掃描交點數,vpN為垂直方向掃描交點數,bCN為下凹區數目,lR為左彎曲度,rR為右彎曲度,lC為左凹區,rC為右凹區,tC為上凹區,bC為下凹區,rtC為右上凹,rbC為右下凹,ltC為左上凹,caR為凹區域與字符總面積比例。
分類器根據字符凹凸性、彎曲度、交點數等形狀特征的邏輯組合進行分類,如字符“A”,可根據其有一個圈(CN=1)、無左右凹(lC=0rC=0)、有下凹(bC=1)來與其余字符相區別,即CN=1,lC=0rC=0,bC=1。該分類器簡單,只需對相應字符特征所構成的邏輯表達式進行判別,沒有復雜繁瑣的計算,不需要樣本圖像,是一種簡單快速有效的分類器。
3 實驗分析
本文方法的實驗程序在CxImage圖像處理框架下,使用C++編寫,在HP Presario V3000筆記本電腦(Intel T2080 1.73 GHz CPU,1 GB內存,Vista Home Basic操作系統)上運行,對進出于攀枝花營口、云甸和會理這三個礦物運輸站點采集到的大量不同光照條件和不同環境下質量較差的車牌圖像字符和在停車場中采集到的車牌圖像字符作為測試集,對分割后的字符進行二值、去噪處理后,分別使用本文的識別方法與模板匹配、BP神經網絡對大小為45×120的字母和數字字符進行識別。實驗中,確保所抽取車牌圖像中覆蓋了所有字母和數字字符的前提下,從測試集中隨機地抽取了2 368張車牌圖片,對約有14 208個字符進行了測試。圖4列舉了測試集中的部分車牌字符。
表1 基于字符形狀特征的車牌識別分類器
分類結果特征組合判別字符的邏輯關系式
2CN=0,lC=1rC=1,rbC=1,hpN=2
3CN=0,lC=1rC=1,rbC=0,ltC=1
4CN=1,lC=1rC=0,rR<0.08
5CN=0,lC=1rC=1,rbC=0,ltC=0,hpN=1
6CN=1,lC=0rC=1,rtC=1
7CN=0,lC=1rC=0,ltC=1
8CN=2,lR>0.1
9CN=1,lC=1rC=0,rR>0.08
ACN=1,lC=0rC=0,bC=1
BCN=2,lR<0.1
CCN=0,lC=0rC=1,bC=0,vpN=2
DCN=1,lC=0rC=0,bC=0,hPN=2,lR<0.08
ECN=0,lC=0rC=1,bC=0,vpN=3,rbC=1
FCN=0,lC=0rC=0,bC=1,tC=0
GCN=0,lC=0rC=1,bC=0,vpN=3,rbC=0
HCN=0,lC=0rC=0,tC=1bC=1,hpN=2
JCN=0,lC=1rC=0,ltC=0
KCN=0,lC=0rC=0,bC=1,tC=1
LCN=0,lC=0rC=1,bC=0,vpN=1
MCN=0,lC=0rC=0,tC=1bC=1,hpN=4,bCN=2
NCN=0,lC=0rC=0,tC=1bC=1,hpN=3
OCN=1,lC=0rC=0,bC=0,hPN=2,lR>0.08
PCN=1,lC=0rC=1,rtC=0,hPN=1
QCN=1,lC=0rC=0,bC=0,hPN=3
RCN=1,lC=0rC=1,rtC=0,hPN=2
SCN=0,lC=1rC=1,rbC=0,ltC=0,hpN=2
TCN=0,lC=1rC=1,bC=1,tC=0
UCN=0,lC=0rC=0,tC=1bC=0,caR>0.35
VCN=0,lC=0rC=0,tC=1bC=0,caR>0.15
WCN=0,lC=0rC=0,tC=1bC=1,hpN=4,bCN=1
XCN=0,lC=1rC=1,bC=1,tC=1
YCN=0,lC=0rC=0,tC=1bC=0,caR<0.1
ZCN=0,lC=1rC=1,rbC=1,hpN=1
在用模板匹配與BP神經網絡進行識別時,提取的是經過細化與傾斜矯正后字符的網格點特征(前景像素占網格像素總數的比例,實驗中使用的是5×5的網格),樣本庫由每一字符的35個樣本圖像構成,圖5列舉了樣本圖像的部分示例。模板匹配的識別中以待測字符與樣本庫中樣本的最小歐氏距離作為分類準則;BP神經網絡的結構為:輸入層、隱含層和輸出層,各層的節點數分別為25、50、5,輸入層與隱含層、隱含層與輸出層間的權值學習率分別為0.05、0.047。實驗結果如表2所示。結果表明本文方法不僅改進了字符的識別率,而且識別速度也提高了1倍左右,本文方法是一種高效的車牌識別算法。
在對實驗結果進行分析后發現,字符斷裂和毛刺是影響本文方法拒識率和誤識率的主要原因,它們影響了字符形狀結構特征的提取,使得粗分類失敗。在圖6(a)中的字符“A”由于毛刺的影響,其凹凸性變為一個圈、一個下凹、一個右上凹,在分類器中沒有這樣的字符,因此被拒識;(b)中的字符“8”同樣因為毛刺的存在改變了其凹凸性的提取被拒識;(c)中的字符“8”由于字符斷裂被誤識為字符“0”或“O”;(d)~(f)也因為字符斷裂的原因被拒識??梢姡嚺谱址拈撝岛腿ピ胩幚硇Ч暮脡膶ψR別結果有很大的影響。
表2 實驗結果
方法正確率/%誤識率/%拒識率/%耗時/s/字符
網格特征+模板匹配93.56.500.074
網格特征+BP網絡94.75.300.058
本文方法97.31.21.50.023
4 結束語
如何提高實際應用中車牌識別系統字符識別的準確率和速度仍然是一個值得研究的重要問題。筆者在對當前車牌字符識別時常用的特征提取和識別方法研究的基礎上,設計了一種基于字符形狀特征的車牌字符識別方法,首先提取字符的凹凸性用于字符的粗分類,再根據需要進一步提取字符的彎曲度和交點數等特征用于詳細分類。該方法無須對分割后的字符作歸一化、細化、傾斜校正處理,減少了因細化、傾斜校正造成字符形變所帶來的拒識和誤識,也不需要構建樣本庫,減少了處理時間,提高了識別率與速度,有較強的魯棒性,是一種高效的車牌識別算法。
參考文獻:
[1]CHANG S L,CHEN L S. Automatic license plate recognition[J] .IEEE Trans on Intelligent Transportation Systems,2004,5(1):42-53.
[2]宋加濤,劉濟林. 車輛牌照上英文和數字字符的結構特征分析及提取[J].中國圖象圖形學報,2002,7(9):945-949.
[3]周治緊,李玉鑑.基于投影歸一化的字符特征提取方法[J].計算機工程,2006,32(2):197-199.
[4]任民宏.輪廓跟蹤算法的改進及在字符識別技術中的應用[J]. 計算機應用,2006,26(10):2378-2379,2382.
[5]梅園,孫懷江, 夏德深.一種基于改進后模板的圖像快速細化算法[J].中國圖象圖形學報,2006,11(9):1306-1311.
[6]AHMED M, WARD R. A rotation invariant rulebased thinning algorithm for character recognition[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2002,24(12):1672-1678.
[7]ROCKETT P. An improved rotationinvariant thinning algorithm[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2005,27(10):1671-1674.
[8]趙磊,陳瓊,陳中.一種新的改進OPTA細化算法[J].計算機應用,2008,28(10):2639-2642.
[9]龔才春,劉榮興.基于整體特征的快速手寫體數字字符識別[J].計算機工程與應用,2004,19(2):82-84.
[10]羅佳,王玲.基于凹凸特性筆順編碼的手寫體數字識別方法[J].計算機工程與科學,2007,29(5):69-70,108.