瞿 中,常慶麗,王永昆,李夢露
(1.重慶郵電大學 計算機科學與技術學院,重慶 400065;2.重慶郵電大學 移通學院,重慶 401520)
一個完整的車牌字符識別系統(license plate character recognizer,LPCR)通常包含字符圖像預處理、字符特征提取和分類器判決[1],[2]三個階段。在這三個階段中,選取何種字符特征和字符識別方法進行字符判決將影響整個識別系統的識別率。目前,關于車牌字符圖像的識別方法很多,最常用的是基于神經網絡的識別方法和基于模板匹配的識別方法[2]。神經網絡方法[3-5]計算量大,算法復雜,實時性不高;而模板匹配方法[6-8]實現簡單,其實時性相對而言要高很多。除此以外,神經網絡識別方法不易區分相似字符,如B和8、D和0、2和Z等;而模板匹配方法雖然較神經網絡方法易識別相似字符,但是準確率并不高。綜合考慮到模板匹配方法的優劣,通過研究模板匹配方法算法思想和針對相似字符的特點,并結合分級分類思想,本文針對單一使用模板匹配車牌字符識別算法識別準確率低的缺點進行改進,并對實際抓拍的車牌圖像進行自動識別測試。實驗結果表明,該字符識別算法準確率達到了系統的要求標準,并具有良好的魯棒性和實時性。
本文設計的LPCR 系統分為模板部分和測試部分,其中模板部分主要是建立一個完整的字符模板庫,為字符系統的識別做準備工作;測試部分主要是將分割得到的字符圖像經過處理,然后與字符模板庫進行匹配,得到置信度最大的模板,從而輸出識別結果。系統設計流程如圖1所示。

圖1 系統流程
在測試部分,二值化處理可能使得字符圖像信息有不同程度的丟失,對于整個系統的識別結果會產生很大影響。為了使得圖像信息丟失最少,閾值的選取尤為重要。本文采用由Ying Wen[2]等提出的一種改進的Bernsen算法對字符圖像進行二值化處理。
經過預處理得到的車牌字符圖像并非都是清晰、標準的,可能出現噪聲、斷裂、粘連等圖像[8-9]。選擇的字符識別方法必須對這樣的圖像有一定的魯棒性。因此,基于實際應用中的系統要求,本文采用模板匹配方法作為基本的字符識別方法,并結合分級分類思想以及相似字符集的特點,提出一種改進的分級分類車牌相似字符識別算法。該方法首先需要建立一個標準的模板庫,為識別做好準備。
對模板匹配識別方法來說,模板庫建立的好壞至關重要,會直接影響到識別率。因此,在建立字庫之前,要搜集完整的字符集樣本,然后進行濾波、二值化、歸一化等預處理,使得圖像的有用部分得到加強,最后提取出字符特征作為匹配模板。
傳統的字符分類模板庫主要分為漢字模板庫、字母模板庫、數字字母模板庫、數字模板庫。對于大多車牌字符的識別,傳統字符分類模板庫是適用的,但隨著車主自主選擇和自編車牌號的盛行,車牌的最后三個字符不再僅僅局限在數字模板庫,而可能出現字母,甚至教練車、警車等的車牌最后是漢字[10]的情況。
車牌編排的靈活性使得傳統的模板庫[11]分類不再適用,因此,本文對模板庫進行改進以適應當前各種靈活編號的車牌。針對車牌的七個字符重新設計了漢字模板庫、字母模板庫、數字字母模板庫、數字字母漢字模板庫四個模板庫。傳統的模板庫分類和本文改進的模板庫分類對比如圖2所示。

圖2 新舊模板庫對比
選取典型測試樣本進行測試,對第五和第六個字符對應的模板庫進行了更新,更新前后的匹配效果如圖3所示,同時對第七個字符對應的模板庫也進行了更新,更新前后的匹配效果如圖4所示。

圖3 第六個字符對比效果

圖4 第七個字符對比效果
從圖4和圖5可以看到,更新后的模板庫可以有效地識別新型車牌號碼。
在成功提取字符特征、構建模板庫后,接下來進行待識別字符的匹配。針對單一使用模板匹配算法對相似字符識別率低的缺點,本文在通用模板匹配識別的基礎上,利用局部特征區域對相似字符進行二次識別,達到了很好的效果。具體識別算法步驟如下:
(1)首先對字符圖像進行二值化處理、去噪處理和歸一化處理;
本文將字符圖像和模板按照邊框比例縮放,將大小歸一化為16×20;
(2)對歸一化后的各二值圖像進行特征提取,將提取的特征向量與模板庫中各相應模板特征向量[12]進行比較得到相似度;
本文考慮到歸一化后的圖像信息僅包括320個像素值,為了使匹配結果更加準確,采用320維的特征向量;
(3)采用通用模板匹配方法對各字符圖像進行第一次識別,預處理后得到P個歸一化后的二值圖像為
{fI(i,j),i=1,2,…,m,j=1,2,…,n},I=1,2,…,P
模板庫中各模板為
{TK(i,j),i=1,2,…,m,j=1,2,…,n},K=1,2,…,Q
其中fI(i,j),TK(i,j)分別表示(i,j)點處待識別圖像和模板圖像的像素值,為了計算簡便,字符有效區域像素值取值“1”,字符背景區域像素值取值“0”,最終得到匹配系數τk,如式(1)所示

其中,ΔTk統計模板圖像Tk中白色像素點的個數,如果τk的最大值為τq,那么輸入圖像{fI(i,j)}是τq所對應的圖像;
(4)判斷步驟(3)得到的識別結果是否在特征上屬于某個相似字符集合;
例如本文將“A”、“4”作為一個相似字符集合,將“B”、“S”、“8”作為一個相似集合等;
(5)如果第一次的識別結果屬于某個相似字符集,就在該相似字符集內采用局部特征匹配方法,相應地選取相似字符特征中差別最大的區域作為特征區域與模板庫中的各模板字符對應區域進行匹配運算。相似字符的差異定義標準[11]是將待識別字符以幾何中心為原點分為四部分,分別對這四部分進行分析排查,找出相似度差別較大的特征區域與模板的對應區域進行匹配;
例如,字符“8”和“B”的最大差別區域如圖5(a)所示。字符“D”和“0”的最大差別區域如圖5(b)所示。

圖5 相似字符最大局部特征對比
(6)如果第一次的識別結果不屬于任何相似字符集,那么直接輸出識別結果。
改進的車牌圖像相似字符識別算法處理流程如圖6所示。
本文對相似字符的誤識別處理改進進行實驗測試。測試結果如圖7所示,傳統的模板匹配將字符“0”識別為字符“D”,改進后則可正確的識別。
本文字符識別系統的開發環境為VS2008+OpenCV2.1。


實驗選擇兩組車牌圖像,第一組包括500張大小為200萬像素的高速卡口車牌圖像,定量評估本文改進模板庫對車牌后三個字符處理的改進效果。
不同情況下典型的4張車牌圖像測試結果如表1所示。

從表1的測試結果可以看出,第一組車牌號屬于常規車牌,因此兩種方法的識別結果都是準確的;第二組車牌號屬于新型車牌號,傳統模板庫將后三個字符和數字模板庫進行匹配,導致第五個字符“B”被誤識為“8”,而改進的模板庫可以正確識別;第三組車牌號以及第四組車牌號和第二組一樣,改進的模板庫可以準確識別。對車牌號碼后三個字符出現字母,或最后一個字符出現漢字的情況,采用改進的模板匹配算法可以準確識別各類新型車牌。
第二組實驗測試圖像包括不同環境下1030 張大小為200萬像素的高速卡口車牌圖像,定量評估對相似字符處理的改進效果,樣本中常見的相似字符車牌實驗結果分析如表2所示。

表2 相似字符測試結果
綜合上述兩個實驗,本文算法在改進模板庫的同時,還對相似字符做了二次識別處理,本文字符識別系統綜合性能比較如表3所示。

表3 系統綜合性能比較結果
由表3可以看出本文算法識別率較改進前有了明顯提高。實驗中,對1030張測試樣本進行識別時間的測試,每個字符圖像的平均識別時間為0.78125ms,達到了實際應用中字符識別系統的實時性要求。
針對單一使用模板匹配車牌字符識別算法識別準確率低下的缺點,本文綜合考慮到模板匹配方法的優劣,以及車牌字符集自身的特點,結合分級分類的思想,并通過研究模板匹配算法和相似字符容易誤識別的特點,采用一種基于模板匹配算法的改進車牌相似字符識別方法使得字符識別系統識別率較傳統方法提高了10.1%。本文對字符識別系統綜合性能進行了比較,測試結果表明,該字符識別方法準確率達到了系統的要求,并具有良好的魯棒性和實時性。
[1]Wijnhoven R G J,De With P H N.Identity verification using computer vision for automatic garage door opening[J].IEEE Transactions on Consumer Electronics,2011,57(2):906-914.
[2]WEN Ying,LU Yue,YAN Jingqi,et al.An algorithm for license plate recognition applied to intelligent transportation system[J].IEEE Transactions on Intelligent Transportation Systems,2011,12(3):830-845.
[3]Anagnostopoulos C N E,Anagnostopoulos I E,Loumos V,et al.A license plate recognition algorithm for intelligent transportation system applications[J].IEEE Transactions on Intelligent Transportation Systems,2006,17(3):377-392.
[4]ZHAO Huihuang,ZHOU Dejian,WU Zhaohua.SMT product character recognition based on BP neural network[C]//Yan-tai,Shandong:6th International Conference on Natural Computation,2010:589-593.
[5]Caner H,Gecim H S,Alkar A Z.Efficient embedded neural network based license plate recognition system[J].IEEE Transactions on Vehicular Technology,2008,57(5):2675-2683.
[6]ZHANG Zhijia,LI Yuan,YUAN Weiqi.Meter character recognition method based on gray template matching[C]//29th Chinese Control Conference,2010:2987-2990.
[7]Myers V,Fawcett J.A template matching procedure for automatic target recognition in synthetic aperture sonar imagery[J].Signal Processing Letters,IEEE,2010,17(7):683-686.
[8]DUAN Qichang.SONG Na.A method of vehicle license plate de-noising and location in low light level[C]//WASE International Conference on Information Engineering,2010:194-198.
[9]LI Yuchen,TIAN Zhen,YOU Jia.Character feature extraction method and its effectiveness evaluation[C]//Hongkong:2012 2th International Conference on Intelligent System Design and Engineering Application,2012:197-200.
[10]WANG Jianxia,ZHOU Wanzhen,XUE Jingfu,et al.The research and realization of vehicle license plate character segmentation and recognition technology[C]//Qingdao,Shandong:Proceedings of the International Conference on Wavelet Analysis and Pattern Recognition,2010:101-104.
[11]Wakabayashi T,Pal U,Kimura F,et al.F-ratio based weighted feature extraction for similar shape character recognition[C]//10th International Conference on Document Analysis and Recognition,2009:196-200.
[12]CHEN Zhenxue,LIU Chengyun,CHANG Faliang,et al.Automatic license-plate location and recognition based on feature salience[J].IEEE Transactions on Vehicular Technology,2009,58(7):3781-3785.