摘要:車牌字符分割是車牌識別系統的三大關鍵技術之一。準確的字符分割,既能提高字符識別的準確率,又能提高識別的速度。針對車牌圖像背景復雜、光照多變、干擾較多的情況,文章在車牌區域預處理的基礎上提出了一種基于先驗知識的垂直投影字符分割方法。實驗結果表明該算法簡潔、實時性好、處理正確率高,達到了實用的標準。
關鍵詞:車牌識別系統;二值化;字符分割;先驗知識;垂直投影
中圖分類號:TP391 文獻標識碼:A文章編號:1009-3044(2008)34-1693-02
Research of Characters Segmentation Technology in VLPRS
CHEN Li1,2
(1.College of Computer Science and Techologe,Anhui University, Hefei 230039, China;2.Department of Computer Engineering,Wuhu Vocational College of Information and Technology, Wuhu 241003, China)
Abstract: License plate character segmentation is one of the three key technologies of Vehicle License Plate Recognition System(VLPRS).A good method or algorithm,which segment characters accurately ,can improve the accuracy of character recognition and make the identification very fast.Vehicle license plate recognition have such characteristics as complex background,changeable lighting and a variety of interference.In view of this situation,the article proposes a method of vertical projection character segmentation,which is based on priori knowledge. The experimental results show that the algorithm, which achieves a good standard of practical,has lots of advantages such as simple and clean, better real-time features and high-accuracy of processing.
Key words: VLPRS; binarization; characters segmentation; prior knowledge;vertical projection
1 引言
車牌字符分割是車牌識別系統(Vehicle License Plate Recognition System,簡稱VLPRS)的三大關鍵技術之一。車牌定位后得到的是一個包含車牌字符的近似水平條形區域,為了進行字符識別,需要將車牌區域中的單個字符分割出來。字符分割的正確與否,直接影響識別的正確性。通常車牌圖像中存在較大的干擾、噪聲,可能產生字符粘連或字符斷裂、字符的筆畫可能變粗、字符的輪廓模糊不清等現象。這些都給正確的分割帶來了困難。本文在車牌區域預處理的基礎上提出了一種基于先驗知識的垂直投影字符分割方法。
2 車牌字符分割
提取車牌區域后,得到的可能是從原始圖像中分割出的彩色車牌區域圖像。由于其可能存在著邊框、鉚釘、噪聲干擾等,為了能迅速準確的進行單字符分割與提取,必須對定位后的彩色車牌區域圖像進行預處理。預處理主要包括對其大小歸一化、灰度化、去噪、二值化、去除邊框和鉚釘等。
2.1 車牌區域圖像的預處理
2.1.1 車牌區域大小歸一化
車牌定位后得到的彩色車牌區域圖像,由于拍攝時的距離、角度等因素的影響,它們大小不一,不適于快速、正確的進行單字符的分割。這就需要根據車牌的特征對定位后的車牌區域進行歸一化處理,即把車牌區域的尺寸規范到一個統一尺寸上再進行單字符分割。常用的大小歸一化的方法是將車牌區域外邊框按比例線形放大或縮小成為規定大小的區域。
■
圖1 車牌分割結果 圖2 車牌尺寸歸一化結果
2.1.2 OTSU二值化
彩色圖像包含大量信息,給圖像存儲及處理速度帶來很大不便。為了減少圖像信息,提高處理速度,以及方便字符分割,需要對定位后的車牌區域進行二值化。二值化圖像畫面內只包含黑色和白色兩種顏色,容易將圖像中的目標和背景分離出來。圖像二值化的關鍵在于閥值T的選取。根據閥值T來區分圖像中的對象和背景。
在各種二值化方法中,全局閥值方法對輸入圖像量化噪聲或不均勻光照等情況抵抗能力差,在分割時會出現斷裂和大面積粘連現象,應用受到極大限制;局部閥值法[1]也存在缺點和問題,分割時會出現非字符區域的干擾和粘連現象。當兩個相鄰的塊的閾值相差太大,二值化后的車牌字符就可能造成變形,不能保證字符筆劃連通性,降低了識別率。而且,該方法實現速度慢、容易出現偽影現象。
本文采用全局動態閥值化方法進行二值化。該方法是從整個灰度圖像的像素分布出發,尋求一個最佳的閥值。其中經典算法是OTSU算法——類間最大方差算法[2]。該方法的主要思想是從圖像的灰度直方圖中把灰度的集合用閥值t分為兩類,然后根據兩個類別的平均值方差——類間方差和各類的方差——類內方差的比為最大來確定閥值t。該閥值即為二值化圖像的最佳閥值。這種方法不論圖像的直方圖有無明顯的雙峰,都能得到較為滿意的效果,因此這種方法是閥值自動選取的較優方法。
Otsu算法有以下優點:該算法實現較為簡單;它是基于圖像的整體特性而非局部特性的;它可以推廣到多閥值的分割方法中去;該算法適應性較強。
■
圖3 OTSU二值化結果
2.1.3 其他基于車牌區域圖像的預處理
為了更好地對車牌字符進行分割與識別,還需要對車牌區域圖像進行諸如灰度化、傾斜校正、去除邊框、去除鉚釘等預處理,限于篇幅,此處不再詳細敘述。
2.2 車牌單字符分割
經過預處理后的車牌是大小統一的包含所有車牌字符的二值圖像。由于識別是逐個字符進行的,這就需要將二值圖像進行單字符分割。字符分割的方法很多,如小區域投影方法結合四連通算法的字符分割算法、利用Hough變換和先驗知識的車牌字符分割算法等等。但這些算法實現復雜,實時性不高。常用的字符分割方法有模板匹配法、水平投影法、聚類分析法等。下面就這些方法做個簡介,并在此基礎上提出自己的字符分割方法——基于先驗知識的垂直投影字符分割算法。
2.2.1 常用車牌字符分割算法簡介
1) 模板匹配法[3]:該方法先在二值圖像上計算豎直積分投影的平滑曲線,搜索平滑曲線的局部最小值得到一個波谷位置序列;再將相鄰兩個波谷分別作為左右邊界提取出一組矩形區域;最后,根據一定的規則對矩形區域進行刪除、分裂、合并及調整大小。從而實現對車牌區域的單字符分割。該方法執行速度較快,能較好地解決漢字不連通問題,而且能克服分割過程中復雜背景的干擾,對車牌尺寸的變化及磨損也有很強的適應性。但該方法程序設計復雜,對車牌左右邊框分割不準,有待改進。
2) 水平投影法[4]:該方法先自下而上再自上而下對車牌區域圖像進行逐行掃描,找到并分別記錄下掃描到的第1個白色像素點位置,確定圖像大致的高度范圍;在此高度范圍之內再自左向右逐行掃描,遇到第1個白色像素時認為是字符分割的起始位置,然后繼續掃描,直至遇到沒有白色像素的列,則認為是這個字符分割結束。重復上述過程,直至圖像的最右端,得到每個字符比較精確的寬度范圍;在已知的每個字符比較精確的寬度范圍內,再分別進行自上而下和自下而上的逐行掃描來確定每個字符精確的高度范圍。此方法主要是針對在車牌定位、圖像預處理后比較規則的車牌圖像比較常用。優點是程序邏輯設計簡單,循環執行功能單一,便于設計和操作,而且程序執行時間短。但是它對字符的粘連問題,解決得不很理想,且在漢字的不連通問題上也存在不足[6]。
3) 聚類分析法[5]:該方法是按照屬于同一個字符的像素構成一個連通域的原則,再結合先驗知識:字符的高度、間距的固定比例關系等,來逐個分割車牌區域中的字符的。該方法分割精確,很好的解決了漢字不連通的問題,對噪聲干擾及車牌磨損問題也能較好處理。但其程序設計復雜,執行時間長,較投影分割速度慢。
2.2.2 車牌先驗知識
標準車牌是由指定國家機關按規定制作的,其特征固定,先驗知識明確。充分利用先驗知識有助于單一字符精確切分。
除軍車、警車、教練車、領使館車外,標準車牌格式是X1X2·X3X4X5X6X7,共有七個字符和一個點符號。其中第一個字符X1是各省、市、軍區和自治區的簡稱,一般是漢字;第二個字符X2是大寫的英文字母;接著是一個點·;第三、四位字符X3和X4可能是大寫英文字母,也可能是阿拉伯數字;目前,第五到七位X6和X7均為阿拉伯數字。
另外,標準車牌長度為450mm,字符總長度為409mm,其中單個字符寬度為45mm,高度為90mm,第二和第三字符間間距為34mm,其中中間小圓點寬度為1Omm,與第二和第三字符間間距均為12mm,其余字符間間距為12mm;字符“1”的寬度約為13.5mm,與其它字符間間距約為22.5mm,連續兩個字符“1”間間距約為38.5mm,第三字符為字符“1”時,與第二字符間間距約為44.5mm。
2.2.3 基于先驗知識的垂直投影字符分割算法
在預處理后的車牌區域上,充分結合車牌的先驗知識,再利用垂直投影算法對車牌區域進行單字符分割,可以獲得較好的分割效果。其算法可按下面步驟實現:
1) 利用Hough變換求取字符水平分割線;
2) 對車牌區域進行字符垂直投影,尋找字符垂直投影的谷底,將谷底位置作為候選垂直分割線的位置;
3) 根據水平分割線和候選垂直分割線提供的位置信息,并利用車牌尺寸的先驗知識,估算整個車牌的寬度和每個字符的寬度;
4) 估算出車牌尺寸以后,利用車牌尺寸的先驗知識,再估算出前兩個字符和后面5個字符之間的大間隔的位置,然后根據垂直投影以及方差信息,在估算出的位置附近搜索,確定大間隔的左右邊界;
5) 根據4)中確定的大間隔的位置,并利用先驗知識估算出垂直分割線的位置,然后再在估算出的位置附近,根據垂直投影以及方差信息,從候選垂直分割線中確定最終垂直分割線。確定垂直分割線時,需要通過強化先驗知識的約束來準確定位。
■
圖4垂直投影結果
從大量的實驗結果看,此方法能得到較好的分割效果,可以滿足系統對字符分割的需求。下面是對車牌單字符分割的過程與結果圖示。
■
圖5 字符分割圖
(下轉第1699頁)
(上接第1694頁)
■
圖6 單字符分割結果
3 總結
通過與幾種常用的字符分割方法的比較以及實驗的驗證,本文提出的基于先驗知識的垂直投影字符分割方法,在對定位出的車牌區域進行歸一化、二值化等一系列處理后,能迅速、準確地對車牌區域字符進行單字符分割。這為后續的字符識別打下了良好的基礎,能夠滿足車牌識別系統的實時性、準確率的要求。
參考文獻:
[1] 吳冰,秦志遠.自動確定圖像二值化最佳閥值的新方法[J].測繪學院學報,2001,18(4):1-2.
[2] 吳傳孫,鄒德揚,周定康.二值化算法在車牌識別中的應用[J].計算機與現代化,2003.6:13-16.
[3] 范瑋琦,穆長江.一種基于漢字結構特征的車牌照字符分割方法[J].儀器儀表學報,2003,24(4):472-474.
[4] 胡小鋒,趙輝.Visual C ++/MATLAB圖像處理與識別[M].北京:人民郵電出版社,2004.
[5] 李文舉,梁德群.質量退化的車牌字符分割方法[J].計算機輔助設計與圖形學學報,2004,6(5):697-700.
[6] 劉明軍,謝宏霖,孫雪松,等.車牌字符分割算法的比較研究[J].濟南大學學報:自然科學版,2006,30(3):246-248.
[7] Barroso J,Dagless E L,Rafel A,et al.Number plate reading using computer vision[C].Proc IEEE International Symposium on Industrial Electronics,1997.