梁宏 劉琦 西安科技大學信息網絡中心
車牌識別系統開發與實現
梁宏 劉琦 西安科技大學信息網絡中心
隨著汽車保有量的迅速增長,交通擁堵頻繁發生。如何使用智能化的方式對交通進行高效的管理,成為交管部門的迫切需求。車牌識別系統利用圖像預處理、車牌檢測與定位、字符識別很好的實現了對車牌的自動識別。車牌識別系統的開發和實現,將會促進交通管理的智能化和計算機化,減少日益增長的車輛管理壓力。
智能交通 車牌識別 圖像灰度化
近年來,全國各地的車輛保有量急劇增長,交通擁堵頻繁發生。采取傳統意義上的增加道路公里數、限制車輛數量、限制出行已經不能很好的解決存在的問題。交通管理受人員數量的限制,不可能實時實地的對道路車輛進行監管,因此交通管理的智能化受到了越來越多的關注。目前,在我國的部分一線城市,交警已經開始大規模的利用智能交通系統進行交通管理。車牌識別系統的技術研究,將會促進交通管理的智能化和計算機化,減少日益增長的車輛管理壓力。
車牌識別技術主要分為兩大類,即傳統的間接識別法和直接識別法。間接法通過掃描車輛上的IC卡或者是磁條信息,進而確認車牌的信息。但是,需提前部署識別信息。直接識別法,通過對圖像的處理,進而識別出車牌信息。直接法的原理是數字圖像處理和模式識別技術。通過圖像進行預處理、識別,進而得出車牌的信息。直接法的優點是省時省力,不用對車輛進行IC卡或者磁條信息安裝。但是直接法的技術難度相對較大,在一些情況下的識別率不是非常理想。
車牌識別主要是利用計算機圖像處理和模式識別技術。因此,車牌識別技術的關鍵就在于從圖像定位出車牌位置和進行車牌字符識別。從圖像中定位車牌位置來講,其精確度會受各種環境的干擾導致定位錯誤。在字符識別上,因為我國車牌的特殊性,含有漢字、數字和字母三種字符,增加了字符識別的難度。目前,我國的車牌共由7個字符組成。車牌中,首字符是漢字字符,是各省的簡稱。第二個字符為字母字符,代表發牌機關號。后五個字符為數字和字母的組合,代表序號。
從車牌識別的關鍵來分析,車牌識別的難點主要在于以下幾點:
①識別受環境影響較大,對于惡劣的天氣情況,識別難度大。
②對于一些強光照條件下,識別的難度比較大。
③個別車牌污損情況比較嚴重,對于字符識別加大了難度。
④我國車牌字符較多,尤其是漢字字符,增加了識別的難度。
根據本系統的整體設計,本系統主要分為三個模塊。即,圖像預處理、車牌定位、字符識別。其中,圖像預處理模塊是實行圖像初步處理。預處理實現輸入的圖像灰度化、濾波等一系列的操作。車牌定位模塊是按照我國車牌的特點,遍歷可能是車牌位置的矩形區域。然后,找出準確的車牌位置,并且將定位出來的車牌單獨裁剪出來。字符識別是利用各個字符特點,完成字符分割。然后,調用Tesseract工具進行識別,并且將識別的信息保存輸出。本系統的模塊結構如圖所示。

2.1 車牌圖像預處理模塊
系統首先對圖像進行預處理。通過前期的灰度化、高斯濾波、中值濾波三步處理,讓圖像達到系統的要求。
圖像灰度化。由于在圖像采集的過程中,車牌背景不統一。因此,首先對圖像進行灰度化處理,因為直接對彩色圖像進行處理,運算量太大。所以,首先要將圖像轉化為灰度圖。圖像灰度化常用方法有三種。最大值法,平均值法,加權平均值法。
圖像去噪處理。在獲取圖像的過程中,由于一些因素的干擾,圖像可能受一些噪聲滋擾。這樣會或多或少降低圖像質量,可能影響圖像的分析。所以,系統應該排除噪聲干擾,并且提高圖像質量。對圖像進行平滑化和去噪處理。使用高斯濾波和中值濾波法。
2.2 車牌定位模塊
首先采用sobel算子進行邊緣檢測。然后選取合適的閾值,進行閾值分割。將我們要的目標通過二值化處理,與背景分割開來。隨后,使用形態學變形的方法。對圖像進行開閉運算,使的車牌連通區域更加明顯。最后進行車牌提取,利用車牌的固定長寬比,還有一定的面積大小,進行車牌精定位。在排除干擾,確定車牌位置后。系統將車牌從原圖像中裁剪出來,以便于下一步的識別。
2.3 字符識別系統
首先,對車牌圖片進行閾值分割。提取出車牌中的字符。其次,對字符進行分割,分割為漢字與非漢字字符。最后,利用Tesseract—OCR開源引擎,進行字符識別。在實際識別中使用自己的字符庫,識別率比較理想。
車牌識別系統是在Windows平臺上,基于MFC對話框的應用。主要實現的功能是圖像的輸入,一鍵識別,將識別的結果到保存到數據文件。并且提供單步運行的功能,逐步完成車牌的識別,包括分步獲取車牌識別的各個步驟,以便于更好的分析識別率和識別失敗的一些原因。
系統完成開發工作后,對采集到的100多張照片進行了分析測試,并且對結果進行了統計分析。在車牌定位測試中,對116張圖像進行定位測試,成功定位出車牌的共105張,定位正確率為90.5%,如表1所示。

表1 車牌定位測試結果
隨后,再進行字符識別測試。分別計算漢字和非漢字的識別率。表2是漢字識別率的統計,針對105張車牌照片,105個漢字字符,漢字字符識別成功的共81個,正確識別率為78%。表3是非漢字字符識別率的統計。對于105張照片,630個數字字母字符,正確識別個數為576個,正確識別率為91%。

表2 漢字字符測試結果

表3 非漢字字符測試結果
通過對上述結果進行分析,識別錯誤的車牌主要是字符識別錯誤引起的,通過單步運行分析原因,主要原因是采用的算法還具有一定的不足。其次,還有圖像的質量問題、拍攝環境問題和角度問題,最后導致字符識別錯誤。
總體而言,車牌識別系統較好的完成了對車牌的識別和辨識功能,在后期通過對算法進行優化,可以提高車牌識別率,達到應用推廣的目的。隨著智能化應用在交通管理中的廣泛推廣使用,以車牌識別技術為主體的智能化應用也將在交通智能化中的占有更加重要的地位。
TP311
A
梁宏(1976-),男,工程師,主要從事網絡建設和運維管理工作。