任安虎, 張 燕 ,張 亮
(1.西安工業(yè)大學 電子信息工程學院,陜西 西安 710032;2.陜西工業(yè)職業(yè)技術學院 電氣工程系,陜西 咸陽 712000)
車牌識別系統(tǒng)是圖像模式識別領域的一個經典研究課題。對車牌識別技術的研究不但會極大促進數(shù)字圖像處理、計算機視覺、模式識別與人工智能等相關領域理論與實踐的發(fā)展,而且其在公共安全、交通管理、軍事部門等的實際應用價值也不可估量。一個典型的車牌識別系統(tǒng)由圖像采集、圖像預處理、車牌定位、字符分割以及字符識別幾部分組成。其中字符識別是車牌識別系統(tǒng)中的關鍵環(huán)節(jié),識別方法的好壞直接影響到整個車牌最終的識別效果。在字符識別模塊,針對單一識別技術識別率較低的問題提出了從數(shù)據(jù)融合理論的角度出發(fā),有效地、綜合地應用多種識別技術來提高系統(tǒng)的識別率。
數(shù)據(jù)融合技術實際上是對人腦綜合處理復雜問題的一種功能模擬。在多傳感器系統(tǒng)中由于各種傳感器提供的信息具有不同的特征:時變的或者非時變的;實時的或者非實時的;快變的或者緩變的;模糊的或者確定的;精確的或者不完整的;可靠的或者非可靠的;相互支持的或者互補的;也可能是相互矛盾或沖突的。而數(shù)據(jù)融合系統(tǒng)能充分利用多個傳感器資源、對各種傳感器及其觀測信息合理支配與使用,將各種傳感器在空間或時間上的互補或冗余信息依據(jù)某種優(yōu)化準則組合起來,產生對觀測環(huán)境的一致性解釋和描述。因此,數(shù)據(jù)融合的目標是基于各種傳感器分離觀測信息,再通過對信息的優(yōu)化組合導出更多的有效信息,它的最終目的是利用多個傳感器共同或聯(lián)合操作的優(yōu)勢,提高整個系統(tǒng)的有效性,消除單個或少量傳感器的局限性。
數(shù)據(jù)融合技術與經典信號處理方法有本質的區(qū)別,數(shù)據(jù)融合所處理的多傳感器信息不但具有更為復雜的形式,而且還可以在不同的信息層次上出現(xiàn),這些信息表征層次包括:數(shù)據(jù)層、特征層和決策層。直接在采集到的原始數(shù)據(jù)層上進行的融合稱為數(shù)據(jù)層融合,數(shù)據(jù)層融合是最低層次的融合,它的優(yōu)點在于能保持盡可能多的現(xiàn)場數(shù)據(jù),提供其他融合層次所不能提供的細微信息,但其局限性也是比較明顯的,主要原因在于數(shù)據(jù)層融合是在信息的最底層進行的,由于傳感器原始信息的不確定性、不完全性和不穩(wěn)定性,對融合結果影響較大,穩(wěn)定性較差。因此,數(shù)據(jù)層上的融合具有很大的盲目性,原則上不贊成直接在數(shù)據(jù)層上進行數(shù)據(jù)融合,而且數(shù)據(jù)層融合通常要求選用的傳感器必須是同類型傳感器或相同量級的傳感器。數(shù)據(jù)層上通常采用的融合方法有加權平均法、像素灰度值選擇融合方法、基于區(qū)域特征的融合方法、小波變換法、金字塔分解方法等。特征層融合是先對來自傳感器的原始信息進行特征提取,然后再對特征信息進行綜合分析和處理,特征層融合屬于中間層次的融合,也是最成熟、發(fā)展最完善的融合理論,它的優(yōu)點是通過特征提取既實現(xiàn)了信息壓縮,又保留了最重要的信息。特征層融合通常采用的算法有參量模板法、聚類分析法、人工神經網絡等。決策層融合是一種高層次融合,它能充分利用特征層融合的最終結果,采用適當?shù)娜诤霞夹g給出最終的檢測、控制、指揮、決策的依據(jù),決策層融合的最大優(yōu)點是具有容錯性,當一個或幾個傳感器出現(xiàn)錯誤時,通過適當?shù)娜诤希到y(tǒng)最終還能獲得正確的結果。決策層融合通常所采用的方法有貝葉斯推斷、D-S證據(jù)理論、模糊集理論、專家系統(tǒng)等。總地說來,數(shù)據(jù)融合本質上是一個由底層至頂層,對多元信息進行融合,逐層抽象的信息處理過程[1-3]。
數(shù)據(jù)融合是一種對數(shù)據(jù)的綜合和處理技術,是許多傳統(tǒng)學科和新技術的繼承和應用,而對數(shù)據(jù)的綜合和處理能力反應在所選用的融合算法上。因此,在一個融合系統(tǒng)中,核心的問題是選擇合適的融合算法。經過對各種融合算法原理及優(yōu)缺點的研究比較之后,最終確定了各層上所采用的融合算法:數(shù)據(jù)層選擇了加權平均算法;特征層選擇了人工神經網絡算法;決策層采用了模糊推理算法以實現(xiàn)對車牌字符的最終識別。圖1為應用數(shù)據(jù)融合技術識別車牌字符的流程框圖。

圖1數(shù)據(jù)融合技術識別車牌字符流程框圖Fig.1 Flow chart of data fusion technology to identify license plate characters
加權平均融合算法,是通過融合各源圖像的冗余信息提高檢測的可靠性和融合后圖像的信噪比。而且它對來自不同傳感器的多幅源圖像進行數(shù)據(jù)層融合時,無需考慮各源圖像像素之間的相關性及配準技術,因此也是最簡單、最方便的數(shù)據(jù)層融合算法。
以3幅圖像為例對加權平均算法進行敘述:設融合結果為 FUS(i,j),輸入圖像為 A(i,j)、B(i,j)和 C(i,j),(i,j)是圖像中某點像素的坐標位置,該算法的表達式如式1所示:

其中 α、β、γ 為加權系數(shù),且 α+β+γ=1。 權值系數(shù)的大小可依據(jù)圖像的質量來確定。若則為平均融合。
設計中對同一車輛采集了3幀圖像,通過定位、字符分割、歸一化后,針對同一個車牌字符得到了3個樣本,對這3個樣本的像素值進行平均融合,得到融合以后的字符樣本,再將融合結果送往特征層進行下一步處理。與以往只用單幀圖像作為識別對象的識別算法比較,數(shù)據(jù)融合技術彌補了因單幀圖像拍攝效果不佳而造成無法識別的不足,這也是本設計的創(chuàng)新處之一。
神經網絡[4-5]具有很強的容錯性和自學習、自組織及自適應能力,能夠模擬復雜的非線性映射,恰好滿足多傳感器信息融合技術處理的要求,在數(shù)據(jù)融合理論研究中受到高度重視,具有廣闊的應用前景。另外,在數(shù)據(jù)融合系統(tǒng)中要將來自不同類型傳感器的數(shù)據(jù)進行非線性關聯(lián)并形成一個融合矢量是非常困難的,而神經網絡則能實現(xiàn)這一特殊功能。因此,神經網絡分類器是本設計特征層融合首先考慮采用的算法。在諸多的神經網絡分類器中BP神經網絡算法數(shù)學意義明確、學習步驟分明,而且網絡經訓練收斂之后進行識別時還具有計算量小、速度快等優(yōu)勢。所以,最終確定采用BP神經網絡分類器作為特征層的融合算法。
具有單隱層的3層BP網絡能夠逼近任何有限函數(shù),也能使處理的問題簡單化,而且車牌識別系統(tǒng)屬于一個小類別分類問題,故采用3層BP神經網絡結構符合實際應用的要求。首先對經過數(shù)據(jù)層融合后的字符像素進行特征提取,設計中共提取了3類互補性強的字符特征:字符原始特征,粗網格特征及水平、垂直投影特征和字符外圍輪廓特征,作為輸入信號分別送給3個BP神經網絡分類器,根據(jù)識別系統(tǒng)的需求設置好各個網絡的初始參數(shù)后,開始對3個BP網絡進行訓練,訓練過程中不斷調整網絡參數(shù),最終使各個BP網絡達到良好的收斂效果,然后用訓練好的3個BP神經網絡分別對同1個車牌字符進行識別。
決策層采用了模糊推理技術[6-7]作為最終判決的依據(jù)。模糊系統(tǒng)中,知識的抽取和表達比較方便,但學習能力較差,神經網絡可從樣本中進行有效的學習,但從網絡中提取知識的過程比較困難;模糊系統(tǒng)適合于處理結構化的知識,而神經網絡對處理非結構化信息更為有效。設計中選擇特征層神經網絡分類器的輸出作為決策層模糊推理系統(tǒng)的輸入還可實現(xiàn)數(shù)據(jù)整理、聚集和抑制噪聲,使獲取模糊規(guī)則的過程變得容易。所以,融合系統(tǒng)中模糊推理技術和神經網絡技術能克服自身不足、各取所長、優(yōu)勢互補,從而使融合系統(tǒng)的性能得到改善。
運用模糊理論進行模式識別時通常采用3種方法:隸屬原則識別法、擇近原則識別法以及模糊聚類分析法。設計中選用了隸屬原則識別算法對3個BP網絡的識別結果進行最終決策。隸屬原則識別法的難點在于隸屬度函數(shù)的選擇。
隸屬原則識別法的原理如下:設論域U中n個模糊子集A1,A2,…,An,且對于每一個 Ai都有隸屬度函數(shù) μAi(x),對任意 x0∈U,若有:

則判定x0屬于Ai,隸屬原則簡單易懂、清晰明了。
由于每個BP網絡提取的是字符的不同特征,各網絡參數(shù)的設置也各不相同,導致3個神經網絡對同一個測試字符的輸出向量和識別率各不相同,所以設計中是從這兩個方面出發(fā)確定隸屬度函數(shù)。3個BP網絡對同一個字符進行識別時的輸出向量構成一個3行50列 (設計中所需識別的字符共計50類)的矩陣M,統(tǒng)計出3個BP網絡的識別率后將其歸一化為一個1行3列的矩陣N,確定隸屬度函數(shù)可通過兩矩陣相乘Q=N[1×3]·M[3×50]得到,相乘結果Q[1×50]為一個行向量,取該向量中最大值所對應的字符作為模糊決策的最終結果,如式3所示:

應用MATLAB軟件對上述各個模塊所采用的算法進行了仿真,效果如圖2所示。仿真結果表明,針對同一幅車牌圖像,3個BP網絡給出了不同的識別結果,但是通過決策層的模糊推理融合算法仍然能夠正確地識別。

圖2車輛原圖像及識別結果Fig.2 Vehicles of the original image and the recognition results
設計中共采集到實際的車輛圖像84套,其中因無法準確定位或字符分割的圖像共12套,在剩余的72套圖像中,用其中的50套作為神經網絡的訓練樣本,其余22套作為測試樣本,對車牌識別,經實驗統(tǒng)計,其結果如表1所示。

表1車牌識別結果統(tǒng)計Tab.1 Statistical result of license plate recognition
由以上統(tǒng)計結果可明確的看出,應用數(shù)據(jù)融合技術系統(tǒng)的識別率較單一識別方法有了較大的提高,達到了90.9%。
基于數(shù)據(jù)融合理論,將不同的識別方法有效地結合起來構成融合型車牌字符識別系統(tǒng),數(shù)據(jù)層應用了加權平均算法,特征層選用了BP神經網絡,決策層采用了模糊推理算法。實驗證明,該系統(tǒng)能有效的實現(xiàn)車牌字符識別,字符識別率達到了90%以上,較采用單一識別方法有了較大的提高。通過融合使信息資源得到了充分利用,各種方法互補,系統(tǒng)性能得到了很大提高。對于特征層融合應用的BP神經網絡算法,直接使用了前人的研究成果,可對網絡的參數(shù)設置及收斂速度進一步的研究,加以改善提高。
[1]呂穎.基于模塊化的數(shù)據(jù)融合系統(tǒng)在車牌識別中的應用[D].河北:河北工業(yè)大學,2006:23-32.
[2]郭濤,李龍飄,費慶國,等.數(shù)據(jù)融合技術中Dempster-Shafer證據(jù)理論的應用[J].信息化縱橫,2009,28(16):80-82.GUO Tao,LI Long-piao,F(xiàn)EI Qing-guo,et al.Application of dempster-Shafer evidence theory in data fusion technology[J].Informationization,2009,28(16):80-82.
[3]Lee MS,Kim Y H.New multitarget data association using OSJPDA algorithm for automotive radar[J].IEICE Transaction on Electronics,2001,E84-c(8):1077-1083.
[4]湯茂斌,謝渝平,李就好.基于神經網絡算法的字符識別方法研究[J].微電子學與計算機,2009,26(8):91-93.TANG Mao-bin,XIE Yu-ping,LI Jiu-hao.Research of character recognition method based on neural network algorithm[J].Microelectronics&Computer,2009,26(8):91-93.
[5]馬寧,常驥.基于BP神經網絡的手寫數(shù)字識別研究[J].哈爾濱師范大學自然科學學報,2009,25(4):89-91.MA Ning,CHANG Ji.Research of handwritten digital recognition based on Back Propagation neural network[J].Natural sciences journal of Harbin Normal University,2009,25(4):89-91.
[6]董方靈,陳劍祥,趙江南.模糊模式識別法在成礦預測中的應用[J].新疆地質,2009,27(3):294-296.DONG Fang-ling,CHEN Jian-xiang,ZHAO Jiang-nan.The application of the fuzzy pattern recognition to predict the mineralization[J].XinJiang Geology,2009,27(3):294-296.
[7]韓峰,朱鐳,智小軍.基于模糊理論的多傳感器數(shù)據(jù)融合測量[J].應用光學,2009,30(6):988-991.HAN Feng,ZHU Lei,ZHI Xiao-jun.Measurement of multi-sensor data fusion method based on fuzzy theory[J].Journal of Applied Optics,2009,30(6):988-991.