于雙芳
(空軍工程大學(xué)航空機務(wù)士官學(xué)校,河南 信陽 464000)
在國內(nèi)外,關(guān)于運動目標(biāo)識別方面的研究已經(jīng)有很久遠(yuǎn)的歷史,最早的體現(xiàn)是在英國完成了車輛圖像識別系統(tǒng);自此,產(chǎn)生了車輛自動識別系統(tǒng),它最先用于被盜車輛的檢測[1]。目前車牌檢測系統(tǒng)的研究在國外已經(jīng)達(dá)到了一個非常高的水平。在國內(nèi),中科院在運動狀態(tài)下檢測目標(biāo)信息方面研究做的較好,它生產(chǎn)的“漢王眼”就是一個優(yōu)秀的產(chǎn)品[5]。在現(xiàn)代,隨著科學(xué)技術(shù)技術(shù)的提高,電子產(chǎn)品性能越來越優(yōu)越,圖像處理技術(shù)的發(fā)展,進(jìn)一步促進(jìn)了圖像識別技術(shù)的發(fā)展,提高了圖像識別系統(tǒng)的性能。
由于運動目標(biāo)的圖像采集是在室外進(jìn)行,天氣的變化直接影響著采集的圖像質(zhì)量好壞,曝光不足或過分曝光的圖像經(jīng)常出現(xiàn),除此之外還有它干擾的存在,都使圖像質(zhì)量下降。因此對原圖像進(jìn)行預(yù)處理,去除原圖像中的干擾信息是必不可少的,而且要保證不增加原圖像額外的信息量,從而達(dá)到增強部分圖像的效果。圖像預(yù)處理方法使用尺寸調(diào)整、亮度校正、灰度化、濾波、銳化和腐蝕。
首先對圖像進(jìn)行字符的分割,為了使單個字符的特征明顯,識別效率高,進(jìn)而使用顏色填充把字符變?yōu)閷嵭捏w,最后對字符進(jìn)行識別。
選用投影法進(jìn)行單個字符的分割[1]。分割結(jié)果見圖1,從圖1 中可以看出投影法對數(shù)字的分割結(jié)果是比較理想的,但對漢字和較小字符的分割結(jié)果不理想,不過可以滿足本研究的要求。

圖1 投影分割方法的結(jié)果
顏色填充常用的一種方法是種子填充,它與邊緣檢測運算剛好相反,互為逆運算。為了保證運動目標(biāo)編號自動識別系統(tǒng)的實時性,本研究選用掃描線種子填充法。
字符識別是根據(jù)每個字符獨有的特征比較分類[3]。字符識別包括漢字的識別、數(shù)字的識別和英文字母的識別,對于數(shù)字和英文字母來說,數(shù)字只有0~9 10個字符,英文大寫字母和小寫字母共52 個[5],都屬于小字符集,提取特征比較容易;而常用漢字就有3 755個[2],其他漢字更是結(jié)構(gòu)復(fù)雜,屬于大字符集,所以提取特征就比較難。字符識別從宏觀上講屬于圖像識別,圖像識別又被稱為模式識別,根據(jù)模式識別的概念,識別一幅圖像,無論圖像中是字符還是景物都是除掉表面現(xiàn)象找出它們的共有特征,然后根據(jù)每個字符獨有的特征進(jìn)行分類。
神經(jīng)網(wǎng)絡(luò)識別是一種人工模擬人腦神經(jīng)網(wǎng)絡(luò)編寫的識別方法[5]。神經(jīng)網(wǎng)絡(luò)識別系統(tǒng)的準(zhǔn)確性和實時性很高[6],BP 神經(jīng)網(wǎng)絡(luò)(Error back propagation neural network)是目前字符識別中經(jīng)常用到的一種識別方法。BP 神經(jīng)網(wǎng)絡(luò)識別流程見圖2。

圖2 BP 神經(jīng)網(wǎng)絡(luò)識別流程
BP 神經(jīng)網(wǎng)絡(luò)與其他識別方法相比,最大的優(yōu)勢在于其分類器含有一個向后傳播神經(jīng)網(wǎng)絡(luò),可以將新訓(xùn)練得到的不理想結(jié)果修正后再次匹配,BP 網(wǎng)絡(luò)分類器見圖3。

圖3 BP 網(wǎng)絡(luò)分類器
BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要權(quán)重系數(shù),但BP 網(wǎng)絡(luò)的權(quán)重系數(shù)不是人為設(shè)置的一個不變系數(shù),它是不斷訓(xùn)練、不斷變化的。BP 網(wǎng)絡(luò)是一種簡單地表示模型,圖4 為三層BP 網(wǎng)絡(luò)簡圖,它分為三層,層與層之間相連,而同層之間的單元沒有聯(lián)系。當(dāng)BP 網(wǎng)絡(luò)輸出層給出的響應(yīng)結(jié)果不正確時,它會向它的前面一級傳送修正[6]。

圖4 三層BP 網(wǎng)絡(luò)簡圖
假設(shè)有N 個訓(xùn)練樣本,對第q(q∈Z)個訓(xùn)練樣本,隱層j 的實際輸出為Oqj,它的第i 個神經(jīng)元的輸出為Oqi,設(shè)

式中:Dqj表示對q 個訓(xùn)練樣本,單元j 的期望輸出[7]。
利用梯度最速下降法,使權(quán)值沿誤差函數(shù)的負(fù)梯度方向改變[7]。若權(quán)值的變化量記為Δwij,即

式中:η 為學(xué)習(xí)因子。
BP 網(wǎng)絡(luò)的訓(xùn)練算法如下:
(1)初始化,給所有節(jié)點一個小閾值;
(2)訓(xùn)練足夠多的樣本圖像,使訓(xùn)練樣本的是正確率達(dá)到要求;
(3)輸出結(jié)果與期望結(jié)果比較,如果在誤差范圍內(nèi),則進(jìn)入下一個樣本的訓(xùn)練,否則執(zhí)行(4);
(4)誤差后向傳播,修正權(quán)重系數(shù)wji(t+1)=wji(t)+ηδqjOqj,再進(jìn)行樣本的訓(xùn)練。
神經(jīng)網(wǎng)絡(luò)識別方法具有好的容錯性,而且識別速度快[8]。所以本研究設(shè)計系統(tǒng)使用BP 神經(jīng)網(wǎng)絡(luò)識別方進(jìn)行運動目標(biāo)編號的識別。
本研究利用上述算法應(yīng)用VC++ 平臺結(jié)合OpenCV 庫編制成一套適用于現(xiàn)場運行的軟件系統(tǒng),本章結(jié)合系統(tǒng)的算法流程圖,下面就根據(jù)算法流程圖對各個模塊的實現(xiàn)進(jìn)行分析說明并給出系統(tǒng)運行結(jié)果。
運動目標(biāo)編號識別自動識別系統(tǒng)主要包含五部分:圖像采集、圖像預(yù)處理、定位、識別、車廂編號提取。
(1)圖像的采集,把運行運動目標(biāo)編號的圖像拍攝下來,作為目標(biāo)圖像。
(2)圖像預(yù)處理,把原圖像尺寸歸一化、校正亮度、銳化、灰度化、濾波以及膨脹與腐蝕。
(3)定位,先把灰度圖像進(jìn)行邊緣檢測二值化,然后對運動目標(biāo)編號區(qū)域定位。
(4)識別,先把定位出的運動目標(biāo)編號區(qū)域中的字符分成單個字符圖像;為了識別更確切,利用種子填充算法把單個字符圖像填充完整,然后再進(jìn)行識別。
(5)運動目標(biāo)編號的提取,把識別出的運動目標(biāo)編號顯示在屏幕上。
3.2.1 圖像的采集
本研究設(shè)計的運動目標(biāo)編號自動識別系統(tǒng)中的圖像采集,直接使用場地現(xiàn)有的圖像采集設(shè)備,這樣不僅可以省去很多復(fù)雜的過程,還可以節(jié)省資源。場地現(xiàn)有設(shè)備是通過傳感器與照相機設(shè)備相連,當(dāng)有運動目標(biāo)經(jīng)過時,傳感器會將感應(yīng)信號轉(zhuǎn)化為動作信號啟動照相機采集圖像,然后將采集的圖像經(jīng)過輸入線路傳輸給運動目標(biāo)編號識別系統(tǒng)。采集的原圖像尺寸為7 728×5 368 像素。
3.2.2 圖像預(yù)處理
由運動目標(biāo)編號自動識別系統(tǒng)算法流程圖可知,圖像預(yù)處理包含尺寸調(diào)整、亮度校正、銳化、灰度化、濾波以及腐蝕[9]。
3.2.3 運動目標(biāo)編號的識別
由運動目標(biāo)編號識別系統(tǒng)算法流程圖可知,運動目標(biāo)編號的識別部分包括字符分割、顏色填充和字符識別。
(1)字符分割,為字符的識別做準(zhǔn)備。本研究設(shè)計的系統(tǒng)選用投影法進(jìn)行單個字符的分割,從實驗結(jié)果中也可以看出,投影法對圖像中數(shù)字的分割結(jié)果是比較理想的,但對較小字符和漢字的分割并不是很準(zhǔn)確,不過這一點對本研究運動目標(biāo)編號的識別提取沒有太大的影響,是可以滿足要求的。
(2)顏色填充,是為了字符識別更準(zhǔn)確。顏色填充這一方法是在實驗的過程中加入的,因為圖像中的數(shù)字8 總是識別不準(zhǔn)確,大部分被識別成了3 或者6,所以這里想利用顏色填充,把字符變成實心體,這樣字符的特征就會變得更多一些,然后再進(jìn)行字符訓(xùn)練,達(dá)到更高的識別率。本研究使用的顏色填充方法是種子填充算法中的掃描填充算法,并在其基礎(chǔ)上加入了一些限制條件,可以從定位出來的車廂編號區(qū)域看出,除了字符邊緣是白色點之外,其他地方都是黑色點,根據(jù)這一特點在找像素段時,當(dāng)遇到像素段只有一端有白色像素點時,這種像素段優(yōu)先填充。
(3)字符識別,識別出有用信息進(jìn)行存儲和顯示,這是本系統(tǒng)的目標(biāo)。運動目標(biāo)編號自動識別系統(tǒng)中,由于外在原因和內(nèi)在條件的影響,存在著很多不利因素,當(dāng)然也有它的便利性。運動目標(biāo)編號區(qū)域的字符集有以下四個特點:
A.小字符集。運動目標(biāo)編號區(qū)域的字符是比較固定的。漢字包括車、空、調(diào)、發(fā)、電等字符;英文字母包括A,K,X,D,T 等字符;數(shù)字包括0~9 10 個字符。
B.單個字符的圖像像素小。運動目標(biāo)編號區(qū)域在圖像中占的比例并不大,定位出的區(qū)域被分割為單個字符之后,圖像變得更加小,增加了識別難度。
C.外界因素干擾大。圖像的采集是在運動目標(biāo)高速運行的情況下進(jìn)行的,而且外界光線的的變化也會給圖像的采集帶來困難,很可能采集的圖像是光線不足或者光線過強,又或者是字符黏連的。
D.相似字符的相互干擾。在字符訓(xùn)練的過程中常出現(xiàn)的一個錯誤就是2 被識別成了Z。
神經(jīng)網(wǎng)絡(luò)分類器比其他分類器多了一個學(xué)習(xí)規(guī)則,更適用于本研究設(shè)計的系統(tǒng),所以選擇BP 神經(jīng)網(wǎng)絡(luò)識別方法。
運用本研究設(shè)計系統(tǒng)對運動目標(biāo)編號進(jìn)行識別的結(jié)果見表1,圖像的識別正確率和平均反應(yīng)時間還是比較理想的。從表1 中可以看出圖像的識別正確率與圖像的質(zhì)量有很大關(guān)系,在下一步的研究中加入圖像融合技術(shù),可以使圖像的質(zhì)量更好,從而提高識別率,但也要保證系統(tǒng)的實時性。

表1 運動目標(biāo)編號識別結(jié)果的統(tǒng)計
本研究研究了現(xiàn)有運行運動目標(biāo)編號定位和識別系統(tǒng)的現(xiàn)狀,查閱了大量國內(nèi)外的技術(shù)文獻(xiàn)和資料。經(jīng)過對三層BP 神經(jīng)網(wǎng)絡(luò)識別方法進(jìn)行識別技術(shù)的研究,提出了一種適用于運動目標(biāo)編號區(qū)域的粗定位和精確定位兩層定位方法。經(jīng)過現(xiàn)場試驗運行,表明本研究設(shè)計的運動目標(biāo)編號自動識別系統(tǒng)對所采集圖像的識別正確率是達(dá)到預(yù)期目標(biāo)的。