運動目標(biāo)編號識別技術(shù)的研究

2022-09-14 06:36:54于雙芳

科學(xué)技術(shù)創(chuàng)新 2022年25期

于雙芳

（空軍工程大學(xué)航空機務(wù)士官學(xué)校，河南信陽 464000）

引言

在國內(nèi)外，關(guān)于運動目標(biāo)識別方面的研究已經(jīng)有很久遠(yuǎn)的歷史，最早的體現(xiàn)是在英國完成了車輛圖像識別系統(tǒng)；自此，產(chǎn)生了車輛自動識別系統(tǒng)，它最先用于被盜車輛的檢測[1]。目前車牌檢測系統(tǒng)的研究在國外已經(jīng)達(dá)到了一個非常高的水平。在國內(nèi)，中科院在運動狀態(tài)下檢測目標(biāo)信息方面研究做的較好，它生產(chǎn)的“漢王眼”就是一個優(yōu)秀的產(chǎn)品[5]。在現(xiàn)代，隨著科學(xué)技術(shù)技術(shù)的提高，電子產(chǎn)品性能越來越優(yōu)越，圖像處理技術(shù)的發(fā)展，進(jìn)一步促進(jìn)了圖像識別技術(shù)的發(fā)展，提高了圖像識別系統(tǒng)的性能。

1 圖像預(yù)處理

由于運動目標(biāo)的圖像采集是在室外進(jìn)行，天氣的變化直接影響著采集的圖像質(zhì)量好壞，曝光不足或過分曝光的圖像經(jīng)常出現(xiàn)，除此之外還有它干擾的存在，都使圖像質(zhì)量下降。因此對原圖像進(jìn)行預(yù)處理，去除原圖像中的干擾信息是必不可少的，而且要保證不增加原圖像額外的信息量，從而達(dá)到增強部分圖像的效果。圖像預(yù)處理方法使用尺寸調(diào)整、亮度校正、灰度化、濾波、銳化和腐蝕。

2 運動目標(biāo)編號的識別

首先對圖像進(jìn)行字符的分割，為了使單個字符的特征明顯，識別效率高，進(jìn)而使用顏色填充把字符變?yōu)閷嵭捏w，最后對字符進(jìn)行識別。

2.1 字符分割

選用投影法進(jìn)行單個字符的分割[1]。分割結(jié)果見圖1，從圖1 中可以看出投影法對數(shù)字的分割結(jié)果是比較理想的，但對漢字和較小字符的分割結(jié)果不理想，不過可以滿足本研究的要求。

圖1 投影分割方法的結(jié)果

2.2 顏色填充

顏色填充常用的一種方法是種子填充，它與邊緣檢測運算剛好相反，互為逆運算。為了保證運動目標(biāo)編號自動識別系統(tǒng)的實時性，本研究選用掃描線種子填充法。

2.3 字符識別

字符識別是根據(jù)每個字符獨有的特征比較分類[3]。字符識別包括漢字的識別、數(shù)字的識別和英文字母的識別，對于數(shù)字和英文字母來說，數(shù)字只有0～9 10個字符，英文大寫字母和小寫字母共52 個[5]，都屬于小字符集，提取特征比較容易；而常用漢字就有3 755個[2]，其他漢字更是結(jié)構(gòu)復(fù)雜，屬于大字符集，所以提取特征就比較難。字符識別從宏觀上講屬于圖像識別，圖像識別又被稱為模式識別，根據(jù)模式識別的概念，識別一幅圖像，無論圖像中是字符還是景物都是除掉表面現(xiàn)象找出它們的共有特征，然后根據(jù)每個字符獨有的特征進(jìn)行分類。

神經(jīng)網(wǎng)絡(luò)識別是一種人工模擬人腦神經(jīng)網(wǎng)絡(luò)編寫的識別方法[5]。神經(jīng)網(wǎng)絡(luò)識別系統(tǒng)的準(zhǔn)確性和實時性很高[6]，BP 神經(jīng)網(wǎng)絡(luò)（Error back propagation neural network）是目前字符識別中經(jīng)常用到的一種識別方法。BP 神經(jīng)網(wǎng)絡(luò)識別流程見圖2。

圖2 BP 神經(jīng)網(wǎng)絡(luò)識別流程

BP 神經(jīng)網(wǎng)絡(luò)與其他識別方法相比，最大的優(yōu)勢在于其分類器含有一個向后傳播神經(jīng)網(wǎng)絡(luò)，可以將新訓(xùn)練得到的不理想結(jié)果修正后再次匹配，BP 網(wǎng)絡(luò)分類器見圖3。

圖3 BP 網(wǎng)絡(luò)分類器

BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要權(quán)重系數(shù)，但BP 網(wǎng)絡(luò)的權(quán)重系數(shù)不是人為設(shè)置的一個不變系數(shù)，它是不斷訓(xùn)練、不斷變化的。BP 網(wǎng)絡(luò)是一種簡單地表示模型，圖4 為三層BP 網(wǎng)絡(luò)簡圖，它分為三層，層與層之間相連，而同層之間的單元沒有聯(lián)系。當(dāng)BP 網(wǎng)絡(luò)輸出層給出的響應(yīng)結(jié)果不正確時，它會向它的前面一級傳送修正[6]。

圖4 三層BP 網(wǎng)絡(luò)簡圖

假設(shè)有N 個訓(xùn)練樣本，對第q（q∈Z）個訓(xùn)練樣本，隱層j 的實際輸出為Oqj，它的第i 個神經(jīng)元的輸出為Oqi，設(shè)

式中：Dqj表示對q 個訓(xùn)練樣本，單元j 的期望輸出[7]。

利用梯度最速下降法，使權(quán)值沿誤差函數(shù)的負(fù)梯度方向改變[7]。若權(quán)值的變化量記為Δwij，即

式中：η 為學(xué)習(xí)因子。

BP 網(wǎng)絡(luò)的訓(xùn)練算法如下：

（1）初始化，給所有節(jié)點一個小閾值；

（2）訓(xùn)練足夠多的樣本圖像，使訓(xùn)練樣本的是正確率達(dá)到要求；

（3）輸出結(jié)果與期望結(jié)果比較，如果在誤差范圍內(nèi)，則進(jìn)入下一個樣本的訓(xùn)練，否則執(zhí)行（4）；

（4）誤差后向傳播，修正權(quán)重系數(shù)wji（t+1）=wji（t）+ηδqjOqj，再進(jìn)行樣本的訓(xùn)練。

神經(jīng)網(wǎng)絡(luò)識別方法具有好的容錯性，而且識別速度快[8]。所以本研究設(shè)計系統(tǒng)使用BP 神經(jīng)網(wǎng)絡(luò)識別方進(jìn)行運動目標(biāo)編號的識別。

3 運動目標(biāo)編號自動識別系統(tǒng)的實現(xiàn)

本研究利用上述算法應(yīng)用VC++ 平臺結(jié)合OpenCV 庫編制成一套適用于現(xiàn)場運行的軟件系統(tǒng)，本章結(jié)合系統(tǒng)的算法流程圖，下面就根據(jù)算法流程圖對各個模塊的實現(xiàn)進(jìn)行分析說明并給出系統(tǒng)運行結(jié)果。

3.1 運動目標(biāo)編號自動識別系統(tǒng)算法流程圖

運動目標(biāo)編號識別自動識別系統(tǒng)主要包含五部分：圖像采集、圖像預(yù)處理、定位、識別、車廂編號提取。

（1）圖像的采集，把運行運動目標(biāo)編號的圖像拍攝下來，作為目標(biāo)圖像。

（2）圖像預(yù)處理，把原圖像尺寸歸一化、校正亮度、銳化、灰度化、濾波以及膨脹與腐蝕。

（3）定位，先把灰度圖像進(jìn)行邊緣檢測二值化，然后對運動目標(biāo)編號區(qū)域定位。

（4）識別，先把定位出的運動目標(biāo)編號區(qū)域中的字符分成單個字符圖像；為了識別更確切，利用種子填充算法把單個字符圖像填充完整，然后再進(jìn)行識別。

（5）運動目標(biāo)編號的提取，把識別出的運動目標(biāo)編號顯示在屏幕上。

3.2 功能模塊與實驗結(jié)果分析

3.2.1 圖像的采集

本研究設(shè)計的運動目標(biāo)編號自動識別系統(tǒng)中的圖像采集，直接使用場地現(xiàn)有的圖像采集設(shè)備，這樣不僅可以省去很多復(fù)雜的過程，還可以節(jié)省資源。場地現(xiàn)有設(shè)備是通過傳感器與照相機設(shè)備相連，當(dāng)有運動目標(biāo)經(jīng)過時，傳感器會將感應(yīng)信號轉(zhuǎn)化為動作信號啟動照相機采集圖像，然后將采集的圖像經(jīng)過輸入線路傳輸給運動目標(biāo)編號識別系統(tǒng)。采集的原圖像尺寸為7 728×5 368 像素。

3.2.2 圖像預(yù)處理

由運動目標(biāo)編號自動識別系統(tǒng)算法流程圖可知，圖像預(yù)處理包含尺寸調(diào)整、亮度校正、銳化、灰度化、濾波以及腐蝕[9]。

3.2.3 運動目標(biāo)編號的識別

由運動目標(biāo)編號識別系統(tǒng)算法流程圖可知，運動目標(biāo)編號的識別部分包括字符分割、顏色填充和字符識別。

（1）字符分割，為字符的識別做準(zhǔn)備。本研究設(shè)計的系統(tǒng)選用投影法進(jìn)行單個字符的分割，從實驗結(jié)果中也可以看出，投影法對圖像中數(shù)字的分割結(jié)果是比較理想的，但對較小字符和漢字的分割并不是很準(zhǔn)確，不過這一點對本研究運動目標(biāo)編號的識別提取沒有太大的影響，是可以滿足要求的。

（2）顏色填充，是為了字符識別更準(zhǔn)確。顏色填充這一方法是在實驗的過程中加入的，因為圖像中的數(shù)字8 總是識別不準(zhǔn)確，大部分被識別成了3 或者6，所以這里想利用顏色填充，把字符變成實心體，這樣字符的特征就會變得更多一些，然后再進(jìn)行字符訓(xùn)練，達(dá)到更高的識別率。本研究使用的顏色填充方法是種子填充算法中的掃描填充算法，并在其基礎(chǔ)上加入了一些限制條件，可以從定位出來的車廂編號區(qū)域看出，除了字符邊緣是白色點之外，其他地方都是黑色點，根據(jù)這一特點在找像素段時，當(dāng)遇到像素段只有一端有白色像素點時，這種像素段優(yōu)先填充。

（3）字符識別，識別出有用信息進(jìn)行存儲和顯示，這是本系統(tǒng)的目標(biāo)。運動目標(biāo)編號自動識別系統(tǒng)中，由于外在原因和內(nèi)在條件的影響，存在著很多不利因素，當(dāng)然也有它的便利性。運動目標(biāo)編號區(qū)域的字符集有以下四個特點：

A.小字符集。運動目標(biāo)編號區(qū)域的字符是比較固定的。漢字包括車、空、調(diào)、發(fā)、電等字符；英文字母包括A，K，X，D，T 等字符；數(shù)字包括0～9 10 個字符。

B.單個字符的圖像像素小。運動目標(biāo)編號區(qū)域在圖像中占的比例并不大，定位出的區(qū)域被分割為單個字符之后，圖像變得更加小，增加了識別難度。

C.外界因素干擾大。圖像的采集是在運動目標(biāo)高速運行的情況下進(jìn)行的，而且外界光線的的變化也會給圖像的采集帶來困難，很可能采集的圖像是光線不足或者光線過強，又或者是字符黏連的。

D.相似字符的相互干擾。在字符訓(xùn)練的過程中常出現(xiàn)的一個錯誤就是2 被識別成了Z。

神經(jīng)網(wǎng)絡(luò)分類器比其他分類器多了一個學(xué)習(xí)規(guī)則，更適用于本研究設(shè)計的系統(tǒng)，所以選擇BP 神經(jīng)網(wǎng)絡(luò)識別方法。

運用本研究設(shè)計系統(tǒng)對運動目標(biāo)編號進(jìn)行識別的結(jié)果見表1，圖像的識別正確率和平均反應(yīng)時間還是比較理想的。從表1 中可以看出圖像的識別正確率與圖像的質(zhì)量有很大關(guān)系，在下一步的研究中加入圖像融合技術(shù)，可以使圖像的質(zhì)量更好，從而提高識別率，但也要保證系統(tǒng)的實時性。

表1 運動目標(biāo)編號識別結(jié)果的統(tǒng)計

4 結(jié)論

本研究研究了現(xiàn)有運行運動目標(biāo)編號定位和識別系統(tǒng)的現(xiàn)狀，查閱了大量國內(nèi)外的技術(shù)文獻(xiàn)和資料。經(jīng)過對三層BP 神經(jīng)網(wǎng)絡(luò)識別方法進(jìn)行識別技術(shù)的研究，提出了一種適用于運動目標(biāo)編號區(qū)域的粗定位和精確定位兩層定位方法。經(jīng)過現(xiàn)場試驗運行，表明本研究設(shè)計的運動目標(biāo)編號自動識別系統(tǒng)對所采集圖像的識別正確率是達(dá)到預(yù)期目標(biāo)的。