摘 要:利用CCD對LCD數碼顯示字符進行采集,在分析圖像處理和神經網絡理論的基礎上,采用網格法與交線特征提取法,對LCD數顯字符進行識別,為具有LCD數顯而與計算機無標準通信接口的儀器儀表設備提供一種實用的無線接口。實驗表明,系統對LCD數顯字符采集方便,識別率高,并且抗干擾能力強。
關鍵詞:CCD采集;圖像處理;BP神經網絡;字符識別
中圖分類號:TM932;TP216 文獻標識碼:B
文章編號:1004373X(2008)0116402
LCD Display Character Acquisition and Recognition Based on CCD
and BP Artificial Neural Network
ZHONG Liangping,WANG Wei
(China Jiliang University,Hangzhou,310018,China)
Abstract:The LCD display character is acquisited by CCD,after analysis with image process and artificial neural network theory,through grid and intersecting lines to pick up the character′s characteristic,recognize LCD display character,provide with a kind of interface for the instruments and equipments which have no standard interface with the computer but have a LCD display.The experiment result shows that the system acquire and recognize LCD display character is very successfully,and high anti-jamming ability.
Keywords:CCD acquisition;image processing;BP neural network;character recognition
隨著技術的發展,現在的儀器儀表設備越來越多地采用LCD顯示,LCD數碼顯示具有功耗低、無閃爍等很多優點。然而,很多的儀器儀表設備并沒有提供數據存儲空間和與計算機通信的標準接口,使得LCD所顯示字符難以傳輸給計算機處理并存儲。文章在分析圖像處理和神經網絡理論的基礎上,實現LCD數碼顯示字符的快速采集、識別與存儲。
1 系統實現
基于CCD和神經網絡的LCD數顯字符采集與識別系統平臺框圖如圖1所示。
先利用CCD采集LCD數顯字符圖像并傳輸給計算機,再將改進的BP神經網絡用于LCD數顯字符識別,最后存儲于計算機上。系統主要由CCD圖像采集、圖像預處理和神經網絡幾部分組成。
1.1 圖像預處理
圖像預處理是特征提取和神經網絡字符識別的前提,圖像預處理的好壞直接影響字符識別結果,文章圖像預處理主要有256級灰度化、中值濾波、區域定位、二值化、傾斜調整、字符分割、歸一化、重排。
1.1.1 濾波
中值濾波[1]能在保護圖像邊緣的同時去除噪聲,即采用一個滑動窗口,將窗口中各點灰度值的中值來替代指定點(一般是指窗口的中心點)的灰度值。對于奇數個元素時,中值指按大小順序排序后中間的數值。對于偶數個元素,中值指按大小順序排序后中間兩元素灰度值的平均值。
1.1.2 LCD區域定位與二值化
多次實驗表明,一般LCD經CCD采集并256級灰度后,LCD區域的灰度級幾乎都在175左右,所以,可以根據這個灰度級定位LCD區域,圖2為LCD數顯表面256級灰度圖。然后對定位后的區域進行二值化,二值化[1]對于特征的提取非常重要,文章采用局部自適應閾值化,圖3為區域定位分割后二值化圖。
1.1.3 字符分割
字符分割采用投影法[2],由于LCD數碼字符之間具有一定的間隔,這個間隔就是字符分割的依據,對字符圖像進行垂直投影,相鄰字符之間間隔的投影值正好處于波谷處,此處正好為字符分割位置。
1.2 BP神經網絡字符識別
BP(Back Propagation)神經網絡于1986年由Rumelhant和McClelland提出,是目前應用最為廣泛和成功的神經網絡之一[3],學習過程由信號的正向傳播和誤差的反向傳播兩個階段組成[4,5]。BP神經網絡設計主要有特征提取、輸入、輸出和隱層節點設計。
1.2.1 特征提取
采用網格法與交線特征提取法,把整個歸一化后的字符區域全部象素作為特征,文章網格大小為一個象素大小,黑色象素取1,白色取0(因為LCD顯示字符一般為黑色),將字符歸一化到8*16象素大小,通過網格法提取128個特征。再根據交線法提取特征,利用3條豎線和4條橫線在豎直和水平方向把字符分別分成4份和5份。如字符“0”,4條橫線穿過這個字符,有8個交點,3條豎線有6個交點,圖4為字符“0”水平交線圖。所有字符中在水平方向交點最多為 8個,豎直方向最多為9個,再對水平和豎直方向交點共同編碼,如字符“9”水平方向有6個交點,豎直方向9交點,則按交線交點順序可編碼為(10101111111111111),共17個交線特征,為增加交線特征的網絡影響能力,交線特征編碼重復取4次得68個輸入特征,再加上網格法提取的特征總共196個,作為輸入特征。
1.2.2 I/O及隱層節點數設計
提取了196個特征,即輸入節點196個。識別字符主要由0~9和小數點共11個字符組成,采用“N-1”表示法,取4個輸出神經元。如輸入字符“ 1”,輸出用(01,01,01,09)表示,取01和09,不取0和1主要是因為選擇的神經元功能函數是單極性Sigmoid函數,輸出只能無限趨近0和1。隱層節點數設計先由經驗公式m=n*l(m為隱層節點數,n為輸入節點數,l為輸出節點)確定初值,然后試湊得出最佳節點數,實驗試得隱層最佳節點數為28個。
1.2.3 BP神經網絡的改進
改進BP算法主要是增加動量項和調整學習步長。增加動量項之后,當上次調整與本次調整梯度方向相同時,起加速作用,不同起阻尼作用[6],文章動量系數取06。讓學習步長在學習過程中自動調整,學習步長η初值取02,對訓練中權值的修正值進行檢查分析,看他是否真正減小了誤差,若權值的修正確實減小了誤差,則增大學習步長,否則,應減小學習步長。文章學習步長η調整公式如下:
2 實驗結果
本實驗利用系統平臺采集了LCD數碼字符樣本220個,即每個字符20個樣本。取132個為訓練樣本(剩下的88個作為測試樣本),將訓練樣本按奇偶分成兩部分,采用交叉訓練法以提高網絡的魯棒性,訓練時間約為1~5 s。對132個訓練樣本本身進行識別,正確率為100%,對剩下的88個測試樣本進行識別,正確率為9886%,訓練好后采集識別并存儲每塊LCD上數顯字符總時間約為02~05 s,圖5為字符識別結果圖。
3 結 語
利用CCD和神經網絡對LCD數顯字符采集與識別,實驗表明,采集方便、識別速度快、抗干擾能力強、正確率高。增加訓練樣本數和提取適當的特征,可以進一步提高正確率。系統可用于LCD數顯字符采集錄入,為很多帶有LCD數顯而又與計算機無標準通信接口的儀器儀表設備提供很好的接口,同時,可以推廣到LED數碼顯示及其他字符采集錄入系統中。
參 考 文 獻
[1][日]田村秀行.計算機圖像處理[M].北京:科學出版社,2004.
[2]劉興,蔣天發.車牌字符圖像分割技術的研究與應用[J].武漢大學學報:自然科學版,2006,39(6):125-128.
[3]朱大奇,史慧.人工神經網絡原理及應用[M].北京:科學出版社,2006.
[4]Silva F M,Almeida L B.Speeding up back Propagation[J].Advanced Neural Networks,1988(1):131-139.
[5]Van Ooyen A,Nienhuis B.Improving the Convergence of the Back Propagation Algorithm[J].Neural Networks,1992,5:465-471.
[6]胡伍生,沙月進.神經網絡BP算法的誤差分級迭代法[J].東南大學學報:自然科學版,2003,33(3):376-378.
作者簡介 鐘亮平 男,1981年出生,江西永豐縣人,中國計量學院機電工程學院碩士研究生。主要從事檢測技術方面的研究。
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。”