唐守鋒, 史經(jīng)燦, 周楠, 趙仁慈, 仝光明, 黃潔
(中國礦業(yè)大學(xué) 信息與控制工程學(xué)院, 江蘇 徐州 221116)
儀器儀表顯示值的識別在機(jī)器人自動巡檢、自動檢定系統(tǒng)示值讀取等應(yīng)用領(lǐng)域必不可少。目前數(shù)顯儀表的顯示方式主要有數(shù)碼管和液晶2種。常用的甲烷傳感器多為非色散紅外甲烷傳感器,主要采用數(shù)碼管顯示。甲烷傳感器自動檢定系統(tǒng)采集傳感器數(shù)值圖像時(shí),由于傳感器本身材質(zhì)存在光反射,且顯示面板上有附著物,采集到的數(shù)值圖像質(zhì)量較差,對字符識別造成困難,降低了識別準(zhǔn)確率。
基于機(jī)器學(xué)習(xí)的檢測算法是一種常用的儀表字符識別方法,可以很好地解決傳統(tǒng)圖像處理方法對圖像噪聲敏感且魯棒性差的問題。這類算法中,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和支持向量機(jī)(Support Vector Machine,SVM)表現(xiàn)突出并逐漸成為主流。文獻(xiàn)[1]將圖像預(yù)處理方法與模板匹配結(jié)合使用進(jìn)行數(shù)值圖像識別,實(shí)時(shí)性好,但識別率較低。文獻(xiàn)[2-4]分別使用BP神經(jīng)網(wǎng)絡(luò)和CNN對數(shù)字儀表進(jìn)行識別,不僅可以識別儀表字符圖像和小數(shù)點(diǎn),還可以識別儀表字輪圖像,但識別率較低。文獻(xiàn)[5-6]提出了一種基于CRNN的識別方法,結(jié)合CNN和深度循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)進(jìn)行聲紋個(gè)體識別,識別率高,但忽略了網(wǎng)絡(luò)模型輸出數(shù)據(jù)量大小,算法運(yùn)行時(shí)間較長。文獻(xiàn)[7]以SSD(Single Shot MultiBox Detector)為算法框架基礎(chǔ),有效解決了文字識別問題,但算法運(yùn)行速度較慢。文獻(xiàn)[8]采用FasterR-CNN網(wǎng)絡(luò)對存在擁擠、遮擋等情況的圖像進(jìn)行識別,其優(yōu)點(diǎn)是魯棒性強(qiáng)。文獻(xiàn)[9]提出的YOLOv3網(wǎng)絡(luò)具有很好的實(shí)時(shí)性,但對相似目標(biāo)的檢測效果很差。……