999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進卷積神經網絡的手寫試卷分數識別方法

2020-08-20 04:04:00仝夢園金守峰尹加杰
西安工程大學學報 2020年4期
關鍵詞:特征

仝夢園,金守峰,陳 陽,李 毅,尹加杰

(西安工程大學 機電工程學院/西安市現代智能紡織裝備重點實驗室,陜西 西安 710048)

0 引 言

試卷作為評價學生學習效果的主要形式,評閱過程主要以人工進行閱卷及分數統計,但人工閱卷及分數統計過程中存在勞動強度大、人為主觀統計誤差等問題。機器評閱作為輔助手段,主要在客觀題中大量使用,但是設備價格貴,需要特定的答題卡。隨著深度學習在人工智能技術的快速發展,在語音、手寫數字識別等領域受到廣泛關注[1-2]。

近年來,手寫字符識別已應用于快遞表單[3]、條碼識別[4]、數字表盤抄表[5]、檔案信息[6]等各方面,應用深度學習技術的手寫字符識別可分為傳統模型、模型改進與新模型。在傳統模型階段,陳龍等分別通過對各傳統模型進行手寫體數字識別,驗證了BP神經網絡效果較好[7]。在模型改進階段,通過對卷積神經網絡[8]、VGG-16網絡改進[9]與LeNet-DL網絡[10]等的改進使手寫字符識別得到更好地識別。為了進一步提高識別的準確率與效率,魏明俊等提出了一種帶PCA卷積的稀疏表示分類算法,解決卷積核訓練困難的問題[11];楊怡等提出了一種結合評判函數Silhouette改進的AP聚類算法,實現手寫字符的識別[12];Kang等提出在不需要任何預處理任務,通過編碼器、CNN和雙向GRU的手寫體識別模型,能夠逐字符拼寫相應的單詞,但是出現大寫字母時,識別過程會出錯[13];Wang等提出了一種新的具有密集連接結構的自由基分析網絡(DenseRAN),使DenseRAN具有識別未見漢字類的能力,但是識別的種類有限[14];劉慶等基于稀疏自編碼器和卷積神經網絡,提出新的CNN模型,克服了帶標簽訓練數據樣本不足的問題,還可以提取有效特征以加速網絡收斂[15];任曉奎等提出了一種多分類器下無分割手寫數字字符串識別算法,使用動態選擇策略,以避免長度分類器誤分類對識別結果的影響[16];Mohamad等提出了一種基于HSA的元啟發式方法,采用Freeman鏈碼作為數據表示,求解HCR最短路徑長度和最短的計算時間[17];Roy等提出了一種基于深度架構的串聯方法,用于無限制的手寫筆跡識別,充分利用隱藏在文檔圖像中的監督信息,并解決識別任務[18];楊鐘亮等提出了一種基于sEMG的KF-LSTM模型,實現由sEMG信號預測并重建手寫數字的軌跡,但是需要按住按鈕來完成數字圖像的繪制,與平時書寫習慣不完全匹配,會造成人手疲勞[19]。

針對人工評閱強度大、效率低等問題,文中采用圖像分割來簡化手寫分數識別的類別,通過構建卷積神經網絡提取特征,PCA進行降維,應用貝葉斯分類器實現數字分類,提高分數識別的準確性與效率。

1 分數提取

1.1 試卷圖像校正

由于圖像存在噪聲、光照等干擾,本文采用直方圖增強、中值濾波及同態濾波等預處理算法對圖像進行處理,以提高圖像質量。由于試卷成像過程中的隨機放置會導致圖片發生傾斜,對手寫數字的提取造成影響,本文對預處理后的圖像建立旋轉模型,計算分數欄與水平方向的夾角來進行旋轉校正。對原圖進行最大類間方差法的圖像分割獲得標題欄區域后,應用Canny算子提取邊緣特征建立如圖1(a)所示的計算模型,點A(x1,y1)為標題欄上邊緣除原點外任意一點,點B(x2,y2)為x軸上的任意一點,分別與原點構成向量OA和向量OB,根據向量數量積運算原理來計算它們之間的夾角,表達式為

(1)

式中:θ為圖像旋轉角。根據計算的旋轉角,進行旋轉校正補償,并二值化后的圖像如圖1(b)所示。

(a) 原圖

1.2 分數區域分割

在試卷圖像采集視場高度一定的前提下,成像大小是一致的,每個圖像中分數欄線框的大小都是一致的,通過計算每個分數欄區域內的像素來判別是否存在手寫數值,對分隔欄進行一次分割如圖2(a)所示。對于單個手寫數字0~9之間的像素范圍為36~65,2個手寫數字的像素數范圍將大于71,超過單個最大像素數的圖像則判定為存在左端數字部分。根據區域分割法,將每個分數欄中的分數進行一次分割,對于分數欄中超過單個最大像素的圖像進行二次分割,分割后的圖像如圖2(b)所示。對分割后的圖像進行圖像透視變換,轉換為28×28的子圖,作為神經網絡訓練的樣本。

(a) 一次分割

2 分數求和理論模型

2.1 卷積神經網絡框架

為提高手寫試卷分數的精度,本文構建如圖3所示的卷積神經網絡模型,由輸入層、第1卷積層(用C1表示)、第1池化層(用S1表示)、第2卷積層(用C2表示)、第2池化層(用S2表示)、輸出層組成。輸入層為分割后的28×28的手寫分數圖像;C1層由8個5×5的濾波器對輸入圖像進行卷積;C2由18個5×5的濾波器對S1的輸出圖像進行卷積;S1與S2層用2×2的窗口,以步長為2進行最大池化采樣;輸出層為手寫分數圖像的特征。卷積過程中ReLU函數作為激活函數,學習率為2.4。

圖 3 CNN網絡結構的設計

2.2 基于PCA的數據降維

通過卷積神經網絡提取單幅圖像的特征為288維,由于構建卷積神經網絡導致特征維數較多,影響識別效率,因此本文采用PCA方法對數據進行降維,將卷積神經網絡提取的18層4×4的特征組成18條16維的數據,將數據排成16行18列的矩陣Am×n,先對Am×n進行零均值化表達式為

(2)

之后,對協方差矩陣C進行求取,表達式為

(3)

式中:m表示樣本個數。同時求出協方差矩陣的特征值λ1,λ2,…,λk。

最后,對特征向量按照對應特征值λ大小從上到下按行排列成矩陣B,Y=BA即為降維后的k維矩陣。特征貢獻率的表達式為

(4)

通過分析不同特征累計貢獻率下數字的識別效果,在Mnist數據庫中驗證最優的特征識別率,得出特征累計貢獻率與識別率的關系如圖4所示。

圖 4 特征累計貢獻率與識別率的關系

如圖4所示,特征累計貢獻率為95%時,由于剔除了特征中冗余信息,因此識別準確率最高。將特征提取后的原始數據與降維后數據進行對比,得到對全部訓練集的訓練次數與時間和識別準確率之間的關系如表1所示。

表 1 原始數據與PCA降維的對比

如表1所示,將特征從288維降到144維后,依然保持著較高的準確率,但是算法消耗的時間節省約51%。

2.3 融合貝葉斯分類器的識別分類

通過降維后需要實現手寫數字的識別分類,由于特征降維后的特征數量減少,且數字識別分類為多分類問題,本文通過融合貝葉斯分類器對手寫數字進行分類。

貝葉斯分類器是對訓練數據集中圖像的特征進行獨立性假設,對輸入的特征利用貝葉斯公式求出后驗概率的最大輸出,進而實現數字的分類。假設一個待分類樣本H(h1,h2,…,hm),類別集合表示為Ω(ω1,ω2,…,ωn),對樣本H判別分類,就是求取后驗概率的最大值。先計算先驗概率,其表達式為

(5)

式中:Ni為數字i的樣本數;N為樣本總數;P(ωi)為類別數字i的先驗概率。

之后,計算每個類別的條件概率,其表達式為

P=(H|ωi)=P(h1,h2,…,hm|ωi)

(6)

式中:P(H|ωi)訓練集中每個類別的條件概率。

最后,求取后驗概率,其表達式為

P(ωi|H)=P(ωi)P(H|ωi)/P(ω0)P(H|ω0)+

P(ω1)P(H|ω1)+…+P(ωn)P(H|ωn)

(7)

式中:P(ωi|H)為后驗概率。

由于本文實現的是手寫數字多分類問題,為體現預測結果和實際結果的差別,選擇對數損失函數,其表達式為

L(Ω,P(Ω|H))=-lgP(Ω|H)

(8)

對手寫試卷分數欄進行預處理后,通過輸入卷積神經網絡提取特征,經過PCA降維,融合貝葉斯分類器進行分類識別,直接輸出圖像的類別。實現端到端的學習方法,不用對各部分問題進行方法的選擇與分析。

2.4 分數求和模型

在識別出手寫數字后,需要將識別結果與分數欄區域相匹配進行分數的求和,由于單個分數欄中的分數不能出現3位數的成績,只存在單個數字和2位數字,因此在二次分割的分數欄區域進行標記的基礎上,建立分數求和模型為

(9)

式中:zi為統計的分數;i為分隔欄數量;f為二次分割中十位左邊的分數;g表示為進行二次分割中右邊的分數。

3 實驗分析

3.1 算法對比

為了驗證本文算法的效率,采用Mnist數據庫分別與文獻[20]和文獻[21]的算法進行對比分析,實驗結果如表2所示。

表 2 實驗對比結果

由表2可知,本文算法的識別率較高,算法耗時短,具有較好的效率。

3.2 分數識別與求和

本文以液壓傳動及控制技術、互換性與測量技術與機械設計基礎這3門專業核心課程的試卷來驗證本文算法的可行性。每門課程的開課班級為12個班共計396份試卷,3門課共計1 188份試卷。

對3門課程各396份試卷分數,通過預處理將每組手寫分數欄整理成28×28的圖片作為樣本輸入,將本文算法與文獻[20]、文獻[21]算法對手寫試卷分數進行識別,實驗統計數據如表3所示。

表 3 分數識別數據

如表3所示,本文算法對3門課程共計1 188份試卷識別的平均準確率為98.23%,平均每份試卷識別時間為7.5 s,與文獻[20]、文獻[21]進行對比,準確率高,耗時短。本文算法的識別平均準確率為98.23%,其1.77%的錯誤率主要來源于,在試卷分數欄圖像采集過程中會出現手寫數字不規范、數字與分數欄有交叉等情況。

4 結 論

1) 本文通過對手寫試卷圖像的采集、對分數欄的提取以及分割處理等將手寫分數簡化為單個數字識別的問題。

2) 本文算法通過卷積神經網絡提取圖像的特征,為實現效率采用PCA進行特征降維,融合貝葉斯分類器實現數字的分類,在Mnist數據庫中實現較高的識別率。

3) 將本文算法對手寫試卷各欄分數進行識別,通過各欄分數的統計,得到3門課程共計1 188份試卷識別的平均準確率為98.23%,平均每份試卷識別時間為7.5 s,證明了算法的實用性。

4) 解決人工評閱試卷耗時長的問題,為提高手寫試卷的識別質量以及統計準確率,后面需要進一步提高圖像采集質量與優化算法。

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 在线精品自拍| 欧美在线观看不卡| 91在线精品麻豆欧美在线| 99精品视频在线观看免费播放| 中文无码精品a∨在线观看| 中国一级特黄视频| 婷婷六月综合网| 人禽伦免费交视频网页播放| 国产成人永久免费视频| 中文国产成人久久精品小说| 欧美精品在线免费| 久久99久久无码毛片一区二区| 91香蕉视频下载网站| 亚洲天堂网视频| 欧类av怡春院| 亚洲视频免费在线看| www.亚洲一区二区三区| 国产伦片中文免费观看| 婷婷六月激情综合一区| 在线观看91精品国产剧情免费| 欧美午夜理伦三级在线观看| 少妇精品在线| 91精品最新国内在线播放| 亚洲第一视频网站| 九九热视频精品在线| 国产97视频在线| 中文字幕av一区二区三区欲色| 无遮挡国产高潮视频免费观看| 国产亚洲精品自在久久不卡 | av大片在线无码免费| 国产日韩欧美中文| 国产欧美日韩在线在线不卡视频| 日本高清有码人妻| 亚洲无码高清视频在线观看| 最近最新中文字幕在线第一页| 国产无吗一区二区三区在线欢| 在线视频亚洲欧美| 亚洲欧洲日本在线| 国产自在线播放| 亚洲床戏一区| 欧美日韩在线国产| 久久综合结合久久狠狠狠97色| 91久久偷偷做嫩草影院| 午夜爽爽视频| 国产欧美日韩精品第二区| 国产青榴视频| 中文字幕 91| 中文字幕在线免费看| 国产噜噜在线视频观看| 国产精品免费福利久久播放| 97视频在线观看免费视频| 午夜成人在线视频| 免费不卡在线观看av| 久久精品这里只有精99品| 亚洲欧美激情小说另类| 亚洲va欧美ⅴa国产va影院| 天堂成人在线| 久久久久国产精品熟女影院| 亚洲国产综合第一精品小说| 亚洲自拍另类| 国产日韩欧美一区二区三区在线| 国产亚洲高清在线精品99| 日韩在线2020专区| 亚洲动漫h| 亚洲综合一区国产精品| www.精品国产| 亚洲男人天堂网址| 激情综合图区| 亚洲精品成人片在线观看 | 久久久久久尹人网香蕉| 国产男女免费视频| 在线看片国产| 国产精品漂亮美女在线观看| 精品少妇三级亚洲| 福利片91| 一级片一区| 亚洲不卡影院| 亚洲午夜国产精品无卡| 成人免费一级片| 国内精品久久人妻无码大片高| 99久久国产精品无码| 亚洲第一成年人网站|