馬建宇 孟祥 趙瑩

摘要:針對傳統手寫體數字識別精度不高的問題,本文設計了一種基于脈沖神經神經網絡的手寫體數字識別算法。該算法首先對輸入的手寫體數字進行預處理,然后提取手寫體數字的二值圖像輪廓和筆畫次序等結構特征,最后根據脈沖神經網絡模型分類,預測測試集合樣本。該算法在MNIST字體庫里的數據進行實驗,精度可達98.7%,優于其它識別算法。
關鍵詞:手寫體數字識別;預處理;脈沖神經網絡
中圖分類號:TP391.41;TP183 文獻標識碼:A 文章編號:1007-9416(2019)05-0081-01
0 引言
手寫體數字識別屬于模式識別問題,在金融、財稅和數據識別領域有著廣泛的應用。手寫體數字識中最重要的部分是手寫體數字圖像識別時的特征提取,而脈沖神經網路具有較好的圖像特征提取能力[1-4],因此應用該算法可以使手寫體數字識別精度得到很大的提高,實驗結果表明,精度可達到98.7%,明顯優于其它算法。
1 手寫體數字識別流程
手寫體數字識別流程如圖1所示。
1.1 脈沖神經網絡
這個模型表示一個神經元的電位[5],膜電位V(t)由微分方程演化為:
當V(t)≥VT,一個脈沖被發出并傳送到下游的突觸,在脈沖后,膜電位被重置為其靜態值,我們在仿真時設EL=-70mv,VT=20mv,C=300pF,gL=30nS。生物神經元在一個脈沖發出后立即進入一個不應期,在此期間另一個脈沖不能發出。我們通過將膜電位保持在V(t)=EL的短時間內,在產生一個尖峰后,tref=3ms來實現這一點。我們還通過剪切將膜電位限制在[EL,VT]范圍內。到達突觸的脈沖的權值為w,將在其下游神經元產生后突觸電流(Isyn(t)),表達式如下[6]:
這里,ti表示第i個到達的脈沖的時間;*是卷積運算符號;變量 τ1 =5msand,τ2=1.25ms分別表示c(t)的下降和上升時間常數。
1.2 網絡結構
我們建立的脈沖神經網絡模型包括三層[7],即輸入層、卷積層和輸出層,結構如圖2所示。由于MNIST圖像為28×28像素,我們的網絡輸入層有784個神經元,輸出層有10個神經元,每個神經元對應一個特定的數字。輸入層神經元通過12個事先固定的3×3大小的卷積核與8112個隱層神經元連接。連接這個隱藏層和輸出層的突觸使用NormAD算法[8]進行訓練。
2 結果與分析
本文采用MNIST數據集里的50000張手寫體數字做訓練,選擇5000張做測試實驗,得測試結果如表1所示,從表中數據可以看出,本文提出的算法的手寫體數字的識別精度優于其它三種算法。
3 結語
本文提出了一種用于手寫數字識別的高度緊湊、高效的三層脈沖神經網絡,該神經網絡對MNIST數據集的正確率達到98.7%。網絡中的所有信息都以稀疏的生物峰速率在峰域內編碼和處理。我們的研究表明,與簡單的速率編碼方法相比[4],使用脈沖精確時間進行分類具有較好的準確性。
參考文獻
[1] 朱書眉.基于卷積神經網絡的手寫體數字識別[J].數字技術與應用,2018,36(11):44-46.
[2] Shruti R. Kulkarni. Spiking neural networks for handwritten digit recognition—Supervised learning and network optimization[J]. Neural networks,2018(103):118-127.
[3] 高諾.采用卷積神經網絡的數字手寫體識別的研究[J].齊魯工業大學學報,2018,32(5)45-49.
[4] 馬媛媛.卷積神經網絡及其在手寫體數字識別中的應用[J].湖北工程學院學報,2017,37(6):66-72.
[5] 辛平.三相電流型PWM整流器的能量成型控制[J].煤礦機械,2016,37(8):132-134.
[6] 劉德君.基于能量成型的雙足機器人解耦控制[J].控制與決策,2012,27(12):1890-1892.
[7] 曲萍萍.一種有效的組合電路測試生成算法[J].機床與液壓,2018,46(18):100-103.
[8] 周振雄.精密六自由度平面懸浮平臺懸浮位置控制[J].機床與液壓,2018,46(24):125-127.