999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TensorFlow 手寫體數字識別系統的研究

2020-03-24 03:49:32李建新
智能計算機與應用 2020年11期
關鍵詞:用戶模型

李建新

(廣州工商學院 計算機科學與工程系,廣州528138 )

0 引言

目前,手寫體數字識別是人工智能機器學習領域眾多研究者關注的一個熱點,廣泛應用于公安、稅務、交通、金融、教育等行業的實踐活動中。在實際應用中,對手寫數字單字識別率的要求比手寫普通文字識別要苛刻許多,識別精度需要達到更高的水平。由于手寫數字識別沒有文字識別那樣的上下文,不存在語意的相關性,而數據中的每一個數字又至關重要。因此,提高手寫數字識別率,成為人工智能的重要研究領域。

人工神經網絡是一種類似于大腦神經突觸聯接的結構,進行信息處理的數學模型,具有學習和記憶功能,可以讓神經網絡學習各個模式類別中的大批量訓練樣本,記憶各個模式類別中的樣本特征。在識別樣本時,將逐個與記憶中各模式類別的樣本特征相比較,從而確定樣本所屬類別。人工神經網絡通過學習調整內部大量節點之間相互連接的關系,可獲得眾多優化的模型參數。

1 手寫體數字識別系統

1.1 系統組成

手寫體數字識別系統由輸入、預處理、識別等環節組成,系統架構如圖1 所示。

輸入環節包括MNIST 手寫體數據集輸入和用戶預測圖片里的手寫體數字;預處理環節主要指用戶手寫體數字預測圖片的預處理;識別環節包括卷積神經網絡、分類識別器、損失函數和優化器。卷積神經網絡實現數字手寫體0~9 特征提取,分類識別是手寫體數字識別最關鍵的部分。經過卷積神經網絡提取來的特征被送到分類器中,對其進行分類識別。分類識別器由softmax 完成,softmax 得到當前樣例中屬于不同種類的概率分布情況。

優化器在神經網絡訓練和測試過程中,根據計算結果與損失函數要求,調節模型可變參數,讓神經網絡參數盡快達到理想誤差范圍。

1.2 MNIST 數據集訓練與測試

訓練一個卷積神經網絡時,需要大量的數據、設置卷積的層數、卷積核大小、池化的方式(最大、平均)、損失函數、設置目標(如:手寫數字的識別,輸出一個10 維向量)等,讓卷積神經網絡通過不斷的訓練更新參數,向設置的目標靠近,最后可以通過這些參數來預測樣本。

圖1 手寫體數字識別系統組成Fig.1 Composition of handwritten digit recognition system

通常情況下,假設樣本由K個類組成,共有m個,則數據集可由式(1)表示:

式中,x(i)∈R(n +1);y(i)∈{1,2,…,K},n +1 為特征向量x的維度。

MNIST 是機器學習中的一個數據集,包含0~9的不同人手寫數字圖片。數據集由60 000 個手寫數字訓練樣本和10 000 個手寫數字測試樣本組成,每個樣本是一張28 * 28 像素的灰度手寫數字圖片。則MNIST 數據集的訓練集m=60 000,n +1=784,K=10、MNIST 數據集的測試集m=10 000,n+1=784,K=10;分別由式(2)、式(3)表示為:

機器學習模型設計時,將提供大量的數據以訓練一個手寫體數字的機器學習,所得到的模型參數,最終用于預測用戶圖片里面的數字。

1.3 卷積神經網絡與分類器

卷積神經網絡是系統的核心部分,是由輸入層、多個卷積層、多個池化層、多個全連接層以及輸出組成的多層感知器。卷積層為局部連接,用于提取圖像特征;池化層用于進一步降低輸出參數數量,提高了模型的泛化能力;全連接層進行特征關系和權重值計算,完成分類處理。手寫體數字識別卷積神經網絡的組成示意如圖2 所示。

在TansorFlow 中卷積層、池化層和全連接層部分代碼如下:

圖2 手寫體數字識別卷積神經網絡組成Fig.2 Composition of convolution neural network for handwritten digit recognition

為了提高卷積神經網絡對手寫體數字識別的準確率,可以通過多種途徑來實現。如:增加卷積層數量,以便進行更高層次的特征提取;改變各卷積層的卷積核大小,以便調整特征提取范圍,或改變卷積步長;增加卷積層中卷積核的數量,意味著提取特征圖的數量(一個卷積核卷積出來一個特征圖),也就意味著可以從更多的角度提取原圖的特征,避免視角單一,卷積出來多個特征圖后要重新組織輸出形態,用以適應下一層的輸入要求。

分類器采用Softmax 回歸算法,該算法能將二分類的Logistic 回歸問題擴展至多分類。Softmax 回歸算法對于給定的輸入值x(i),輸出的K個估計概率可由式(4)[1]表示:

其中,K為類別的個數,和bi為第i個類別對應的權重向量和偏移向量,在TensorFlow 中用張量表示。

上述Softmax 回歸算法在TansorFlow 中的相應代碼如下:

1.4 損失函數和優化器

通常采用的損失函數“交叉熵”(cross -entropy),如式(5)[2]所示:

式中,y為預測概率的分布,y' 為實際樣本的標簽值。

TensorFlow 中提供了8 種優化器,即BGD、SGD、Momentum、Nesterov Momentum、Adagrad、Adadelta、RMSprop 和Adam,模型訓練一般采用梯度下降優化器。

在TansorFlow 中,損失函數、學習率為learning_rate 的優化器代碼[2]如下:

由以上系統組成可知,MNIST 數據集、卷積神經網絡與分類器、損失函數和優化器是人工神經網絡學習模型訓練機制的組成部分。

2 用戶手寫體數字識別

通過對MNIST 數據集的訓練和測試,模型參數達到要求并予以保存。在用戶實際應用時可以導入模型參數對用戶手寫數字識別。由于MNIST 數據集手寫數字以張量形式存在,其形態為1 維[784],而用戶手寫數字可以各種像素的數字圖像存在,故用戶手寫數字在識別前需要將其圖像進行預處理,需與MNIST 數據集28×28 像素達到一致。

2.1 數字預處理

預處理對于系統設計非常重要,經過預處理后的圖像才能進行特征提取。因此,預處理的好壞直接影響著識別結果。因導入的點陣圖形大小各異,需將點陣圖形壓縮成與MNIST 數據集中的大小相一致,調整用戶手寫數字灰度圖像形態為[28,28];隨后將用戶手寫數字圖像轉換為灰度圖像?;叶葓D像像素值純黑色的灰度級別為0,純白色的灰度級別為255,介入兩者之間還有許多灰度級別。由于MNIST 數據集圖片像素純白色~純黑色采取正規化的0~1 區間,故用戶手寫數字灰度圖像也須進一步正規化到0~1 區間。用戶手寫數字預處理流程如圖3 所示。

圖3 用戶手寫數字預處理流程Fig.3 Preprocessing process and code of handwritten digits

經處理后的數字圖片格式與MNIST 數據集的圖片格式相同,則可將圖片輸入到網絡中進行識別。

2.2 檢測用戶手寫數字圖像的神經網絡

對用戶手寫數字圖像進行檢測的卷積神經網絡,與MNIST 數據集的訓練和測試的卷積神經網絡結構相同。模型參數為MNIST 數據集的訓練與測試得到并保存模型參數,主要是卷積神經網絡的各層參數。只要恢復、使用之前保存的模型參數,用這些已知的參數構建卷積神經網絡,通過其將用戶手寫數字圖像從卷積神經網絡輸入,以完成到輸出的映射,獲得相應數字。

2.3 數字識別實現

TensorFlow 是一個開源的機器學習框架,在圖形分類、音頻處理、推薦系統和自然語言處理等場景下有著豐富的應用,并提供了多種編程語言的接口。本系統建立在TensorFlow 平臺上,分二部分完成:

2.3.1 建立模型參數

(1)導入MNIST 數據集,并構建卷積神經網絡學習模型;

(2)對學習模型進行訓練和測試;

(3)評價學習模型是否為最佳模型參數,是則保存模型參數,否則修改學習模型,繼續執行(2)、(3)步驟。

2.3.2 用戶手寫數字識別

(1)數字預處理,以使用戶手寫數字與MNIST數據集一致;

(2)使用保存的模型參數構建用戶手寫數字識別模型;

(3)用戶手寫數字輸入手寫數字識別模型,得到用戶手寫數字輸出。

3 實驗數據分析

實驗分為無卷積神經網絡和有卷積神經網絡。實驗以損失函數、訓練數據準確率和測試數據準確率為參考,見表1。

表1 訓練損失值與數據準確率Tab.1 Training loss and data accuracy

由表1 中上半部數據可知,隨著學習率的增加,損失函數值的減少,訓練準確率和測試準確率均增加,但學習率增加過大。如,學習率為1.0 和1.5 時,導致數據準確率發生振蕩。

由表1 中下半部數據可知,當學習率小于0.65時,前20 輪訓練損失函數收斂很快,訓練準確率和測試準確率很快達到0.98 以上,最高為1。學習率過大,如0.75,損失函數找不到最小點,無法收斂,甚至出現未定義或不可表示的值。

4 結束語

通過實驗比較了無卷積和卷積在神經網絡中的作用,對學習訓練參數、優化器也做了比較,取得了相應數據,學習率大小對無卷積神經網絡影響為引起數據準確率發生振蕩,對有卷積神經網絡影響為引起損失函數找不到最小點,數據準確率大幅度下降。在學習率大小合適條件下有卷積神經網絡的損失值和學習率均明顯優于無卷積神經網絡,實驗結果挖掘了神經網絡對圖形內在的特性。

本研究是手寫體數字識別系統開發的組成部分,其成果對整個系統開發工作奠定了很好的基礎。

猜你喜歡
用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 精品91视频| 大香伊人久久| 青草午夜精品视频在线观看| 久久久成年黄色视频| 亚洲国产成人在线| 日本亚洲欧美在线| 青青操国产| 亚洲国产精品一区二区第一页免| 国产精品不卡永久免费| 日日拍夜夜操| 九色在线观看视频| 欧美特黄一免在线观看| 亚洲bt欧美bt精品| 99在线小视频| 成人精品区| 日韩在线永久免费播放| 国产欧美日韩综合一区在线播放| 欧美日韩成人在线观看| 久久青草免费91观看| 特级精品毛片免费观看| 大陆国产精品视频| 精久久久久无码区中文字幕| 91久久国产综合精品女同我| 中文字幕乱妇无码AV在线| 亚洲一区毛片| 综合色88| 精品91自产拍在线| 亚洲视屏在线观看| 亚洲熟女偷拍| 婷婷色一二三区波多野衣| 国产无码网站在线观看| 亚洲精品无码AⅤ片青青在线观看| 四虎永久在线精品国产免费| 四虎永久免费地址| 国产成人艳妇AA视频在线| 中文纯内无码H| 国产乱人乱偷精品视频a人人澡| 国产啪在线91| 在线观看国产小视频| 国产精品九九视频| 女人18毛片久久| 亚洲高清中文字幕在线看不卡| 国产一区二区人大臿蕉香蕉| 狼友av永久网站免费观看| 免费国产黄线在线观看| 国产成人精品优优av| 韩日午夜在线资源一区二区| 婷婷亚洲天堂| 亚亚洲乱码一二三四区| 人与鲁专区| 欧美性天天| av在线手机播放| 香蕉eeww99国产在线观看| 日韩在线2020专区| 午夜国产小视频| 免费观看无遮挡www的小视频| 国产精品永久久久久| 国产日韩欧美一区二区三区在线 | www亚洲精品| 99一级毛片| 日韩第一页在线| 国产欧美日韩免费| 自慰网址在线观看| 啪啪啪亚洲无码| 狠狠做深爱婷婷综合一区| 国产99在线观看| 在线精品亚洲一区二区古装| 午夜爽爽视频| 欧类av怡春院| 视频一本大道香蕉久在线播放| 九九久久精品国产av片囯产区| 亚洲无码熟妇人妻AV在线| 国产性生大片免费观看性欧美| 日韩欧美中文| 97国产精品视频自在拍| 免费一级α片在线观看| 特级欧美视频aaaaaa| 成人综合久久综合| 国产欧美日韩综合在线第一| 欧美综合一区二区三区| 午夜国产小视频| 亚洲综合激情另类专区|