999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習模型的手寫數字識別

2019-01-08 03:16:09黃志超喬振華
電腦知識與技術 2019年33期

黃志超 喬振華

摘要:手寫數字識別是將人手寫的0-9十個數字識別出來的一個過程,本文首先分別使用邏輯斯蒂回歸算法和支持向量機算法對提取出特征向量的圖片進行訓練,建立模型;其次,針對不同的樣本數測試以上兩個模型的準確性;最后通過Py-thon3.7實驗仿真,實驗結果表明,這兩種模型的識別的準確率較高。

關鍵詞:手寫數字識別;邏輯斯蒂回歸;支持向量機

中圖分類號:TP18 文獻標識碼:A

文章編號:1009-3044(2019)33-0215-03

1概述

隨著信息全球化時代的到來,互聯網技術數字化加速發展,人工智能已稱為當今世界最為前沿的熱點方向之一。人工智能技術已滲入到生活的方方面面。手寫數字識別技術屬于人工智能范疇,手寫數字識別是一種傳統的數字識別技術,而數字識別技術又是一個典型的模式識別問題。模式識別使用計算機算法對圖像進行自動處理和判讀,自動模式識別由機器自動進行模式識別,無須人為干涉。隨著大數據的興起,像郵政、金融等這些行業由于手寫的數據較多、數據量龐大且對數據的準確性要求較高,因此,急需一個能準確高效自動識別手寫數字的方法。

雖然數字是由0~9十個數字,但是每個人的書寫方式和習慣差別較大,寫法截然不同,且很多數字自身相似度較高,因此,想要準確識別出每個手寫數字還是存在一定難度的。

2基于機器學習模型的手寫數字識別原理

本文的手寫數字識別方法可分為兩個過程與三個步驟,兩個過程分別是:訓練(學習)與測試(識別),如圖1所示,三個步驟是:1)生成手寫數字樣本庫;2)特征提取;3)模型訓練和測試。

2.1LR(Logistic Regression)原理

LR(邏輯斯蒂回歸)是一種線性分類模型,采用Sigmoid函數作為后驗概率分布函數來對輸人數據集進行分類,除了可用于解決二分類問題,同時也可用于解決多分類問題。該算法計算量小,易于實現,既能應用于分布式場景,也能應用于在線實施場景,其基本原理如下:

3實驗過程與結果

3.1實驗過程

通過Pvthon3.7實驗仿真手寫數字識別,手寫數字識別主要以下三個步驟:生成手寫數字樣本庫、特征提取、模型訓練和測試。

1)生成手寫數字樣本庫

如上文所述,手寫數字因人而異,因此,首先應建立自己的手寫數字樣本庫。當然,還可以直接選用現有的手寫數字樣本庫。這兩種方法各有優缺點,第一種方法是量身定做的手寫數字樣本庫,更為適合實驗環境場景,但缺點是費事費力。第二種方法的優點是簡單方便,但缺點是不能面向大規模的應用,可能導致誤差較大。本實驗采用第一種方法建立自己的手寫數字樣本庫。生成手寫數字樣本庫核心思想是隨機生成數字0-9,然后利用python的PIL畫筆工具進行畫圖,通過對圖像進行扭曲,生成手寫數字樣本庫。手寫數字樣本庫具體生成步驟如下圖所示。

2)特征提取

特征提取是通過剔除圖像中對分類沒有幫助的部分,提取出具有代表性的幾個特征的過程。手寫數字樣本庫中的圖片是30*30的灰度圖片即900個像素點,本文采用的特征提取方法是選取每行中黑點的個數以及每列中黑點的個數作為輸入,這樣也可達到降低維度目的,將維度從900降到了60,如下圖所示。

3)模型訓練和測試

手寫數字識別實質上是一個圖像分類問題,及其學期中大多數分類算法都可以應用到手寫數字識別中,這里主要介紹兩種分類方法:

(1)基于LR的分類器

通過sigmoid函數作為預測函數,來預測條件概率P(y=1x)。輸人圖片使用sigmoid函數計算出圖片屬于數字0-9的概率,范圍在[0,1]之間。為了提高模型預測的準確率,在模型訓練過程中,不斷最小化極大似然代價函數。

(2)基于支持向量機的分類器

通過訓練數據不斷地迭代計算,在多維空間中找到一個最佳的決策平面,從而實現二分類,但是,手寫數字識別并不是一個標準的二分類問題,因此,需要訓練多個支持向量機的模型,每個模型能將一個數字與其他數字區分開,例如,支持向量機模型SVMl能夠區分數字1和其他數字,給出輸入圖片為1的概率。對于給定輸入,將其帶人這10個支持向量機模型,從而可以分別得出圖片屬于0-9的概率,其中概率值最大的即為最后的分類結果。

3.2實驗結果

在手寫數字識別中,通過最常見的正確率來評價該模型性能的高低,其中正確率的計算公式如下:

計算手寫數字樣本庫中圖片數量從100至10000的識別準確率,其中,訓練數據占比75%,測試數據占比25%,計算結果如下表和下圖所示。由此可見,當樣本數低于1000個時準確率較低;當樣本數在1000至6000之間,SVM模型的準確率高于LR模型的準確率,且準確率都在0.9以上;當樣本數在6000至10000之間,SVM模型的準確率與LR模型的準確率不相上下,且準確率大部分都在0.96以上。本實驗結果表明,這兩種模型的識別的準確率較高。

4結束語

手寫數字識別是對人們手寫的數字進行分析處理,自動識別的過程。該文分別通過邏輯斯蒂回歸算法和支持向量機算法建立模型,通過測試集對其進行測試,計算準確率。通過此方法可實現手寫數字識別,且識別效果較好,但是,該文所討論的方法,對于樣本個數較少的情況,識別準確率不高。

主站蜘蛛池模板: 久久精品国产亚洲AV忘忧草18| 亚洲国产精品美女| 精品欧美一区二区三区在线| 毛片大全免费观看| 日韩毛片免费视频| 五月婷婷丁香综合| 制服丝袜无码每日更新| 久久久噜噜噜| 精品伊人久久大香线蕉网站| 99re在线免费视频| 大学生久久香蕉国产线观看| 久久黄色影院| 青草精品视频| 免费日韩在线视频| 香蕉国产精品视频| 欧美自慰一级看片免费| 最新日本中文字幕| 老司机久久99久久精品播放| 国产性爱网站| 欧美色综合网站| 亚洲色图综合在线| 亚洲色精品国产一区二区三区| 国内精品小视频在线| 亚洲欧美在线综合一区二区三区| 国产精品九九视频| 99一级毛片| 国产国产人在线成免费视频狼人色| 亚洲天堂日韩av电影| 国产精品永久免费嫩草研究院| 免费国产小视频在线观看| 婷婷伊人五月| 免费国产福利| 久久夜色精品国产嚕嚕亚洲av| 午夜一级做a爰片久久毛片| 热久久综合这里只有精品电影| 99久久国产自偷自偷免费一区| 免费AV在线播放观看18禁强制| 午夜福利免费视频| 91久久偷偷做嫩草影院电| 无遮挡一级毛片呦女视频| 亚洲免费福利视频| 99久久精品国产综合婷婷| 欧美在线中文字幕| 国产免费怡红院视频| 国产迷奸在线看| 久久天天躁狠狠躁夜夜躁| 亚洲婷婷六月| 久久婷婷人人澡人人爱91| 精品久久777| 免费国产不卡午夜福在线观看| 欧美性久久久久| 国产无码网站在线观看| 亚洲福利视频一区二区| 免费一级α片在线观看| 亚洲精品成人片在线观看| 久久熟女AV| 精品无码视频在线观看| 无码aⅴ精品一区二区三区| 国产99热| 色窝窝免费一区二区三区| 毛片久久久| 精品国产中文一级毛片在线看| 亚洲中文字幕23页在线| 最新亚洲人成网站在线观看| 久久久久久久蜜桃| 成人福利视频网| 中文字幕日韩丝袜一区| 国产网站免费看| 成色7777精品在线| 久久人搡人人玩人妻精品 | 国产精品永久不卡免费视频| 欧洲一区二区三区无码| 国产欧美在线观看视频| 91久久偷偷做嫩草影院精品| 在线亚洲小视频| 精品丝袜美腿国产一区| 91久久天天躁狠狠躁夜夜| 日韩资源站| 国产综合在线观看视频| 香蕉久久国产超碰青草| 亚洲天堂首页| 伊人久久久久久久|