999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于opencv的手寫數字識別

2017-07-19 01:20:36梁培哲
卷宗 2017年15期
關鍵詞:機器學習

摘 要:隨著科技的不斷發展,在財務、經濟等一系列領域對于使計算機自動識別數字的應用越來越廣泛,同時也不斷推動著更加精確的識別算法的深入研究。本文提出了一種針對手寫數字進行識別的方法,其基本思路是:將opencv開源庫函數與CodeBlocks編譯環境相結合,圖像預處理后再使用SVM(支持向量機)算法與較權威的MNIST數據集結合識別手寫數字。實驗結果表明,相比于參考文獻中的典型常用算法,該方法大大降低了識別錯誤率,在統計量樣本數比較小的情況下也能獲得較為準確的統計規律,該算法可行且有效。

關鍵詞:機器學習;圖像處理;手寫數字識別;SVM分類算法

圖像是人們日常生活和工作中隨時都會碰到的一種客觀的靜態描述,對數字圖像的深入透徹研究大大方便了我們的生活。目前的對于數字識別的算法主要有K鄰近分類算法[1-3]、BP神經網絡算法[4]。K近鄰分類算法本身簡單有效,不需要分類器進行訓練,但其計算量較大,可理解性差;傳統的BP神經網絡收斂速度慢,網絡和學習記憶不穩定。本文使用SVM分類算法結合MNIST數據集進行數字的識別,SVM(support vector machine)即支持向量機是一種分類算法[5],其優點是在統計量樣本數比較小的情況下也能獲得較為準確的統計規律。本文著手于研究機器識別手寫數字,此手寫數字識別實驗主要分為三個部分:圖像采集、圖像預處理、數字識別。

1 圖像預處理

對于攝取到的圖片進行數字預處理是實驗中重要的步驟之一是實驗得出準確結果的前提。采集信號時,周圍環境以及攝取設備對采集后的圖片影響很大,若不進行圖片預處理,往往很難得出正確結果。步驟如下:

1.1 中值濾波

一幅圖像中,噪聲的出現會使噪聲點處的像素值比其周圍的像素值相差非常多??砂褕D像中某一塊的數據中所有像素值按大小順序排列,如此和其他像素值相差很大的噪聲點處的像素就會被排到最前或者最末端,再將排在中間的像素值代替模塊中的中間的目標像素值,便可有效去除噪聲。

1.2 直方圖均衡化

直方圖均衡化著重于圖像灰度級的變換,目的是將圖像灰度增強,它在實際工程中使用比較廣泛。利用直方圖均衡化可以將處理后的圖像實際亮度集中的分布在亮度范圍的中間區域。

1.3 圖像分割

對提取到的圖片進行圖片分割,可將想要得到的數字更清晰的呈現出來。對于最佳閾值的選取,可以采用遍歷像素值[1~254]。

(1)首先人工設置初始閾值Th=Th0將原圖分為兩類;分別計算兩類的類內方差:

(4)

(5)

(6)

(7)

(2)計算兩個區域各自的分布概率

(8)

(9)

(3)像素遍歷選擇選擇最佳閾值,根據以下公式判定

(10)

1.4 形態學濾波

最基本的形態學濾波是腐蝕和膨脹,考慮到手寫數字筆畫可能會很粗不易于后期識別,所以采用膨脹的算法思路。一般膨脹是對二值圖像進行處理,將此放在預處理最后一步。

2 數字識別

得到攝像頭采集并經過處理后的數字圖片后,下一步便是識別。識別數字的方式有很多,本文我們使用支持向量機SVM分類算法來實現手寫數字識別。深度學習一般的解決思路便是將大量實例用于訓練學習,學習后的機器會產生自己的一套識別體系,利用訓練好的系統去識別未知的數字。其中SVM分類算法就是這樣一個基礎的機器學習的思想,在獲得大量樣本進行大量學習形成學習系統之后,機器形成一套自己用來識別手寫數字的規則。隨著樣本數量的增加,算法會學的更加精確,不斷提升自身的準確性。通常對于分類問題,可以將數據集分成三部分:訓練集、測試集、交叉驗證集。用訓練集訓練系統從而生成對數字的學習模型,用后者進行準確性驗證(優化參數)。在ubuntu上,大約運行十分鐘便可以完成訓練和預測測試集的結果。

采用MNIST數據集下載訓練數據和測試文件。要注意,攝像機采集之后,為了增強識別效果,對采集到的數字圖片進行預處理以達到手寫數字圖片庫的數字模式使識別可以更加準確。MNIST數據庫是一個手寫數據庫,它有60000個訓練樣本集,10000個測試樣本集。它是NIST數據庫的一個子集。下載后的文件并不是標準的圖像格式,圖像都保存在二進制文件中,每個樣本圖像的寬高為28*28。在進行編寫匹配程序之前要把其轉換為普通jpg格式的文件。

3 結論

本文從識別手寫數字字符識別入手,通過查閱大量資料得出一套完整的手寫數字識別的方法體系,并且在Windows平臺下,利用計算機視覺庫OpenCv和CodeBlocks環境相結合進行實驗,得出結果準確度高。采用的SVM分類算法與和典型的K鄰近分類算法、BP神經網絡算法相比,識別精度高。但是,在攝取圖片背景復雜、圖片曝光過度或不足、分辨率低的情況下,各算法還需要進一步完善。

參考文獻

[1] 陳振洲,李磊,姚正安. 基于SVM的特征加權KNN算法[J]. 中山大學學報(自然科學版). 2005(01)

[2] 錢曉東,王正歐. 基于改進KNN的文本分類方法[J]. 情報科學. 2005(04)

[3] Yufei Tao,Dimitris Papadias,Nikos Mamoulis,Jun Zhang.An efficient cost model for K-NN search technical report. HKUST . 2001

[4] 王建梅,覃文忠. 基于L-M算法的BP神經網絡分類器[J]. 武漢大學學報(信息科學版). 2005(10)

[5] 奉國和,朱思銘. 基于聚類的大樣本支持向量機研究[J]. 計算機科學. 2006(04)

作者簡介

梁培哲(1997-),女,漢族,鄭州大學物理工程學院電子信息科學與技術專業2014級學生。

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 亚洲第一在线播放| 国产大全韩国亚洲一区二区三区| 香蕉视频在线精品| 热久久这里是精品6免费观看| 在线毛片网站| 国产va在线| 国产高清无码第一十页在线观看| 亚洲一区色| 欧美国产在线看| 亚洲高清中文字幕| 91久久青青草原精品国产| 视频一区视频二区日韩专区 | 国产乱人免费视频| 永久毛片在线播| 欧美日韩中文国产va另类| 在线a网站| 福利姬国产精品一区在线| 亚洲精品动漫在线观看| 亚洲国产成人精品一二区| 97亚洲色综久久精品| 久久成人18免费| 亚洲欧洲综合| 女人天堂av免费| 久久久久九九精品影院| 福利视频一区| 欧美精品亚洲精品日韩专| 亚洲天堂网视频| 小蝌蚪亚洲精品国产| 国产美女无遮挡免费视频| 女同国产精品一区二区| 色网站在线免费观看| 亚洲日韩精品欧美中文字幕| 亚洲色大成网站www国产| 99精品在线看| 天天综合网亚洲网站| 欧美亚洲欧美区| 88国产经典欧美一区二区三区| 玖玖精品视频在线观看| 91久久精品日日躁夜夜躁欧美| 国产视频久久久久| a级毛片免费播放| 国产极品美女在线播放| www.youjizz.com久久| 美女免费黄网站| 一本一本大道香蕉久在线播放| 久久国语对白| 就去色综合| 欧美精品成人| 国产又爽又黄无遮挡免费观看| 国产极品美女在线| 日本在线视频免费| 激情午夜婷婷| www亚洲精品| 精品无码一区二区三区电影| 精品三级在线| 日韩免费毛片视频| 国语少妇高潮| 亚洲无码日韩一区| 亚洲无码在线午夜电影| 国产亚洲成AⅤ人片在线观看| 91亚洲影院| 成人免费一级片| 中文字幕亚洲第一| 亚洲精品天堂在线观看| 欧美成人怡春院在线激情| 欧美日韩在线第一页| 国产欧美日韩91| 国产成人高精品免费视频| 国产午夜无码片在线观看网站 | 精品久久久久成人码免费动漫| 欧美视频在线不卡| 免费观看精品视频999| 亚洲黄色成人| 色135综合网| 国产毛片久久国产| 成人永久免费A∨一级在线播放| 热久久国产| 在线欧美a| 国产美女在线观看| 成人精品在线观看| 色综合激情网| 99re热精品视频国产免费|