999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于稠密卷積網絡的文字識別研究

2021-07-16 09:23:50王庭棟
科學技術創新 2021年20期
關鍵詞:模型

王庭棟

(西安郵電大學,陜西西安 710121)

1 概述

信息化社會給人們的生活帶來了翻天覆地的變化,每個人身邊的文字資料也越來越多,但各種證件、單據的錄入工作,目前仍然依賴于人工實現,錄入速率慢的同時也耗費了大量人力物力。因此利用計算機技術實現文字的識別與錄入成為一個急需解決的問題。

近年來,圖像處理技術和計算機視覺技術得到飛速發展,尤其是神經網絡理論的發展為文字識別提供了新的方向。二十世紀六十年代,第一個光學字符識別 (Optical Character Recognition ,OCR)系統就已出現,隨著圖像識別技術的發展,其涉及的應用范圍也在逐步擴大,基于圖像處理以及模式識別理論的OCR 系統在行業間已得到廣泛應用。基于光學字符識別發展起來的漢字識別在部分領域也得到了應用。雖然光學字符識別技術發展已比較成熟,但由于中文漢字種類繁多,識別準確率仍有待提高。為提高識別準確率,本文在卷積神經網絡的基礎上引入了稠密卷積網絡模型結構,提出了一種基于稠密卷積網絡的文字識別方法。

2 相關工作

在《現代漢語常用字表》中共有3500 個漢字,國家標準信息交換漢字字符集GB2312-80 收錄了一級漢字3755 個,能夠覆蓋現在主流文本的99.48%,基本滿足人們日常閱讀與交流的需求。但是漢字種類繁多,且包含多種書寫字體如:隸書、楷書、行書等,且可用的漢字訓練數據集數量相對較少,對漢字進行識別成為深度學習中是一個熱點問題。Wu 在通過卷積神經網絡進行文字識別的基礎上,提出了一種多級特征提取模塊,替換卷積神經網絡中的卷積層與池化層[1]。Xu 基于神經網絡和分類器原理,提出了漢字識別二級分類集成策略,基于LDA 特征提取算法,結合K 分類器實現對漢字的識別[2]。Li 提出了基于改進SURF 算法和SPM 方法的細分類算法,通過多特征融合實現了對漢字的直接分類[3]。Ding 針對現有神經網絡特征提取能力差、計算量大等問題,提出了一種添加RMSprop 優化器、數據擴增、批標準化等方式優化的新的卷積神經網絡架構, 可用于漢字的識別[4]。YU 以隱馬爾可夫模型為基礎,提出了在原筆跡提取得到的筆劃像素點坐標序列中,利用拐點檢測算法提取筆劃的拐點,將筆劃分割為筆段,使用SVM 方法對筆段進行分類,得到漢字的筆段編碼序列;最后,通過隱馬爾可夫模型對漢字進行模型建立、訓練和識別[5]。

3 稠密卷積網絡文字識別

3.1 稠密卷積網絡簡介

在圖像分類領域,網絡模型的深度是一個重要環節,從一開始LeNet[6]的五層結構,VGG[7]網絡的19 層結構,到152 層的Resnet[8]網絡結構,網絡層數的加深成為卷積神經網絡發展的主要方向之一。但是隨著網絡模型深度的增加,梯度爆炸、梯度消失、過擬合等現象影響了模型的訓練結果,而Densenet[9]通過對特征的重復利用和減少每層網絡的計算量,降低參數量,減輕了梯度消失帶來的影響,加強了特征的傳播效果[10]。

DenseNet 由Gao Huang 于CVPR2017 提出。它的基本思想是使網絡模型中的任何兩層之間都建立直接的連接,這樣每一層的輸入都是之前所有層輸出的并集,而這一層所學習的特征也會成為后面所有層的輸入。

在Resnet 網絡結構中,第i 層的輸出xi 由前一層的輸出進行非線性變化后相加獲得如式(1)

在Densenet 網絡中,設模型層出為N 層,那么通過推算可以得出模型中共有N(N+1)/2 個連接,將第i 層與前面所有層進行連接,輸出結果會成為第i+1,i+2,…層的輸入。于是將網絡第0 層到第i-1 層輸出特征圖通道的合并用[X0,X1,…,Xi-1]表示,可以得到i 層的輸出:

Densenet 網絡包括稠密模塊和過渡層模塊,稠密模塊首先為歸一化層將圖像進行歸一化處理,然后緊接激活函數層和池化層對圖像進行初次篩選,再通過設計多個卷積層與激活函數層的結構,將多個這樣的不同結構之間互相連接,構成了一個整體的稠密模塊,不同的稠密模塊之間在通過過渡層進行連接,通過過渡層可以使稠密模塊之間的特征圖大小進行統一,設計過渡層中的卷積層大小為1*1,可以用來降低參數量。在稠密模塊中不同的卷積層兩兩互相連接,實現了對已提取特征的重復利用,而隨著網絡層數的不斷增加出現的梯度消失問題,也會因為每一個卷積層都與損失函數進行連接而得到緩解。

3.2 稠密卷積網絡模型

本文輸入圖像大小為(64*64)的中文一級漢字,設計了3 個結構相同的密集模塊與2 個過渡層。圖像輸入后首先做一次大小為5*5 步長為2 的卷積,然后以大小為2*2 步長為2 進行池化,隨后進入密集模塊。每個密集模塊包括8 個節點,其中每個節點以歸一化層、激活函數層、卷積層和拼接層的方式組成,每個卷積層的卷積核為8,為加速參數運算,減輕過擬合程度,基于Inception[10]網絡結構,結合非對稱卷積,將原網絡中進行一次3*3 卷積操作以兩次3*1 和1*3 的卷積操作代替[11],激活函數層為Relu 函數。過渡層由歸一化層、卷積層和池化層組成,卷積核大小為1*1,數量等同于輸入特征數量圖數量,保證過渡層特征輸入數和輸出數數量相同。網絡最后采用softmax 進行分類,結構為全連接結構。

圖1 DenseNet 網絡圖

4 實驗

4.1 實驗環境

表1

圖2 準確率與損失函數

4.2 實驗結果

通過人工合成包含多種字體的3755 個一級漢字數據集進行模型訓練。對262850 幅一級漢字圖像進行添加噪聲,角度傾斜等圖像仿真處理后,隨機選取70%作為訓練集進行訓練,剩余30%作為測試數據,采用隨機梯度下降法進行優化。每次迭代數據量為64,共進行50 輪訓練,圖2 為50 輪訓練中準確率變化圖與訓練損失函數變化圖。圖2 中可以看出,訓練過程中準確率逐漸提高,損失函數逐漸降低,過擬合現象不明顯。其中準確率最高到達97.1%。

5 結論

提出了一種基于稠密卷積網絡模型的文字識別算法,實驗證明可以較好的完成文字識別任務,但是識別是建立在單個文字的基礎上進行識別,對一段文本的識別依賴切割算法,并且對形近字之間的魯棒性仍有待提高。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 免费不卡在线观看av| 538精品在线观看| 久久久久亚洲精品成人网| 亚洲成人网在线播放| 香蕉eeww99国产在线观看| 无码丝袜人妻| 99久久精品视香蕉蕉| 视频二区欧美| 精品无码一区二区三区电影| 中国一级特黄大片在线观看| 久久永久视频| 一区二区三区高清视频国产女人| 亚洲精品男人天堂| 久久精品国产精品一区二区| 伊人查蕉在线观看国产精品| 色男人的天堂久久综合| 国产在线自揄拍揄视频网站| 97在线公开视频| 免费一极毛片| 亚洲毛片一级带毛片基地| 无码一区18禁| 精品丝袜美腿国产一区| 亚洲VA中文字幕| 日韩精品久久久久久久电影蜜臀| 久久久久亚洲精品成人网| 少妇露出福利视频| 97国产成人无码精品久久久| 国产一级特黄aa级特黄裸毛片| 无码高潮喷水专区久久| 国产69精品久久久久妇女| 亚洲第一成网站| 男女男免费视频网站国产| 又黄又湿又爽的视频| 久久性妇女精品免费| 国国产a国产片免费麻豆| 特级欧美视频aaaaaa| 日韩在线中文| 日韩专区欧美| 免费在线a视频| 老司机午夜精品网站在线观看 | 国内精品自在自线视频香蕉| 精品视频一区在线观看| 日韩欧美中文在线| 四虎在线观看视频高清无码 | 欧美 亚洲 日韩 国产| 久久男人资源站| 国产91av在线| 国内精自线i品一区202| 国产第一页第二页| 国产主播在线观看| 久久香蕉国产线| 久久国产成人精品国产成人亚洲| 国产一区二区三区精品欧美日韩| 亚洲美女一级毛片| 沈阳少妇高潮在线| 日韩亚洲综合在线| 精品国产成人三级在线观看| 欲色天天综合网| 视频二区中文无码| 国产精品99一区不卡| 国产a在视频线精品视频下载| 久久久久久久久亚洲精品| 国产又大又粗又猛又爽的视频| 亚洲精品色AV无码看| 精品国产91爱| 一级成人欧美一区在线观看| 欧美日韩国产精品va| 香蕉视频国产精品人| 欧美国产在线看| 天天色综网| 97青草最新免费精品视频| 丰满人妻中出白浆| 日本高清成本人视频一区| 日本草草视频在线观看| 久久人人爽人人爽人人片aV东京热 | 久久精品国产999大香线焦| 日本三区视频| 国产主播喷水| 精品色综合| 无码久看视频| 国产第一色| 蜜桃视频一区二区|