999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于卷積神經網絡的古文字識別系統設計與實現

2021-06-28 19:13:56陳盈祾潘玉霞
電腦知識與技術 2021年10期
關鍵詞:深度學習

陳盈祾 潘玉霞

摘要:古文字作為中國上下五千年以來的使用文字,記錄了我國從古至今的文化發展歷史,對于我國的歷史文化研究具有十分重要的作用。對古文字的識別能夠將那些珍貴的文獻材料轉換為電子文檔,便于這些珍貴文獻材料的保存和傳播。該文將深度學習中經典的卷積神經網絡技術應用到古文字識別中,剖析了運用的卷積神經網絡技術的原理結構,并闡述了系統在識別方面所運用的技術。

關鍵詞:古文字識別;深度學習;卷積神經網絡

中圖分類號:TP393? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)10-0207-02

1前言

古文字學——這一門古老但是卻極其富有生命力的學科,在我們研究中國的古代歷史以及文化中具有的十分重要的作用,它是打開古代歷史文化寶庫的一把鑰匙。我國歷經上下五千年,文化厚重繁多,經過歷史變遷,無數的朝代都擁有獨屬于自己的文化,尤其是文字。文字最初的誕生傳說是由于倉頡造字,后來隨著歷史演變,朝代更迭,文字慢慢進化。在殷商時期有了我們熟悉的甲骨文,這是我們目前見到的最早的,較系統的成熟的文字。再往后又進化出了金文,石鼓文,大小篆等。

目前,市面上現有的古文字識別系統可以根據用戶所輸入的簡體漢字來查詢出各個歷史朝代對應的古文字。但是,這些古文字識別系統卻僅僅能夠根據簡體漢字來查詢古文字,而不能通過古文字來查詢簡體字或者形近字。而在考古方面出土文獻的處理應用上,我們需要根據未知的古文字的字型來檢視我們該文字已知的形近字及相關資料信息來輔助推斷未知古文字的含義,例如:如果我們在某文物上發現刻有古文字,那我們如何快速的確定其是否為已知的古文字,抑或者我們又該如何快速地獲取其已知形似字及該形近字的相關資料信息以便于我們推測其含義呢?如果沒有一種技術或者產品能夠輔助解決這個難題,無疑會給古文字工作者的工作帶來極大的不便,影響古文字研究工作的迅速開展。

除此之外,在我們日常古文字的學習上由于我們對于古文字的不了解,以至于我們甚至都不能識別部分簡單的古文字,若我們對學習古文字有興趣,我們甚至都不知道如何去查詢,因為我們需要的辨認我們不認識的古文字,而目前的系統還未有這種功能,這將會對我們的興趣產生極大的打擊。所以我們打算設計一款古文字識別系統幫助人們更好的認識和識別古文字。

2 系統簡介

目前市面上的文字識別系統花樣繁多,但是古文字識別系統就較為稀少,而且幾乎大部分的古文字識別系統都是基于簡體漢字上的識別翻譯從而找出與該簡體漢字相對應的各個朝代的古文字。但是,不論是從科研,也就是考古方面出土文獻的處理應用上還是日常生活的漢語文學的學習上來說,更多的都是從未知的古文字入手去查詢其簡體漢字或形近字及其意思,而目前幾乎沒有基于此的應用。我們的古文字識別系統是基于手寫古文字識別的識別系統,不同于別的古文字識別系統僅僅只能通過簡體漢字來實現其古文字及其形近字的查找。我們的古文字識別系統是建立在用戶日常學習和研究需求上的,從用戶需求出發,與用戶形成良好的人機交互感受,并且能夠具有較高的識別查找正確率。

不同于較為簡單的數字識別和常見的簡體漢字識別,對于古文字識別來說,古文字的書寫較簡體漢字和數字來說更加的復雜,筆畫也更加冗長,且某些象形文字會更趨近于圖形而非漢字。由于沒有統一的規范,古文字識別的復雜性也隨之而增加。雖然目前的文字識別技術獲得了較大的發展,但是由于歷史和區域發展的不平衡以及古文字的不常用使得古文字識別當前的研究甚少。而且日常的古文字學習基本都為手寫,手寫的多樣性毫無疑問會增加識別的難度。因此,古文字識別的困難主要表現在:

(1)缺乏成熟的手寫樣本庫。手寫樣本庫對于古文字識別有很重要的作用,這決定著古文字識別的效果。而目前古文字的研究方面幾乎沒有一個系統的已知古文字的整理庫,很難找到可用的古文字手寫樣本庫。

(2)古文字字體字形變化較多,且沒有統一的標準,不同的朝代書寫的規則不同,體例和格式變化較多,增加了識別的難度。

3系統介紹

本系統可實現功能有識別大部分手寫的古文字包括但不限于甲骨文,金文,小篆等,以及搜索與該古文字相近或者形似的古文字,同時還可以識別部分簡體字,用戶可通過主界面的搜索欄來上傳需識別的圖,同時系統會輸出識別結果及其相似字與形近字。

本系統的核心技術為卷積神經網絡。最初的卷積神經網絡是1987年由Alexander Waibel等提出的時間延遲網絡[1],其為一個隱含層是由兩個一維的卷積核組成的用于語音識別方面的卷積神經網絡。第一個二維卷積神經網絡——平移不變人工神經網絡是由Wei Zhang提出,并且最終被其應用到醫學影像的檢測方面[2]。LeNet最初的版本[3]同樣于1988年被Yann LeCun構建并應用與計算機視覺方面,其包含有兩個卷積層和兩個全連接層,共六萬個學習參數,同時還與現代的卷積神經網絡在結構上十分相近[4]。同年,YannLeCun在LeNet的基礎上,與其合作者一起構建了更加完備的卷積神經網絡LeNet-5并且在手寫數字的識別方面中取得了成功。

卷積神經網絡分別由數據輸入層、卷積層、激勵層、池化層、全連接層以及輸出層組成。

(1)數據輸入層

卷積神經網絡的數據輸入層主要是對原始圖像進行預處理,其中包括去均值,歸一化和PAC/白化。并且還可以處理多維數據,由于卷積神經網絡在計算機視覺領域應用較廣,因此輸入數據一般為三維,即平面的二維像素點以及RGB通道。與此同時,由于卷積神經網絡使用梯度下降法進行學習,其輸入特征需要進行標準化處理,這有利于提升卷積神經網絡的學習效率和表現。

(2)卷積層

卷積層是卷積神經網絡最重要的一個層次,功能是對輸入的數據進行特征的提取,內部包含有多個卷積核。在這個卷積層有兩個關鍵操作即局部關聯和窗口滑動。神經元是神經網絡最基本的構成單元,一個神經元模型由輸入信號、權值、偏置、加法器和激活函數共同構成的。

卷積層內每個神經元都會與前一層的局部感受野相連接,這并不意味著這部分局部連接的神經元權值相同,而是意味著同一平面層的神經元權值共享,擁有相同程度的位移、旋轉不變性。卷積層在對圖像進行卷積操作時可以理解為有一個滑動窗口把卷積和與對應的圖像像素做乘積然后求和。感受野的掃描間隔為步長,當步長較大時,掃描邊界特征可能會使得感受野“出界”,這時就需要對邊界進行填充。而一個帶有卷積核的感受野掃描生成的神經元矩陣就是特征圖。當卷積核在工作時,會有規律地掃過輸入特征,在感受野內對輸入特征做矩陣元素乘法求和并疊加偏差量。

(3)激勵層

激勵層就是把卷積層的輸出結果做非線性映射,而卷積神經網絡常用的激勵函數一般為ReLU(修正線性單元),梯度簡單而且收斂快。

ReLU函數具有單側抑制,即輸入是負值時都會變為0,而輸入為正值的時候就為原值。這意味著全部的神經元不會在同一時間下被激活,這就使得網絡會變得比較稀疏,最終使得計算效率變得特別高。但是當一個比較大的梯度流過ReLU函數的神經元時就會導致這個神經元永久性的失活,并且不可逆,此后,這個神經元的梯度一直為0。

(4)池化層

池化層位于連續的卷積層中間,能夠壓縮數據和參數的量,在一定程度上可以防止過擬合,即若輸入的是圖像,那么池化層最主要的作用就是能夠壓縮圖像。池化層壓縮圖像時擁有特征不變性,即圖像壓縮時會過濾除去一些無關緊要的信息,從而留下一些具有尺度不變性特征的信息,這些特征時最能夠表達圖像的特征。池化層的池化操作還能夠進行特征降維,即去除圖像中沒有太多用途或者有重復的冗余信息,而把最重要的特征給提取出來。池化層一般用Max pooling和average pooling來進行池化操作,即選取局部區域的最大值或者平均值,其中用的比較頻繁的就是Max pooling,選取局部區域的最大值。

(5)全連接層

卷積神經網絡中的全連接層就相當于前饋神經網絡中的隱含層,每一層都是由許多神經元所組成的平鋪結構,通常其位于卷積神經網絡的尾部并且兩層之間的所有神經元都是擁有權重連接的。

(6)輸出層

輸出層是卷積神經網絡的最后一層,一般使用邏輯函數或歸一化指數函數即softmax function來對于圖像分類問題輸出分類標簽。輸出層會將上層輸出的特征向量通過內部的分類器進行處理,最后輸出分類標簽。常用的分類算法有樸素貝葉斯分類算法、支持向量機算法、K近鄰近算法等。其中使用比較頻繁的是softmax和支持向量機算法。

4總結

深度學習身為機器學習的一個新的研究方向,近幾年隨著機器學習的飛速發展,深度學習技術也越來越先進和成熟,人們對于人工智能的熱情也日漸增強。而機器視覺是通過機器將攝取到的目標轉化成圖像信號,可以說是相當于是人工智能領域的眼睛,也是該領域的一個重要研究方向。本文通過對于機器學習中深度學習的橫向研究,選擇了在機器視覺領域具有十分優秀效果的卷積神經網絡來對我們的項目“古文字識別系統”展開縱向的研究。本文主要就我們課題所使用的卷積神經網絡的發展與結構進行剖析,逐步展開卷積神經網絡技術的使用,最終成功地完成了課題的研究任務。

參考文獻:

[1] Waibel A. Phoneme recognition using time-delay neural networks[C].Meeting of the Institute of Electrical, Information and Communication Engineers (IEICE). Tokyo, Japan, 1987.

[2] Zhang W. Shift-invariant pattern recognition neural network and its optical architecture[C]. Proceedings of annual conference of the Japan Society of Applied Physics, 1988.

[3] LeCun Y,Boser B,Denker J S,etal.Backpropagation applied to handwritten zip code recognition[J].Neural Computation,1989,1(4):541-551.

[4] LeCun Y,Kavukcuoglu K,Farabet C.Convolutional networks and applications in vision[C]//Proceedingsof2010 IEEE International Symposium on Circuits and Systems.May 30 - June2,2010,Paris,France.IEEE,2010:253-256.

【通聯編輯:代影】

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 激情综合婷婷丁香五月尤物| 青青草国产一区二区三区| 91免费国产高清观看| 男女性午夜福利网站| 天堂在线视频精品| 欧美日韩一区二区三| 婷婷色婷婷| 欧美日韩在线亚洲国产人| 国产人免费人成免费视频| 成人在线亚洲| 色视频久久| 日韩在线视频网| 亚洲三级片在线看| 国产视频欧美| 高清大学生毛片一级| 日韩一区二区在线电影| 色婷婷成人网| 91视频99| 国产福利小视频高清在线观看| 国产精品男人的天堂| 亚洲AⅤ永久无码精品毛片| 国产成人高清精品免费5388| 色亚洲成人| 亚洲一级毛片在线观| 波多野结衣久久精品| 激情五月婷婷综合网| 青草国产在线视频| 另类重口100页在线播放| 午夜免费视频网站| 996免费视频国产在线播放| 精品人妻无码中字系列| 中日无码在线观看| 亚洲αv毛片| 国产99欧美精品久久精品久久| 永久毛片在线播| 欧美一区国产| www中文字幕在线观看| 欧美日韩亚洲国产主播第一区| 中文字幕日韩视频欧美一区| 中国毛片网| 日韩成人在线网站| 欧美97色| 亚洲永久精品ww47国产| 四虎免费视频网站| 精品视频在线一区| 成年午夜精品久久精品| 亚洲人成网址| 毛片手机在线看| 国产喷水视频| 性色一区| 国产视频欧美| 亚洲第七页| 丰满的熟女一区二区三区l| 国产成人精品一区二区不卡| 国产高清无码麻豆精品| 免费中文字幕一级毛片| 亚洲欧洲日韩久久狠狠爱| 波多野结衣一级毛片| 在线播放精品一区二区啪视频| 亚洲成人免费看| 久草性视频| 伊人久久综在合线亚洲2019| 日韩国产一区二区三区无码| 最新国产精品鲁鲁免费视频| 国产成人高清精品免费5388| 精品国产免费人成在线观看| 午夜欧美理论2019理论| 国产视频一二三区| www.日韩三级| 欧美高清日韩| 波多野结衣的av一区二区三区| 国产一级妓女av网站| www中文字幕在线观看| 黄色国产在线| 久久精品免费国产大片| 成人午夜福利视频| 福利在线不卡| 欧美一级视频免费| 亚洲欧美在线综合图区| 熟妇人妻无乱码中文字幕真矢织江| 一本无码在线观看| 欧美久久网|