999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機(jī)器學(xué)習(xí)的中小學(xué)書法評價研究綜述及展望

2021-09-10 07:22:44許兵
江蘇教育·書法教育 2021年4期
關(guān)鍵詞:機(jī)器學(xué)習(xí)深度學(xué)習(xí)

【摘 要】當(dāng)下,中小學(xué)的書法評分方法是按照一定的鑒賞標(biāo)準(zhǔn)來設(shè)計評分要點的,由評閱專家進(jìn)行主觀評分。但是由于不同專家的個人喜好、審美不同,所以很難解決公平、公正的問題。在書法評分標(biāo)準(zhǔn)中,所設(shè)計的評分要點看起來很細(xì)致、具體,但實際進(jìn)行評分操作時,那些描述精細(xì)的評分標(biāo)準(zhǔn)很難落實到具體的評分上。而且,不同的專家和教師評分結(jié)果參差不齊,評分標(biāo)準(zhǔn)懸殊較大。目前,機(jī)器學(xué)習(xí),特別是深度學(xué)習(xí)在圖像識別、自然語言處理等方面取得了較大的進(jìn)展,只要有足夠大的數(shù)據(jù)集,它們在圖像分類方面的精確性非常高。機(jī)器學(xué)習(xí),特別是深度學(xué)習(xí)圖像分類法,為解決中小學(xué)書法作品分級評分提供了全新的思路和解決方案。

【關(guān)鍵詞】書法評價;機(jī)器學(xué)習(xí);數(shù)據(jù)集;深度學(xué)習(xí)

【中圖分類號】G471? 【文獻(xiàn)標(biāo)志碼】B? 【文章編號】1005-6009(2021)30-0017-05

【作者簡介】許兵,江蘇省鹽城市日月路小學(xué)(江蘇鹽城,224005)黨支部書記、校長,高級教師,江蘇省語文特級教師。

基于機(jī)器學(xué)習(xí)的書法評價需要大量的數(shù)據(jù)和訓(xùn)練才能得以驗證其評價結(jié)果的有效性。目前,國內(nèi)外已有不少學(xué)者在文字識別領(lǐng)域取得了豐碩的研究成果,并很好地應(yīng)用在了印刷體和部分手寫體文字識別方面。但是,目前基于機(jī)器學(xué)習(xí)的書法評價體系方面的相關(guān)研究還非常少,尚處于起步階段。國內(nèi)只有湖北工業(yè)大學(xué)的邵榮堂、西安理工大學(xué)的張福成有了一些探索和研究。實踐證明,基于機(jī)器學(xué)習(xí)的書法評價方法可以發(fā)現(xiàn)很多傳統(tǒng)人工評價難以觀察到的規(guī)律,有很強(qiáng)的實用價值和現(xiàn)實意義。本文系統(tǒng)地闡述國內(nèi)外書法評價體系的現(xiàn)狀以及基于機(jī)器學(xué)習(xí)的書法評價模型,還提出一種自建數(shù)據(jù)集的全新書法評價模型和后續(xù)研究的建議。

一、中小學(xué)書法評價體系研究綜述

目前常見的書法評價體系研究主要可以分為定量研究、定性研究和機(jī)器學(xué)習(xí)研究三大類型。

1.定量研究。

定量研究中最常見的指標(biāo)建構(gòu)方法是因子分析法:因子分析法(或稱因素分析、指數(shù)分析)是定量研究中得到最普遍應(yīng)用的指標(biāo)建構(gòu)方法,它屬于社會科學(xué)實證研究方法,一般通過統(tǒng)計學(xué)統(tǒng)計軟件包SPSS等軟件來完成計算,其操作相對簡單、易學(xué)。因子分析法包括探索性因子分析和驗證性因子分析兩種進(jìn)路。指標(biāo)建構(gòu)時所采用的因子分析法一般是前者。

因子分析的前提是獲得大量資料,并通過“概念化”的操作,將其轉(zhuǎn)換為可分析的數(shù)據(jù)。關(guān)于這一點,白謙慎曾多次提議中國書法家協(xié)會的研究人員利用投稿登記表進(jìn)行一些基礎(chǔ)性的實證研究。

因子分析的原理是將收集到的盡可能多的各項細(xì)分標(biāo)準(zhǔn)加以量化,通過計算機(jī)“巴雷特球形檢驗”等檢驗方法,看原始數(shù)據(jù)是否具備指標(biāo)建構(gòu)的可能性。檢驗之后進(jìn)行統(tǒng)計,將分散的要素進(jìn)行歸納整理,再進(jìn)行坐標(biāo)軸轉(zhuǎn)換,最后利用人工判斷對所歸納出來的各主要成分進(jìn)行因子命名。

因子分析的優(yōu)勢,是由計算機(jī)對各類數(shù)據(jù)進(jìn)行統(tǒng)計歸納,所建構(gòu)出的因子邏輯性較強(qiáng)。但此方法比較簡單,且仍需經(jīng)過研究者的人工命名,最終結(jié)果又具有研究者的主觀性。

2.定性研究。

德爾菲法是書法評價定性研究中普遍使用的指標(biāo)建構(gòu)方法。在這方面,海南師范大學(xué)的代晴做了較為深入的研究。建立一個學(xué)科教學(xué)評價體系是非常復(fù)雜的過程,需要綜合教育學(xué)、心理學(xué)、統(tǒng)計學(xué)、數(shù)學(xué),甚至哲學(xué)等多個學(xué)科的知識來完成。閉門造車、單一化的構(gòu)建方法都無法探索出一套科學(xué)的、符合客觀實際的教學(xué)評價體系。在此基礎(chǔ)上,德爾菲法作為一種匿名式的、征詢多輪專家意見的、具備集體經(jīng)驗判斷的方法,近些年受到了教育界人士的關(guān)注,并逐漸被更多的教育工作者運用到教學(xué)評價體系中。德爾菲法是建立在一個結(jié)構(gòu)化的收集和提取過程基礎(chǔ)上的方法論,通過一系列問卷調(diào)查與意見反饋交叉獲取到共識目標(biāo)。

3.機(jī)器學(xué)習(xí)研究。

當(dāng)前對于書法字的識別大多采用輪廓相似性以及骨架相似性的方法。吳媛等人提出的一種基于數(shù)學(xué)形態(tài)學(xué)的脫機(jī)手寫體漢字識別方法,此方法識別率很高,但遇到檢索數(shù)據(jù)量大的情況時速度會明顯變慢。俞凱等人在此基礎(chǔ)上又提出一種基于骨架相似性的書法字檢索方法,在保證查全率與查準(zhǔn)率的基礎(chǔ)上,檢索速率方面有顯著的提升。但是此方法建立的特征數(shù)據(jù)庫比較大,并不能滿足系統(tǒng)的設(shè)計要求。之后,章夏芬等人提出根據(jù)樣本字特征而進(jìn)行動態(tài)變化的自適應(yīng)匹配法,在效率沒有改變的前提下,查全率與查準(zhǔn)率都得到了一定的提升。此方法很大程度上解決了算法計算量大、耗時長、效率低的問題。

在識別樣本完成之后,書法評價系統(tǒng)方面的研究同樣復(fù)雜。目前,絕大多數(shù)采用的是將要評價的樣本與標(biāo)準(zhǔn)書法作品進(jìn)行相似度計算的方法。例如,湖北工業(yè)大學(xué)的邵榮堂首先進(jìn)行計算書法練習(xí)作品樣本中書法字的骨架與字帖中書法字骨架的相似度,骨架提取的算法采用本文中提出的一種基于Z-S 算法改進(jìn)的單像素化處理算法,從而得到基于整體結(jié)構(gòu)特征的相似度值;而后采用九宮格的形式對書法字骨架進(jìn)行切分,將每一部分的骨架對比字帖書法字相同位置的骨架,利用Hu矩與皮爾遜相關(guān)系數(shù)對相似度進(jìn)行計算,得到基于筆畫形體特征的相似度值;最后利用書法字距離邊框的值與整個書法字在邊框中的布局來綜合計算字體布局特征面的相似度值。整體評判的標(biāo)準(zhǔn)依據(jù)書法初級考試的標(biāo)準(zhǔn)制定。

但是以上方法都沒有充分利用機(jī)器學(xué)習(xí)的優(yōu)勢,沒有采集大量的數(shù)據(jù)、建立專用數(shù)據(jù)集,更沒有用深度學(xué)習(xí)的方法訓(xùn)練系統(tǒng),從而達(dá)到自動打分的目的。

二、書法識別與評價研究綜述

1.手寫漢字識別國內(nèi)外研究現(xiàn)狀。

德國的Taushek首次通過實驗,利用光學(xué)模板匹配的方法獲得了英文光學(xué)字符識別的專利,拉開了利用機(jī)器學(xué)習(xí)進(jìn)行文字識別歷史的帷幕。美國IBM公司的Casey和Nagy通過基于漢字結(jié)構(gòu)的匹配法來進(jìn)行印刷體漢字識別的研究,同時該方法得到了廣泛的應(yīng)用。Pittsburgh大學(xué)的Zobark提出利用漢字筆跡的方向特征來對在線漢字進(jìn)行識別。麻省理工學(xué)院的Liu等人則提出通過漢字筆畫來實現(xiàn)在線漢字識別。受到這些技術(shù)的啟發(fā),日本也著手開始了對漢字識別技術(shù)的研究。東芝公司率先生產(chǎn)出第一個印刷體漢字識別系統(tǒng),其所能識別的漢字達(dá)2000個。

相較于其他國家,我國開始著手漢字識別的時間較晚。20世紀(jì)70年代末,我國才開始了漢字識別的研究。在漢字識別的起始階段,我國實現(xiàn)的漢字識別效果并不是很理想,往往對于已完成訓(xùn)練的樣本的識別準(zhǔn)確率很高,但是以現(xiàn)實場景的實際文字來看,識別準(zhǔn)確率仍然達(dá)不到預(yù)期,其緣由是因為在漢字識別的起始階段,由于技術(shù)不成熟,我國漢字識別系統(tǒng)的抗干擾能力以及泛化能力并不是很強(qiáng)。隨著我國對漢字識別技術(shù)的深入研究,部分產(chǎn)品已經(jīng)在市場中受到廣泛關(guān)注。沈陽自動化研究所與清華大學(xué)計算機(jī)系研發(fā)出了可以識別3755個印刷體漢字的技術(shù)。朱夏寧團(tuán)隊等提出了能夠識別6763個印刷體漢字的識別方法。中科院自動化研究所也研制出了可用于一定人群的脫機(jī)手寫漢字識別系統(tǒng)。隨著我國漢字識別技術(shù)研究的不斷深入,許多成熟的漢字識別系統(tǒng)也已在市場得到了廣泛的應(yīng)用,例如曙光OCR、清華文通、漢王OCR等。

2.書法評價國內(nèi)外研究現(xiàn)狀。

在基于機(jī)器學(xué)習(xí)的書法評價研究方面,萬華林等人提出了比較圖像幾何形狀的方法來比較兩幅圖像的相似度,并將其應(yīng)用在了書法字幾何形狀的提取上。俞凱等提出了基于骨架相似性的書法檢索方法。首先提取檢索字與被檢索字的骨架信息,然后計算檢索字上每一點像素周圍規(guī)定范圍內(nèi)與被檢索字骨架上對應(yīng)點的距離,最后通過兩者骨架相似度進(jìn)行選擇。劉洋通過提取結(jié)構(gòu)等特征的方法提取出了書法字的部分及整體布局,從而提取出了書家的特征點,并將此方法用于書法字真?zhèn)舞b別。簡麗瓊通過文字識別的方法進(jìn)行區(qū)分書法字,該方法首先提取圖像的Zemike矩和Hu矩,然后通過K近鄰進(jìn)行識別,該方法具有很強(qiáng)的魯棒性。陳頡提出了一種分層的特征匹配法,該方法基于骨架結(jié)構(gòu)相似性。首先通過分層模板獲取二值圖像的精細(xì)骨架,然后通過形狀不變矩把相似圖像放在一起,最后進(jìn)行第二次檢索,并根據(jù)相似度來顯示同一漢字的不同字體。李牧采用歐式距離法計算骨架相似度。該方法首先尋找臨摹字骨架圖像上每個與原帖字骨架圖像上距離最小的像素點,然后通過最小距離和來評價臨摹作品。需要指出的是,該方法僅適用于結(jié)構(gòu)簡單的書法字體,對于結(jié)構(gòu)復(fù)雜的漢字效果并不理想。

三、書法評價網(wǎng)絡(luò)模型與訓(xùn)練研究綜述

目前,常見的有兩種進(jìn)行書法評價的深度學(xué)習(xí)網(wǎng)絡(luò)模型,一種是采用Keras搭建的卷積網(wǎng)絡(luò)模型,另一種是曲延直等人采用的深度殘差網(wǎng)絡(luò)ResNet50模型。

1.卷積網(wǎng)絡(luò)模型。

卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)在計算機(jī)視覺應(yīng)用上的主要方法,研究價值與應(yīng)用前景與日俱增。作為區(qū)別于全連接神經(jīng)網(wǎng)絡(luò)的多層神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)具有更高的工作效率,在圖像處理,特別是大圖像處理方面有著較大的優(yōu)勢。

卷積網(wǎng)絡(luò)模型主要由卷積、卷積核、池化、全連接層、損失函數(shù)、激活函數(shù)等構(gòu)件組成。為達(dá)成不同目的,選擇構(gòu)建網(wǎng)絡(luò)的組件往往不同,構(gòu)筑的模型也不同。曲延直等人主要使用Keras框架進(jìn)行卷積網(wǎng)絡(luò)模型的訓(xùn)練與測試實驗。Keras是用Python編寫的開源人工神經(jīng)網(wǎng)絡(luò)庫,它能夠進(jìn)行模塊化的程序設(shè)計,同時還能夠在此基礎(chǔ)上進(jìn)行擴(kuò)充,具有簡易性、快速性的特點。

2.深度殘差網(wǎng)絡(luò)ResNet50模型。

卷積神經(jīng)網(wǎng)絡(luò)能夠提取不同級別的特征,網(wǎng)絡(luò)層數(shù)越多,意味著能夠提取到越豐富的不同級別的特征。但當(dāng)深度卷積網(wǎng)絡(luò)達(dá)到一定深度后,再單純地增加層數(shù)并不能帶來網(wǎng)絡(luò)性能的提高,反而會導(dǎo)致網(wǎng)絡(luò)收斂變得更慢,分類準(zhǔn)確率也會變得更差。在2014年提出的 GoogleNet僅有14層,為保證在準(zhǔn)確率較高的前提下增加網(wǎng)絡(luò)層數(shù),何凱明等4名來自微軟研究院的華人在2015年提出了ResNet殘差網(wǎng)絡(luò)模型,該模型具有152層。這大大提升了網(wǎng)絡(luò)層數(shù)的數(shù)量級,同時解決了增加網(wǎng)絡(luò)深度帶來的副作用,使通過單純增加網(wǎng)絡(luò)深度來提高網(wǎng)絡(luò)性能的構(gòu)想成為可能。

傳統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)是將每層的輸出直接傳遞給相鄰的下一層,作為下一層的輸入值。而ResNet網(wǎng)絡(luò)結(jié)構(gòu)通過改變映射方式,降低了擬合殘差的難度。實驗表明,殘差網(wǎng)絡(luò)更容易優(yōu)化,并且能夠通過增加相當(dāng)?shù)木W(wǎng)絡(luò)深度來提高準(zhǔn)確率。

四、書法評價系統(tǒng)實現(xiàn)與展望

目前,云服務(wù)功能強(qiáng)大,市場主流的云服務(wù)供應(yīng)商如AWS、阿里云和騰訊云都提供了功能強(qiáng)大的機(jī)器學(xué)習(xí)服務(wù),如AWS的Machine Learning、阿里云的機(jī)器學(xué)習(xí)平臺PAI和騰訊云的智能鈦機(jī)器學(xué)習(xí)(如圖1)。三者功能大同小異,都提供基于TensorFlow的機(jī)器學(xué)習(xí)服務(wù)。

以采用亞馬遜AWS服務(wù)搭建基于機(jī)器學(xué)習(xí)的書法評分體系為例,將采集的書法圖片和老師人工打分上傳到在AWS虛擬主機(jī),建立的專用數(shù)據(jù)集,選用適合的模型進(jìn)行訓(xùn)練,將書法作品按結(jié)構(gòu)、書寫、篇幅三個方面,各項按一定的分值評分,并將該三個評分加權(quán)綜合評分,給出最終評分結(jié)果,很好地解決了公平公正和評判速度等問題。AWS服務(wù)系統(tǒng)操作流程如下:

1.首先在AWS注冊一個賬號,需要填寫Visa或者M(jìn)astercard信用卡信息。

購買一個合適的實例,運行TensorFlow(如圖2)。

a.登錄控制臺。

b.在控制臺首頁,選擇數(shù)據(jù)準(zhǔn)備 ,再選擇數(shù)據(jù)集管理。

c.在數(shù)據(jù)集管理頁面,單擊注冊數(shù)據(jù)集。

3.電腦和AWS實例配置過程如下:

在電腦上端安裝Python 3.5及以上的版本(TensorFlow從1.2開始支持 Python3.6,之前的版本官方是不支持的)。

4.導(dǎo)入文件實現(xiàn)訓(xùn)練。

導(dǎo)入文件,打開winscp使用公有DNS把文件放在home→ubuntu 這個文件夾里面,上傳完畢以后,查看你第一次連接實例的時候刷出的環(huán)境信息,比如打開TensorFlow環(huán)境就用source activate tensorflow_p36。最后上傳數(shù)據(jù),進(jìn)行訓(xùn)練即可。

這種基于機(jī)器學(xué)習(xí)的采用亞馬遜AWS服務(wù)的書法評價系統(tǒng)有很好的實用價值。但由于其使用的樣本總數(shù)偏少,導(dǎo)致算法不夠完美,所以目前機(jī)器學(xué)習(xí)系統(tǒng)打分打出來的分?jǐn)?shù)還不夠準(zhǔn)確,后續(xù)需要進(jìn)一步完善。

【參考文獻(xiàn)】

[1]張福成. 基于卷積神經(jīng)網(wǎng)絡(luò)的書法風(fēng)格識別的研究[D].西安:西安理工大學(xué),2018.

[2]郭鵬. 深度卷積神經(jīng)網(wǎng)絡(luò)及其在手寫體漢字識別中的應(yīng)用研究[D].成都:四川師范大學(xué),2016.

[3]尹成娟. 基于深度學(xué)習(xí)的手寫漢字集識別方法的研究[D].天津:天津科技大學(xué),2019.

[4]邵榮堂. 基于機(jī)器學(xué)習(xí)的書法字識別與智能評判[D].武漢:湖北工業(yè)大學(xué),2020.

[5]周潤物,李智勇,陳少淼,等.面向大數(shù)據(jù)處理的并行優(yōu)化抽樣聚類K-means算法[J].計算機(jī)應(yīng)用,2016,36(2):311-315,329.

[6]王民,曾寶瑩,要趁紅,等.中國書法的特征提取及識別[J].信息通信,2015(7):19-20.

[7]曲延直.基于深度學(xué)習(xí)的漢字書法識別研究[J].電子測試,2019(24):44-46,61.

猜你喜歡
機(jī)器學(xué)習(xí)深度學(xué)習(xí)
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
軟件工程(2016年8期)2016-10-25 15:47:34
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
主站蜘蛛池模板: 亚洲欧美极品| 小说 亚洲 无码 精品| 亚洲一级毛片免费看| 日韩精品免费一线在线观看| 亚洲五月激情网| 成人av专区精品无码国产| 色婷婷成人| 亚洲第一香蕉视频| 国产一区三区二区中文在线| 伊人久久综在合线亚洲91| 久久这里只有精品2| 制服丝袜一区| 欧美亚洲日韩中文| 久久精品66| 国产拍揄自揄精品视频网站| 黄色片中文字幕| 日本精品αv中文字幕| 大陆精大陆国产国语精品1024| 欧美一区中文字幕| 国产成人精品2021欧美日韩 | 亚洲欧美日韩中文字幕在线一区| 亚洲天堂视频在线观看| 一级毛片在线直接观看| 亚洲国产天堂久久综合226114| 制服无码网站| 高清大学生毛片一级| 波多野结衣视频网站| 9久久伊人精品综合| 波多野结衣中文字幕一区二区| 国产一二三区视频| 首页亚洲国产丝袜长腿综合| 亚洲视频免费在线看| 狠狠综合久久| 国产成人麻豆精品| 美女无遮挡免费视频网站| 青青草原国产| 久久香蕉国产线看精品| 久久一日本道色综合久久| 亚洲一区色| 精品第一国产综合精品Aⅴ| 欧美成人a∨视频免费观看| 日本高清免费不卡视频| 91蝌蚪视频在线观看| 2021亚洲精品不卡a| 亚洲黄色激情网站| 久久久精品国产亚洲AV日韩| 亚洲美女久久| 亚洲成人黄色网址| 国模私拍一区二区| 999精品色在线观看| 亚洲欧美在线综合图区| 亚洲精品自在线拍| 国产精品jizz在线观看软件| 青青草91视频| 69av免费视频| 国产浮力第一页永久地址| 99热这里只有精品国产99| 国产亚洲精品精品精品| 中文字幕久久亚洲一区| 亚洲精品va| 超薄丝袜足j国产在线视频| 波多野结衣亚洲一区| 无码不卡的中文字幕视频| 亚洲成年人片| 婷婷六月综合网| 无码不卡的中文字幕视频| 国产精品无码在线看| 亚洲bt欧美bt精品| 狠狠做深爱婷婷久久一区| 欧美日韩在线成人| 免费中文字幕一级毛片| 亚洲视频一区| 日韩精品一区二区三区视频免费看| 无码专区国产精品第一页| 国产日韩精品欧美一区喷| 国产91在线|日本| 婷婷在线网站| 操国产美女| 中国一级毛片免费观看| 国产第一页亚洲| 免费人欧美成又黄又爽的视频| 国产精品三区四区|