999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

手寫漢字正確性評價綜合方案實現(xiàn)及效果測試

2019-10-08 03:21:33姜杰吳菊英韓青李藝
電化教育研究 2019年9期

姜杰 吳菊英 韓青 李藝

[摘? ?要] 漢字書寫評價與指導的信息化需求,促進了書寫質(zhì)量智能評價技術(shù)方案的研究以及付諸教學實踐。既有“關(guān)鍵筆畫+逐步蔓延”方案經(jīng)歷了三年的書寫教學實驗后,研究站在漢字歷史、文化以及日常書寫識讀立場上,確立了新的書寫正確性綜合判定思想以及書寫細節(jié)糾錯的評價目標。研究優(yōu)化先前正確性評價指標體系,采取筆畫類型、空間關(guān)系等構(gòu)字要素邏輯地位等同評價策略,設(shè)計了基于綜合特征匹配的漢字書寫正確性評價方案。針對該綜合匹配方案,根據(jù)實效進行了筆畫形態(tài)、相對位置等正確性評價指標特征權(quán)重的調(diào)整。為驗證面向教學應用的效果,設(shè)計了“惡意書寫場景”下的新舊方案的對比測試,結(jié)果表明,綜合方案對錯字的判定率相較于舊方案的93%進一步提高到97.5%,并在錯誤細節(jié)發(fā)現(xiàn)上有質(zhì)的突破,達到89.9%;設(shè)計了“數(shù)據(jù)真實”情境下的一般性測試,結(jié)果表明,綜合方案在漢字書寫教學實踐數(shù)據(jù)抽樣樣本的正確性評判與人工評判的一致性上達到98.22%,可以更好地支持新一階段漢字書寫教學信息化實踐的應用需求。

[關(guān)鍵詞] 漢字書寫; 綜合特征匹配; 正確性評價; 效果測試

[中圖分類號] G434? ? ? ? ? ? [文獻標志碼] A

[作者簡介] 姜杰(1977—),男,江蘇揚州人。講師,博士,主要從事教育信息化、文字計算研究。E-mail:jiangjie @foxmail.com。

一、引? ?言

我國政府非常重視漢字書寫教育,相關(guān)部委近年來發(fā)布的《國家中長期語言文字事業(yè)改革和發(fā)展規(guī)劃綱要》《教育部關(guān)于在中小學加強寫字教學的若干意見》等多項文件[1-2]中,皆反復強調(diào)漢字書寫教育的重要性,甚至提出增設(shè)相應課程的要求,其中就包括硬筆漢字書寫部分。而與之相對應,實踐過程中書法師資缺乏等因素使得漢字書寫教育一直處于困境之中,無法獲得較高效率的發(fā)展。在這一需求的刺激下,既有研究者圍繞漢字結(jié)構(gòu)與計算提出種種非常有建構(gòu)意義的模型,推動了技術(shù)的進步;也有部分企業(yè)開展了智能漢字書寫評價產(chǎn)品的研發(fā)與市場化,旨在為學生漢字書寫提供智能化指導,借此緩解師資力量不足的矛盾。考察所有這些技術(shù)或產(chǎn)品,硬筆漢字書寫正確性的評價,是書寫質(zhì)量評價技術(shù)的基礎(chǔ)與核心。在所有這些研發(fā)主體群落中,本團隊在手寫硬筆漢字正確性評價方面的工作最有實效,也最有代表性。

二、相關(guān)研究基礎(chǔ)和進展情況

(一)其他團隊相關(guān)研究

在針對文字(漢字)結(jié)構(gòu)計算的相關(guān)領(lǐng)域中,有一些研究在CDL(字符描述語言)、SCML(結(jié)構(gòu)化字符描述語言)基礎(chǔ)上,開始對構(gòu)字元素與規(guī)則進行標識與計算,如設(shè)計了漢字結(jié)構(gòu)碼對傳統(tǒng)書法規(guī)則進行量化[3]等,用數(shù)學領(lǐng)域中的拓撲學理論對漢字的拓撲結(jié)構(gòu)進行分析[4]等,該類型的研究在文字表征基礎(chǔ)上對構(gòu)字元素的識別與測量,與本研究僅在對文字表征的基礎(chǔ)研究層面有相似相通之處。

指向漢字書寫質(zhì)量評價的相關(guān)研究方案中,部分以筆畫匹配為手段對漢字書寫筆順進行識別、判斷與展示,研究主要指向筆順特征的評判[5];部分限定了正確筆順前提[6],或正確筆畫起落點空間位置前提[7],或有限書寫格式前提[8],抑或同時限定諸如形體結(jié)構(gòu)及筆畫等多個前提,方能準確判定漢字書寫正誤,其研究成果實現(xiàn)的限制條件過多;部分研究將正確與美觀整合在一起進行字體結(jié)構(gòu)的綜合評分[9],或?qū)ΨQ性、緊湊性和勻稱性等結(jié)構(gòu)規(guī)范性方面開展評價[10],其“正確”概念界定不明;亦有研究提出了與本研究目標相近的筆畫書寫、筆畫順序以及筆畫關(guān)系正誤判斷,但其筆畫空間關(guān)系細化中缺乏相交相接概念,且方案中以節(jié)點及邊替換的方法,對于較為復雜且書寫自由度較大的漢字來說,判斷準確度很差,遠不能談及實用[11]。

從技術(shù)方法上考察,上述相關(guān)研究大都用到筆畫類型特征識別與判別、筆畫空間拓撲關(guān)系判別、特征向量距離計算、關(guān)系矩陣計算、模板匹配等其中的某種方法或多種技術(shù)方法的組合來實現(xiàn)特定目標。同時,研究方案和技術(shù)方法的最終驗證大都采用實驗數(shù)據(jù)來測試檢驗,較少見到應用服務(產(chǎn)品)形態(tài)的檢驗,更罕見一定時間跨度和實踐規(guī)模下面向應用問題驅(qū)動的迭代更新研究。

(二)本團隊的既有解決方案

借鑒并突破國內(nèi)外的相關(guān)研究,本研究團隊完成了漢字書寫描述語言(WDL)設(shè)計[12]、GB2312楷體書寫字庫構(gòu)建等相關(guān)基礎(chǔ)研究工作,確立了基于正確性和工整性評價兩層體系的書寫質(zhì)量評價方案。其中正確性評價的目標,是對用戶書寫樣本字給出嚴格意義上的整體判定;其技術(shù)實現(xiàn),是基于“關(guān)鍵筆畫+逐步蔓延”思路的模板匹配方案,即在統(tǒng)一建立的漢字筆畫元素與結(jié)構(gòu)描述標準的基礎(chǔ)上,采集用戶手寫字信息并將其與標準模板相匹配完成正確性判斷的方案[13]。該方案以自動化分析、提取標準模板字筆畫、部件、整字三層構(gòu)字特征為基礎(chǔ),輔助以半人工方式對模板字中諸如唯一類型筆畫、特殊復雜筆畫等關(guān)鍵性判別筆畫進行標注,完成基于標準模板字的正確性特征標記集。對用戶樣本字的正確性評價的過程,即以對應模板字的正確性特征標記集為查找、配對標準,首先匹配確認關(guān)鍵性筆畫(或筆畫集),再進一步查找匹配與之具有嚴格交關(guān)系特征以及具有明確位置關(guān)系特征的筆畫元素;后續(xù)不斷以確認完成的筆畫元素為基礎(chǔ),配合筆畫類型與筆畫間拓撲關(guān)系等特征蔓延匹配剩余的待匹配筆畫,直至完成樣本字與標準模板字所有筆畫的匹配,在此基礎(chǔ)上,完成手寫漢字的正確性判斷。

三、綜合匹配正確性評價方案構(gòu)思

(一)正確性評價技術(shù)思想討論

原“關(guān)鍵筆畫+逐步蔓延”的正確性評價方案(下文簡稱:“原方案”)投入實驗后,參加實驗的學生及教師普遍反映該方案在正確性評價方面是有效的[14-15],就是說,基本上步入了“可用”的范圍。但是,由于實際漢字書寫學習中需要指出在筆畫及部件層次的各種錯誤細節(jié),如一個短撇寫成短橫、橫折寫成了橫折鉤、不該交的位置寫成了交等,針對這些情況,該方案很容易陷入判斷困境,只好要求用戶再次書寫。總體上說,針對真實的應用需求,原方案在正確性評價精準程度方面依然有一定的局限性。

研究團隊一方面在繼續(xù)優(yōu)化原方案,另一方面開始了對原方案合理性的質(zhì)疑,試圖尋找關(guān)于手寫漢字正確性計算的更加合理的理解和解釋。考察漢字的發(fā)明及歷史上的演進,我們發(fā)現(xiàn),“筆畫形態(tài)”“關(guān)鍵筆畫”及個別“重要特征”在構(gòu)成漢字上并不具有邏輯在先的地位,相反,筆畫相對位置有時卻可以被認為有更高的“權(quán)重”,如圖1所示。

在這些漢字的演化過程中,筆畫層次的部分特征雖然得以保留,但演化過程更忠誠于其相對位置關(guān)系。至少可以認識到,所有漢字構(gòu)成特征中的各個“分項”,包括筆畫形態(tài)、筆畫交接關(guān)系、筆畫相對位置等,并沒有任何一個是“邏輯在先”的,只能是權(quán)重上的差異。再進一步考察當代漢字應用場景,如諸多變形的美術(shù)字以及創(chuàng)意類字體,其筆畫乃至部件的形態(tài)發(fā)生了異化與變形后,但只要其相對位置關(guān)系正確,并不會產(chǎn)生太多識讀層面上的歧義。

總結(jié)原有正確性評價方案目標與方案思想的局限,研究團隊對新階段正確性評價方案有了更新的認識與定位。首先,在正確性的評判思想上,站在漢字歷史、文化和應用的立場上進行評判,亦即在尊重書法藝術(shù)對文字筆畫形體和結(jié)構(gòu)適度創(chuàng)作性表達基礎(chǔ)上,在適應漢字書寫與識讀的實際應用場景的基礎(chǔ)之上,采取允許適度“意達形變”的評判規(guī)則;其次,功能目標上,超越原有整體通過與否的簡單判定,站在精確定位錯誤對象、精準判斷錯誤類型的書寫指導需求服務之上,在正確性評判的同時開展細節(jié)糾錯型評價。

與新階段正確性評價方案思想、目標相適應,突破既往的“筆畫類型邏輯在先,其余諸如空間拓撲等筆畫間關(guān)系邏輯在后輔助判斷”的技術(shù)方案,研究團隊采用了筆畫類型、空間關(guān)系等要素邏輯地位等同,并根據(jù)實效進行特征權(quán)重調(diào)整的綜合匹配正確性評價技術(shù)方案(下文簡稱:綜合方案)。

(二)綜合方案的指標體系框架

原方案從書寫入手,以書寫所得字的形態(tài)結(jié)構(gòu)以及書寫過程的運筆筆順兩方面構(gòu)建正確性指標體系。首先由書寫徑跡得其筆畫形態(tài),再通過筆畫間關(guān)系構(gòu)成部件,最終由部件通過部件關(guān)系(亦或構(gòu)成更復雜形態(tài)的部件)完成整字構(gòu)建。筆畫間關(guān)系是指筆畫方位關(guān)系、筆畫組合關(guān)系(交接鄰)及筆畫長短關(guān)系,部件間關(guān)系以方位關(guān)系特征指標為主[16],其指標體系框架見表1。

綜合方案指標體系,立足于既有指標體系,依據(jù)方案思想與目標,作了體系框架和內(nèi)容的調(diào)整,見表2。在體系框架上,取消構(gòu)字中間層的部件指標體系,究其原因,其一,部件本身是基于筆畫形態(tài)和筆畫間關(guān)系而形成的筆畫關(guān)系組合體,從識別角度考察是用戶書寫筆畫所得之組合的整體表征,從計算方法考察是正確筆畫匹配映射之后基于模板字部件關(guān)系標注的加工結(jié)果,部件本身不存在超越筆畫及組合關(guān)系的正確性判斷需求。其二,多個部件之間以方位為主的拓撲關(guān)系的計算與正確性評判,其可以通過部件間的筆畫關(guān)系計算得來;同理,原來整字層面一些特征的正確性判定,亦可通過筆畫特征及組合關(guān)系計算判斷。其三,構(gòu)字元素的計算方法上,扁平單一的筆畫元素與關(guān)系層面的計算相較于多層結(jié)構(gòu)元素與關(guān)系的計算在效率、復雜度、可靠度方面均有較大的優(yōu)勢。在體系內(nèi)容歸屬上,筆畫數(shù)量特征、筆順特征調(diào)整到整字特征指標體系之下,因這兩類特征雖可直接關(guān)聯(lián)到具體筆畫,但只有從全體筆畫層面考察與評判才有意義。

四、綜合方案的實現(xiàn)與性能優(yōu)化實驗

(一)正確性判定實現(xiàn)流程與特征權(quán)重分配實驗設(shè)計

綜合匹配方案的正誤判定,以用戶樣本字與模板字各指標項特征相似度加權(quán)來綜合評判。方案實現(xiàn)的主要步驟是:首先,對筆畫走向特征、筆畫長度比特征、筆畫絕對位置特征、相對位置特征,以及交關(guān)系等多個指標項分別求解特征相似度矩陣;而后,在此基礎(chǔ)上進行各特征相似度矩陣的權(quán)重加權(quán)求和計算與匹配判定。通常情況下,樣本字與模板字相對應的筆畫能以高于匹配度閾值或明顯高于其他筆畫匹配度數(shù)值的方式顯現(xiàn),從而實現(xiàn)筆畫匹配;對于仍然無法匹配的易混淆筆畫(或筆畫集),則須進行附加的兩兩之間筆畫鄰方位關(guān)系的匹配運算,達到最終正確與否的判定,其主要流程如圖2所示。

綜合方案中,各指標項權(quán)重比例分配通過權(quán)重實驗檢驗優(yōu)化,并可在后期教學實踐中微調(diào),權(quán)重實驗設(shè)置與效果檢驗,主要考慮下面幾方面因素:其一,評價方案思想對不同指標項寬容程度,即正確性認識與理解的差異,賦予不同指標項特征的正確與否判定權(quán)設(shè)置;其二,評價方案的實施目標性質(zhì),即考試考級目標的整體評判,亦或指導教學目標的細節(jié)糾錯等;其三,正確性評價所施教對象的漢字書寫水平與需求,此項主要以漢字是否為第一母語文字為依據(jù),區(qū)分筆畫形態(tài)、書寫過程等特征項嚴判程度。

權(quán)重分配實驗是對綜合方案的優(yōu)化測試。實驗設(shè)計的測試樣本字集的選擇考慮了以下幾個方面:其一,字集基礎(chǔ)要求應該是包含各種典型筆畫及結(jié)構(gòu),以使實驗對各種情況有較好的覆蓋;其二,測試字集的信度要求,字集應該有一定的數(shù)量,以獲得有信度的統(tǒng)計結(jié)果,所謂數(shù)量的考量不僅僅是總體數(shù)量,亦應該考慮關(guān)于筆畫及結(jié)構(gòu)的每個類的數(shù)量;其三,必須是真實對象的手寫字,這樣才對將來的手寫字判斷應用有直接的針對性,團隊在此方面有豐富的積累,即來自若干年基于原方案的教學實驗所積累的學生手寫字;其四,由于此時進行的是針對系統(tǒng)基礎(chǔ)性優(yōu)化,所選手寫字應該相對較為“工整”,所謂“工整”的基礎(chǔ)條件是,關(guān)于該字是否正確應該有明確的判斷而不至于無法分辨;其五,所選例字中應該有一定比例的錯字,可以初步順便檢驗系統(tǒng)對錯字的檢出率以及可否發(fā)現(xiàn)錯誤細節(jié),而實際上,團隊前期實驗中所積累的用戶手寫字中,恰好有一定比例的錯字,可以用于支持本基礎(chǔ)性測試。

根據(jù)上述權(quán)重分配與測試字集設(shè)計需求,由研究團隊中負責書寫教學實施、跟蹤的研究者(非開發(fā)者)從實驗積累用戶字中篩選1000個字組成測試樣本字集。實驗對各指標項特征相似矩陣進行多輪次、不同權(quán)重配比方案下的綜合正誤判定結(jié)果進行統(tǒng)計,并與專家人工的判定作一致性對比。實驗對比結(jié)果顯示,筆畫形態(tài)特征、筆畫長度比特征、筆畫絕對位置特征、筆畫相對位置特征、筆畫交關(guān)系特征,這些指標項權(quán)重按1:1:0:7:1配比時,可獲得最高62%的專家人工判定一致性,以此權(quán)重配比為基礎(chǔ),對混淆未能匹配的剩余筆畫集進行鄰關(guān)系特征附加判定,可實現(xiàn)最高98%的總體判斷正確率。

主站蜘蛛池模板: 操美女免费网站| 亚洲va精品中文字幕| 久久亚洲黄色视频| 十八禁美女裸体网站| 国产一区二区精品福利| 日本免费精品| 97一区二区在线播放| 在线观看欧美国产| 欧美色综合网站| 日本手机在线视频| 国产99视频精品免费视频7| 熟女成人国产精品视频| 一级爱做片免费观看久久| 国产自视频| 一区二区三区精品视频在线观看| 亚洲性影院| 在线观看欧美精品二区| 2019年国产精品自拍不卡| 日韩 欧美 小说 综合网 另类 | 亚洲第一区精品日韩在线播放| 亚洲国产综合精品一区| 人妻精品全国免费视频| 永久免费AⅤ无码网站在线观看| 日韩a在线观看免费观看| 国产精品午夜福利麻豆| 午夜性爽视频男人的天堂| 一区二区影院| 制服丝袜 91视频| 真实国产乱子伦视频| 91成人在线免费视频| 国产精品免费久久久久影院无码| 中国黄色一级视频| 亚洲一区二区三区麻豆| 久久久久九九精品影院| 自慰网址在线观看| 午夜视频免费试看| 欧美日韩一区二区在线播放| 亚洲国产中文精品va在线播放 | 日韩欧美国产成人| 91精品国产一区| 欧洲成人在线观看| 99久久精品无码专区免费| 国产成人a在线观看视频| 中文字幕永久在线观看| 国产96在线 | 亚洲国产中文在线二区三区免| 麻豆精品视频在线原创| 亚洲国产AV无码综合原创| 国产成人精品男人的天堂下载 | 午夜免费小视频| 亚洲精品视频免费| 2024av在线无码中文最新| 亚洲综合极品香蕉久久网| 亚洲国产午夜精华无码福利| 91尤物国产尤物福利在线| www.国产福利| 强乱中文字幕在线播放不卡| 国产成人精品免费av| 国产精品无码AV片在线观看播放| 91国语视频| 无码高潮喷水专区久久| 国产一级在线播放| 精品91视频| 一本色道久久88| 成年人视频一区二区| 国产91小视频在线观看| 风韵丰满熟妇啪啪区老熟熟女| 国产成人AV男人的天堂| 欧美一道本| 福利一区在线| 免费又爽又刺激高潮网址| 精品无码一区二区三区电影| 色网在线视频| 成人福利在线观看| 色香蕉影院| 精品视频第一页| 国产九九精品视频| 国产日本欧美在线观看| 欧美第二区| 新SSS无码手机在线观看| 亚洲欧美另类视频| 亚洲第一av网站|