999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

雙向匹配向量空間算法在智能閱卷系統中的應用

2021-05-24 07:59:53季天凱朱軒周漢清
電腦知識與技術 2021年12期
關鍵詞:文本智能

季天凱 朱軒 周漢清

摘要:目前,主觀題自動化閱卷的準確度是智能閱卷系統能否有效的關鍵要素,通過提出雙向匹配向量空間算法,使用盤古分詞組件進行文本預處理,利用算法中的雙向匹配和向量空間計算關鍵詞匹配和文本相似度,實現主觀題自動閱卷的評分功能,并通過C#.NET語言開發智能閱卷系統。通過系統實驗結果證明,該算法下的自動閱卷與人工閱卷的結果誤差率較小,具有良好的應用前景。

關鍵詞:中文分詞;雙向匹配;向量空間;相似度計算

中圖分類號:TP18? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)12-0079-03

Abstract: Currently, the accuracy of automatic marking of subjective questions is the key factor for the effectiveness of intelligent marking system, by proposes a bidirectional matching space algorithm, use Pangu word segmentation for text preprocessing, use keyword bidirectional matching and vector space model to calculate keyword matching and text similarity, and C#. Net design marking system. Experimental results show that the result of automatic marking under the guidance of this algorithm is less different from that of manual marking, and has a good application prospect.

Key words: Chinese word segmentation; bidirectional matching; vector space; similarity computation

1 背景

智能閱卷是指通過計算機對學生作答的試題答案進行自動閱卷[1],減少閱卷工作量,提高評卷的公平性和效率。目前,智能閱卷是在線考試領域研究的前沿技術之一[2]。現階段,針對客觀題的智能閱卷已經得到了廣泛的應用,例如計算機等級考試、GRE考試以及會計電算化考試等[3],然而由于主觀題評閱涉及分詞技術與關鍵詞匹配技術等,這使得主觀題評閱成為智能閱卷中的技術難點。近年來,隨著對自然語言處理理論研究的深入,已經提出了一些相對較為成熟的主觀題算法,但是在系統實現和具體應用上面仍然很少[4]。本文主要利用基于雙向匹配的中文分詞技術和向量空間的文本相似度技術,通過中文分詞技術將答案切分成不同的詞語,再經過雙向關鍵字匹配,獲取關鍵詞得分點;并通過向量空間,計算答案與標準文本的貼近度,完成主觀題答案的自動評閱,實現在線考試的智能閱卷功能,并利用實驗結果驗證智能閱卷的可靠性。

2 雙向匹配向量空間算法原理

本系統中主觀題部分的評閱采用雙向匹配向量空間算法實現,算法流程如圖1所示。

算法主要包含關鍵詞匹配計算方法,語義相似度計算方法以及綜合相似度融合算法。其中,關鍵詞匹配度可以通過關鍵詞雙向匹配進行計算,而語義貼近度可以通過向量空間進行量化,答案文本綜合相似度則通過關鍵詞匹配度與語義相似度兩維度進行融合,最終得出對主觀題的智能閱卷得分。

2.1 關鍵詞雙向匹配

關鍵詞雙向匹配即通過正向匹配和反向匹配相結合的方式,把學生答案中的關鍵詞依次和標準答案中的關鍵詞進行比較,當匹配一致時將字符字數進行累加,最后將正向匹配和反向匹配中匹配字符數值大的一項與標準答案中的關鍵詞字符數進行相除,得出的比值即為學生答案與標準答案關鍵詞的匹配程度。例如設[A0]為考生的答案,[?(T,A0)]為關鍵詞匹配的比值。雙向匹配的具體公式為:

在公式1中,[Ti]和[Tj]分別為關鍵詞在正向和反向匹配中匹配成功的字符數;[Ui]為標準答案中關鍵詞的字符數,[?Ti,A0]為考生答案與標準答案某關鍵詞匹配字符的比值;在公式2中,[S0]是題目的分值,[U]是標準答案中關鍵詞的個數,[T]為關鍵詞匹配的最終得分。

2.2 中文分詞技術

在主觀題智能閱卷中,中文分詞的作用十分重要,它可以將中文語句中的詞匯,按照一定的規則進行切分,形成一個一個單獨的詞語。而由計算機自動識別文本中的詞,實現切分處理過程的技術就是中文分詞技術[5]。例如中文“中國的首都是北京”,分詞結果是“中國\的\首都\是\北京”。在分詞時,分詞的結果受到語義、句法等因素影響。

目前,中文分詞技術已經比較成熟,網絡上出現很多開源的分詞軟件,例如盤古分詞、IKAnalyzer、Phpanalysis、Paoding等[6]。本文的中文分詞技術采用的是開源的盤古分詞組件,它是目前能夠對中文語句進行準確切詞的工具之一。例如,利用盤古分詞對中文“操作系統是管理計算機硬件與軟件資源的計算機程序。”進行分詞,最終的結果為“操作系統\是\管理\計算機硬件\與\軟件\資源\的\計算機\程序”。

2.3 向量空間

在向量空間模型中,文本以向量的形式進行表示,通過把文本轉化為對向量空間的相似度運算計算文本相似度。向量空間相似度的計算可以用內積、夾角余弦、Jaccard相似度和Dice系數等方法來計算[7]。

本文采用夾角余弦方法計算文本相似度,當向量間的夾角越接近于0°,即夾角余弦值越接近于1,表示兩個向量越相似,即文本間的相似程度越高。計算公式為:

在公式3中,其中[A]和[U]表示兩個向量,代表考生答案和標準答案,[Ai]和[Ui] 分別表示兩個向量中的各個元素。

2.4 相似度融合

在得到答案文本基于關鍵詞的匹配得分以及基于語義結構的相似程度后,采用統計回歸的方法將兩個維度的相似度以最優的權重融合為答案文本的最終綜合相似度。本文將關鍵詞匹配與語義相似度定義為自變量,將考生答案得分與題目滿分值定義為因變量,定義的主觀題評分公式為:

在公式4中,[S]為考生答案最終得分;[S0]為題目滿分值;[T]為關鍵詞匹配得分值;[SimilarityA,U]為考生答案與標準答案間的相似度;[α]和[β]分別為匹配關鍵詞和文本相似度的權重,滿足[α+β=1],權重可以根據實際需求自行調整。

3 智能閱卷系統設計

本文中基于雙向匹配向量空間算法設計的智能閱卷系統框架主要包括三個重要模塊,分別為定義模塊、處理模塊和響應模塊,如圖2所示。

定義模塊由試題內容、試題分值、標準答案、權重分配和考生答案構成,值得注意的是,在定義主觀題閱卷權重時,需要分別設置關鍵詞和相似度的權重,并保證兩者權重之和為1。主觀題設置界面如圖3所示。

處理模塊由中文分詞組件、關鍵詞抽取、關鍵詞雙向匹配和詞語相似度計算構成,通過盤古分詞組件對中文語句進行切詞,濾除與分詞無關的干擾項,通過雙向匹配和夾角余弦算法對關鍵詞匹配和文本相似度進行計算。

在響應模塊,通過對關鍵詞雙向匹配和文本相似度兩個維度的融合計算,量化并確定題目的最終得分。另外,系統中還加入了人工評閱的功能,對主觀題自動評閱的得分進行修正和完善,從而保證系統得分的準確性。閱卷效果如圖4所示。

4 實驗結果及分析

在完成基于雙向匹配向量空間算法設計的智能閱卷系統后,為了驗證算法的可用性,選取了50名考生的試卷進行測試,由于每份試卷有4道主觀類型的題目,在測試時,先利用中文分詞、關鍵詞匹配和夾角余弦相似度計算,進行系統閱卷,然后再進行人工閱卷,最后比較兩者的誤差率,測試結果如表1所示。其中,誤差率=|人工閱卷得分-系統閱卷得分|/滿分,誤差率越小表示系統閱卷結果可靠性越高。

另外,隨機選取其中第二題的閱卷記錄,利用折線圖的方式更加直觀的展示人工閱卷和系統閱卷之間的評分差異性,如圖5所示。

通過表1和圖5可以發現,雙向匹配向量空間算法指導下的系統閱卷雖然與人工閱卷在評分上不完全一致,但是誤差率基本控制在20%之內,說明該算法的結果是比較合理的。

5 結束語

本文詳細分析了雙向匹配向量空間算法的具體應用,在該算法中首先采用雙向匹配對關鍵詞的匹配程度進行度量、再通過向量空間量化文本間的相似度,最后通過對兩個維度的相似度融合,計算出考生答案與主觀題答案最終貼近程度。經過系統的仿真實驗結果表明,雙向匹配向量空間算法指導下的自動閱卷與人工閱卷之間的誤差率較小,在智能閱卷系統領域中具有良好的應用前景和推廣價值。

參考文獻:

[1] 張帥.基于孿生神經網絡的主觀題自動閱卷評分技術[J].現代計算機,2020(5):23-25.

[2] 李紀扣,韓建宇,王嫄.基于相似度融合算法的主觀題自動閱卷機制[J].天津科技大學學報,2019,34(1):76-80.

[3] 張翠翠,周國祥,俞磊,等.基于MVC的試卷生成及主觀題判卷算法研究[J].系統仿真學報,2020,32(1):105-112.

[4] 陳賢武,劉道波.基于語句相似度的主觀試題自動閱卷模型研究[J].武漢大學學報(工學版),2018,51(7):654-658.

[5] 馮光,喬丹丹,常靜怡.基于分詞匹配的主觀題自動評閱技術研究[J].計算機與現代化,2013(3):212-214,219.

[6] 宋雪亞,王傳安.基于中文分詞的主觀題自動評分算法研究[J].河北北方學院學報(自然科學版),2017,33(9):7-11.

[7] 秦學勇.基于相似度計算的主觀題閱卷系統設計[J].安徽建筑工業學院學報(自然科學版),2010,18(4):77-80.

【通聯編輯:謝媛媛】

猜你喜歡
文本智能
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
智能制造 反思與期望
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
智能制造·AI未來
商周刊(2018年18期)2018-09-21 09:14:46
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 久久这里只有精品国产99| 69综合网| 国产粉嫩粉嫩的18在线播放91| 国产精品女同一区三区五区| av尤物免费在线观看| 54pao国产成人免费视频| 国产色图在线观看| 亚洲精品中文字幕午夜 | 欧美日韩国产高清一区二区三区| 欧美在线视频不卡| 欧美亚洲一区二区三区在线| 国产视频只有无码精品| 亚洲美女一区二区三区| 国产亚洲欧美另类一区二区| 91区国产福利在线观看午夜| 国产高颜值露脸在线观看| 国产亚洲精品97AA片在线播放| 欧美精品xx| 国产欧美日本在线观看| 91无码人妻精品一区二区蜜桃| 免费无遮挡AV| 国产精品免费电影| 亚洲欧美日韩另类在线一| 亚洲男女在线| 久久久久人妻精品一区三寸蜜桃| 精品夜恋影院亚洲欧洲| 久操线在视频在线观看| 99ri国产在线| 免费一看一级毛片| 色欲不卡无码一区二区| 国产高清精品在线91| 亚洲AV人人澡人人双人| 中国一级特黄大片在线观看| 国产一在线观看| 国产激情无码一区二区免费| 夜夜拍夜夜爽| 夜精品a一区二区三区| 午夜精品久久久久久久无码软件| 影音先锋亚洲无码| 伊人久久精品亚洲午夜| 欧美日韩久久综合| 久久久久青草大香线综合精品 | 欧美亚洲一区二区三区在线| 亚洲香蕉久久| 久久精品91麻豆| 粉嫩国产白浆在线观看| 97免费在线观看视频| 亚洲天堂网在线播放| 91成人在线观看视频 | 欧美影院久久| 无码人妻热线精品视频| 日韩无码精品人妻| 九九热精品视频在线| 国产成人资源| 呦视频在线一区二区三区| 亚洲日韩久久综合中文字幕| A级全黄试看30分钟小视频| 欧美啪啪视频免码| 国内丰满少妇猛烈精品播| 亚洲熟女偷拍| 免费无遮挡AV| 网友自拍视频精品区| 青青青视频免费一区二区| 在线观看国产精品日本不卡网| 免费又爽又刺激高潮网址| 亚洲中文久久精品无玛| 亚洲欧洲综合| 久久伊人操| 亚洲天堂视频在线观看| 日韩AV无码一区| 免费国产小视频在线观看| 日韩A级毛片一区二区三区| 色偷偷综合网| 久久亚洲中文字幕精品一区| 任我操在线视频| 久久精品这里只有国产中文精品| 在线观看欧美精品二区| 丰满的熟女一区二区三区l| 国产日韩AV高潮在线| 国产精品一区二区无码免费看片| 色综合中文字幕| 国产成人精品综合|