999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于電子作業挖掘的學生學習預警模型研究

2019-06-24 08:25:34張笑非段先華劉鎮錢萍
軟件工程 2019年4期

張笑非 段先華 劉鎮 錢萍

摘 ?要:混合式教學的普及使得電子作業成為一種評價學生學習效果的重要數據來源,利用機器學習對電子作業進行建模是對學生學習預警的一種有益探索。本文在對電子作業進行分詞和向量化基礎上,通過k-means聚類和輪廓系數來判斷其語義的多樣性,通過計算文檔向量相似性矩陣的網絡效率來評價電子作業的中心性。實驗結果顯示,該方法可以有效尋找電子作業聚類效果最優時的簇類多樣性,也可以有效評價電子作業相似度的網絡中心性。因此,該方法作為一種學生學習預警模型,可以對電子作業文檔的多樣性和中心性給出客觀的總體評價。

關鍵詞:文檔向量;k-means聚類;輪廓系數;文檔相似度;圖論效率

中圖分類號:TP181 ? ? 文獻標識碼:A

Abstract:The popularity of hybrid teaching makes electronic assignment an important data source for evaluating students' learning effects.Modeling electronic assignment with machine learning is a useful exploration for school precaution.Based on the word segmentation and vectorization of electronic assignments,this paper determines the semantic diversity by k-means clustering and silhouette coefficient,and evaluates the centrality of electronic assignment by calculating the network efficiency of document vector similarity matrix.The experimental results show that the method can effectively find the cluster diversity when the clustering effect of electronic assignments is optimal,and can also effectively evaluate the network centrality of the similarities of electronic assignments.Therefore,as a school precaution model,this method can give an objective overall evaluation of the diversity and centrality of electronic assignments.

Keywords:document vector;k-means clustering;Silhouette coefficient;documents' similarity;graph theoretic efficiency

1 ? 引言(Introduction)

隨著慕課(Massive Online Open Courses, MOOC)和翻轉課堂(Small Private Online Course, SPOC)提供了在線遠程學習的條件[1],對學生的自主學習態度和學習能力的要求也越來越高,如何同樣利用網絡平臺及人工智能等手段檢驗和評價學生的學習效果也是一個亟待解決的問題。作業電子化和網絡化的嘗試,一方面減少了對紙張的使用,符合各高校類似辦公自動化的綠色理念;另一方面,這意味著可以利用各種先進的信息技術對電子作業進行收集、分類、管理、挖掘等操作,從中可以挖掘電子作業文檔的特征并構建模型,充當對慕課和翻轉課堂等“教”的環節補充,從中挖掘學生“學”的情況。

電子作業抄襲檢測也一直是教育信息技術應用的一個研究熱點。文獻[2]提出了基于網絡郵件的作業自動收集技術,并通過句子相似度的方法來發現抄襲的方法。文獻[3]針對機房環境和網絡環境,分別采用了信息隱藏技術和向量空間距離模型進行電子作業反抄襲。文獻[4]利用空間向量模型及相似度分布圖輔助教師進行作業抄襲甄別工作。文獻[5]采用了直覺模糊聚類的方法來進行電子作業抄襲檢測。本文通過將電子作業文檔向量化,采用k-means聚類和相似性矩陣進行建模,基于輪廓系數和網絡效率對電子作業文檔樣本整體質量進行評價,以此作為學生學習預警依據。

2 ?電子作業文檔預處理(Preprocessing of ElectronicAssignments)

2.1 ? 電子作業文檔分詞

學生學習預警模型的建立首先需要能夠對電子作業文檔進行分詞,由于學生的電子作業是以中文為主,所以這里采用了“結巴”中文分詞組件。該組件是基于前綴詞典實現高效的詞圖掃描,生成句子中漢字所有可能成詞情況所構成的有向無環圖,并采用了動態規劃查找最大概率路徑,能夠找出基于詞頻的最大切分組合。而對于未登錄詞,則采用了漢字成詞能力的隱含馬爾可夫模型,并通過Viterbi算法進行分詞。

2.2 ? 電子作業文檔向量化

文檔向量化是對詞向量化算法的一種擴充,通過對句子、段落、甚至整個文檔這樣的大塊文本進行無監督學習,從而得到文檔的定長特征向量。傳統的文本定長特征向量使用詞袋(bag-of-words)時存在兩個不足,即詞袋內詞是無序的、且不考慮詞的語義信息。文獻[6]提出了名為“段落向量”的非監督學習算法,可以從變長的文本單元(如語句、段落、文檔)中學習得到定長的特征向量。該算法將文檔表達為密集向量用于訓練模型,并以此預測文檔中的詞。

Doc2vec(https://radimrehurek.com/gensim/models/doc2vec.html)是一個有效的能夠為分詞后的文檔創建向量的工具,圖1中是通過Doc2vec對一門課程61名學生的電子作業文檔進行向量化后得到的結果,每份電子作業文檔被表示為具有100個特征的特征向量。

3 ? 學習預警建模(Modeling of school precaution)

3.1 ? 聚類分析

如圖6所示為根據電子作業文檔相似性矩陣在100個稀疏度上,分別計算全局效率和局部效率的結果。可以看出,與通過與隨機網絡產生的仿真數據相比,實際數據的全局效率和局部效率在主要稀疏度區間上都比仿真數據要低。這說明實驗用的電子作業文檔無論是整體的存在高中心度節點的情況,還是節點鄰居網絡存在高中心度節點的情況都不算嚴重,說明電子作業文檔具有較高的多樣性,質量較高。

5 ? 結論(Conclusion)

信息技術的發展使得教學在形式上發生了變化,機器學習的應用可以更好地對教學數據進行建模和利用。同論文撰寫、項目申請等文檔的電子化一樣,作業的電子化也成為一種趨勢,將電子作業作為機器學習的樣本,不僅能夠得到作業質量本身的信息,還能夠挖掘出學生的學習行為信息。本文正是從這點出發,通過對學生電子作業的挖掘,從中建立學習預警模型,通過聚類效果的評價及網絡分析的度量對電子作業文檔的整體質量作評估。

參考文獻(References)

[1] Kaplan A M,Haenlein M.Higher education and the digital revolution:About MOOCs,SPOCs,social media,and the Cookie Monster[J].Business Horizons,2016,59(4):441-450.

[2] 秦新國.電子作業管理和作業抄襲檢測技術研究[D].南京師范大學,2007:12-26.

[3] 付兵,謝本貴.網絡環境與機房環境下電子作業反抄襲策略[J].實驗室研究與探索,2013,32(04):79-82;91.

[4] 張星,劉帥.基于空間向量的電子作業相似度檢測的設計與實現[J].福建電腦,2014,30(02):125-126.

[5] 張潔,魚先鋒.基于直覺模糊聚類的電子作業抄襲檢測研究[J].計算機與現代化,2014,(06):106-110.

[6] Le,Quoc V.,Mikolov,Tomas.Distributed Representations of Sentences and Documents[C].International Conference on Machine Learning,2014,(4):1188-1196.

[7] Rousseeuw P J.Silhouettes:A graphical aid to the interpretation and validation of cluster analysis[J].Journal of Computational & Applied Mathematics,1999,20(20):53-65.

[8] Amorim R C D,Hennig C.Recovering the number of clusters in data sets with noise features using feature rescaling factors[M].Elsevier Science Inc,2015:10-13.

[9] Latora,V.,M.Marchiori.Efficient Behavior of Small-World Networks[J].Physical Review Letters,2001,87(19):1-4.

[10] ?Latora,V.,M.Marchiori.Economic small-world behavior in weighted networks[J].The European Physical Journal B-Condensed Matter and Complex Systems,2003,32(2):249-263.

作者簡介:

張笑非(1980-),男,博士生,講師.研究領域:物聯網技術,人工智能.

段先華(1965-),男,博士,教授.研究領域:模式識別.

劉 ?鎮(1961-),男,碩士,教授.研究領域:計算機系統結構,軟件定義網絡.

錢 ?萍(1978-),女,博士,講師.研究領域:信息安全.

404 Not Found

404 Not Found


nginx
主站蜘蛛池模板: 精品国产污污免费网站| 国产乱人视频免费观看| 亚洲欧美一区二区三区蜜芽| 91无码视频在线观看| 在线欧美日韩国产| 亚洲欧美自拍中文| 一级黄色网站在线免费看| 久久人搡人人玩人妻精品一| 日本欧美精品| 亚洲男人在线| 国产精品爽爽va在线无码观看 | 国产麻豆永久视频| 久久公开视频| 啦啦啦网站在线观看a毛片 | 40岁成熟女人牲交片免费| 国产成人AV综合久久| 一边摸一边做爽的视频17国产 | 18禁不卡免费网站| 亚洲欧美极品| 中文字幕在线看| 亚洲中文字幕国产av| 久久精品国产免费观看频道| 免费国产黄线在线观看| 亚洲中文字幕97久久精品少妇| 亚洲高清无在码在线无弹窗| 国产主播福利在线观看| 亚洲第一成年网| 久久黄色视频影| 欧美一区二区精品久久久| 午夜免费视频网站| 国产又色又爽又黄| 亚洲日本在线免费观看| 国产超碰一区二区三区| 久热这里只有精品6| 2022精品国偷自产免费观看| 久99久热只有精品国产15| 亚洲成在线观看 | 一本大道香蕉久中文在线播放| 色欲不卡无码一区二区| 国产色爱av资源综合区| 在线播放91| 日韩在线播放中文字幕| 一级毛片免费不卡在线| 国产91丝袜| 国产欧美日韩91| a色毛片免费视频| 国产极品粉嫩小泬免费看| 天天综合网亚洲网站| 在线观看视频一区二区| 又粗又大又爽又紧免费视频| 欧美乱妇高清无乱码免费| 国产性生大片免费观看性欧美| 久久国产精品娇妻素人| 国产成人综合久久精品尤物| 成年看免费观看视频拍拍| 视频一区视频二区日韩专区| 欧美性久久久久| 久综合日韩| 22sihu国产精品视频影视资讯| 亚洲精品无码人妻无码| 国产精品自在在线午夜区app| 人妻一区二区三区无码精品一区| 欧美激情视频一区| 国产精品久久久久鬼色| 激情视频综合网| 98精品全国免费观看视频| 国模私拍一区二区| 天堂va亚洲va欧美va国产| 国产成人高清在线精品| 国产白浆在线观看| 国产精品视频导航| 激情乱人伦| 精品成人一区二区三区电影| 亚洲中文无码av永久伊人| 99国产精品一区二区| 亚洲欧洲日本在线| 国产精品性| 亚洲精品图区| 国产成人av大片在线播放| 精品国产www| 国产夜色视频| 亚洲毛片一级带毛片基地|