999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Weka的MOOC學習者學習成績影響因素分析

2021-05-31 00:29:21王小越賈積有
數字教育 2021年2期
關鍵詞:數據分析

王小越 賈積有

摘 要:本文應用數據挖掘軟件Weka,對北京大學2015年在Coursera平臺上線的一門課程中學員的網上學習行為數據進行了相關分析。對全體學員和有學習成績的學員的學習行為分析結果均表明:學員的學習成績與課程網頁瀏覽次數、平時測驗總成績、論壇發帖數、論壇回帖得票呈正相關關系。對無學習成績的學員學習行為分析結果表明:他們的論壇討論參與度不高,不重視平時測驗。出現這個現象的原因可能是他們不關注考試成績和證書,只關注學習過程。基于以上數據挖掘結果,為了取得較好的教學效果,我們建議MOOC課程應該積極引導學生參與論壇的發帖,重視課程網頁和課件的設計,同時可考慮改進平時測驗的內容和方式,關注學習者的需求,以便引起學員注意,讓學員積極主動地完成測驗。

關鍵詞:Weka;學習成績;數據分析;MOOC

中圖分類號:G4文獻標志碼:A文章編號:2096-0069(2021)02-0068-07

收稿日期:2020-12-14

基金項目:江蘇開放大學(江蘇城市職業學院)“十三五”2020年度科研規劃課題“藝術設計類在線課程構建模式研究”(2020-J-02)

作者簡介:王小越(1992— ),女,河北唐山人,助教、碩士,研究方向為學習科學與技術、學習分析、在線教育、藝術教育等;賈積有(1969— ),男,河南獲嘉人,北京大學教育學院教育技術系主任、教授、博士生導師、北京大學教育信息化國際研究中心主任,研究方向為教育技術學和人工智能教育應用。

自2012年MOOC爆炸般地在國內外紅火起來后,一批MOOC學習平臺相繼出現并迅猛發展起來,比如Udacity、Edx、Coursera、中國大學MOOC等等。Udacity平臺是于2011年由斯坦福大學的一個實驗室創辦,該平臺提供的在線課程以營利為目的;Edx平臺是于2012年1月由麻省理工學院和哈佛大學共同創辦的,致力于與全世界最好的大學合作,建設影響范圍廣且最著名的在線學習課程;Coursera平臺是于2012年7月由斯坦福大學的兩名計算機專家創立,致力于與全世界最頂尖的大學和機構合作,提供免費的在線學習課程。這三大平臺目前保持著全球領先的地位,其中Coursera平臺作為全球MOOC第一大供應商,其課程門類豐富,學習者注冊數量最多,遍布世界各地。

MOOC發展至今,學員注冊人數不斷增長,從幾百到幾十萬不等,但學員中斷學習現象依舊突出,真正完成學習并獲得結業證書的人數相對較少。因此,本文以北京大學2015年在Coursera平臺上線的一門課程(簡稱為A課程)為例,基于學校提供的課程后臺數據,從學員在該課程中的網上學習行為包括發帖、作業、測試等方面入手,使用數據挖掘工具Weka分析影響學員學習成績的因素[1]。

一、數據處理及描述性統計分析

(一)課程注冊人數及及格率

該課程共有8019位學員注冊,去除授課教師、助教以及沒有參與任何學習活動的學員之后,剩余真正學員6167位,其中919位學員有學習成績(即grade>0),約占真正學員總人數的14.9%,5248位學員學習成績為0,約占真正學員總人數的85.1%。比照常規考試,將60分(含)作為及格的閾值[2],在919位學員中,達到60分以上的學員有280人,占有學習成績學員的30.47%,占真正學員總人數的4.54%。

(二)網上課程學習行為基本分析

表1列出了學習成績及11個網上學習行為因素的數值分布。學員人均次數指網上學習行為次數大于0的學員網上學習行為次數(或天數等)的平均值,所有真正學員人均次數指真正學員網上學習行為次數(包括次數為0的學員)的平均值。

表1顯示,在6167位學員中,所有學員均在完成課程注冊后反復登錄課程網站,即具有在線時間(最后一次登錄課程網站時間與注冊時間之差),所有學員平均在線時間為23.16天,但由于該時間為學員最后一次登錄課程網站時間與注冊時間之差,所以不能說明學員在這個時間內一直在學習課程內容;該課程的視頻有超過一半的學員進行了觀看,并且人均次數超過200次;瀏覽課程網頁可以獲取課程的相關信息,數據表明大部分學員都瀏覽了課程網頁,較積極地獲取課程動態;所有學員均無平時作業成績,其原因可能是平時作業成績與最后成績不相關;課件作為課程內容的重要載體之一,因此多數學員查看或下載課件進行學習;平時測驗是階段性檢驗學員掌握課程知識的一種方式,但數據顯示只有較少學員獲得平時測驗總成績;課程論壇為學員提供了與其他學員、助教和教師交流的機會,實現知識探討和疑問解答,課程論壇分為發帖和回帖兩種形式,每種形式可獲得學員投票,得票為正表明學員贊同發帖或回帖,為負表示學員反對發帖或回帖,同時以論壇名聲來反映學員論壇總體表現[3],數據顯示只有少數學員參與課程論壇,并且也只有極少數參與論壇發帖或回帖的學員獲得了論壇名聲值。

本文按有無學習成績將學員分成兩類,為了進一步呈現上述學習成績和11個網上學習行為因素的分布情況,筆者對有學習成績的學員的各個網上學習行為數據用Weka軟件進行了可視化處理,發現學員在視頻觀看、課程網頁瀏覽、在線時間、查看和下載課件以及平時測驗總成績方面表現較為突出。所有學員均無平時作業成績,并且大部分學員未完成參與課程論壇的發帖和回帖活動,這也可能會影響學員網上學習行為及其學習成績。

二、影響學員學習成績因素的相關分析

為了探討網上學習行為的哪些行為因素會影響學員學習成績,筆者用數據挖掘軟件Weka對有學習成績的919位學員的學習成績影響因素進行了相關分析。本文首先采用Weka軟件中線性回歸算法對上述11個網上學習行為因素與學習成績的相關性進行了線性回歸分析,得到了如下線性回歸模型及結果:

學習成績 =0.0101×課程網頁瀏覽-0.0295×查看和下載課件+0.0880×平時測驗總成績+1.0159×論壇發帖次數-1.2422×論壇回帖次數+1.8896×論壇回帖得票-1.0238×論壇名聲-4.6210

根據回歸模型可知:在11個網上學習行為因素中,課程網頁瀏覽次數、查看和下載課件、平時測驗總成績、論壇發帖次數、論壇回帖次數、論壇回帖得票、論壇名聲7個因素與學習成績具有相關性,并且在這7個因素中,相比較而言,論壇發帖次數、論壇回帖次數、論壇回帖得票、論壇名聲與學習成績的相關性較高。另外,在這7個網上學習行為因素中,查看和下載課件、論壇回帖次數、論壇名聲與學習成績有負相關關系;課程網頁瀏覽、平時測驗總成績、論壇發帖次數、論壇回帖得票與學習成績有正相關關系。而其他指標因素與學員學習成績無關。

另外,多層感知算法結果顯示,相關系數為0.9604,相關性很高,平均絕對誤差為6.8566,均值平方根誤差為10.464,相對絕對誤差為20.1568%,相對平方根誤差為27.8099%,總體來說,各個評估指標因素的效果較好。

三、影響學員學習成績因素的神經網絡分析

為了改進上面的結果,筆者又使用了Weka中神經網絡方法中的多層感知算法,并將參數“learning rate”設置為0.001,將“training time”設置為10000,得到了如圖1所示的神經網絡圖和表2(見下頁)所示的分類統計模型表。

從圖1我們可以看出,通過Weka的多層感知算法,將11個網上學習行為因素按照不同的權重分成了6個神經元節點,并且這6個神經元節點又與學習成績這一神經元節點相連。

筆者以表2(見下頁)分類統計模型表來進一步對圖1進行解釋,圖1中右側學習成績神經元節點即為表2中的節點0(Node 0),節點0的極限值為0.482,其權重分布對應的是左側的6個神經元節點,即表2中的節點1、節點2、節點3、節點4、節點5、節點6,權重分別為0.735、0.725、-1.492、-0.486、-2.017、1.482。

同樣,在圖1中我們可以發現,節點1、節點2、節點3、節點4、節點5、節點6的權重又分別對應的是左側11個網上學習行為因素的權重,每個神經元節點中11個網上學習行為因素的權重均在表2中呈現出來。

在多層感知算法中,相關系數為0.9773,平均絕對誤差為4.7928,均值平方根誤差為7.96,相對絕對誤差為14.0897%,相對平方根誤差為21.1551%,可見相關系數比線性回歸中的相關系數略有提高,并且其他各個評估指標值均有所下降,表明分類結果很好,結果也有了改善。

四、影響學員學習成績因素的聚類分析

聚類分析是把一個數據集合中相似的數據進行聚合分類處理,每個分類聚群我們稱其為一族[4]。筆者利用Weka軟件中EM(Expectation Maximization,期望最大)聚類算法對A課程中有學習成績的學員學習行為數據進行聚類分析。

EM算法是一種迭代算法, 每一次迭代都能保證似然函數值增加, 并且收斂到一個局部極大值[5]。通過運行Weka軟件得到的結果如表3所示。

EM聚類算法將學習成績聚成了兩族,標號分別為0和1。其中0族有599位學員的學習成績記錄,占有學習成績學員總人數的65%,1族有320位學員的學習成績記錄,占有學習成績學員總人數的35%。

表3呈現了所有指標因素在兩族中的均值和標準差。我們發現,0族學員學習成績的均值僅為9.61分,1族學員學習成績的均值為77.77分,說明1族學員平均學習成績要遠遠高于0族學員平均學習成績。但是1族學員學習成績的標準差(26.28)要大于0族學員學習成績的標準差(9.95),表明1族學員學習成績離散程度較大,分布不均勻,相比較而言,0族學員學習成績分布較均衡,成績均較低。

表3也顯示平均學習成績較高的1族學員在線時間、視頻觀看、課程網頁瀏覽、查看和下載課件、平時測驗總成績、論壇發帖次數、論壇發帖得票、論壇回帖次數、論壇回帖得票、論壇名聲的均值均大于平均學習成績低的0族相應的網上學習行為因素的均值,表明1族學員比0族學員在網上學習行為中的10個網上學習行為因素平均表現更為突出,這可能是導致1族學員平均學習成績高于0族學員平均學習成績的根本原因。除在線時間、平時作業成績外,1族學員在剩余9個網上學習行為因素的標準差均高于0族學員的標準差,說明1族學員比0族學員在這9個網上學習行為因素上表現差異更大(或次數、時長離散程度更大),分布更不均衡,這是導致1族學員內部學習成績分布不均、過于離散的原因。另外,由于所有學員的平時作業成績均為0,所以0族和1族學員的這一網上學習行為相一致。

為了更好地分析兩族學員學習成績與網上學習行為表現的關系,筆者分別以11個網上學習行為因素為x軸,學習成績為y軸,對網上學習行為因素和學習成績的關系進行了聚類可視化分析。

通過對在線時間-學習成績進行聚類可視化分析,可以發現,0族學員和1族學員在線時間分布均較為分散,但1族學員在線時間相對聚集,主要集中在104天左右,并且1族學員在線時間普遍大于0族學員,1族大部分學員的學習成績也普遍高于0族學員的學習成績,但在相同在線時間范圍內,0族存在少數學員的學習成績高于1族少數學員的學習成績的現象。

通過對視頻觀看-學習成績進行聚類可視化分析,可以發現,0族學員觀看視頻次數分布較為集中,并且大部分學員的學習成績較低;而1族中學員觀看視頻次數分布相對分散,并且在視頻觀看次數相同的情況下,不同學員學習成績有高有低,差距略大。另外,筆者還發現,在1族中,即便有些學員觀看視頻的次數較少甚至為0,這些學員的學習成績也會較高,可能這些學員只想獲得較高分數和證書,并不想真正學習A課程的知識。

通過對課程網頁瀏覽-學習成績進行聚類可視化分析,可以發現,0族學員瀏覽課程網頁次數分布相對集中,并且大部分學員的學習成績較低;而1族學員瀏覽課程網頁次數分布相對離散。在瀏覽課程網頁次數一樣的情況下,1族學員的學習成績也會出現高低不同的情況,瀏覽課程網頁次數較少的學員也會有較高的學習成績,但從0族和1族瀏覽課程網頁次數與學習成績整體分布來看,瀏覽課程網頁次數越多,其學習成績可能越高。

通過對平時作業成績-學習成績進行聚類可視化分析,可以發現,無論0族學員還是1族學員平時作業成績均為0,但1族學員的學習成績普遍高于0族學員的學習成績,表明學員的學習成績與平時作業成績無關。

通過對查看和下載課件-學習成績進行聚類可視化分析,可以發現,0族學員查看和下載課件次數分布相對集中,且大部分學員學習成績較低;1族學員查看和下載課件次數分布相對分散。另外,在查看和下載課件次數相同的情況下,0族也存在少數學員學習成績較高,1族也有少數學員學習成績較低,但相對而言,1族中大部分學員的學習成績要比0族學員高。

通過對平時測驗總成績-學習成績進行聚類可視化分析,可以發現,雖然0族學員的平時測驗總成績與學習成績分布較為分散,但學員學習成績與平時測驗總成績之間的整體分布呈線性上升趨勢,即0族學員平時測驗總成績較高的話,那么其學習成績可能會相對較高;與0族相比,1族中學員的平時測驗總成績與學習成績分布的離散程度更大,但除少部分學員外,大部分學員的平時測驗總成績分布較為集中,學員平時測驗總成績與學習成績之間的整體分布也呈線性上升趨勢,也就是說,如果學員平時測驗總成績較高,那么其學習成績也可能會比較高(個例除外)。綜合0族和1族來看,學員的學習成績會因平時測驗總成績的增長而增長,也就是說,二者存在正相關性。這一點也印證了線性回歸中學習成績與平時測驗總成績有正線性相關關系的結論。

通過對論壇發帖次數-學習成績進行聚類可視化分析,可以發現,0族學員論壇發帖次數分布集中,主要聚集在發帖次數為0的范圍內,并且同一發帖次數的學員學習成績略有差距;1族學員論壇發帖次數分布相對分散,在論壇發帖次數一致的情況下,學員學習成績有高有低,有一定差距;學員論壇發帖次數較多的話,其學習成績可能會相對較高。

通過對論壇發帖得票-學習成績進行聚類可視化分析,可以發現,0族學員論壇發帖得票數呈一條直線(即幾乎所有0族學員論壇發帖得票數相同),但學員之間學習成績略有差距,以低于50分的居多;1族學員論壇發帖得票數分布相對離散,且獲得相同發帖得票的學員之間的學習成績差距較為明顯。

通過對論壇回帖次數-學習成績進行聚類可視化分析,可以發現,0族學員論壇回帖次數呈一條直線(即幾乎所有0族學員論壇回帖次數相同,均為0),但學員之間學習成績略有差距,以低于50分的居多;1族學員論壇回帖次數分布相對離散,且獲得相同發帖得票的學員的學習成績有高有低,差距較為明顯。另外,普遍而言,1族論壇回帖次數相對較多的學員學習成績沒有比回帖次數少的學員學習成績高,有些甚至較低。這符合線性回歸中學習成績與論壇回帖次數呈負線性相關關系的結論。

通過對論壇回帖得票-學習成績進行聚類可視化分析,可以發現,0族學員均未得到回帖投票,各個學員之間學習成績差異略大;1族學員大部分學員也未得到回帖投票,學員學習成績之間差距較大,并且獲得論壇回帖得票較多的學員的學習成績均不高。

通過對論壇名聲-學習成績進行聚類可視化分析,可以發現,0族學員論壇名聲均為0,學習成績略有差距;而1族學員論壇名聲分布較離散、有高有低,且大部分學員的論壇名聲為0,學員的學習成績也存在差距;并且論壇名聲大于0的學員的學習成績并沒有都很高,有些甚至較低。

五、對所有學員學習成績影響因素的相關分析

以上內容均是針對A課程中有學習成績的學員的分析,接下來筆者對所有學員學習成績影響因素用Weka軟件進行了相關分析,得到了線性回歸模型如下:學習成績=-0.0003×視頻觀看+0.0167×課程網頁瀏覽-0.0311×查看和下載課件+0.0765×平時測驗總成績+1.3311×論壇發帖次數-0.4871×論壇發帖得票-1.1739×論壇回帖次數+2.2637×論壇回帖得票- 0.9755×論壇名聲-0.6222。

我們發現所有學員的學習成績與視頻觀看次數、課程網頁瀏覽次數、查看和下載課件次數、平時測驗總成績、論壇發帖次數、論壇發帖得票、論壇回帖次數、論壇回帖得票、論壇名聲具有相關性,并且相比較而言,學習成績與論壇發帖次數、論壇發帖得票、論壇回帖次數、論壇回帖得票、論壇名聲相關性更大一些,表明學員參與課程論壇的網上學習活動行為對其學習成績的影響較大。另外,在這些相關因素中,學習成績與視頻觀看次數、查看和下載課件次數、論壇發帖得票、論壇回帖次數、論壇名聲呈負相關,與課程網頁瀏覽次數、平時測驗總成績、論壇發帖次數、論壇回帖得票呈正相關。

另外,多層感知算法結果顯示,相關系數為0.9614,平均絕對誤差為2.1976,均值平方根誤差為5.276,相對絕對誤差為24.2013%,相對平方根誤差為27.5007%。該結果表明對所有學員學習成績影響因素的線性回歸效果較好。

六、對無學習成績學員特征的分析

在對無學習成績學員數據分析時,發現5248名學員中僅有287名學員獲得平時測驗總成績,且超過三分之二的學員平時測驗總成績不超過100分(與平時測驗總成績1016分相差甚多)。在5248位學員中,只有1位學員參與論壇發帖22次、回帖1次,獲得發帖得票46次、回帖得票2次,論壇名聲值為16。除此之外,22位學員參與了論壇發帖,發帖次數以1次和2次居多,3位學員參與了1次論壇回帖,5位獲得1至4票發帖投票,4位獲得論壇名聲,值為1或2,綜合說明學員對論壇發帖、回帖、投票不積極,也不重視論壇名聲。另外,雖然大部分學員在線時間較長,平均在16天左右,且有不少學員觀看視頻或瀏覽課程網頁次數較多(有些學員二者均較多),但是仍沒有平時測驗成績和學習成績。出現這個現象的原因可能是這些學員學習MOOC課程并不是為了考試成績和課程證書。

七、結論

通過Weka軟件對A課程中學員網上學習行為數據的相關分析和聚類分析,筆者發現,取得最后學習成績的學員的學習成績與課程網頁瀏覽次數、平時測驗總成績、論壇發帖次數、論壇回帖得票呈正相關;所有學員的學習成績都與課程網頁瀏覽次數、平時測驗總成績、論壇發帖次數、論壇回帖得票呈正相關。

根據這些結論,筆者認為MOOC課程應該積極引導學生參與論壇的發帖,重視課程網頁、課件的設計,同時還應考慮重新設計或更改平時測驗的內容、方式,以便引起學員注意,讓學員積極主動地完成測驗。另外,MOOC課程還需關注學習者的學習需求和特點,有針對性地給予學習者個性化的學習支持,幫助學習者獲得較好的學習成績。

[1][2][3]賈積有,繆靜敏,汪瓊.MOOC學習行為及效果的大數據分析:以北大6門MOOC為例[J].工業和信息化教育,2014(9):23-29.

[4]何昌霖.基于Weka平臺的數據挖掘技術在教學質量分析中的應用[D].南寧:廣西民族大學,2013.

[5]張杰,陽憲惠.多變量統計過程控制[M].北京:化學工業出版社,2000.

(責任編輯 孫興麗)

An Analysis of Influential Factors of MOOC LearnersAcademic Record Based on Weka

—A Case Study of a Curriculum of Peking University in the Network of Coursera

WANG Xiaoyue1,JIA Jiyou2

(1.School of Design,Jiangsu Open University,Nanjing,Jiangsu,China 210000;

2.Graduate School of Education,Peking University,Beijing,China 100871)

Abstract: With the application of data mining software Weka,this paper has done a correlation analysis to the trainees online learning behavior data of a course logged on the platform Coursera in Peking University in 2015.The results of the analysis of the learning behavior of all the trainees and the trainees with academic record all show that: trainees academic records and curriculum webpage browsing frequency,the normal test results,number of forum posts,forum response votes have positive correlation.The results of the analysis of learning behavior of trainees without the academic records show that: their participation degree of forum discussion is not high,and they do not pay attention to the normal tests.The reasons for such phenomenon could be that they do not focus on the examination performance and certificates,but on the learning process.Based on the above data mining results,we,in order to gain a better teaching effect,make a suggestion that MOOC curriculum should actively guide students to participate in the posting in the forum,focus on the design of curriculum webpage and courseware.At the same time,we should consider improving the contents and ways of normal tests,focus on the needs of learners,so as to arouse the attention of trainees and make the trainees complete the tests actively.

Key words:? Weka;academic record;data analysis;MOOC

猜你喜歡
數據分析
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
淺析大數據時代對企業營銷模式的影響
基于讀者到館行為數據分析的高校圖書館服務優化建議
科技視界(2016年22期)2016-10-18 14:37:36
主站蜘蛛池模板: 国产主播在线一区| 国产第一页亚洲| 色欲国产一区二区日韩欧美| 久久福利片| 久久综合国产乱子免费| 亚洲国产AV无码综合原创| 久久久久青草线综合超碰| 色香蕉影院| 国产一区二区三区在线观看免费| 免费看久久精品99| 强奷白丝美女在线观看| 国产三级a| 国内视频精品| 不卡无码h在线观看| 91丝袜美腿高跟国产极品老师| 丁香婷婷在线视频| 全免费a级毛片免费看不卡| 国产一区二区丝袜高跟鞋| 国模在线视频一区二区三区| 亚洲精品在线影院| 精品一区二区无码av| 国产激情第一页| 99久久国产自偷自偷免费一区| 99人体免费视频| 国产成人精品一区二区三区| 亚洲侵犯无码网址在线观看| 国产精品伦视频观看免费| 波多野结衣一二三| 伊人婷婷色香五月综合缴缴情| 亚洲第一黄色网址| 成年人久久黄色网站| 高清无码手机在线观看| 色国产视频| 亚洲色图综合在线| 综合五月天网| 欧美日韩免费观看| 亚洲午夜综合网| 国产亚洲男人的天堂在线观看 | 亚洲无线观看| 手机精品福利在线观看| 欧美日韩国产成人在线观看| 日韩精品毛片| 国产99视频精品免费视频7| 福利国产微拍广场一区视频在线| 亚洲综合天堂网| 国产极品粉嫩小泬免费看| 国产成人91精品| 午夜高清国产拍精品| 丰满人妻一区二区三区视频| 国产成人无码AV在线播放动漫| 久久精品一卡日本电影| 一本色道久久88综合日韩精品| 国产激情无码一区二区三区免费| 全色黄大色大片免费久久老太| 毛片三级在线观看| 99热精品久久| 亚洲一级色| 国产另类乱子伦精品免费女| 久久综合国产乱子免费| 99成人在线观看| 欧美日韩另类国产| 国产精品亚洲欧美日韩久久| 久久中文字幕不卡一二区| 99re这里只有国产中文精品国产精品| 国产乱子伦视频在线播放 | 色婷婷电影网| 成人毛片在线播放| 亚洲一区二区三区中文字幕5566| 91原创视频在线| 欧美一区精品| 波多野结衣无码AV在线| 99国产在线视频| 欧美日韩国产成人在线观看| 日本爱爱精品一区二区| 亚洲v日韩v欧美在线观看| 中文字幕日韩丝袜一区| 免费A级毛片无码无遮挡| 三级毛片在线播放| 性色一区| 日韩a级片视频| 天天综合色天天综合网| 拍国产真实乱人偷精品|