代紅 崔文華 張文宇 歐陽鑫玉


[摘 要] 智能學習環境下隨時隨地可以進行學習的方式是人類學習方式的重大變革,也為人類能夠進行終身學習提供機會。本文使用哈佛大學和麻省理工學院的edX在線學習平臺公開的數據集進行統計分析,同時使用K-MEANS聚類算法對edX平臺上具有中國國籍網絡學習者的學習行為信息進行挖掘分析,得出不同類型學習者的學習行為模式。針對得到的學習者學習行為分析模型提出網絡學習績效提高的策略和建議。
[關鍵詞] 學習行為分析;在線學習平臺;學習績效
[中圖分類號] G642?? ?[文獻標志碼] A [文章編號] 1008-2549(2019) 10-0076-03
隨著無線通信技術的發展和智能手機的廣泛應用,2014年至2018年至今,對網絡學習行為的研究熱度在持續上升,論文數量達到533篇,是過去十年的1.21倍。利用學習者的網絡學習行為數據,并借助數據挖掘、機器學習技術進行學習者學習結果分析,可以對學習者給出更客觀全面的學習評價,同時也為教育管理者的政策制定、教師的教學干預和學習者的自我調整提供參考和指導。通過閱讀文獻,總結對學習者學習行為數據分析上的研究還存在以下不足:(1)多數研究者使用的是本校部分學科學生網絡學習行為的數據,受學習環境影響,數據缺乏通用性、代表性且樣本數量小。(2)多數研究是以對知識點的學習次數為特征屬性,缺少學習交互次數、學習頻度等特征屬性的關聯分析。為此本文使用哈佛大學和麻省理工學院開放的數據集從智能環境下的網絡學習行為分析方法入手,采用力求特征集中的特征數據為建立準確模型的貢獻率最大的方法,構建有利于提高學習者學習績效的分析預測模型,同時對教學干預提供參考建議。
一網絡學習行為分析的發展研究
伴隨物聯網、云計算以及大數據等新技術的出現,智能學習環境下學習者的學習方式正在逐漸發生變革。2006年《中國電化教育》期刊上華中師范大學彭文輝老師的一篇題目為“網絡學習行為分析及其模型研究”的論文中第一次對網絡學習行為的概念進行了總結定義,同時他在對2004~2013年這個時間段我國網絡學習行為期刊論文的內容分析進行了調查研究。由于網絡學習方式場景多元化,多層面獲取知識實時、方便和快捷等優勢,改變了學習者學習習慣和學習態度,對實現學習者終身教育也很有幫助。但是如果在學習行為分析后除了給出適合學習者的學習模式,進行有效學習建議反饋和學習路徑推薦之外,對學習者進行一定的學習行為預測和干預,將會對學習者的學習績效提升更有意義。
二 智能學習環境下學習者分析模型
1 學習者學習特征屬性的選擇
學習者的學習行為分為顯性和隱性。學習者顯性學習行為一般是操作層面的行為日志信息,如評價、交流、答疑、測驗、討論、分享、創作等反映在交互文本上信息,以及學習事件次數、學習時長、學習重復率、學習時間跨度等統計出來的數據。學習者隱性學習行為一般需要通過數據篩選、過濾、挖掘分析出來,同時進行信度度量,如學習動機、學習目的和學習目標等信息。本文研究使用的數據來源于edX 2014年發布的數據集——“HMXPC13_ DI_ v2_ 5-14-14.csv”,如表1所示。哈佛大學和麻省理工學院的edX數據并沒有提供長期學習行為模式的信息,如論壇帖子是否隨時間而增加或減少,視頻訪問是否隨時間而改變等等(見表1)。
在edX公開數據集中共包含641138個實例,其中標注中國國籍的學習者5170個實例。開放數據集的20個列項按照內容歸納成五大類,即課程信息類、學習者基本信息、學習者類型信息、學習者行為信息和其他。其中按照edX開放數據集中給出的學習者特征屬性信息,將學習者類型又分為注冊者(registered)、瀏覽者(viewed)、探索者(explored)和獲得證書者(certified)。平臺要求先注冊才能進一步學習,因此開發數據集中的所有實例學習類型均先為注冊者。在學習者注冊時有些信息并未輸入,如性別,為此在數據集上留有空白或者標注N/A。本文對學習者學習行為進行分析,因此使用學習者行為信息建立學習分析模型,將學習者類型的特征屬性信息作為建立模型的標簽,且只對國籍為中國的學生進行學習者學習行為分析。這樣在不降低模型建立準確性的前提下,既減少了模型建立的冗余屬性,節省了存儲空間,同時也加快了模型建立的時間。
2 學習者學習行為分析模型
(1)學習者基本信息分析
通過對edX平臺上的16門課程開放數據的統計,對全球學習者類型與中國學習者類型進行了對比,全球大部分學習者以瀏覽者學習類型數量居多,同時也能夠得到中國學習者數量占全球學習者數量的0.81%,其中中國學習者在edX平臺通過學習獲得證書者占全球學習者獲得證書數量的0.35%。根據有標注性別的信息統計(標注N/A和空白不在統計之列),在中國學習者中男性數量偏大,且大多數屬于瀏覽性質的學習。
對于身份經過申請認證的獲得證書學習者來說,數量方面男女相差不大,尤其是女性學習者在進行探索性學習后大部分都能獲得證書,說明女性學習者的學習目的很明確,需要拿到證書。在獲得證書的學習者中專門對學歷和性別進行統計,學歷高的學習者不太重視在平臺上獲得證書,學歷偏低的人群更注重證書的獲得。除了向在線學習者提供普通證書課程之外,其還與德州公立大學系統開展合作,開發“線上”與“線下”相結合的學分課程,這樣既方便了德州公立大學系統內的學生選修通識課程學分,又使課程學分在大學系統內得到充分認可,將在線教育正式納入正統學位教育,為此分析出學歷偏低的學習者更希望通過課程認證增加求職的機會。
由于學習者行為信息不能通過簡單的統計分析出學習者行為模式,現只對針對中國學習者進行研究分析,選取了反應學習者行為信息的課程交互次數、課程訪問天數、播放視頻次數、學習章節數和論壇發帖數特征屬性作為學習行為分析的客觀依據,以注冊者(registered)、瀏覽者(viewed)、探索者(explored)和獲得證書者(certified)為模型的類別標簽。采用挖掘分析,建立學習者行為分析預測模型。
(2)學習者學習行為分析模型
由于K-MEANS算法在處理大數據時算法簡單、具有收斂速度快等優點,為此本文使用此算法進行學習分析模型的建立。首先對HMXPC13_ DI_ v2_ 5-14-14.csv開放數據集進行預處理使其滿足數據挖掘工具軟件Weka的格式導入要求,導入后使用K-MEANS算法進行聚類分析。以獲得證書者聚類模型為例,對獲得證書者數據用K-Means算法迭代八次,初始產生了兩個中心點,最終有62個instances聚合為一類,5108個instances聚合為一類,建模時間為0.12秒。對其他學習者類型采用同樣K-MEANS算法可以建模。
(3)結果剖析
通過數據挖掘統計結果,可以得出中國學生課程平均交互次數為144.86次,平均訪問天數3.33天,平均播放視頻次數為64.26次,平均學習章節數2.904,中國學生不論是否獲得證書均沒有論壇發帖,即平均論壇發貼數為0。獲得證書者課程平均交互次數s為3854.90次,平均訪問天數38.94天,平均播放視頻次數為200.17次,平均學習章節數16.69,獲得證書者在課程交互次數和訪問天數均遠高于學習者平均水平。在使用K-MEANS算法對其他學習者類型建立模型后總結歸納得到表2學習者行為對比信息。
從表中信息得到中國學習者不論是哪種學習者類型都比較喜歡通過觀看視頻方式獲取知識,因為觀看視頻方式作為網絡學習最大優點是可以對不懂之處反復學習觀看,且相對于自己瀏覽學習章節更能夠吸引學習者注意力。如果視頻制作能夠短小精悍、有針對性地介紹某個知識點,且能夠引入多種元素進行介紹,會有更多的學習者愿意采用此種方式進行網絡學習。從學習頻度和學習交互次數上看,獲得證書者和探索者的網絡學習投入的時間和精力遠高于一般瀏覽者,說明開放學習平臺是學習者獲取知識的有效途徑之一。為此合理地設計課程和組織課程學習資源,并在學習社區上請專家和名師參與互動,可以更有利于調動學習者的參與度,從而使優質資源共享得到最大利用。而獲得證書者在不同學習者類型中投入網絡學習的時間和精力值是最大的,其中課程平均交互次數遠遠大于其他類型學習者,但是獲得證書者和其他類型學習者在國外論壇從未發帖,而在國內網站上通過在論壇發帖獲得幫助是很常見的。分析原因在于文化背景、語言習慣或者使用方式上有一定差異導致這種網絡學習方式在有多國學習者環境中被遺棄。
三 提高網絡學習績效的策略和建議
1 明確學習目標,提高激勵價值
網絡學習是一種依據個人學習目標和意愿自主選擇學習時間、學習地點的學習方式,其中學習的目的性直接影響學習績效。從學習者學習行為分析模型得出,獲得證書的學習者都有明確的學習目的和目標,因此在學習過程中每項活動的參與度均高于其他類型學習者。為此建議提高網絡在線學習證書的認可度,直接刺激和提高學習者的學習自控性。當網絡在線學習成績、學分和證書的認可度提高時,或者學校將在線學習教育納入正規學位教育時,社會對在線學習教育更加認可,就會有更多學習目標清晰的學習者參與進來。為了提高證書價值,可以在平臺建設中增加未來能夠使用網上認證證書的企業與公司信息,明確證書類別信息,使學習范圍和目標更加明確,同時也為企業和公司獵頭尋找優秀人才提供有效數據、線索和幫助。通過學習者學習行為的統計分析,為學習者提供量化的數據和預測學習績效,可以改變學習者的認知內驅動,使其能夠更加清晰地意識到自己學習的薄弱環節和提高學習績效的方法。
2 豐富課程資源,提高學習興趣
通過在edX平臺上對學習者行為對比信息分析發現,在線學習者更愿意學習章節、觀看視頻,而不愿在網站通過發帖討論方式獲取知識。說明學習者進行網絡課程交互時,學習章節和觀看視頻獲取知識更加快速高效,而討論雖然會啟發思考,但有時討論后未必直接能夠得到答案。為此建議對于討論發帖進行知識歸類和整理,或由專家進行定期回復和總結。利用微課程微型、超鏈接、微媒體、半開放結構、個性化特點,吸引學生進行自主課外學習,減少閱讀或觀看時間過長給學習者帶來的疲勞感,更加高效學習。在平臺資源建設上,將優秀教師的科研項目、指導學生的競賽成果與課程知識點結合,增加拓展性資源,使其獲得最直接的經驗和科研競賽思路。
3 消除文化、語言、使用平臺障礙
從各國高校推出的edX在線課程數量上來看中國位列世界第二,但在edX平臺上從中國學習者使用數量來看,遠低于其他國家,分析其原因之一是語言和平臺使用上的障礙。為此開發者在交互化界面設計上,尤其要關注學習者學習習慣和可視化效果,注重視覺聽覺效果,結構設計合理,便于學習、資料查找和操作。
從edX平臺上的統計數據看到無論國外學習者還是中國學習者在交互的論壇中參與度相對其他交互學習方式少,說明學習者在交互式論壇中很難找到歸屬感和認同感。在學習共同體的建設中,應該充分考慮消除文化、語言交流障礙。對于主要使用英語提供網絡學習服務的edX在線學習平臺,建議使用多種語言版本或者具有自翻譯功能,這樣受教育者在網絡資源使用上人人平等。由于在線學習資源可以共享共建,隨著學習者參與度的提高,可以使網絡資源更加豐富,使得更多的學習者進行網絡學習成為習慣。
4 教師參與評價,及時反饋預測
利用平臺上學習行為數據,可以對學習績效提前預測,當反饋給學習者時,能夠使其總結反思,增強認知內驅動,并通過教師給出的指導性建議來改進學習者的學習行為和學習方法,從而形成動態良性循環。從edX平臺上學習者論壇發帖數量對比來看,學習者自我表達、主動思考提問的積極性不高,教師積極參與互動和上線頻率提高能夠幫助學習者找到歸屬感,有利于提高學習者思考問題的積極性和自我表達,特別是在自己提出的問題得到及時回復后,學習者將更加愿意在線交流,從而形成良性循環。
參考文獻:
[1]彭文輝,曾東薇. 近十年我國網絡學習行為期刊論文的內容分析研究[J].中國遠程教育,2015(1):42-48.
[2]傅鋼善,王改花. 基于數據挖掘的網絡學習行為與學習效果研究[J]. 電化教育研究, 2014(9):53-57.
[3]江波,高明,陳朝陽. 建構學習行為模式發現與學習效果關系研究——基于虛擬仿真的學習分析[J]. 遠程教育雜志, 2018(4):95-103.
[4]武法提,牟智佳. 基于學習者個性行為分析的學習結果預測框架設計研究[J].中國電化教育,2016(1):41-48.
[5]彭文輝,楊宗凱,黃克斌. 網絡學習行為分析及其模型研究[J].中國電化教育,2016(10):31-35.
[6]李小娟,梁中鋒,趙楠. 在線學習行為對混合學習績效的影響研究[J]. 現代教育技術, 2017(2):79-85.
[7]吳青,羅儒國. 基于在線學習行為的學習成績預測及教學反思[J]. 現代教育技術,2017年06期,18-24.
[8]MITx and Harvardx.Harvard X-MITx Person-Course
Academic Year 2013 De-Identified dataset,version 2.0[EB/OL].[2018-08-09].http://dataverse.harvard.edu/dataset. xhtml.
persistentld = doi: 10. 7910/DVN/26147.
(責任編輯:張宏玉)