游琪 陳紅玲



DOI:10.19850/j.cnki.2096-4706.2021.09.033
摘? 要:隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,人們紛紛轉(zhuǎn)向在線課程等線上學(xué)習(xí),然而海量學(xué)習(xí)資源的出現(xiàn)引發(fā)了諸如“學(xué)習(xí)迷航”和“信息過(guò)載”等問(wèn)題,給學(xué)習(xí)者帶來(lái)巨大挑戰(zhàn),亟待解決。文章運(yùn)用lxml、RE等爬蟲手段獲取慕課網(wǎng)用戶和用戶學(xué)習(xí)課程相關(guān)信息,并利用Python軟件對(duì)慕課網(wǎng)在線學(xué)習(xí)者的特征進(jìn)行可視化數(shù)據(jù)分析,基于學(xué)習(xí)者特征構(gòu)建個(gè)性化學(xué)習(xí)路徑,有效解決了網(wǎng)絡(luò)迷航問(wèn)題。
關(guān)鍵詞:在線學(xué)習(xí)者;特征;個(gè)性化;學(xué)習(xí)路徑
中圖分類號(hào):TP391? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2021)09-0127-04
Research on Personalized Learning Path Based on the Characteristics of?Online Learners
YOU Qi,CHEN Hongling
(Guangdong Polytechnic of Science and Technology,Zhuhai? 519090,China)
Abstract:With the development of mobile internet,people have turned to online courses and other online learning. However,the emergence of a large number of learning resources has caused problems such as “l(fā)earning trek” and “information overload”,which has brought great challenges to learners and need to be solved urgently. In this paper,crawling means such as lxml and RE are used to obtain the relevant information of IMOOC users and user learning courses,and Python software is used to make visual data analysis to the characteristics of IMOOC online learners,and builds a personalized learning path based on learnerscharacteristics,which effectively solves the problem of network getting lost.
Keywords:online learner;characteristic;personalized;learning path
0? 引? 言
中共中央、國(guó)務(wù)院印發(fā)的《中國(guó)教育現(xiàn)代化2035》提出,推進(jìn)教育現(xiàn)代化要“更加注重因材施教的教育理念”,并將“加快信息化時(shí)代教育變革,利用現(xiàn)代技術(shù)加快推動(dòng)人才培養(yǎng)模式改革,實(shí)現(xiàn)規(guī)?;逃c個(gè)性化培養(yǎng)的有機(jī)結(jié)合”作為重要的戰(zhàn)略任務(wù)[1]。新時(shí)代以“學(xué)習(xí)者為中”的人才培養(yǎng)模式為學(xué)習(xí)者提供個(gè)性化學(xué)習(xí)環(huán)境,學(xué)習(xí)者可以根據(jù)自己的需求進(jìn)行學(xué)習(xí),激發(fā)學(xué)習(xí)的自主學(xué)習(xí)意識(shí)。隨著移動(dòng)互聯(lián)網(wǎng)的蓬勃發(fā)展,在線學(xué)習(xí)已成為學(xué)生的一種常態(tài),各類在線教育平臺(tái)拔地而起,網(wǎng)絡(luò)學(xué)習(xí)資源層出不窮,人們?cè)诩橙≈R(shí)的同時(shí)也面臨著新的問(wèn)題,如“信息過(guò)載”、“網(wǎng)絡(luò)迷航”等,都會(huì)阻止學(xué)習(xí)者的個(gè)性化學(xué)習(xí)路徑的發(fā)展。因此,迫切需要解決制約個(gè)性化學(xué)習(xí)路徑中的諸多因素,如學(xué)習(xí)者特征、學(xué)習(xí)者需求等。
1? 學(xué)習(xí)路徑
1.1? 國(guó)外相關(guān)研究
國(guó)外對(duì)于學(xué)習(xí)路徑方面的研究側(cè)重于學(xué)習(xí)路徑的算法實(shí)現(xiàn)。例如:提出一種基于圖論的學(xué)習(xí)設(shè)計(jì)推薦系統(tǒng)的構(gòu)建模型,挖掘教育數(shù)據(jù)相關(guān)新特性,使用小團(tuán)體概念幫助學(xué)習(xí)者在學(xué)習(xí)過(guò)程中找到合適的學(xué)習(xí)對(duì)象,建立有效的學(xué)習(xí)路徑[2];基于學(xué)生學(xué)習(xí)方式的需求,應(yīng)用群體智能模型和蟻群優(yōu)化方法,在靜態(tài)和動(dòng)態(tài)學(xué)習(xí)單元中尋找合適的學(xué)習(xí)路徑[3]。
1.2? 國(guó)內(nèi)相關(guān)研究
國(guó)內(nèi)則側(cè)重于通過(guò)大數(shù)據(jù)對(duì)學(xué)習(xí)者的行為習(xí)慣進(jìn)行分析,主要集中在學(xué)習(xí)行為、知識(shí)結(jié)構(gòu)、學(xué)習(xí)模式和情境推薦學(xué)習(xí)路徑。例如:?jiǎn)闻迮寤谥R(shí)圖譜的個(gè)性化推薦研究,從知識(shí)圖譜的定義出發(fā),綜述了知識(shí)圖譜的知識(shí)提取、表達(dá)、存儲(chǔ)和檢索以及教育資源個(gè)性化推薦方向的應(yīng)用研究進(jìn)展[4];段玉聰?shù)然谥R(shí)圖譜的云端個(gè)性化測(cè)試推薦,將知識(shí)圖譜引入到非結(jié)構(gòu)化語(yǔ)義信息中來(lái)改進(jìn)搜索效率和目標(biāo)有效性,語(yǔ)義知識(shí)豐富了基于內(nèi)容的搜索,增強(qiáng)了所推薦內(nèi)容的正確性,降低了計(jì)算復(fù)雜度[5];姜強(qiáng)等基于AprioriAll算法,整合知識(shí)水平相當(dāng)、學(xué)習(xí)偏好接近的學(xué)習(xí)群體行為軌跡,根據(jù)學(xué)習(xí)者特征、學(xué)習(xí)的難度等級(jí)、學(xué)習(xí)的媒體類型等要素,繪制學(xué)習(xí)路徑,用以支持個(gè)性化學(xué)習(xí)[6]。
基于上述情況,個(gè)性化學(xué)習(xí)路徑已成為在線學(xué)習(xí)平臺(tái)中不可或缺的部分,研究也有很多,但是針對(duì)在線學(xué)習(xí)者特征分析的個(gè)性化學(xué)習(xí)路徑很少。
2? 在線學(xué)習(xí)者特征
據(jù)中國(guó)互聯(lián)網(wǎng)信息中心(CNNIC)發(fā)布的第47次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[7]顯示,截至2020年12月,我國(guó)在線教育用戶規(guī)模達(dá)3.42億,較2020年3月減少8 125萬(wàn),占網(wǎng)民整體的34.6%;手機(jī)在線教育用戶規(guī)模達(dá)3.41億,較2020年3月減少7 950萬(wàn),占手機(jī)網(wǎng)民的34.6%,如圖1所示。
隨著教育信息技術(shù)的發(fā)展,在線學(xué)習(xí)逐漸成為人們的關(guān)注點(diǎn)。特別是2020年,受新冠肺炎疫情影響,教育信息化進(jìn)一步深化落實(shí),各類在線學(xué)習(xí)平臺(tái)也推出了五花八門的在線學(xué)習(xí)類型,一定程度上滿足了廣大用戶的個(gè)性化教育的需求。在線學(xué)習(xí)平臺(tái)的優(yōu)勢(shì)在于可以隨時(shí)隨地學(xué)習(xí)、資源重復(fù)利用、投入資金較少、每個(gè)人都可享受高質(zhì)量課程資源等,這是傳統(tǒng)教學(xué)模式無(wú)法比擬的。但是,學(xué)習(xí)者們?cè)谙硎苓@些在線學(xué)習(xí)平臺(tái)便捷服務(wù)的同時(shí),也面臨著信息過(guò)載等問(wèn)題,如何在眾多的在線教育平臺(tái)中為學(xué)習(xí)者推薦滿意的、符合需求的課程,節(jié)省學(xué)習(xí)者時(shí)間成本、提高學(xué)習(xí)者滿意度、增加學(xué)習(xí)者黏性是在線教育平臺(tái)的關(guān)注重點(diǎn)和亟須解決的問(wèn)題。為此,個(gè)性化推薦系統(tǒng)應(yīng)運(yùn)而生,該系統(tǒng)能有效地解決信息過(guò)載的問(wèn)題。
在線學(xué)習(xí)平臺(tái)積累了大量的用戶學(xué)習(xí)數(shù)據(jù),包括學(xué)習(xí)者的基本信息、在線學(xué)習(xí)行為、習(xí)慣統(tǒng)計(jì)數(shù)據(jù)、在線學(xué)習(xí)效果評(píng)估等,圖2是慕課網(wǎng)某課程學(xué)習(xí)的用戶數(shù)量可視化統(tǒng)計(jì)。
3? 在線學(xué)習(xí)者數(shù)據(jù)分析
3.1? 在線學(xué)習(xí)的數(shù)據(jù)獲取
在線學(xué)習(xí)者在學(xué)習(xí)過(guò)程中產(chǎn)生的一些歷史數(shù)據(jù),如學(xué)習(xí)時(shí)間、發(fā)帖討論、在線測(cè)試和練習(xí)等。運(yùn)用lxml、RE等爬蟲手段,將慕課網(wǎng)上學(xué)習(xí)者相關(guān)在線學(xué)習(xí)信息爬取并存儲(chǔ)到CSV文件中。主要步驟為:
(1)請(qǐng)求解析課程信息,關(guān)鍵代碼為:
html = requests.get(url, headers=head)
selector = etree.HTML(html.text)
content = selector.xpath("http://html")
(2)通過(guò)XPath或RE匹配獲取課程名稱、課程URL、課程類型等信息。關(guān)鍵代碼為:
course_id = int(url.replace('http://www.imooc.com/learn/', ''))
course_name = each.xpath('//h2[@class="l"]/text()')
course_type_other = each.xpath('//div[@class="path"]/a[3]/text()')
if course_type_other:
course_type = each.xpath('//div[@class="path"]/a[2]/text()')[0] + '-' + each.xpath('//div[@class="path"]/a[3]/text()')[0]
else:
course_type = 'other-' + each.xpath('//div[@class="path"]/a[2]/span/text()')[0]
print('course_type: ' + course_type)
(3)解析學(xué)習(xí)難度關(guān)鍵代碼為:
course_difficulty = each.xpath('//div[@class="static-item l"]/span[@class="meta-value"]/text()')[0]
(4)解析學(xué)習(xí)時(shí)長(zhǎng)關(guān)鍵代碼為:
course_time_1 = each.xpath('//div[@class="static-item l"]/span[@class="meta-value"]/text()')[1]
print('course_time_1: ' + course_time_1)
course_time_2 = course_time_1.strip().replace(u'小時(shí)', 'h').replace(u'分', 'm')
(5)打開并創(chuàng)建csv文件,將爬取到的內(nèi)容寫入到csv文件中。創(chuàng)建線程池,構(gòu)建爬取課URL,一般慕課網(wǎng)的課程URL,執(zhí)行爬蟲。將爬取的數(shù)據(jù)進(jìn)行整理,得到慕課網(wǎng)用戶的在線學(xué)習(xí)信息。該信息包括靜態(tài)特征的學(xué)習(xí)者個(gè)人基本信息和具有動(dòng)態(tài)特征的相關(guān)信息。
3.2? 靜態(tài)特征數(shù)據(jù)
在線學(xué)習(xí)者的個(gè)人基本信息、歷史學(xué)習(xí)成績(jī)和學(xué)習(xí)背景,這些特征記載著學(xué)習(xí)者的基本信息,是分析學(xué)習(xí)者特征的基礎(chǔ),這類數(shù)據(jù)一般情況是沒有變化的。
3.3? 動(dòng)態(tài)特征數(shù)據(jù)
該數(shù)據(jù)包含學(xué)習(xí)者的在線學(xué)習(xí)行為、學(xué)習(xí)實(shí)效等,這個(gè)數(shù)據(jù)是時(shí)刻有變化的。通過(guò)Python軟件對(duì)爬取的用戶學(xué)習(xí)課程情況數(shù)據(jù)進(jìn)行分析,如圖3所示;該圖顯示的用戶在過(guò)去一年內(nèi)的學(xué)習(xí)集中在Web前端技術(shù)的學(xué)習(xí)。
用戶數(shù)排名前10不同地區(qū)的不同性別的用戶的學(xué)習(xí)情況統(tǒng)計(jì),如圖4、圖5、圖6、圖7所示。
圖4、圖5、圖6、圖7是從用戶學(xué)習(xí)課程數(shù)、用戶學(xué)習(xí)積分、用戶學(xué)習(xí)經(jīng)驗(yàn)和用戶學(xué)習(xí)分鐘數(shù)四個(gè)方面進(jìn)行了統(tǒng)計(jì)。根據(jù)這些數(shù)據(jù),在線平臺(tái)可以重點(diǎn)推薦一些資源給用戶活躍度高的地區(qū)。
根據(jù)上述特征,慕課網(wǎng)隨機(jī)給出了視頻、作業(yè)、章節(jié)測(cè)試、討論和過(guò)關(guān)游戲等基本模塊應(yīng)用滿意度的在線問(wèn)卷調(diào)查,共有254 562人填寫了問(wèn)卷,調(diào)查結(jié)果顯示如圖8所示。
從圖8中可以看出,學(xué)習(xí)者對(duì)于課程模塊中的討論和過(guò)關(guān)游戲滿意程度均達(dá)到80%以上,根據(jù)該調(diào)查問(wèn)卷,課程建設(shè)者可以修改相應(yīng)的學(xué)習(xí)模塊資源,既可以提高用戶的學(xué)習(xí)興趣,又能推廣課程的應(yīng)用。
4? 基于學(xué)習(xí)者特征構(gòu)建個(gè)性化學(xué)習(xí)路徑
從圖8中,可以看出在線學(xué)習(xí)者對(duì)課程模塊中的討論和過(guò)關(guān)游戲類的學(xué)習(xí)模塊滿意度較高,對(duì)于常規(guī)的視頻和作業(yè)滿意度較低。綜合學(xué)習(xí)者的靜態(tài)、動(dòng)態(tài)特征和課程問(wèn)卷調(diào)查結(jié)果,構(gòu)建出符合學(xué)習(xí)者特性的認(rèn)知和行為習(xí)慣的個(gè)性化學(xué)習(xí)路徑,如圖9所示。
該學(xué)習(xí)路徑的進(jìn)行模式:根據(jù)學(xué)習(xí)者的學(xué)習(xí)狀態(tài)采用不同的匹配策略向?qū)W習(xí)者推薦個(gè)性化學(xué)習(xí)列表,學(xué)習(xí)者依據(jù)自己的需求選擇一個(gè)最合適的學(xué)習(xí)列表進(jìn)行學(xué)習(xí),然后測(cè)試學(xué)習(xí)效果,這個(gè)效果可以生成學(xué)習(xí)者的動(dòng)態(tài)特征。為了能向?qū)W習(xí)者精準(zhǔn)推薦個(gè)性化學(xué)習(xí)列表,因此,需要保證學(xué)習(xí)動(dòng)態(tài)特征的產(chǎn)生過(guò)程是不斷迭代的;個(gè)性化學(xué)習(xí)列表推薦可以讓學(xué)習(xí)者根據(jù)每個(gè)人自己的情況自主選擇學(xué)習(xí)方式,避免了向?qū)W習(xí)者強(qiáng)制推薦學(xué)習(xí)內(nèi)容而導(dǎo)致的學(xué)習(xí)者厭煩情緒。
5? 結(jié)? 論
通過(guò)分析在線學(xué)習(xí)者特征類型,運(yùn)用lxml、RE等爬蟲手段獲取了慕課網(wǎng)用戶和用戶學(xué)習(xí)課程相關(guān)信息,并利用Python軟件對(duì)慕課網(wǎng)在線學(xué)習(xí)者的特征進(jìn)行了可視化數(shù)據(jù)分析,構(gòu)建了基于學(xué)習(xí)者特征構(gòu)建的個(gè)性化學(xué)習(xí)路徑,有效解決了在線學(xué)習(xí)中的“信息過(guò)載”“網(wǎng)絡(luò)迷航”問(wèn)題。但同時(shí)是也存在一些問(wèn)題,如:對(duì)于新用戶的特征,需要積累一段時(shí)間的迭代數(shù)據(jù)才能夠構(gòu)建出對(duì)應(yīng)的模型及相關(guān)學(xué)習(xí)路徑,考慮動(dòng)態(tài)時(shí)間序列對(duì)所有在線學(xué)習(xí)者特征進(jìn)行建模分析,是下一步解決個(gè)性化學(xué)習(xí)路徑的關(guān)鍵。
參考文獻(xiàn):
[1] 中共中央國(guó)務(wù)院印發(fā)《中國(guó)教育現(xiàn)代化2035》 [J].人民教育,2019(5):7-10.
[2] 鐘紹春.構(gòu)建信息時(shí)代教育新模式 [J].電化教育研究,2019,40(4):23-29.
[3] 中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.CNNIC發(fā)布第47次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》 [R/OL].(2021-02-03).http://cnnic.cn/gywm/xwzx/rdxw/20172017_7084/202102/t20210203_713 64.htm.
[4] 唐燁偉,茹麗娜,范佳榮,等.基于學(xué)習(xí)者畫像建模的個(gè)性化學(xué)習(xí)路徑規(guī)劃研究 [J].電化教育研究,2019,40(10):53-60.
[5] 單佩佩.基于知識(shí)圖譜的個(gè)性化推薦研究 [J].電腦知識(shí)與技術(shù),2020,16(36):177-178+184.
[6] 段玉聰,邵禮旭,崔立真,等.基于知識(shí)圖譜的云端個(gè)性化測(cè)試推薦 [J].小型微型計(jì)算機(jī)系統(tǒng),2018,39(12):2743-2747.
[7] 黃立威,江碧濤,呂守業(yè),等.基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述 [J].計(jì)算機(jī)學(xué)報(bào),2018,41(7):1619-1647.
作者簡(jiǎn)介:游琪(1981—),女,漢族,江西九江人,講師,碩士研究生,研究方向:教育大數(shù)據(jù);陳紅玲(1980—),女,漢族,湖南邵陽(yáng)人,講師,碩士研究生,研究方向:大數(shù)據(jù)挖掘。
收稿日期:2021-03-08
基金項(xiàng)目:廣東省教育科學(xué)“十三五”規(guī)劃項(xiàng)目(2018GXJK320,2019GXJK272)