張佳鈺 東北師范大學(xué)信息科學(xué)與技術(shù)學(xué)院
張海 東北師范大學(xué)傳媒科學(xué)學(xué)院
楊絮 東北師范大學(xué)留日預(yù)備校
隨著物聯(lián)網(wǎng)技術(shù)、云計(jì)算技術(shù)等研究與應(yīng)用的不斷發(fā)展與創(chuàng)新,大數(shù)據(jù)(Big Data)所帶來的“信息風(fēng)暴”正在改變我們的生活與工作模式,教育領(lǐng)域同樣累積了海量數(shù)據(jù),教育信息化面臨變革的巨大機(jī)遇。2012年,美國聯(lián)邦政府教育部技術(shù)辦公室發(fā)布的綱領(lǐng)性文件《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析改進(jìn)教與學(xué):問題簡介》,指出在教育中有兩個(gè)特定的領(lǐng)域——學(xué)習(xí)分析(Learning Analytics)和教育數(shù)據(jù)挖掘[1]會應(yīng)用到大數(shù)據(jù),而學(xué)習(xí)風(fēng)險(xiǎn)預(yù)警是學(xué)習(xí)分析這一領(lǐng)域的最前沿。本文將以英國開放大學(xué)(The Open University)構(gòu)建的“風(fēng)險(xiǎn)學(xué)習(xí)者”預(yù)測模型為例,對大數(shù)據(jù)在學(xué)習(xí)分析領(lǐng)域中如何應(yīng)用在學(xué)習(xí)風(fēng)險(xiǎn)預(yù)警中加以介紹。
智慧課堂產(chǎn)生海量數(shù)據(jù),學(xué)習(xí)分析技術(shù)應(yīng)運(yùn)而生。經(jīng)教育研究者們的研究分析,在傳統(tǒng)課堂教學(xué)活動中,對學(xué)生們的實(shí)際學(xué)習(xí)狀況進(jìn)行分析,對課堂教學(xué)采取相應(yīng)的措施方法,可以避免出現(xiàn)以教材為中心的教學(xué)模式。然而,面對基于物聯(lián)網(wǎng)技術(shù)的“智能課堂”,如何將在教育領(lǐng)域設(shè)置的學(xué)習(xí)管理系統(tǒng)中,存儲的大量的學(xué)生學(xué)習(xí)信息與學(xué)習(xí)過程數(shù)據(jù)轉(zhuǎn)變成知識信息,從而優(yōu)化教育質(zhì)量監(jiān)測與教育決策呢?這就亟須尋求新的方法與工具對教學(xué)過程中呈現(xiàn)的“數(shù)據(jù)”進(jìn)行處理。學(xué)習(xí)分析技術(shù)能夠獲取越來越準(zhǔn)確學(xué)生信息,使學(xué)習(xí)過程中的產(chǎn)生的數(shù)據(jù)成為教學(xué)決策、優(yōu)化過程、提升教師對特定學(xué)生的有效關(guān)注、提高教學(xué)效果的重要依據(jù)。
研究者對學(xué)習(xí)分析概念的理解,隨著實(shí)踐的深入越來越明晰。Slade和Prinsloo認(rèn)為,學(xué)習(xí)分析是對學(xué)習(xí)者生成的、可提供行為參考的數(shù)據(jù)進(jìn)行收集、分析、利用與傳播,從而為學(xué)習(xí)者提供適當(dāng)且有效的認(rèn)知、管理支持。[2]So LAR的成員將學(xué)習(xí)分析定義為“為了理解和優(yōu)化學(xué)習(xí)與學(xué)習(xí)發(fā)生的環(huán)境,對學(xué)習(xí)者及其所處境脈的數(shù)據(jù)進(jìn)行的測量、收集、分析與報(bào)告”。[3][4]Siemens于2012年對相關(guān)定義進(jìn)一步提煉之后提出,學(xué)習(xí)分析技術(shù)是“關(guān)于學(xué)習(xí)者以及他們的學(xué)習(xí)環(huán)境的數(shù)據(jù)測量、收集、分析和匯總呈現(xiàn),目的是理解和優(yōu)化學(xué)習(xí)以及學(xué)習(xí)情境”。[5]葛道凱、張少剛、魏順平在《教育數(shù)據(jù)挖掘:方法與應(yīng)用》中提出,基于任務(wù)情境的學(xué)習(xí)分析模式是一種由“學(xué)習(xí)分析”“工具與算法”及“數(shù)據(jù)”三要素構(gòu)成的用于分析學(xué)習(xí)過程任務(wù)情境的學(xué)習(xí)分析模式流程圖。[6]其中“學(xué)習(xí)分析工作流”包括數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析、預(yù)測與應(yīng)用等環(huán)節(jié)。
學(xué)習(xí)分析能在實(shí)踐中應(yīng)用,其關(guān)鍵在于學(xué)習(xí)分析算法和模型的快速發(fā)展。國內(nèi)外許多研究者對學(xué)習(xí)分析的實(shí)踐研究,逐漸由識別和提高對概念、邊界的認(rèn)識層面向分析建模、應(yīng)用層面發(fā)展。隨著大型數(shù)據(jù)集、分析引擎的可用性能的增加,以及精細(xì)的學(xué)習(xí)過程支持,洞察力模型可視化分析結(jié)果,使應(yīng)用層面的研究也正從宏觀的教育決策、教育質(zhì)量監(jiān)測統(tǒng)計(jì)等逐步邁向微觀的教師教學(xué)、學(xué)生學(xué)習(xí)等方面。盡管Tempelaar等幾位研究人員表明,還有許多研究者可能還沒有準(zhǔn)備好利用各種可用的數(shù)據(jù)集進(jìn)行研究與教學(xué),或者相應(yīng)的教學(xué)人員還沒具備相應(yīng)的教學(xué)設(shè)計(jì)所需的技能,但Bienkowski等人提出,“教育正在越來越接近個(gè)性化,這將成為學(xué)習(xí)的共同點(diǎn)”。使用一系列先進(jìn)的計(jì)算技術(shù)(如預(yù)測模型、機(jī)器學(xué)習(xí)、貝葉斯模型、社交網(wǎng)絡(luò)分析、聚類分析)對學(xué)生的數(shù)據(jù)集分析,為學(xué)生訂制個(gè)性化學(xué)習(xí)目標(biāo)與方案,提供特定的資源信息,這有助于推進(jìn)“因材施教與終身學(xué)習(xí)”,為個(gè)性化教學(xué)指明方向。
學(xué)習(xí)分析的應(yīng)用,面向了學(xué)習(xí)過程中的所有參與者,即學(xué)生與教師。經(jīng)研究者多次實(shí)踐研究論證,利用學(xué)習(xí)分析技術(shù)對學(xué)生、教師、技術(shù)開發(fā)人員、研究人員均具有重要價(jià)值。針對學(xué)生方面,學(xué)習(xí)分析技術(shù)可以深度剖析學(xué)習(xí)過程的發(fā)生,基于累積的學(xué)習(xí)數(shù)據(jù)分析為學(xué)生推薦學(xué)習(xí)計(jì)劃,展開自我導(dǎo)向?qū)W習(xí)、個(gè)性化學(xué)習(xí)。針對教師方面,學(xué)習(xí)分析技術(shù)可以提供更為準(zhǔn)確的課程評估、更為深入的學(xué)情分析,基于數(shù)據(jù)的分析可為教師提供精準(zhǔn)的教學(xué)干預(yù)。針對技術(shù)開發(fā)人員方面,學(xué)習(xí)分析技術(shù)可以勘察學(xué)習(xí)管理系統(tǒng)的各個(gè)模塊使用路徑與頻次,從而優(yōu)化系統(tǒng)的模塊設(shè)計(jì)。針對學(xué)習(xí)研究者人員方面,學(xué)習(xí)分析技術(shù)可以成為研究學(xué)生學(xué)習(xí)與教師教學(xué)過程的有效工具。
英國開放大學(xué)的學(xué)生學(xué)業(yè)質(zhì)量聲名素著,其教育技術(shù)應(yīng)用與知識媒體開發(fā)一直處于世界前沿。英國開放大學(xué)的學(xué)習(xí)風(fēng)險(xiǎn)預(yù)警實(shí)踐提供了非常值得我們參考的經(jīng)驗(yàn)。從數(shù)據(jù)中可以分析出學(xué)習(xí)者的學(xué)習(xí)風(fēng)險(xiǎn),并加以預(yù)警。許多學(xué)習(xí)分析應(yīng)用程序是從學(xué)生活動(如登錄次數(shù)、模塊點(diǎn)擊率、花費(fèi)時(shí)間、訪問資源類型及其數(shù)量、論壇討論、個(gè)人作品、測試成績等)中收集行為數(shù)據(jù)。學(xué)生與教師行為數(shù)據(jù)還經(jīng)常從虛擬學(xué)習(xí)環(huán)境(Virtual Learning Environment,簡稱VLE)或其他應(yīng)用系統(tǒng)中檢索,最后形成數(shù)據(jù)集。基于數(shù)據(jù)集的學(xué)習(xí)分析技術(shù)可對學(xué)生學(xué)習(xí)進(jìn)行描繪、評測等,能夠挖掘出學(xué)生學(xué)習(xí)現(xiàn)象“背后”隱藏的規(guī)律與信息,從而能更早地對學(xué)生的學(xué)習(xí)進(jìn)行教學(xué)干預(yù),對學(xué)習(xí)成果進(jìn)行預(yù)測,為學(xué)習(xí)的個(gè)性化與自適應(yīng)提供支持。
在實(shí)踐(OU Analyze)中,開放大學(xué)對使用遠(yuǎn)程教育形式的大約1730名學(xué)生進(jìn)行了持續(xù)17周的數(shù)據(jù)監(jiān)測,利用學(xué)習(xí)分析技術(shù)預(yù)測“風(fēng)險(xiǎn)學(xué)習(xí)者”(缺乏參與性、可能退出的學(xué)習(xí)者),以便教師能夠及時(shí)對其進(jìn)行教學(xué)干預(yù)。此次學(xué)習(xí)分析實(shí)踐調(diào)查整體分為兩步計(jì)算:第一步預(yù)測模型數(shù)據(jù)是由機(jī)器學(xué)習(xí)方法(Machine Learning Methods)提供,數(shù)據(jù)是來自同一課程的先前操作記錄中的遺留數(shù)據(jù)。機(jī)器學(xué)習(xí)方法旨在構(gòu)建預(yù)測模型,該模型數(shù)據(jù)從形成性評價(jià)或總結(jié)性評價(jià)中捕獲。第二步預(yù)測模型數(shù)據(jù)由當(dāng)前學(xué)生操作形成,然后對兩種類型的數(shù)據(jù)進(jìn)行聚合,用于預(yù)測模型的建模。
本次開放大學(xué)的學(xué)習(xí)分析實(shí)踐調(diào)查每天要對這些數(shù)據(jù)進(jìn)行收集,然后再使用每周聚合的算法形成數(shù)據(jù)集。最后,應(yīng)用信息理論標(biāo)準(zhǔn)選擇4~6種對下一次或最終的行為評估結(jié)果有用的學(xué)生行為活動,這些活動類型用于構(gòu)建預(yù)測模型。此外,依據(jù)學(xué)生所選活動類型的活動頻率,來表明學(xué)習(xí)材料的訪問次數(shù)。其中學(xué)生未使用的活動類型,就表明了學(xué)生潛在的知識差距,這些未被使用的活動類型將被預(yù)測模型用作個(gè)性化研究。在構(gòu)建預(yù)測模型時(shí)采用了機(jī)器學(xué)習(xí)方法中開發(fā)的四種預(yù)測模型,即貝葉斯分類器、分類和回歸樹、靜態(tài)數(shù)據(jù)、虛擬學(xué)習(xí)環(huán)境中數(shù)據(jù)的k-NN(K Nearest Neighbor,K近鄰算法)。這四種模型依據(jù)數(shù)據(jù)的不同屬性相互補(bǔ)充,同時(shí)每種模型又獨(dú)立地將每名學(xué)生分類。在上圖模塊視圖中,可以看出實(shí)驗(yàn)對象的平均表現(xiàn),其中列出了所有學(xué)生的學(xué)習(xí)情況分析結(jié)果。由于每名學(xué)生的活動類型都是通過呈現(xiàn)時(shí)間點(diǎn)的軌跡來記錄的,所以分析結(jié)果可以被用來向每名學(xué)生推薦最佳的學(xué)習(xí)材料。

“風(fēng)險(xiǎn)學(xué)習(xí)者”預(yù)測模型分析圖
由預(yù)測模型分析圖可知,在第四個(gè)總結(jié)性評估點(diǎn)之前共有329名學(xué)生“處于危險(xiǎn)中”。分析圖的上半部分突出顯示了學(xué)生在VLE中的平均參與度,并將其與以前的同一模塊(虛線)進(jìn)行了比較,結(jié)果表明學(xué)生在第17周的參與度大大低于之前。OU Analyze還表示第二個(gè)Y軸上的平均評估分?jǐn)?shù),其中第四個(gè)評估的平均分?jǐn)?shù)預(yù)計(jì)低于第三個(gè)評估的平均分?jǐn)?shù)。分析圖的下半部分給出了每名學(xué)生的學(xué)習(xí)行為概況,以及是否被認(rèn)為“有風(fēng)險(xiǎn)”。例如,第一名學(xué)生通過了之前的三個(gè)評估,并且預(yù)計(jì)在即將到來的評估中表現(xiàn)良好。然而,第二名學(xué)生的第一次評估是否能夠通過呈現(xiàn)不穩(wěn)定性,雖然在第二次和第三次評估時(shí)表現(xiàn)稍好,但仍然“有風(fēng)險(xiǎn)”通過整體評估,因?yàn)檫@名學(xué)生沒有參與第14、16、17周的VLE學(xué)習(xí)活動,因此無法對其進(jìn)行評估。圖中列出的第六名學(xué)生未通過第一次評估,并且沒有及時(shí)提交第二次與第三次評估,通過學(xué)習(xí)分析對第六名學(xué)生的數(shù)據(jù)集進(jìn)行分析,結(jié)果顯示該學(xué)生不會提交第四次評估并且也不能完成該模塊學(xué)習(xí)。
此學(xué)習(xí)分析技術(shù),有助于教師調(diào)整教學(xué)計(jì)劃和針對“有危險(xiǎn)”的學(xué)生制訂有積極作用的干預(yù)措施。英國開放大學(xué)通過基于證據(jù)的學(xué)習(xí)和教學(xué)研究方法,對學(xué)生們的數(shù)據(jù)集進(jìn)行學(xué)習(xí)分析,從而可形成具有成本效益的學(xué)習(xí)成果,減少學(xué)生輟學(xué)率,讓學(xué)生充分發(fā)揮潛能。
進(jìn)入21世紀(jì),社會正在不斷地?cái)?shù)據(jù)化,生活、工作等方面無不以數(shù)據(jù)為依據(jù)。隨著技術(shù)的發(fā)展,在在教育領(lǐng)域信息化逐步推進(jìn),特別是中小學(xué)數(shù)字化校園建設(shè)、網(wǎng)絡(luò)高等教育的普及使得眾多學(xué)習(xí)管理系統(tǒng)被開發(fā)。在這些學(xué)習(xí)管理系統(tǒng)中存儲著大量的學(xué)生學(xué)習(xí)過程數(shù)據(jù)以及學(xué)生基本信息,如將這些數(shù)據(jù)轉(zhuǎn)變成教育信息,可使得教育模式逐漸向智慧教育模式轉(zhuǎn)變,智慧教育模式是以學(xué)生為主,教師為輔的個(gè)性化學(xué)習(xí)模式,能為學(xué)生提供全面、精準(zhǔn)的學(xué)習(xí)支持。Clow指出,目前,快速發(fā)展的新型學(xué)習(xí)分析技術(shù)雖然在教育領(lǐng)域中未形成脈絡(luò)清晰的理論體系[7],但基于大數(shù)據(jù),學(xué)習(xí)分析技術(shù)以教學(xué)理論、教學(xué)設(shè)計(jì)理論和學(xué)習(xí)系統(tǒng)中聚集的數(shù)據(jù)集等變量,及時(shí)監(jiān)測學(xué)生學(xué)習(xí)情況,發(fā)現(xiàn)學(xué)習(xí)過程中存在的不足,分析學(xué)習(xí)活動的質(zhì)量,為教育實(shí)踐研究提供了更為高效精確的方法。因此,學(xué)習(xí)分析技術(shù)應(yīng)該成為我國教育技術(shù)研究者特別關(guān)注的新領(lǐng)域。