潘青青 王 浩
(1.鎮(zhèn)江心湖高級中學(xué),江蘇 鎮(zhèn)江 212132;2.江蘇省馬壩高級中學(xué),江蘇 盱眙 211751)
當(dāng)前,很多學(xué)者都在積極探索教育數(shù)據(jù)資產(chǎn)的巨大價值。楊現(xiàn)民等人[1]指出教育大數(shù)據(jù)的價值應(yīng)體現(xiàn)在與教育主流業(yè)務(wù)的深度融合和推動教育系統(tǒng)智慧化變革。肖玉敏等人[2]認(rèn)為教育大數(shù)據(jù)能夠幫助教學(xué)者加深對學(xué)習(xí)者成長過程的認(rèn)知和理解,實(shí)現(xiàn)對人性的洞悉,便于提供更符合內(nèi)需的教育。祝智庭等人[3]把數(shù)據(jù)提煉為不同的類型,提出不同類型的數(shù)據(jù)所處的數(shù)據(jù)價值層級有所差異,解決的問題也分為不同的階段。Siemens G等[4]學(xué)者對大數(shù)據(jù)在教育中的應(yīng)用進(jìn)行了實(shí)踐,試圖通過數(shù)據(jù)分析來促進(jìn)教育的良構(gòu)。Darrell M.West[5]指出大數(shù)據(jù)可以通過學(xué)生成績和學(xué)習(xí)方法挖掘更深層的學(xué)習(xí)信息。Picciano等人[6]認(rèn)為大數(shù)據(jù)和學(xué)習(xí)分析已經(jīng)成為整合行政和教學(xué)功能的一種解決方案。Matthew M A等人[7]提出數(shù)據(jù)科學(xué)、預(yù)測分析和大數(shù)據(jù)可以轉(zhuǎn)變教學(xué)設(shè)計和管理的應(yīng)用鏈。
教育數(shù)據(jù)挖掘是從海量的學(xué)校數(shù)據(jù)庫中判別、篩選、重組、分析有效的、具有潛在作用的數(shù)據(jù)以獲取教育利益的過程。對教育數(shù)據(jù)資產(chǎn)的深度挖掘可以揭開隱藏在數(shù)據(jù)背后的意義,充分發(fā)揮數(shù)據(jù)對教學(xué)和管理的價值,服務(wù)教學(xué)者、學(xué)習(xí)者、管理者、軟件開發(fā)者以及教育研究者等。李婷等人[8]開展了教育數(shù)據(jù)挖掘在教育教學(xué)和教務(wù)管理中的應(yīng)用研究,指出其在網(wǎng)絡(luò)教育中重要的價值在于指導(dǎo)、改善學(xué)生學(xué)習(xí),提升教師教學(xué)質(zhì)量。施佺等人[9]以網(wǎng)絡(luò)學(xué)習(xí)平臺為研究對象,利用統(tǒng)計分析和可視化、關(guān)聯(lián)和聚類等數(shù)據(jù)挖掘的技術(shù),解讀了在線學(xué)習(xí)過程中的數(shù)據(jù),建立了在線學(xué)習(xí)監(jiān)管的教育數(shù)據(jù)挖掘模型,根據(jù)分析結(jié)果對學(xué)習(xí)過程提出了思考和建議。胡水星[10]基于Moodle網(wǎng)絡(luò)日志和微視頻學(xué)習(xí)案例,利用教育數(shù)據(jù)挖掘技術(shù)進(jìn)行實(shí)證分析,發(fā)現(xiàn)了教育現(xiàn)象之間的關(guān)聯(lián)和規(guī)則,為教育預(yù)測和教育決策提供支持。
教育數(shù)據(jù)是客觀的,其價值的挖掘取決于控制和應(yīng)用數(shù)據(jù)的人。為了清晰地了解數(shù)據(jù)深度挖掘的思路,本研究將其分為六個方面。如圖1所示。

圖1 數(shù)據(jù)深度挖掘的思路
1.1.1 教學(xué)理解
教學(xué)人員和研究人員圍繞數(shù)據(jù)進(jìn)行教學(xué)業(yè)務(wù)的深入調(diào)研和分析,通過交流合作,明晰需要解決什么樣的教學(xué)問題,采取措施有針對性地解決這些問題。教育大數(shù)據(jù)反映的是教育現(xiàn)象外在數(shù)字形式,也體現(xiàn)了具有潛在價值的教與學(xué)的信息。
1.1.2 數(shù)據(jù)理解
數(shù)據(jù)是挖掘的原材料和基礎(chǔ),在數(shù)據(jù)理解環(huán)節(jié)需要做到以下幾點(diǎn):一是要了解教育中的數(shù)據(jù)類型,即認(rèn)識學(xué)校自身有哪些數(shù)據(jù),按照不同的層次劃分;二是描述數(shù)據(jù)特征,將其存儲到相應(yīng)數(shù)據(jù)庫中;三是在數(shù)據(jù)間建立聯(lián)系,實(shí)現(xiàn)動態(tài)循環(huán)。認(rèn)清數(shù)據(jù)本身代表的意義,以便于實(shí)現(xiàn)對數(shù)據(jù)的調(diào)用和分析。
1.1.3 數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備是數(shù)據(jù)挖掘和分析的基礎(chǔ),它可以為數(shù)據(jù)挖掘提供高質(zhì)量的、完整、實(shí)時、準(zhǔn)確的數(shù)據(jù)。利用高性能的T-SQL語句在數(shù)據(jù)源處進(jìn)行數(shù)據(jù)準(zhǔn)備工作,采用SSIS技術(shù)連接多種不同的數(shù)據(jù)源獲取數(shù)據(jù),將數(shù)據(jù)導(dǎo)入到分析工具,通過過濾采樣、清洗數(shù)據(jù)、創(chuàng)建數(shù)據(jù)庫,不斷迭代更新,為后續(xù)研究提供有效的數(shù)據(jù)源。
1.1.4 建立數(shù)據(jù)模型
建立模型分為業(yè)務(wù)建模、領(lǐng)域概念建模、邏輯建模和物理建模,用于幫助研究者全面了解教育業(yè)務(wù),改進(jìn)教學(xué)流程。整合全方位的數(shù)據(jù)源能夠消除數(shù)據(jù)孤島和數(shù)據(jù)差異,提高數(shù)據(jù)利用效率。如建立學(xué)業(yè)評價模型可以幫助學(xué)生改變學(xué)業(yè)評價研究中的無序狀態(tài),提高學(xué)生能力,獲得個人發(fā)展。
1.1.5 評估模型
研究利用訓(xùn)練數(shù)據(jù)得到的模型能適應(yīng)于所研究的實(shí)際數(shù)據(jù),觀察模型對數(shù)據(jù)集的測評效果。根據(jù)環(huán)境因素、發(fā)展?jié)摿蛻?yīng)用水平評價模型使用效果。如果使用獲得顯著成效,可以繼續(xù)推廣到實(shí)際應(yīng)用中,如果出現(xiàn)問題則需要重新進(jìn)行教學(xué)理解的需求分析,再次建立模型,直至達(dá)到預(yù)期成效。
1.1.6 教學(xué)應(yīng)用
數(shù)據(jù)挖掘的初衷是為教學(xué)提供精準(zhǔn)的數(shù)據(jù)服務(wù),向?qū)W習(xí)者推薦個性化的學(xué)習(xí)資源、學(xué)習(xí)活動以及學(xué)習(xí)路徑,輔助教師更好地調(diào)整和改進(jìn)教學(xué)策略,完善課程設(shè)計和開發(fā),幫助管理者進(jìn)行更科學(xué)的管理決策。
教育數(shù)據(jù)挖掘的方法主要包括聚類分析技術(shù)、分類技術(shù)、離群點(diǎn)檢測技術(shù)、關(guān)聯(lián)規(guī)則挖掘技術(shù)和序列分析技術(shù),本研究主要對這五種技術(shù)在教育教學(xué)中的應(yīng)用進(jìn)行分析和探討,總結(jié)各種技術(shù)在教育教學(xué)中的應(yīng)用方向,剖析技術(shù)應(yīng)用流程,期望能為數(shù)據(jù)挖掘在教育教學(xué)中的應(yīng)用提供參考。
教育情況復(fù)雜多樣,教學(xué)者若要實(shí)現(xiàn)不同的教學(xué)目標(biāo),需要準(zhǔn)確找到適合的數(shù)據(jù)挖掘方法,以便有針對性地解決問題。在一個班級中,教師想要了解不同學(xué)生群體的差異,可對學(xué)習(xí)者進(jìn)行聚類分析,應(yīng)用到的數(shù)據(jù)主要包含標(biāo)準(zhǔn)規(guī)定采集的學(xué)習(xí)者基礎(chǔ)信息(姓名、學(xué)號、成績、專業(yè)、年齡等)、在線學(xué)習(xí)行為(瀏覽信息、錯題記錄、在線討論、發(fā)帖、答疑等)、在線學(xué)習(xí)路徑(訪問方式、頁面、時間、瀏覽路徑、資源訪問順序等)、資源使用情況、課堂學(xué)習(xí)行為等所有與學(xué)習(xí)者有關(guān)的學(xué)習(xí)和生活數(shù)據(jù)。例如,對學(xué)生在網(wǎng)絡(luò)學(xué)習(xí)平臺中的登錄頻次、進(jìn)入課程頻次、課程討論區(qū)交互頻次、閱讀課程通知頻次、閱讀課程資源頻次等數(shù)據(jù)進(jìn)行聚類,可以按照網(wǎng)絡(luò)學(xué)習(xí)行為活躍度將學(xué)生分為“活躍型”“中度活躍”“非活躍型”三類群體,并對這三類學(xué)習(xí)群體采用不同的在線教學(xué)策略。
利用關(guān)聯(lián)規(guī)則技術(shù)挖掘各科成績之間以及與總成績的內(nèi)在關(guān)系,找出隱藏的課程關(guān)聯(lián)規(guī)則,將這些規(guī)則應(yīng)用于學(xué)生成績預(yù)警,及時找出可能出現(xiàn)不及格的課程,對部分學(xué)生給出警告,加強(qiáng)學(xué)習(xí)監(jiān)督。王華[11]以計算機(jī)專業(yè)相關(guān)課程為主,通過關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn),如果在電路原理課程這門課上取得60~80分的成績,那么大學(xué)物理成績可能會不到80分,因此對電路原理成績不理想的學(xué)生要加強(qiáng)指導(dǎo),這樣可以有效預(yù)防學(xué)生在其他課程中取得較低成績。
通過對不同數(shù)據(jù)挖掘方法的解讀分析,可以找到其共同點(diǎn),數(shù)據(jù)挖掘整體框架如圖2所示。

圖2 教育數(shù)據(jù)挖掘方法應(yīng)用框架
首先確定數(shù)據(jù)挖掘的目的,教學(xué)研究者需明確要解決什么樣的教學(xué)問題,接著確定數(shù)據(jù)挖掘?qū)ο螅鐚W(xué)習(xí)者、教師、學(xué)習(xí)資源、學(xué)校等,然后選擇合適的方法進(jìn)行挖掘,最后實(shí)施教育應(yīng)用。根據(jù)實(shí)踐應(yīng)用效果,和最初設(shè)定的目的對比,反饋成效,改進(jìn)挖掘過程,效果是對教學(xué)目的的反饋,可以了解反饋給教學(xué)者設(shè)定的挖掘目的,不斷優(yōu)化,實(shí)現(xiàn)挖掘效率和教育實(shí)踐利益最大化。
多模態(tài)學(xué)習(xí)分析(Multimodal Learning Analytics,簡稱MLA)是根據(jù)人的多重感知模式,對于同一現(xiàn)象、過程或環(huán)境,采用多種方式獲取學(xué)習(xí)過程中產(chǎn)生的相關(guān)數(shù)據(jù),包括聲音、手勢、關(guān)節(jié)動作、視覺注意等同時發(fā)生的多種不同的生理和心理數(shù)據(jù)。利用可穿戴感知設(shè)備,教師可以在不影響學(xué)習(xí)者的情況下研究學(xué)習(xí)過程和學(xué)習(xí)軌跡,使研究結(jié)果更加客觀翔實(shí)。多模態(tài)數(shù)據(jù)采集技術(shù)和機(jī)器學(xué)習(xí)分析技術(shù)可以在更復(fù)雜和開放式的學(xué)習(xí)環(huán)境中對學(xué)生的學(xué)習(xí)行為進(jìn)行分析,為深度挖掘數(shù)據(jù)價值提供新的見解[12]。
Xavier Ochoa等[13]人指出教育大數(shù)據(jù)的價值是理解和改進(jìn)教與學(xué),然而分析不僅僅是通過單一系統(tǒng)中的學(xué)生數(shù)字痕跡實(shí)現(xiàn)的。隨著在線學(xué)習(xí)系統(tǒng)的增加和復(fù)雜學(xué)習(xí)環(huán)境的出現(xiàn),學(xué)習(xí)分析應(yīng)該捕獲、處理和分析多種數(shù)字信號,以便理解學(xué)習(xí)過程中參與者的行為和相互作用的痕跡,深入揭示學(xué)習(xí)規(guī)律。
Ez-Zaouia等[14]人指出學(xué)習(xí)者的情緒數(shù)據(jù)對提升學(xué)習(xí)效果有著至關(guān)重要的作用,在同步在線學(xué)習(xí)環(huán)境中,將學(xué)習(xí)者的情緒可視化處理能夠幫助教師建立和保持與學(xué)習(xí)者之間的社會情感關(guān)系。情感分析可通過學(xué)生學(xué)習(xí)的自我報告、視頻、音頻、交互軌跡四個方面來獲取數(shù)據(jù),建立以教師為導(dǎo)向的多模態(tài)和聯(lián)系上下文的情感儀表板。

表1 不同數(shù)據(jù)挖掘方法的對比
Mitri等人[15]通過運(yùn)用腕帶、平臺記錄、自我報告等方式獲得的多模態(tài)數(shù)據(jù)來建立自主學(xué)習(xí)環(huán)境下心跳、步數(shù)、天氣狀況和學(xué)習(xí)活動等因素與學(xué)習(xí)成績的線性混合效應(yīng)模型,以檢驗這些指標(biāo)對學(xué)習(xí)成績的預(yù)測效果。
機(jī)器學(xué)習(xí)是將信息轉(zhuǎn)化為智能行為的過程,數(shù)據(jù)挖掘是從海量的數(shù)據(jù)中挖掘出數(shù)據(jù)主體隱藏的信息,數(shù)據(jù)挖掘是指完整地完成一項事務(wù),機(jī)器學(xué)習(xí)是一種方法,可以理解為用機(jī)器學(xué)習(xí)的方法支持?jǐn)?shù)據(jù)挖掘工作。在教育領(lǐng)域,借助機(jī)器學(xué)習(xí)算法可以實(shí)現(xiàn)對學(xué)習(xí)的預(yù)測,挖掘數(shù)據(jù)隱藏的價值。
預(yù)測分析是統(tǒng)計分析的子集,是從現(xiàn)有的信息中提取有用的數(shù)據(jù),通過使用各種技術(shù)發(fā)現(xiàn)趨勢,實(shí)現(xiàn)對未來結(jié)果的預(yù)測。在教育中,研究者可以利用預(yù)測分析提高學(xué)生的入學(xué)率,降低輟學(xué)率。Halde等人[16]學(xué)者在大一新生入學(xué)時,按照他們的總成績將學(xué)生劃分為三個類別,分別是風(fēng)險級、中級、高級。根據(jù)建立的預(yù)測模型,研究表明,處于風(fēng)險級的學(xué)生更有可能失敗。預(yù)測是為了識別和幫助有困難的學(xué)生,教師和助教在發(fā)現(xiàn)有困難的學(xué)生后會及時給予他們相應(yīng)的建議。任課教師可以在學(xué)校門戶系統(tǒng)網(wǎng)站上建立交流平臺,學(xué)生可以提交作業(yè),教師可以發(fā)布筆記,師生可以隨時溝通。同時,教師要評價學(xué)生的課程表現(xiàn)、學(xué)生的作業(yè)、測驗和期末考試成績,然后給出可視化的反饋,為學(xué)生提供改進(jìn)意見,幫助學(xué)生發(fā)掘自己的潛能和興趣,推薦給他們最適合的學(xué)習(xí)路徑和課程,以便提高學(xué)習(xí)效率。這些過程都是系統(tǒng)聯(lián)機(jī)的,便于師生能夠有計劃地完成這些事項,最后實(shí)現(xiàn)提升學(xué)生成績的目標(biāo)。對于教育管理者來說,預(yù)測分析能夠為其提供客觀的教學(xué)反饋,幫助學(xué)校管理者制定恰當(dāng)?shù)慕逃龥Q策,對教學(xué)資源、教學(xué)計劃、課程體系和師資力量重新評估和分配。
為了保障數(shù)據(jù)挖掘的可用性和高效性,必須開發(fā)多種專業(yè)的數(shù)據(jù)挖掘工具,研究多樣的方法。學(xué)校中有多種數(shù)據(jù),但不是每類數(shù)據(jù)都采用同樣的方法。首先要明確數(shù)據(jù)挖掘的初衷,利用數(shù)據(jù)完成什么樣的教學(xué)任務(wù)。一個學(xué)校如果想了解生源分布情況,教學(xué)管理者可以讓學(xué)生登錄學(xué)校教育系統(tǒng),填寫個人的基本信息。若想了解學(xué)生的生源質(zhì)量,可以通過記錄學(xué)生所有學(xué)科的成績、比賽獲獎、技能特長等學(xué)習(xí)成果,熟悉學(xué)生的狀態(tài)和特點(diǎn)。以上數(shù)據(jù)的分析方法屬于對基礎(chǔ)層的數(shù)據(jù)的挖掘,主要目的是能夠宏觀掌握教育發(fā)展的現(xiàn)狀、制定科學(xué)的教育政策、完善教育體系以及合理配置資源。精準(zhǔn)合適的挖掘方式可以讓數(shù)據(jù)應(yīng)用更有針對性。
在教育數(shù)據(jù)資產(chǎn)挖掘工具方面,研究者越來越關(guān)注使用視覺表示和交互技術(shù)傳達(dá)學(xué)習(xí)感知和意識,讓教師和教育決策者能從多個維度,理解和探索學(xué)生數(shù)據(jù),可視化工具的設(shè)計應(yīng)該突出指導(dǎo)教師確定學(xué)習(xí)目標(biāo)和明確這些目標(biāo)是否實(shí)現(xiàn)。澳大利亞研究者Roberto等[17]人利用LATUX(Learning Awareness Tools—User eXperience,學(xué)習(xí)意識工具—用戶體驗)可視化學(xué)生的思維過程,并建立學(xué)習(xí)者模型,促進(jìn)教師深度了解學(xué)生,用數(shù)據(jù)支持教學(xué),實(shí)現(xiàn)精準(zhǔn)決策。
維克托·邁爾-舍恩伯格在《大數(shù)據(jù)時代:生活、工作與思維的大變革》中提出,目前社會各行各業(yè)對數(shù)據(jù)的挖掘如冰山一角,只看到了數(shù)據(jù)最基礎(chǔ)的功能與價值,隱藏在數(shù)據(jù)背后的數(shù)據(jù)價值更值得挖掘。同樣,教育數(shù)據(jù)資產(chǎn)的價值也未被充分挖掘,如何深度挖掘數(shù)據(jù)資產(chǎn)的巨大價值,真正促進(jìn)教學(xué)變革成為教學(xué)研究者迫切需要解決的問題,這不僅需要教育領(lǐng)域的專家學(xué)者參與,還需要跨學(xué)科的數(shù)據(jù)挖掘?qū)I(yè)人員的積極加入,共同為教育事業(yè)的美好明天出謀劃策,獻(xiàn)出智慧和勞動。