付志文,吳東醒,賀超波
(仲愷農(nóng)業(yè)工程學(xué)院,廣州 510225)
隨著MOOC 在高校的大規(guī)模推廣應(yīng)用,各高校紛紛建立起了在線(xiàn)教學(xué)平臺(tái),在線(xiàn)學(xué)習(xí)已成為當(dāng)代大學(xué)生不可或缺的學(xué)習(xí)形式。在傳統(tǒng)的面授課堂中,師生沒(méi)有物理隔閡,可以及時(shí)開(kāi)展交互,在交互過(guò)程中教師不斷根據(jù)學(xué)生反饋情況調(diào)節(jié)自己的教學(xué)策略。在線(xiàn)學(xué)習(xí)的課堂,師生地理上處于分離狀態(tài),一般采用錄播視頻及輔助資料開(kāi)展學(xué)習(xí),師生間的反饋限定于預(yù)定的一些收集技術(shù),如作業(yè)、交互式考試、論壇答疑。這些技術(shù)所獲取的交互情況對(duì)比面授課堂還是遠(yuǎn)遠(yuǎn)不夠的,不足以支持教師全面掌握學(xué)生的在線(xiàn)學(xué)習(xí)情況。
在線(xiàn)學(xué)習(xí)平臺(tái)可以采集到更多細(xì)粒度的教育行為數(shù)據(jù)。例如,學(xué)習(xí)者資源瀏覽行為記錄、交互記錄、作業(yè)情況、測(cè)驗(yàn)成績(jī)、小組報(bào)告質(zhì)量、論壇發(fā)帖的數(shù)量和質(zhì)量等,它們能保存到數(shù)據(jù)庫(kù)中或系統(tǒng)日志中。對(duì)這些數(shù)據(jù)進(jìn)行處理,提取出有意義的、具有潛在教育價(jià)值的信息就是教育數(shù)據(jù)挖掘所關(guān)注的領(lǐng)域。教育數(shù)據(jù)挖掘(Educational Data Mining,EDM)是一門(mén)新興的學(xué)科,關(guān)注各種用于分析來(lái)自教育環(huán)境的大規(guī)模數(shù)據(jù)的方法,并使用這些方法來(lái)更好地理解學(xué)生以及他們?cè)谄渲袑W(xué)習(xí)的環(huán)境。這些數(shù)據(jù)通過(guò)EDM 可以轉(zhuǎn)化為有用的信息,從另一個(gè)層面更多地收集在線(xiàn)學(xué)習(xí)平臺(tái)的使用情況。
當(dāng)前國(guó)內(nèi)外已有較多對(duì)EDM 的研究與實(shí)踐,周慶等綜合分析了EDM 在新型網(wǎng)絡(luò)教學(xué)環(huán)境下智能導(dǎo)學(xué)系統(tǒng)、計(jì)算機(jī)支持的協(xié)作學(xué)習(xí)、基于游戲的學(xué)習(xí)系統(tǒng)、社交網(wǎng)絡(luò)方面的應(yīng)用。國(guó)內(nèi)外已有研究指出,對(duì)在線(xiàn)教學(xué)系統(tǒng)進(jìn)行EDM 可產(chǎn)生良好作用,李婷等認(rèn)為EDM 更重要的意義在于指導(dǎo)和改善學(xué)習(xí),提高教學(xué)質(zhì)量。EDM 按數(shù)據(jù)使用方向可分為管理部門(mén)、教師、學(xué)生。管理部門(mén)可以利用這些信息來(lái)了解學(xué)校開(kāi)展在線(xiàn)教學(xué)的整體情況,繼而通過(guò)一定的政策改進(jìn)學(xué)校在線(xiàn)課程管理制度,推動(dòng)在線(xiàn)教學(xué)的平衡發(fā)展;教師可以利用這些信息來(lái)了解學(xué)生個(gè)體及總體情況,改進(jìn)教學(xué)過(guò)程;學(xué)生也可以從這些信息中受益,比如獲取合適的學(xué)習(xí)內(nèi)容,調(diào)整自己的學(xué)習(xí)過(guò)程等等。
本文依托某大學(xué)的在線(xiàn)教學(xué)平臺(tái),試圖通過(guò)教育數(shù)據(jù)挖掘獲取數(shù)據(jù)背后的教育隱義,為學(xué)校在線(xiàn)教育改革提供可行性建議。
本文所研究數(shù)據(jù)來(lái)源于某大學(xué)所使用的在線(xiàn)教學(xué)平臺(tái),平臺(tái)在2016 年投入使用,建有課程200 多門(mén),用戶(hù)數(shù)8 萬(wàn)余人,系統(tǒng)訪(fǎng)問(wèn)量總計(jì)200 萬(wàn)多次。整體來(lái)看,選取的系統(tǒng)數(shù)據(jù)量較大,滿(mǎn)足EDM 的需求。系統(tǒng)采用.net +SQL Server的技術(shù)路線(xiàn)開(kāi)發(fā),整個(gè)系統(tǒng)由四臺(tái)服務(wù)器組成,Web 系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、文件系統(tǒng)分別使用一臺(tái)服務(wù)器,另有一臺(tái)備份系統(tǒng)。
該學(xué)習(xí)平臺(tái)已自帶簡(jiǎn)單的數(shù)據(jù)分析工具,包括瀏覽趨勢(shì)分析、活躍度分析、課程建設(shè)分析、互動(dòng)分析。瀏覽趨勢(shì)分析包括總用戶(hù)、總瀏覽量;活躍度分析包含師生的在線(xiàn)情況、活躍度排行等;課程建設(shè)分析包含網(wǎng)站、MOOC、資源的建設(shè)分析;課程互動(dòng)分析包含作業(yè)、討論等師生互動(dòng)的排名。
這些數(shù)據(jù)分析工具對(duì)了解系統(tǒng)的整體運(yùn)行情況有一定的幫助,但是缺陷也比較明顯。一是統(tǒng)計(jì)指標(biāo)比較少,缺少對(duì)課程運(yùn)行細(xì)節(jié)分析的觀(guān)測(cè)點(diǎn)。二是統(tǒng)計(jì)的時(shí)間跨度較小,僅提供最近60 天的統(tǒng)計(jì)查詢(xún),如果需要分析不同時(shí)間段的數(shù)據(jù)發(fā)展趨勢(shì),就要對(duì)系統(tǒng)數(shù)據(jù)庫(kù)中保存的數(shù)據(jù)進(jìn)行挖掘。系統(tǒng)后臺(tái)記錄的數(shù)據(jù)較為全面,但是系統(tǒng)自帶的分析系統(tǒng)沒(méi)有對(duì)這些數(shù)據(jù)進(jìn)行有效的分析利用。例如數(shù)據(jù)庫(kù)對(duì)用戶(hù)登陸情況記錄就包括用戶(hù)ID、用戶(hù)類(lèi)型、登陸時(shí)間(年月日時(shí)分秒格式)、登陸IP 等四類(lèi)信息,系統(tǒng)自帶的分析系統(tǒng)僅統(tǒng)計(jì)了總的瀏覽量。實(shí)際上對(duì)教育工作者更有意義的可能是某個(gè)ID 每次訪(fǎng)問(wèn)系統(tǒng)時(shí)間、某個(gè)ID 登陸次數(shù)等,這些數(shù)據(jù)有助于形成學(xué)習(xí)者的用戶(hù)畫(huà)像。以上不足之處也是本研究的一個(gè)邏輯起點(diǎn)。
Romero 等等總結(jié)了EDM 研究中正常的工作流程,這個(gè)流程圖已被研究者們廣泛采用,如圖1 所示。從數(shù)據(jù)挖掘的角度來(lái)看,數(shù)據(jù)處理流程包含了預(yù)處理、數(shù)據(jù)挖掘和評(píng)估三個(gè)階段;從教育的角度來(lái)看,這是一個(gè)從教育環(huán)境產(chǎn)生的數(shù)據(jù)中發(fā)現(xiàn)知識(shí),再利用這些知識(shí)來(lái)改善教育環(huán)境的循環(huán)過(guò)程。教育環(huán)境中收集到的原始數(shù)據(jù)需要經(jīng)過(guò)預(yù)處理(數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)變換)再進(jìn)行數(shù)據(jù)挖掘,從海量數(shù)據(jù)中提煉出的教育隱義即為知識(shí),可用以改善教育環(huán)境。這個(gè)工作流程圖是本研究參考的范例,以下根據(jù)EDM 的流程闡述研究開(kāi)展的具體過(guò)程。

圖1 EDM工作流程圖
通過(guò)分析該在線(xiàn)課程平臺(tái)數(shù)據(jù)庫(kù)管理系統(tǒng)發(fā)現(xiàn),整個(gè)系統(tǒng)由五十多個(gè)數(shù)據(jù)表組成,剔除與教學(xué)無(wú)關(guān)的系統(tǒng)運(yùn)行支撐數(shù)據(jù)表后,導(dǎo)出與在線(xiàn)教學(xué)密切相關(guān)的10 個(gè)表格,具體情況見(jiàn)如表1。

表1 在線(xiàn)教學(xué)原始數(shù)據(jù)表
經(jīng)過(guò)以上數(shù)據(jù)清洗之后,進(jìn)行數(shù)據(jù)轉(zhuǎn)換。教學(xué)平臺(tái)原始數(shù)據(jù)存儲(chǔ)于SQL Server中,而本系統(tǒng)擬采取Java+MySQL 的架構(gòu)進(jìn)行開(kāi)發(fā),因此需要將數(shù)據(jù)從SQL Server 中轉(zhuǎn)換格式后導(dǎo)入到MySQL 數(shù)據(jù)庫(kù)。使用SQL Server 自帶的數(shù)據(jù)導(dǎo)出功能將數(shù)據(jù)存儲(chǔ)為SQL 文件,然后使用數(shù)據(jù)庫(kù)管理軟件Navicat for MySQL 的導(dǎo)入數(shù)據(jù)功能將SQL文件還原為數(shù)據(jù)庫(kù)結(jié)構(gòu)、數(shù)據(jù)表及數(shù)據(jù)。
數(shù)據(jù)挖掘的目的是從數(shù)據(jù)中建立模型,主要包括預(yù)測(cè)模型(predictive model)和描述模型(descriptive model)兩類(lèi)。本文對(duì)在線(xiàn)學(xué)習(xí)平臺(tái)數(shù)據(jù)挖掘的目的是建立一個(gè)描述模型,以發(fā)現(xiàn)平臺(tái)上線(xiàn)以來(lái)的總體運(yùn)行狀態(tài),用于評(píng)估參與在線(xiàn)教學(xué)各方的績(jī)效。Romero 等把網(wǎng)絡(luò)教育系統(tǒng)中的特定數(shù)據(jù)挖掘方法分為統(tǒng)計(jì)和可視化及Web 挖掘兩類(lèi),本文所使用的是統(tǒng)計(jì)和可視化。可視化(visualization,VS)將信息或知識(shí)形象化地展示,可視化技術(shù)能夠幫助人們更加直觀(guān)地理解教育數(shù)據(jù)。前文已提及,學(xué)習(xí)平臺(tái)本身自帶的可視化分析功能較弱,為此本研究開(kāi)發(fā)了一個(gè)可視化分析系統(tǒng)。
系統(tǒng)采用主流的Browser/Server 架構(gòu),使用Springboot 技術(shù),以JDK8(Java SE Development Kit 8)作為開(kāi)發(fā)語(yǔ)言,前端框架選擇VUE組件式開(kāi)發(fā)框架、Element UI 頁(yè)面渲染框架與jQuery 框架,后端框架選擇Springboot 集成開(kāi)發(fā)中間件框架,數(shù)據(jù)庫(kù)采用MySQL,數(shù)據(jù)可視化分析框架選擇Echarts,前后端數(shù)據(jù)交互的實(shí)現(xiàn)選擇Ajax異步通信。系統(tǒng)架構(gòu)如圖2所示。

圖2 系統(tǒng)架構(gòu)圖
可視化分析的實(shí)現(xiàn)原理是根據(jù)數(shù)據(jù)庫(kù)表累積的數(shù)據(jù)進(jìn)行可視化圖表的繪制,通過(guò)可視化圖表如柱狀圖、曲線(xiàn)圖等顯示紛繁復(fù)雜的數(shù)據(jù),方便解讀數(shù)據(jù)背后的教育意義。圖3是對(duì)在線(xiàn)課程的“社區(qū)發(fā)帖”這一指標(biāo)進(jìn)行可視化分析的結(jié)果。

圖3 數(shù)據(jù)可視化圖例
在技術(shù)實(shí)現(xiàn)上,為了在系統(tǒng)中實(shí)現(xiàn)可視化分析圖表的復(fù)用,每個(gè)可視化圖表分別使用一個(gè)VUE 組件進(jìn)行繪制。圖表的繪制主要依賴(lài)于Echarts.min.js 文件,通過(guò)前端JavaScript 語(yǔ)言創(chuàng)建option對(duì)象并設(shè)置不同的屬性來(lái)達(dá)到圖表不同效果的展示。由于數(shù)據(jù)量龐大,如果每次都發(fā)送Ajax 請(qǐng)求到MySQL 數(shù)據(jù)庫(kù)讀取數(shù)據(jù),會(huì)造成數(shù)據(jù)庫(kù)查詢(xún)緩慢,前端展示效果不佳。因此使用Redis 來(lái)對(duì)龐大的課程數(shù)據(jù)進(jìn)行緩存,這樣每次Ajax 訪(fǎng)問(wèn)會(huì)先從內(nèi)存中獲取緩存的課程數(shù)據(jù),相比于每次都直接訪(fǎng)問(wèn)數(shù)據(jù)庫(kù),使用Redis 中間件可以大大提高查詢(xún)的效率,減輕數(shù)據(jù)庫(kù)的查詢(xún)壓力。
在線(xiàn)課程數(shù)據(jù)可視化系統(tǒng)對(duì)10 個(gè)數(shù)據(jù)表進(jìn)行了可視化分析,分析的依據(jù)是表2 所列的11個(gè)指標(biāo)項(xiàng)。

表2 數(shù)據(jù)可視化分析指標(biāo)一覽表
從表2可以看出,本文的數(shù)據(jù)可視化分析以教學(xué)單位為統(tǒng)計(jì)口徑,分別對(duì)教學(xué)行為總量和教學(xué)行為分時(shí)段變化趨勢(shì)進(jìn)行了分析,這樣有助于對(duì)各教學(xué)單位在線(xiàn)課程運(yùn)行情況的總體情況和變化趨勢(shì)形成直觀(guān)的認(rèn)識(shí)。

圖4 課程點(diǎn)擊量變化趨勢(shì)圖
知識(shí)是EDM 的研究結(jié)果,EDM 產(chǎn)生的知識(shí)將會(huì)對(duì)教育環(huán)境產(chǎn)生一定的影響。具體到本研究而言,是對(duì)前文得到的數(shù)據(jù)可視圖表進(jìn)行解讀,進(jìn)而為學(xué)校在線(xiàn)課程管理策略提供參考。因篇幅所限,下文僅以“課程點(diǎn)擊量變化趨勢(shì)”這一指標(biāo)項(xiàng)分析結(jié)果進(jìn)行簡(jiǎn)要闡述,其他指標(biāo)項(xiàng)的解讀從略。
(1)多數(shù)教學(xué)單位在線(xiàn)課程點(diǎn)擊量較少,比較活躍的僅有馬克思主義學(xué)院、機(jī)電工程學(xué)院、計(jì)算科學(xué)學(xué)院、自動(dòng)化學(xué)院、人文與社會(huì)科學(xué)學(xué)院和信息科學(xué)與技術(shù)學(xué)院6個(gè)教學(xué)單位。其他教學(xué)單位的活躍度較低則可能是在線(xiàn)課程建設(shè)在其教學(xué)平臺(tái)的緣故。
(2)馬克思主義學(xué)院自2018年9月以來(lái),課程的點(diǎn)擊量逐步攀升,是現(xiàn)有的教學(xué)單位中在線(xiàn)課程點(diǎn)擊量最高的。據(jù)了解,該學(xué)院自2018年以來(lái)多個(gè)課程建設(shè)項(xiàng)目獲得省教育廳的質(zhì)量工程立項(xiàng),已有《馬克思主義基本原理》《思想道德修養(yǎng)與法律基礎(chǔ)》2門(mén)課程持續(xù)開(kāi)展線(xiàn)上教學(xué),這兩門(mén)課程也是公共必修課,因此課程使用率非常高。
(3)2020 年上半年疫情期間,學(xué)校實(shí)行“停課不停學(xué)”的在線(xiàn)教學(xué)模式(2020 年3 月—2020 年7 月),馬克思主義學(xué)院的在線(xiàn)課程點(diǎn)擊量相對(duì)于其他學(xué)院有很明顯的上升走向,其次是計(jì)算科學(xué)學(xué)院,同時(shí)其余學(xué)院均有上升;但相對(duì)于馬克思主義學(xué)院和計(jì)算科學(xué)學(xué)院的數(shù)據(jù),上升幅度相對(duì)平緩。
綜合以上可知:①該平臺(tái)在疫情“停課不停學(xué)”期間起到了較大的作用,為在線(xiàn)教學(xué)的開(kāi)展提供了基礎(chǔ)條件;②各教學(xué)單位在該平臺(tái)的課程建設(shè)非常不均衡,單一平臺(tái)的數(shù)據(jù)尚不能完全反映學(xué)校在線(xiàn)教學(xué)開(kāi)展情況,需要進(jìn)一步調(diào)查其他在線(xiàn)學(xué)習(xí)平臺(tái)的數(shù)據(jù)。
本研究目的是通過(guò)對(duì)某大學(xué)在線(xiàn)課程平臺(tái)進(jìn)行教育數(shù)據(jù)挖掘,探尋該平臺(tái)建設(shè)及運(yùn)行情況的整體趨勢(shì)。關(guān)注的是各教學(xué)單位在線(xiàn)課程運(yùn)行方面的指標(biāo),通過(guò)2 個(gè)一級(jí)指標(biāo)11 個(gè)二級(jí)指標(biāo)的數(shù)據(jù)可視化揭示了在線(xiàn)課程數(shù)量、在線(xiàn)課程活躍度情況。研究結(jié)果可為學(xué)校的教務(wù)管理、教育技術(shù)部門(mén)提供決策支持,以改進(jìn)在線(xiàn)課程管理制度,也可作為對(duì)教師和課程進(jìn)行評(píng)價(jià)的數(shù)據(jù)依據(jù)。
研究的局限性在于,僅使用描述模型通過(guò)分析數(shù)據(jù)對(duì)在線(xiàn)課程的開(kāi)展情況的歷史進(jìn)行了總結(jié)性描述,沒(méi)有做到預(yù)測(cè)性的分析。在數(shù)據(jù)挖掘的使用方面,傾向于為管理決策提供支撐,未對(duì)某一個(gè)在線(xiàn)課程進(jìn)行教學(xué)組織策略、教學(xué)進(jìn)程、教學(xué)討論、教學(xué)成績(jī)等的數(shù)據(jù)進(jìn)行分析,也未對(duì)具體的師生教學(xué)行為數(shù)據(jù)進(jìn)行微觀(guān)的挖掘。未來(lái)可以進(jìn)一步開(kāi)展挖掘參與在線(xiàn)教學(xué)的個(gè)體學(xué)習(xí)數(shù)據(jù)的工作,具體到每個(gè)教師、每個(gè)學(xué)生的教學(xué)行為數(shù)據(jù),如教師對(duì)課程建設(shè)的貢獻(xiàn)度,包括上傳資料,發(fā)布測(cè)試,批改作業(yè),回答問(wèn)題等行為數(shù)據(jù);學(xué)生方面,可關(guān)注學(xué)生的學(xué)習(xí)行為數(shù)據(jù),如完成作業(yè)、完成測(cè)試、觀(guān)看視頻、觀(guān)看文本資料及與其他同學(xué)的互動(dòng)情況等。