代愛妮 王蕊






關鍵詞:計算機教育;Python;線上教學評估;學習成績分析
1 引言
高校在線教學涉及學生規模大,學生學習情況難以跟蹤和把握,一定程度上影響了教學質量,也給高校教學帶來了前所未有的挑戰。機遇與挑戰共存,在線教學平臺也同時提供了大量的可供我們參考利用的在線教學數據,在當前信息時代的新工科背景下,眾多學者利用大數據分析方法及人工智能算法對教學數據進行分析并建立了教學預警模型,引導學生開展了線上自主學習和師生線上自主合作研討的教學模式。學者馬玉玲研究了基于機器學習的高校學習成績預測方法,其中提出了一種基于課程關聯性的“課前”學生成績預測方法,能夠預測下學期成績不及格風險[1]。學者張源設計了基于隨機森林的線上教學智能學業預警模型,對學生行為和教師行為制定了精準干預措施[2];梁偉等學者基于Python大數據對在線教學情況進行了數據可視化分析與研究[3];黃家琦等學者建立了廣義回歸神經網絡預測模型對學生成績進行了預測,可識別不及格學生進行提前干預與教學輔導[4]。宋曉磊等學者采用了4種機器學習算法對教育數據進行分析,然后篩選出最相關的數據特征建立了多種預測模型對學業成績進行預警[5]。此外,還有很多學者也相繼利用大數據及人工智能算法對學習數據進行分析及預測,為高校課程學習成績的數據分析及預測提供了參考[6-10]。
綜上,如何利用人工智能算法對在線教學數據進行數據分析與應用是當前值得研究的熱點方向之一。為有針對性地總結和輔助我校線上教學,揭示教學影響因素,實現教師及高校管理部門客觀評價課程教學效果,本研究特選取《Python與人工智能》線上教學部分作為研究對象,通過收集該課程教學數據,基于Py?thon語言和數據分析技術,對該課程按不同特征匯總的數據分布情況、各教學行為特征與成績相關性進行了分析,并建立了相關性矩陣,最后篩選得出影響高校線上教學成績最相關的學習行為特征,實現了學習行為特征降維。本文相關研究成果為后續本研究進行數據聚類及建立教學預測模型提供了基礎,也可為高校混合式教學模式的改革和教學指導提供了一定參考。
2 研究方法
《Python與人工智能》課程具有操作性和實踐性較強的特點。本研究針對疫情期間開展在線教學特點,利用超星學習通收集的課堂教學數據,采用基于Python的數據分析方法,對教學數據分布情況進行了分析;其次對課堂內外教學核心環節各特征與成績進行了相關性分析;最后給出了相關性分析矩陣,對選擇什么樣的特征數據進行了教學模塊設計,為篩選強特征建立教學預測模型提供了重要參考。
3 數據采集
本文選取青島某高校2019-2020第二學期超星學習通線上教學課程數據,涉及通信工程(物聯網)和電信兩個專業四個班級共107條學生的學習行為數據。數據集具體情況及各字段類型如表1所示,主要包括描述學生信息的“學生序號”“專業”“班級”“性別”四個特征,類型為object類型。數據分析時,本研究將專業、班級和性別進行了離散化處理。其他“課程視頻”“章節測驗”“討論”“作業”“章節學習次數”“簽到”“課程互動”“任務點完成百分比”“期末成績”共11個學生行為特征數據為在線采集的最終轉換為百分制表示的學習數據。學生成績分布主要有A、B、C、D四個等級,分別代表的分數區間為[90,100]、[80,90)、[65,80)、[0,65)。此外,將數據集中期末成績小于75分的給予不及格預警,用目標值0代替;而將考試成績無不及格預警風險的數據,用目標1代替。
4 數據分布分析
為了更好地服務于教學質量的提升,構建高校在線學習成績預測模型,跟蹤高校學生線上教學及學生的學習情況,本研究首先對本學期數據分布情況進行了分析與歸納。
圖1給出了各數值類型字段的總體箱型分布,從中可以看出,數據分布最集中的為課程視頻得分,分布最分散的為章節學習次數和討論得分。說明大部分同學能按要求看完視頻,得分值差別不大,而課堂互動得分差異較大,說明有的學生互動比較積極,但有的學生參與積極性不夠。
圖2中左圖反映了數據集平衡性分布情況,可以看出該數據集的學生學習成績等級基本呈現正態分布。圖2中右圖反映了性別等級分布情況,可以看出男女比例差別較大,其中,性別為男性的數據占比為77.6%,性別為女性的數據占比為22.4%。
圖3為按專業等級分布情況,從圖中可以看出電信專業學生選學本課程人數為67人,占比為61.6%,通信(物聯網外包)專業為40人,占比為37.4%。從成績等級分布來看,成績等級為A的同學全部在電信專業,而且等級為B的同學占比也高于通信(物聯網外包)專業。因此,專業學生學習基礎對學生學習成績有一定影響,今后教學中可以針對不同專業學生制定不同教學策略,或者在教學中加強教學內容的核心教研,制定適合各專業的教學策略。如果是不同專業共同上這一門課程,則應該針對基礎較弱的專業班級加強監督和學習輔導。
5 特征與成績相關性分析
下面分析不同性別情況下,各學習特征與成績等級相關性。圖4為四級制等級與各學習行為特征之間的關系柱狀圖,可以看出,成績等級A的同學在討論、章節測驗、作業、課程互動等學習環節中得分均較高,反之較低。由于在線教學過程中該課程的學習視頻允許學生拖動,因此,從圖4中也可以看出課程視頻、任務點完成百分比分與各成績等級變化對學生成績的影響區別不大,可根據實際教學情況取消這兩個指標,或設置不同權重合理使用該模塊對學生學習情況進行分析。
圖5反映了課程內學習互動與成績等級關系。從圖5可以看出,成績等級越高的同學,參與課堂互動和討論的分數越高,說明課堂互動指標和討論可有效促進學習效果,提高學生學習成績。圖6反映了章節學習次數與章節測驗、討論與作業、作業與期末成績、章節測驗與期末成績之間的關系。可以看出,大多數章節學習次數多的同學,章節測驗分數也相對高;大部分課堂參與討論多的同學,作業完成的分數也相對較高;此外,作業和章節測驗分數高,大部分期末成績也較好。因此,從以上分析可以看出,課堂內外學習情況與學習成績有較大的相關性,今后教學過程中對在這些環節中得分較低的一部分同學應加強監督和督促,從而有效降低課程期末成績不及格風險率,更好地促進教學效果。
6 特征選擇
為充分利用各種學習特征,本研究也同時考慮了專業、班級和性別三個特征,并在相關分析之前對這三個特征進行了離散化數值處理。本研究利用Py?thon中皮爾森相關系數方法進行了不同特征相關性的分析,規定相關性系數大于0.70的學習行為特征為強相關,介于0.5到0.70之間為顯著相關,介于0到0.5之間為弱相關,小于0為不相關。圖7為各學習特征與期末成績的相關性矩陣圖。
從圖7中可以看出章節測驗、討論、作業、章節學習次數4個學習行為特征為強相關;課程互動、班級和簽到3個學習行為特征為顯著相關;課程視頻與任務點完成百分比2個學習行為特征為弱相關;專業與性別為不相關特征。在預測及預警分析中,可對強相關的學習行為指標重點監測或賦予較大的權重值,而對弱相關和不相關的特征可考慮去掉相關特征,實現特征篩選。因此,本研究篩選得出強相關和顯著相關的7個特征變量作為影響高校線上教學成績最相關的學習行為特征,分別為班級、章節測驗、討論、作業、章節學習次數、簽到和課程互動,并作為后續研究建立預警模型奠定基礎。
此外,本研究不僅研究了各學習行為特征與成績的相關性數據,同時也研究了不同特征之間的相關性值,從中發現相關教學規律,為制定正確的教學策略提供參考。圖8為各學習特征之間的相關性矩陣熱力圖。從圖8中可以看出,討論與課程視頻的相關系數值僅為0.21,說明一個能把課程視頻看完的同學,不一定會在課堂上參與討論;此外,從圖8中可以看出班級與期末成績為強相關、討論分別與班級、章節學習次數及課程互動也均為顯著相關,與期末成績為強相關,說明所在班級風氣好的同學更愿意參與討論、其學習主動性更高,課堂互動性也好,期末相對也能取得更好成績,因此,可有針對性地對某些班級進行教學督促和管理,提高教學效果。另外,也可以看出章節學習次數與章節測驗、討論為顯著相關,與作業為強相關等,說明章節學習次數多的同學,通常章節測驗分數也相對較高,作業完成率好,從而最后期末也能取到更好的成績,因此,平時教學過程中,課程教師可以對章節次數少的同學給予教學干預,協助監督這部分同學有質量地完成章節學習,從而有效提高學生的期末考試成績。
7 結論
本研究通過收集線上教學平臺數據,采用Python數據分析方法,對線上教學課程分布及學生的學習行為影響因素進行了分析,并篩選得出學生學習行為特征與學習成績的相關性矩陣,對學習成績影響因素最相關的學習行為特征進行了分析,該研究對提高線上教學效果及線上教學內容的設計有一定的指導和參考價值。研究結論總結如下:
(1) 從圖1、圖4和圖5分析可以看出,課堂互動和討論環節參與多的同學,最終成績也較好,所以教學過程中可以恰當地設計教學互動環節,促進課程教學效果;而對于章節學習次數與章節測驗、討論與作業、作業與期末成績、章節測驗等學習環節中得分較低的一部分同學應加強監督和督促,從而有效降低課程期末成績不及格風險率,更好地促進教學效果。
(2) 不同專業學生應制定不同教學策略。從圖2可以看出,電信專業基礎相對于物聯網專業學生基礎好一些,所以,電信專業平均成績優于物聯網專業,說明以后教學可針對性地對于基礎較弱的專業應加強監督和督促,有效提高整體教學水平。
(3) 圖7與圖8分析了各行為特征與學習成績的相關性,給出了弱相關、強相關和顯著相關的學習行為特征數據。建立綜合考評教學模型時,對于課堂內外學習情況與學習成績相關性不大的學習行為特征,例如“課程視頻”“任務點完成百分比”“專業”“性別”可以設置較小的權重或不考慮,而對于那些與最終學習成績相關性很大的學習行為特征應重點考慮。本研究結合各行為特征與期末成績相關性分析,給出“班級”“章節測驗”“討論”“作業”“章節學習次數”“簽到”和“課程互動”作為后續研究建立預警模型的特征數據,同時教學過程中也應該對這些教學環節加強監督和管理,制定相應教學策略,對該部分環節得分低的同學進行教學干預。