姜志旺 張紅霞 申晨 劉曉樂



摘? ?要:文章針對不同課程各種課堂記錄數據對學生成績的影響,分析不同課程中的共同規律,從而得知哪些因素對學生成績的影響更大,以使智慧課堂更好地指導和管理教學過程。
關鍵詞:隨機森林;重要性;學生成績分類;智慧教學管理
通過大數據挖掘、機器學習的相關技術深入挖掘智慧教學爾雅課堂的相關數據,挖掘內在的規律和結論,可以更好地促進智慧教學管理改革,使教學管理更加智能化和精準化。在我國當前的發展過程中,許多新型教和學的模式已經逐漸開始出現,例如云教育、泛在學習、移動學習、一對一數字化學習,而這些模式的特征均是交互性的、嵌入性的、縮小化的。智慧教育會成為以后教育發展的突破口與沖擊點,將會直接引起教育方面的改革,包括教育理念的改革、教學模式的改革、學習改革、教學管理和教學評價的變革[1]。
本文通過大數據、數據挖掘對教學數據進行建模,通過模型建立和數據分析來挖掘教學數據中表現出來的規律,來更好地進行智慧教學管理改革,這是根本的研究目的。
1? ? 數據預處理
通過爾雅課堂學習數據,提取對本研究有用的數據,即提取的特征屬性,包括任務完成率、視頻任務點完成率、章節測驗完成率、視頻任務點學生觀看時長(單位:min)、章節測驗平均分、考試完成率、考試平均分、學習訪問量等信息,得到如圖1所示的數據。
將數據進行如下保留信息的轉換:
(1)將任務點完成率、視頻任務點完成率、章節測驗完成率、考試完成率轉化為2位小數。
(2)刪除空數據與噪音數據。
經過上述準換,得到最終可用的數據如圖2所示。
將學生記錄按照學生成績進行分類,98~100分為優秀,90~98分為良好,45~90分為合格,0~40分為不合格,對應的標簽為0,1,2,3,按照此得到如圖3所示的數據。
2? ? 特征值提取
隨機森林是一種有監督學習算法。首先,對數據進行歸一化來統一量綱;其次,研究學習記錄信息對學生成績評級(優秀、良好、合格、不合格)的特征貢獻度,即對學生成績評級的分類結果,哪些特征對于決定學生成績評級的貢獻度較高。
本研究需要將隨機森林擬合得到的特征的重要性排序和統計圖,規定>0.2為可以決定學生成績的分割線重要性值,以“創新創業”課程為例,隨機森林得到重要程度數據如表1所示。
首先,“創新創業”課程視頻任務點學生觀看時長的重要性最高,為0.529 267 97,高出其他的特征,說明視頻任務點學生觀看時長是學生成績評定的最重要特征。其次,是學習訪問量,為0.383 433 07。通過以上統計不難發現,在爾雅課堂中對于學生成績評級起決定性的就是視頻任務點學生觀看時長與學習訪問量。
3? ? 學習數據分類
通過研究特征任務點完成率、視頻任務點完成率、章節測驗完成率、視頻任務點學生觀看時長(單位:min)、考試完成率以及學習訪問量能否有較高的教師評學成成績評定價的分類準確率。
需要對數據進行分類預測,預測的算法可以支持向量機(Support Vector Machine,SVM)算法、邏輯回歸(Logistic Regression,LR)算法、樸素貝葉斯算法、決策樹算法、鄰近算法(K-NearestNeighbor,KNN)算法,要通過分類算法參數的不斷調整來規避過擬合和欠擬合的現象。
調整好分類器的參數后,需要對不同分類器進行統計,統計的標準為模型分類準確率,將常用分類器對應的模型準確率針對不同課程分別進行統計。其中,“創新創業”課程分類結果如表2所示。
如表2所示,基本分類算法的效果都極差,其中,LR的分類效果相對于其他的分類器效果更好一些,為52.38%,原因是數據基本為離散數據,且更符合更偏向于直接線性關系,所以邏輯回歸有較高的分類準確率。
從上述分類的過程可以得到針對其他課程學生視頻觀看時長對學生成績評級的影響可以說起導向性的作用,通過對上述整個分類過程的研究發現,對于第一門課程完整數據做分類預測,分類準確率并沒有預測的效果好。
4? ? 結語
在以后的教育管理中應該積極關注本研究結果中最重要因素:學生觀看視頻的時長與學習訪問次數,觀看視頻時間長的且具有較高學習訪問量的學生成績的等級會更高。
分類結果給以后的系統發展優化帶來了更加明確的方向,通過輸入這些重要指標的數值,可以直接、快速地反映出學生的成績評定,教師快速了解每個學生在學習過程中的進度與知識掌握情況,使智慧教學的管理系統更加智能化,為今后的教學管理工作提供更科學的決策依據。
[參考文獻]
[1]曹培杰,尚俊杰.未來大學的新圖景“互聯網+高等教育”的變革路徑探析[J].現代遠距離教育,2016(5):9-14.
Abstract:In view of the influence of various classroom record data on students performance in different courses, this paper analyzes the common laws in different courses, so as to find out which factors have a greater influence on students performance, so as to make the wisdom classroom better guide and manage the teaching process.
Key words:random forest; importance; classification of students grade; intelligent teaching management