




關鍵詞:知識追蹤;在線課程;個性化學習;深度學習;智慧教育
中圖分類號:G642 文獻標識碼:A
文章編號:1009-3044(2024)28-0171-06
0 引言
近年來“互聯網+”教育不斷推進,在線教學平臺越來越普及,為學習者提供了開放、靈活的自主學習途徑,在線學習者的規模也逐漸增大。然而傳統在線教學平臺中普遍缺乏個性化教學手段,教師通常會在開課前預設好整套學習資源,包括文本講義、音視頻課件、作業測驗等,一旦課程開啟,學生便需按照既定的學習路徑進行,瀏覽這些預先準備好的資源。教學活動大多局限于論壇上的簡單交流、教師偶爾進行的直播答疑等,與學生的實時互動相對較少。這樣的模式在某種程度上限制了學生學習的自主性和深度,特別是對于成人學習者而言。大多數成人學習者學習時間靈活、學習水平和偏好存在較大差異,在線課程中靜態的學習資源、單一的教學模式、普適化的測評手段、有限的交互式學習活動已經不能滿足他們多樣化、個性化的學習需求。再加上教師數量遠不及學生數量,教師不可能充分了解每個學生的知識狀態和學習進度,難以為學生提供及時、有效的學習指導[1]。
解決上述問題的一項關鍵技術是知識追蹤,知識追蹤是支撐智慧教育系統的核心技術,近年來受到研究者們的廣泛關注[2]。知識追蹤是指根據學生的歷史答題記錄來自動追蹤學生的知識狀態隨時間的變化過程,以預測學生在未來學習中的表現。基于知識追蹤的結果,教育者可以及時了解學習者的知識掌握情況,學習者可以找到高效的學習路徑和恰當的學習資源。因此,本研究關注在大規模在線課程中如何利用知識追蹤技術輔助個性化教學,為教師和學生提供個性化的學習支持服務,以培養師生形成足夠的個性化教與學能力,為知識追蹤技術在智慧教育領域的應用提供參考。
1 知識追蹤技術的相關研究概述
1.1 起源
學習者知識狀態建模是輔助個性化學習的關鍵路徑之一,早期的研究根據測試成績從宏觀角度對學生進行評價分析,如經典測量理論、概化理論、項目反應理論等。后續有研究者進一步提出以認知診斷為代表的新一代測量理論,認知診斷來源于心理測量領域,通過測量學生個體內部心理對知識的加工過程分析學生的知識狀態。但上述方法通常只基于某一時刻的測驗成績對學生知識狀態進行評估,并假設學生知識狀態在短時間內是固定不變的。然而,在實際場景中,學生的知識狀態跟隨學習過程動態變化,及時追蹤學生的知識狀態對于個性化學習具有十分重要的意義。基于此,美國卡內基梅隆大學的Corbett和Anderson于1995年提出知識追蹤任務[3],旨在通過學生歷史的學習數據,動態跟蹤學生的知識水平的變化情況。此后,知識追蹤受到了教育領域和數據挖掘領域研究者的廣泛關注。
1.2 基本定義
知識追蹤任務可以形式化地表示為一個有監督的序列學習任務,如圖1所示,學生在學習過程中,與不同知識點的習題交互,產生一個習題歷史作答序列,包含習題信息、習題關聯的知識點信息以及學生作答的正確與否信息。知識追蹤模型將該序列作為輸入,通過對習題歷史作答序列建模,預測學生對下一道習題的作答結果與知識狀態。知識追蹤建模通常基于學習者學習過程中的測評性數據和特定的數學模型,隨時間的推移對學習者的知識掌握狀態進行動態估計,同時可以對學習者的答題表現進行預測。
1.3 分類
1) 基于貝葉斯的方法
貝葉斯知識追蹤模型(Bayesian Knowledge Trac?ing,BKT) 將學生的學習過程看作隱馬爾可夫過程,將學生的知識狀態表示為一組二元變量,變量取值為1 或0,分別表示學生對知識點的掌握與否,將學生的歷史答題情況作為觀測變量,使用貝葉斯概率公式計算在當前觀測變量下學生的知識掌握概率。但BEUsN0y6ewVXXLYx0yrXpg==BKT模型并沒有考慮到真實學習環境中的復雜場景,如某些習題的知識狀態不能簡單地表示為二元變量、各知識點存在一定的關聯關系,并非相互獨立、學生在學習過程中必然會存在遺忘行為,針對這些不足,后續出現了對BKT的改進模型[4-6]。
2) 基于邏輯回歸的方法
邏輯回歸是一種基于邏輯函數的預測模型,該函數輸出在[0,1]之間取值,通常用于分類任務的建模。21世紀初,研究者們提出將邏輯回歸模型用于知識追蹤任務,以學生正確作答習題的概率為因變量,將學習者的能力、知識點難度、學習率、學習行為等因素作為參數建立邏輯回歸模型來進行答題預測。基于邏輯回歸的知識追蹤模型采用項目反應理論或因子分析方法[7-9],并充分利用邏輯函數易于實現、計算復雜度低等優點,將知識追蹤問題轉化為邏輯回歸中的分類問題,在模型預測準確性上基本優于基于貝葉斯的知識追蹤模型。
3) 基于深度學習的方法
深度學習是一種新興的人工智能方法,近年來在計算機視覺、語音處理、自然語言處理等領域中發揮著重要作用,也被逐漸應用于知識追蹤任務。Piech 等于2015年首次將深度學習引入知識追蹤領域,提出深度知識追蹤(Deep Knowledge Tracing,DKT) 模型,使用循環神經網絡建模學生作答交互序列的時序關系,獲得知識狀態的高維連續表征并預測學生的未來表現[10]。有研究者將DKT應用于開放式的學習環境中,如編程練習[11]、發現知識點間拓撲順序[12]、生成試卷[13]等。
后續又出現了DKT的擴展模型,如增強的深度知識追蹤模型DKT+[14]、基于動態學生分類的深度知識追蹤模型DKT-DSC[15]等。DKT模型取得廣泛關注后,其他基于記憶網絡[16-17]、注意力機制[18-19]和圖神經網絡[20-21]的深度學習方法被研究者陸續應用于KT 任務中。
綜合對比這三類方法:1) 從模型輸出結果的精細化程度來看,由于隱馬爾可夫模型本身隱狀態的限制,貝葉斯知識追蹤模型的建模結果只有掌握或未掌握兩種離散值,并不能獲得表示學生知識點掌握程度的連續值。基于深度學習的知識追蹤模型可以通過權重參數得到學習者對知識點的掌握概率,其范圍為0~1之間的連續值[22]。2) 從建模能力來看,基于貝葉斯和邏輯回歸的方法一般基于單一或少量知識點進行建模,難以捕獲習題序列中的長期依賴關系,而基于深度學習的知識追蹤模型具備強大的特征提取與表征能力,可以較好地建模多知識點和大規模學習者的作答序列信息。3) 從模型的應用范圍來看,由于基于貝葉斯的知識追蹤模型簡單、可解釋性強,已被廣泛應用到各類智能導學系統中。而基于深度學習的方法雖然尚未廣泛應用,但已成為當前的研究熱點,具有良好的應用前景。
2 深度知識追蹤技術的實驗過程與結果分析
由于基于深度學習的知識追蹤方法建模能力較好,輸出的預測結果更為精細化,也更契合大規模在線教學的應用場景,因此,使用基于深度學習的知識追蹤模型在四門在線課程上開展實驗,對學生個體知識狀態變化過程和學生群體知識狀態分布進行可視化分析。
2.1 數據說明
本研究選擇臨床中醫藥應用、抗美援朝精神、從創新思維到創業實踐、計算機應用基礎四門課程作為實驗數據,前三門課程來自開源數據集MoocCubeX[23],記錄了2020年下半年的學生作答數據。計算機應用基礎課程來自某開放大學教學平臺,采集了某個分部2022年春季學期的學生、習題和作答行為數據。由于在線教學平臺的實際業務中并不存在知識點標注、習題綁定知識點的功能,無法得知這四門課程中的習題與知識點的關聯關系,只能依賴教師人工標注出知識點的層級結構,但習題與多層級知識點的關聯關系十分稀疏,因而本研究使用習題對應的課程章節信息(可粗略認為是一級知識點)代替知識點信息,探究學生在章節上的掌握情況。
表1顯示了每門課程相關信息的統計情況,可以發現這四門課程中平均每個學生作答的習題數量和平均每道習題作答的學生數量均比較高(均占總習題和總學生數量的75%以上),說明學生的歷史作答交互序列質量較高,可以作為實驗對象。所有課程的習題作答交互數據按照8:1:1的比例隨機劃分為訓練集、驗證集、測試集。
2.2 實驗過程
1) 數據預處理
圖2是數據經過預處理后的一個樣例,包含用戶ID、習題ID、每道習題對應的知識點ID、學生對每道習題的作答是否正確以及作答序列長度。這些數據經向量化處理后作為模型的輸入。
2) 知識追蹤方法說明
本研究利用五個基于深度學習的知識追蹤模型在四門課程上進行實驗,分別是深度知識追蹤DKT[15]、增強的深度知識追蹤DKT+[24]、動態鍵值對記憶網絡DKVMN[26]、自注意力知識追蹤SAKT[29]和上下文感知的注意力知識追蹤AKT[30]。這五個模型均為經典的深度知識追蹤模型,本研究使用PyTorch對模型進行了實現,模型結構不在本文中詳細展開。
DKT:使用循環神經網絡對學生的習題作答記錄進行建模,追蹤學生知識點掌握程度隨時間的變化過程,是首次將深度學習引入知識追蹤領域的模型。
DKT+:為改善DKT模型中輸入序列的重構問題和預測結果的波動性問題,提出增加正則項的方法,得到增強的DKT模型。
DKVMN:借鑒記憶增強的神經網絡MANN方法,用一個靜態矩陣和一個動態矩陣分別存儲知識點信息和知識點狀態信息,通過讀寫機制追蹤學生知識狀態的更新過程。
SAKT:利用注意力機制從學生的習題作答記錄中提取與當前知識點相關的信息,是第一個基于自注意力機制的知識追蹤模型。
AKT:使用兩個基于單調注意力機制的編碼器來學習習題和回答的上下文感知表征,并使用認知和心理測量理論中的Rasch模型來規范知識點和習題的表示,能夠在不引入過多參數基礎上捕捉同一知識點的習題之間的個體差異。
2.3 實驗結果
為了評估基于深度學習的知識追蹤模型在四門課程上的表現,大多數知識跟蹤模型研究工作均采用受試者工作特征ROC(Receiver Operating Characteris?tic) 曲線下與坐標軸圍成的面積AUC(Area UnderCurve) 和準確率ACC(Accuracy) 來評價模型的表現,本研究遵循這一做法。AUC是衡量二分類模型優劣的一種評價指標,表示正例位于負例之前的概率,能夠很好地描述模型整體性能的高低,ACC是模型預測正確分類的樣本數占樣本總數的比例。模型的性能與AUC和ACC的值成正比關系,取值越大表示模型預測性能越好。
表2 顯示了各知識追蹤模型在四門課程上的AUC、ACC結果,通過對比可以看出,AKT模型在所有課程上的AUC和ACC值都是最高的,尤其在數據規模較大的臨床中醫藥應用課程中也能保持良好的效果。這得益于三個原因,這三個原因來源于認知科學和心理測量學的經典理論。一是認為學習者在回答問題時理解和學習的方式取決于學習者,即對于兩個具有不同過去歷史記錄的學習者來說,他們理解同一問題的方式以及從實踐中獲得的知識可能不同。基于這一觀點,引入單調注意力機制對習題和回答進行表示,將學習者未來對習題的回答與他們過去的回答聯系起來,能夠捕獲學習者上下文感知的知識狀態。二是認為學習過程是時序的,伴隨著記憶力的衰減,不相關知識點的作答和太久之前的作答與當前習題的作答相關性比較低。因而在計算單調注意力的權重時加入乘法指數衰減項,使得當前習題和過去習題的注意力權重不僅取決于兩者之間的相似性,還取決于它們之間的相對時間步數。三是認為涵蓋相同知識點的習題密切相關,但具有不容忽視的重要個體差異。因此使用心理測量學中經典的Rasch模型構建知識點和習題的表示,通過習題難度和學習者的能力來建模學習者正確作答習題的概率。
2.4 可視化分析
鑒于AKT模型在上述四門課程中均表現最佳,本研究對AKT模型的相關輸出結果進行可視化分析。
1) 學生個體的知識狀態追蹤
選擇計算機應用基礎課程中某位學生的所有答題預測結果,將其對知識點掌握程度的變化過程進行可視化,結果如圖3所示。用不同圖案/顏色表示不同的知識點,圓點的大小表示預測答題正確的概率大小,圓點越大,表示預測正確的概率越大。從圖中可以發現,知識點1、3、7對應的圓點沒有變化,且圓點較大,說明該學生對相應知識點的掌握情況較好。知識點2、4、5對應的圓點開始時較大,中間變小,最后又恢復開始時較大的狀態,說明該學生開始對相應知識點的掌握情況較好,考慮中途學習的遺忘因素,學生知識水平降低,但后續隨著持續練習又恢復了最初的水平。知識點6對應的圓點開始時較小,后續圓點變大并保持較大的狀態,表明該學生開始未掌握知識點6,隨著練習的不斷加強逐步掌握了知識點6。
2) 學生群體的知識狀態分布
選擇從創新思維到創業實踐課程的測試集(共包含430名學生),將這些學生的歷史習題作答交互序列作為AKT模型的輸入,模型的輸出結果是一個概率值,可以判斷這些學生對于相關知識點的掌握水平。本研究根據輸出概率值的取值范圍將知識點掌握水平劃分為三個檔次,概率值大于等于0.9代表優秀掌握知識點,概率值在區間[0.5,0.9) 內代表良好掌握知識點,概率值小于0.5代表不合格,未能掌握知識點。
針對該課程12個不同的知識點,分別計算學生的優秀率、良好率和不合格率,以此表示學生對各知識點的整體掌握情況,結果如圖4所示。從圖中可以看出,學生在所有知識點上的優秀率均達到了70%以上,且不合格率均低于10%,說明在此課程中學生對各知識點的整體掌握情況很好,學生整體的學習效果十分明顯。綜合對比各知識點,學生在知識點1、4、5、7、10、11上的優秀率達到了90%以上,且不合格率均在5%以下,說明學生對這6個知識點的掌握程度很好。學生在知識點3、6、9、12上的優秀率達到了80% 以上,但相比于知識點3和9,學生在知識點6和12上的不合格率超過了5%,說明學生對這兩個知識點的掌握程度出現了一定程度的分化,雖然學生的優秀率較高,但不合格率也較高,存在學生群體掌握情況不均衡的現象。此外,與其他知識點相比,知識點2和知識點8上的優秀率未達到80%,但知識點8的良好率低于知識點2,不合格率高于知識點2,學生在知識點8上的優秀率低而不合格率高,因而學生對知識點8 的整體掌握程度是最差的。
3 在線課程中知識追蹤技術的應用場景
基于上述實驗過程中的可視化分析結果,本研究總結出知識追蹤技術在大規模在線教學場景中實踐應用的整個閉環流程,如圖5所示。以知識追蹤技術為實踐路徑,智能分析學生個體的知識狀態變化過程和學生群體的知識狀態分布,進而將建模結果應用于學情診斷報告、學習資源推薦、學習路徑規劃、學習者畫像等個性化教學支持服務中,學生能夠及時發現自己學習過程中的薄弱環節,從而查漏補缺,促進個性化學習,教師可以根據學生的薄弱環節因材施教,給予學生個性化的學習指導。
1) 學情診斷報告。基于深度學習的知識追蹤模型能夠輸出每個學生對不同知識點的掌握程度,利用這一結果生成學情診斷報告,教師可以對整體的教學效果有所把握,從而及時調整教學策略,提供針對當前學習者群體的教學輔導。一方面,教師可以發現并關注知識掌握水平薄弱的學生,為他們提供個性化的學習輔導;另一方面,教師可以從知識點層面及時調整教學方案,對于學生總體掌握較差的知識點,教師可以有針對性地加強對相關章節的講解或答疑,復習鞏固該知識點,幫助學生進一步提高對相關知識點的熟練程度。
2) 學習資源推薦。根據學生的知識狀態,為其自動推薦相匹配的學習資源,能夠輔助學生提高學習效率,提高學習水平。在線教學平臺中包含多種類型的課件、習題等學習資源,將知識點與這些資源進行關聯綁定,針對學生掌握程度低的知識點,可以向其自動推薦對應的課件,對薄弱知識點加強學習鞏固。此外,根據學生知識狀態的不同,可以結合習題難度設置推薦策略,向學生自動推薦合適的習題。對于學生掌握程度很低的知識點,練習的目的是基礎提升,可以先推薦難度較低的習題,幫助學生先逐步掌握該知識點。隨著學生知識狀態水平的提升,逐步推薦難度更高的習題。而對于掌握程度較高的知識點,練習的目的則是加強鞏固,避免因遺忘導致知識狀態水平下降,因此需要推薦難度較大的習題。
3) 學習路徑規劃。根據學生的知識狀態,為其自動規劃出最優或較優的學習單元序列(如學習資源、學習活動、知識點等),構成個性化的學習路徑。這一過程依賴知識圖譜技術,需要確定知識點的屬性特征及各知識點之間的上下位、前序后繼關系,并綁定學習單元與知識點的包含關系。學習路徑的規劃可分為知識點路徑生成和學習單元路徑生成兩個階段,首先基于學習者對知識點的掌握程度得到待排序的知識點集合,再利用知識點之間的網絡結構生成知識點路徑,以保證學習路徑滿足知識點之間的內在邏輯。在此基礎上,根據學習單元與知識點之間的包含關系得到待排序的學習單元集合,并結合學習單元的內部屬性信息對其排序,形成學習單元路徑,這樣使得學習路徑既滿足知識點間的依賴關系又符合學習活動與學習資源間的對應關系。
4) 學習者畫像。基于學習者的基本屬性信息和學習行為數據來挖掘不同學習者的特點,從不同維度刻畫學習者特征,構建學習者畫像,以識別不同類型的學習者。知識追蹤模型根據學習者與習題產生的歷史作答記錄,診斷出學習者的知識點掌握程度,這一結果可以作為學習者畫像中知識水平維度的一個輸入,輔助構建學習者畫像。
4 總結與展望
本研究以如何在大規模在線課程中利用知識追蹤技術輔助個性化學習為研究目標,通過采集、處理學生在線學習過程中產生的真實作答交互數據,對基于深度學習的知識追蹤方法進行了技術實現,并對實驗結果進行了可視化分析。最后總結出結出在線課程中知識追蹤技術的應用場景。根據技術實現和結果分析過程中的問題與不足,并結合當前智能技術的發展趨勢,對知識追蹤技術在大規模在線課程中的應用提出如下建議:
1) 在線教學平臺需進行充分的數據埋點,以采集多種類型的數據,滿足知識追蹤技術應用的需要。對教育教學過程中產生的真實數據進行廣泛采集、深入挖掘、智能分析,實現對學習者知識水平的過程性、動態性診斷。
2) 增強模型可解釋性方面的研究。基于深度學習的知識追蹤方法使用大量學生作答交互數據,設計一系列權重參數,這些權重參數不符合人的認知規律,模型內部為黑盒,無法得到具體影響學習知識狀態水平的因素,也就無法給出具體而合理的建議。這是深度學習模型應用的一個重要研究難題。
3) 綜合利用知識圖譜、生成式人工智能等技術,打造人機協同的在線測評模式,構建個性化學習應用。利用生成式人工智能技術自動生成題目,經教師人工審核后加入題庫。學生剛開始練習時先隨機抽取題目,在練習過程中利用知識追蹤技術動態診斷學生的知識狀態,根據診斷結果自動推薦合適的習題、知識點和學習資源,并提供學習路徑規劃、學習者畫像等個性化學習服務。