張凱 付姿姿 覃正楚



摘 要:知識追蹤通過對知識點的表示來描述習題,以此建模知識狀態,最終預測學習者的未來表現。然而目前的研究在知識點的表示方面既沒有建模歷史知識點對當前知識點產生的時間關系上的影響,又未能刻畫習題內部各知識點之間產生的空間關系上的作用。為了解決上述問題,提出了時空相關性融合表征的知識追蹤模型。首先,以知識點之間的時間相關程度為基礎,建模歷史知識點對當前知識點的時間作用;其次,利用圖注意力網絡建模習題所包含的若干知識點之間的空間作用,得到蘊涵了時空信息的知識點表示;最后,利用上述知識點的表示推導出習題的表示,通過自注意力機制得到當前的知識狀態。在實驗階段,與五種相關知識追蹤模型在四個真實數據集上進行性能對比,結果表明提出的模型在性能方面有更出色的表現。特別地,在ASSISTments2017數據集中所提模型比五個對比模型在AUC、ACC方面分別提升了1.7%~7.7%和7.3%~2.1%;消融實驗證明了建模知識點之間時空相關影響的有效性,訓練過程實驗表明了提出的模型在知識點的表示及其相互作用關系的建模等方面具有一定的優勢,應用實例也可看出該模型優于其他知識追蹤模型的實際結果。
關鍵詞:知識追蹤;知識點表示;時空相關性;圖注意力網絡
中圖分類號:TP183?? 文獻標志碼:A??? 文章編號:1001-3695(2024)05-015-1381-07
doi: 10.19734/j.issn.1001-3695.2023.09.0414
Knowledge tracing model of temporal and spatial correlation fusion
Abstract:Knowledge tracing aims to model the state of knowledge and ultimately predict the future performance of learners by describing exercises through the representation of concepts. However, in terms of the representation of concepts, the current research doesnt model the influence of historical knowledge concepts on the temporal relationship of the current concepts, nor does it describe the role of the spatial relationship between various concepts in the exercise. In order to solve these problems, this paper proposed a knowledge tracing model characterized by temporal and spatial correlation fusion. First of all, based on the degree of temporal correlation between concepts, it modelled the temporal effect of historical concepts from current concepts. Secondly, it modelled the spatial interaction between several concepts contained in the exercise to obtain the representation of knowledge points containing temporal and spatial information through the graph attention network. Finally, it used the above representation of concepts to derive the representation of the exercises, and generated the current state of knowledge through the self-attention mechanism. In the experimental stage, this paper compared the performance of the proposed model with the five relevant knowledge tracing models on four real datasets. The results show that the proposed model has better performance. In particular, compared to the five comparative models on the ASSISTments2017 dataset, the AUC and ACC are improved by 1.7%~7.7% and 7.3%~12.1%, respectively. At the same time, the ablation experiment proves the effectiveness of modeling the temporal and spatial correlation between concepts, and the training process experiment shows that the proposed model has certain advantages in the representation of concepts and the modeling of their interaction relationships. The application examples can also show that the model has better practical results than other knowledge tracing models.
Key words:knowledge tracing; concept representation; temporal and spatial correlation; graph attention network
0 引言
知識追蹤是智慧教育領域中一項重要的研究內容,其主要任務是分析學習行為數據、建模學習者知識狀態的變化過程、預測學習者的未來作答表現。知識追蹤模型目前應用于各類在線教育平臺,如國家高等教育智慧教育平臺、學堂在線、Coursera等,為智慧教育平臺實現個性化的教與學提供理論依據和技術支撐[1~3]。
知識點的表示是知識追蹤領域的關鍵科學問題,目前的研究主要集中在兩個方面:a)利用歷史知識點對當前知識點在時間上的影響來豐富知識點的表示;b)通過描述習題中若干知識點之間在空間上的相互關系,來增強知識點的表示。這些研究試圖從時間和空間等多個方面建模知識點之間的相互影響或作用,從而更加準確地描述知識點。
盡管當前的研究在刻畫知識點方面取得了不錯的效果,但仍存在一定的局限性。其中,對知識點的表示僅通過卷積網絡提取時間窗口內知識點之間的影響,沒有從全局考慮時間窗口的大?。粌H利用圖神經網絡聚合習題內部知識點之間空間上的作用,未能注意到知識點之間作用程度的區別。本文提出了時空相關性融合表征的知識追蹤模型,在現有研究的基礎上進行了一定的改進,主要創新如下:
a)針對知識點的表示建模時間影響不充分這一問題,提出了一種新的方法。首先計算知識點之間的時間相關程度,根據時間先后信息建模全局歷史知識點對當前知識點的影響,得到知識點的時間相關表示。
b)在上述知識點時間相關表示的基礎上,針對知識點的表示建??臻g作用不精準這一問題,提出一種新的方法。首先計算習題內部各個知識點之間的空間相關程度,以此為依據聚合習題內部知識點之間的空間作用,得到知識點的時空相關表示。
1 相關工作
1.1 知識點的傳統表示
深度知識追蹤(deep knowledge tracing,DKT)[4]首次把深度模型應用于知識追蹤領域,它把學習者與習題的交互數據輸入遞歸神經網絡來建模知識狀態,沒有考慮到知識點的直接表示,未顯式建模知識點間的相互關系。在DKT模型的基礎上,KTCR[5]模型利用矩陣Q將習題映射為知識點,NKTF[6]模型則通過專家標注得到習題中的知識點。劉坤佳等人[7]通過挖掘習題上下文信息得到新的習題與知識點表示。更進一步地,DKVMN[8]模型用一個靜態矩陣來存儲知識點表示,與這種方法類似的還有李曉光等人[9]提出的LFKT模型和宗曉萍等人[10]提出的MSKT模型。上述模型的知識點表示一般僅包含了知識點本身的信息,是知識追蹤研究初期常用的方法,屬于知識點的傳統表示。這些表示方法忽略了以往多個時刻的知識點對當前知識點的影響,也沒有從空間關系考慮知識點之間的相互作用。
知識點的表示會受到知識點之間存在的時間或空間上關系的影響,例如學習者先作答了考查加法的習題,后續作答了考查乘除混合運算的習題,則后續的知識點會受到先前知識點在時間上的影響。另一方面,后續習題所包含的乘法和除法知識點也會受到彼此空間上的影響。
1.2 知識點的時間相關表示
TCN-KT[11]模型融合了學習者的先驗基礎來建模習題的表示,并利用卷積模型的缺省功能提取時間窗口內習題的相互影響。CKT[12]模型把習題映射為知識點,使用層次卷積建模歷史知識點對當前知識點的作用。MAFKT[13]模型使用時間卷積網絡刻畫了多尺度的知識點表示,描述了不同時刻知識點之間的相互作用,融合得到了新的知識點表示。 MLB-KT[14]模型利用多種學習行為數據建模知識點表示,并通過學習行為間的協同性和約束性,構建歷史知識點對當前知識點的影響。李浩君等人[15]使用雙向GRU網絡建模知識點表示,一定程度上描述了歷史知識點對當前知識點間的作用關系。上述研究都是用不同的方法建模歷史知識點對當前知識點的影響,融合時間信息來豐富知識點的表示。但這種方式在建模知識點間的相互作用時使用的是片段時間信息,僅考慮了時間窗口內的知識點相互作用,一般也沒有注意到空間關系對知識點之間相互作用的影響。
1.3 知識點的空間相關表示
GKT[16]模型利用圖結構表示知識點之間的空間關系,通過聚合和更新操作建模知識點的表示。GIKT[17]模型則在GKT的基礎上把習題映射為圖中節點,但沒有建模知識點之間的關系。GAKT-IRT[18]模型將圖注意力網絡與項目反映理論相結合,刻畫包含空間信息的知識點表示。Tong等人[19]利用知識結構中的多種空間關系來模擬知識點之間的影響傳播,以此建模知識點表示。鄭浩東等人[20]使用知識圖來描述知識點之間的相關性,融入知識狀態的變化過程。上述模型都是以不同的方式建模知識點的空間關系,利用圖神經網絡的缺省功能刻畫知識點之間的相互作用,以此來描述知識點,但是忽略了歷史多個時刻的知識點對當前知識點的影響。
綜上所述,三個方面的知識點表示研究均為通過不同方式建模知識點之間的相互作用,刻畫知識點的表示。然而,當前研究尚未完整地從時間關系的角度建模歷史知識點對當前知識點的作用關系,未能從空間關系的角度描述習題包含的若干知識點之間的相互影響。為了更好地表示知識點及其相互作用關系,本文從時間和空間的角度建模了知識點的表示。
2 時空相關性融合表征的知識追蹤模型
2.1 提出的思想
在學習者與習題交互過程中,歷史知識點會影響當前知識點的表示,比如對三角函數知識點的學習會影響到后續對正弦函數知識點的學習。另一方面,習題內部的知識點之間也會存在相互作用,比如在同時具有正弦函數和余弦函數知識點的習題中,這兩個知識點也會相互影響。上述兩種知識點之間的影響方式從時間和空間關系上作用于知識點的表示,現有研究尚未完整地建模這兩種影響。本文提出了一種時空相關性融合表征的知識追蹤模型(knowledge tracing of temporal and spatial correlation fusion,TSKT),利用歷史知識點與當前知識點在時間上的相關性,以及習題中各個知識點在空間上的相關性,從時空角度來建模知識點之間的相互影響,增強知識點的表示。模型共分為三個部分:a)輸入模塊,嵌入表示習題ID、知識點ID和學習行為等輸入數據;b)時空相關性模塊,從時間和空間上建模知識點之間的相互影響,得到蘊涵時空信息的知識點表示,以此推導出習題表示,計算當前知識狀態;c)預測更新模塊,描述學習者知識狀態的變化,預測學習者未來的答題情況。整體模型的架構如圖1所示。
2.2 符號定義
為了準確描述TSKT模型各部分的功能,表1給出了模型的相關符號定義。
2.3 輸入模塊
知識追蹤通過表示知識點、習題和學習時間等數據來建模知識狀態。為了準確描述知識狀態,本節對知識點、習題和學習行為等輸入數據進行嵌入表示。
1)知識點嵌入表示
2)習題嵌入表示
其中:Qt,:表示矩陣的第t行,描述了習題qt所考查的知識點;考查權重wt表示知識點在習題中被考查的程度。
3)學習時間嵌入表示
綜上所述,可以得到知識點的嵌入表示c′p、習題的嵌入表示q′t,以及學習時間的嵌入表示lqi。
2.4 時空相關性模塊
在學習者與習題交互的過程中,知識點之間會存在時間和空間上的相互影響,這兩種影響會作用到知識點的表示。為了更準確地描述知識點,利用歷史知識點與當前知識點時間上的相關性建模知識點之間的時間相關影響;通過習題中若干知識點空間上的相關性建模知識點之間的空間影響,最終得到蘊涵了時間信息和空間信息的知識點表示。
2.4.1 知識點的時間相關表示
知識點的時間相關表示蘊涵了歷史知識點對當前知識點的影響。具體地,根據知識點之間的時間相關程度描述歷史知識點對當前知識點的相關影響;融入時間位置信息來建模歷史知識點對當前知識點的時間相關影響;最后刻畫知識點的時間相關表示,如圖2所示。
a)知識點之間的時間相關程度。皮爾森相關系數是變量的協方差與標準差之商,本節用來度量兩個知識點之間的時間相關程度,具體如下:
b)相關影響。歷史知識點會對當前知識點產生影響,從而增強當前知識點的表示。為了建模這一過程,首先利用知識點之間的時間相關程度計算歷史知識點對當前知識點的相關影響:
其次,考慮到每個習題可能包含多個知識點,利用矩陣Q聚合歷史習題qi中所有知識點對cp的相關影響:
其次,自注意力機制可以根據時間位置信息獲取歷史習題相關影響的權重。建模相關影響隨時間變化的過程,具體如下:
d)知識點的時間相關表示。所有歷史習題的時間相關影響共同作用到當前知識點,會增強當前知識點cp的表示。為了建模上述過程,把所有歷史習題對知識點cp的時間相關影響相加,再與知識點cp的嵌入表示拼接,經過一個ReLU函數得到cp的時間相關表示如下:
2.4.2 知識點的時空相關表示
知識點的時空相關表示是在知識點時間相關表示的基礎上,增加了習題內部各個知識點之間的空間作用。具體地,以矩陣Q為基礎構建知識點關系圖;根據知識點關系圖和時間相關表示得到知識點的時空相關表示,并推導出習題的時空相關表示,與答題結果相結合建模知識狀態,如圖3所示。
a)知識點關系圖。以矩陣Q為基礎,為任一習題qi構建知識點關系圖,記作Gi,Gi={Vi,Si}。其中,Vi={cv|Qi,v=1}是節點集,表示習題qi中知識點的集合,每個知識點的特征向量是其時間相關表示;Si={(u,v)|cu,cv∈Vi}是邊集,每條邊的特征向量為對應兩個知識點之間的注意力系數。
b)知識點的時空相關表示。作答習題的過程中,習題內部的知識點之間會產生空間上的相互作用,采用圖注意力網絡建模這一過程。首先,對于知識點關系圖Gi,圖注意網絡可以捕獲圖中每個知識點的鄰居信息,得到知識點之間的注意力系數,具體過程如下:
為了穩定空間相關程度,通過多頭注意力機制提取多個注意力層面的平均值,最后聚合鄰居信息得到知識點cv的時空相關表示:
其中:qsi蘊涵習題qi的時間信息和空間信息。
2.4.3 融合知識狀態
在建模知識狀態的過程中,還應考慮學習者的答題結果。首先,把習題的時空相關表示qsi與對應時刻的答題結果進行拼接,具體如下:
其次,提出的模型利用自注意力機制,根據融合了時空信息和作答結果的qri提取歷史時刻的權重,建模知識狀態:
為了增強當前知識狀態,將歷史知識狀態進行歸一化,獲取歷史時刻知識狀態的權重為
其中:wi表示歷史知識狀態hi的權重,將其作用于hi并與當前知識狀態ht拼接,通過一個全連接層,最終得到包含歷史信息和當前信息的融合知識狀態:
2.5 預測更新模塊
預測更新模塊用于預測學習者未來的答題情況,并更新知識點狀態。圖4是預測更新過程的示意圖。
2.5.1 預測未來表現
考慮到習題間會存在一定的差異,因此拼接上述融合知識狀態h′t和習題的時空相關表示qst,這樣得到的拼接向量包含了學習者的知識狀態和習題信息。將拼接向量輸入至tanh函數激活的全連接層,得到向量it:
其次,將it輸入全連接層,用sigmoid函數激活,得到學習者對習題qt的表現情況的預測:
yt=sigmoid(WTyit+by)(19)
其中:Wy是權重參數。
2.5.2 更新知識點狀態
在學習者與習題的交互過程中,對每個知識點的掌握程度也在發生變化,因此需要更新每個習題練習前后的知識點狀態。
其中:Ft是學習者遺忘的知識點狀態矩陣。
Ft=Kt-1ft(23)
2.6 損失函數
在訓練過程中,選擇用交叉熵損失函數來最小化預測值yt和真實標簽rt之間的差異性。當交叉熵越小時,預測值與真實值就越接近,表示如下:
由于交叉熵損失函數是凸函數,所以在訓練時使用梯度下降法學習參數,使得模型能夠更準確地預測學習者未來的表現。
3 實驗結果與分析
TSKT模型的主要工作集中于:知識點的時間相關表示、時空相關表示、習題的時空融合表示。為了全面對比分析TSKT模型的性能,本章選取了DKT[4]、DKVMN[8]、TCN-KT[11]、GKT[16]、SKT[19]五個模型作為對比模型。具體原因如下:
a)DKT是首個將深度學習引入知識追蹤的模型,它使用獨熱編碼作為習題的表征,雖然沒有蘊涵時空相關信息,但為后續的研究開辟了新的方向。
b)DKVMN使用靜態矩陣來存儲知識點表示,雖然沒有考慮到知識點之間的相互影響,但由知識點表示的線性組合形成習題的表示。
c)TCN-KT建模了習題在時間窗口內的相互影響,刻畫了習題的時間相關表示。
d)GKT刻畫了知識點在空間上的相互作用,聚合鄰居信息,得到了知識點的空間相關表示。
e)SKT根據知識點空間關系的差異設計了兩種不同的傳播機制,通過融合兩種鄰居信息來建模知識點的空間相關表示。
上述模型的研究開始于對習題的表征,細化的研究著重于知識點的時間和空間相關表示,TSKT將從知識點和習題的時空融合表示等方面與這五個模型在多個評價指標上進行對比。
3.1 實驗方法
TSKT模型以知識點ID、習題ID等為輸入,以學習者的作答預測值為輸出,具體的實驗步驟如下:
a)建模知識點的時間相關表示。對數據集中知識點的ID進行嵌入表示,計算知識點之間的時間相關程度,并融入時間位置信息,建模知識點之間的時間相關影響,得到知識點的時間相關表示cp。
b)建模知識點的時空相關表示。構建習題蘊涵的知識點關系圖,計算知識點之間的空間相關程度,建模知識點的時空相關表示csv,通過聚合同一習題中的知識點時空相關表示,可以得到習題的時空相關表示qsi。
c)建模融合知識狀態。把不同時刻的學習者作答結果映射成零向量,與習題的時空相關表示拼接。通過自注意力機制建模不同時刻的知識狀態hi并計算權重,得到融合知識狀態h′i。
d)預測作答結果。根據學習者當前的知識狀態,結合學習者作答習題的時空相關表示,得到預測的作答結果yt。
e)更新知識狀態。定義一個知識點狀態矩陣,將學習者的遺忘數據映射成嵌入向量并轉換為遺忘權重,從而計算得到當前的知識點狀態矩陣Kt。
3.2 數據集
為了驗證TSKT模型的有效性,分別在ASSISTments2012[21]、ASSISTments2017[22]、Slepemapy.cz[23]以及Junyi Academy[24]四個真實數據集上進行實驗,以下分別簡稱為ASSIST12、ASSIST17、Slepemapy和Junyi。表2展示了各數據集的基本信息。
3.3 實驗環境
實驗環境如表3所示。在每個數據集中,將80%的數據劃分為訓練集,20%的數據劃分為測試集;將訓練集中20%的數據劃分為驗證集,用于選擇最佳模型的超參數。
參數的初始化選擇均值和標準差為零的正態分布隨機初始化,初始學習率設置為0.001,學習率每經過10輪訓練會衰減0.1倍;batch-size設置為32;選擇交叉熵損失函數和Adam優化器。
3.4 性能對比實驗
使用曲線下面積(area under curve,AUC)和準確率(accuracy,ACC)作為模型的評價指標。AUC是ROC(receiver opera-ting characteristic)曲線與坐標軸圍成圖形的面積,其取值在0.5~1,值越大,說明模型預測性能越好,若AUC的值為0.5,說明模型是隨機預測模型。ACC是正確預測結果占所有預測結果的百分比,ACC的值越大,說明模型的預測結果越準確。
圖5展示了TSKT模型與五個對比模型在四個數據集上的AUC值。其中,橫坐標為數據集,縱坐標為AUC的取值。
由圖5可以看出,TSKT模型在四個真實數據集上的表現最好,其AUC值分別為0.788 3、0.801 7、0.844 1和0.873 9。在Slepemapy數據集中,TSKT比第二名的GKT模型要高出2.41%,分析其原因可能是GKT模型只建模了知識點之間的空間作用,忽略了歷史作答習題中的知識點對當前知識點的時間相關影響,導致實驗結果略低于TSKT模型。在ASSIST17數據集中,TSKT模型的AUC值比GKT模型的0.784高出1.7%,比DKVMN模型的0.723 9高出7.7%,分析其原因可能是DKVMN模型利用知識點來表示習題,但未能建模知識點在時空上的相互作用關系,因此性能表現相較于TSKT模型有所欠缺。實驗結果也驗證了TSKT模型從時間和空間兩個角度建模知識點表示的有效性。
圖6展示了TSKT模型與五個對比模型在四個數據集上的ACC值。由圖6可以看出,TSKT模型在四個真實數據集上的ACC值分別為0.782 2、0.803 0、0.793 7和0.845 7,對比其余模型均取得了一定的優勢。值得注意的是,在ASSIST17數據集中,TSKT模型的準確率要比SKT模型的0.730高出7.3%,比TCN-KT模型的0.682高出12.1%。SKT模型根據知識點間不同的空間關系,設計了兩種不同的傳播機制,以此建模知識點的空間相關表示,但沒有完整建模知識點之間的時間相關影響,因此性能表現略差于TSKT模型。TCN-KT模型利用卷積網絡描述時間窗口內歷史對當前的影響,但這種片段式的時間信息不足以囊括所有歷史習題對當前習題的影響,也忽略了習題內部知識點之間的空間關系,所以模型的準確率相較于TSKT模型存在一定的差距。TSKT模型在考慮知識點空間相關影響的同時還注意到了知識點的時間相關影響,刻畫了知識點的時空相關表示,并推導出了習題的時空相關表示。實驗結果充分表明了TSKT模型建模知識點時空相關表示,以及習題時空相關表示的有效性。
3.5 消融實驗
為了進一步對比分析知識點時間和空間上的相互影響對知識點最終表示的作用,設計了TSKT-A模型,消融TSKT模型中歷史知識點對當前知識點的時間相關影響,直接把知識點之間的相關影響映射到知識點表示中;設計了TSKT-B模型,消融TSKT模型中習題內部若干知識點之間空間相關影響,把圖注意力網絡用簡單的聚合功能替代。相關實驗結果如表4、5所示。
從表4、5中可以看出,沒有建模知識點空間相關影響的TSKT-B模型性能表現最差(表4第二行和表5第二行),其次是沒有建模知識點時間相關影響的TSKT-A模型,原本的TSKT模型表現最好。這一實驗結果驗證了知識點之間的相互影響會作用于知識點的最終表示這一假設,證明了TSKT模型中建模知識點的時間相關表示和時空相關表示的有效性。
3.6 訓練過程實驗
為了分析TSKT模型的訓練效率,設計了訓練過程對比實驗,將TSKT模型在四個真實數據集上與對比模型進行迭代次數對比,即比較各個模型在達到最優AUC值的情況下所需的迭代次數。迭代次數反映了模型的訓練效率,迭代次數越低,模型達到最優性能所需要的訓練時間越少,模型的訓練效率越高。相關實驗結果如圖7所示。
從圖7的實驗結果可以看出,TSKT模型在四個數據集上達到最優性能的迭代次數均為最小。最低值出現在Junyi數據集上,僅需要小于350輪迭代即可達到最優性能;最高值出現在ASSIST17數據集上,需要超過550輪迭代達到最優性能。實驗結果說明了TSKT模型的訓練效率最高。
3.7 模型的實例
為了驗證TSKT模型在實際學習中的可用性,指導學生設計開發了 “學習數據與認知模型雙驅動的跨模態多尺度自適應智慧學習環境 (CMA-ILE)”。該環境包括了習題ID、知識點ID和習題作答時間等信息,具體地,包含102個知識點和1 709名學習者的真實作答數據等信息。以此為基礎建模知識點之間的時間影響和空間作用,得到知識點的時空相關表示,完成對學習者知識狀態的判斷和預測。同時,還集成了若干對比模型,以便對比分析各個模型在實際學習環境的性能并進行評估。智慧學習環境的部分功能如圖8所示。
具體應用實例包括在2022—2023年第二學期講授的《人工智能》課程中76名學生的學習行為數據,《機器學習》課程中63名學生的學習行為數據,對隱私信息進行脫敏處理,保存若干次作業的答題記錄。具體實驗步驟參見3.1節,再將其中的80%用作訓練集,20%用作測試集,計算五個對比模型和TSKT模型的平均預測準確率,結果如表6所示。
從表6可以看出,相較于只建模時間窗口內歷史習題對當前習題影響的TCN-KT模型,TSKT模型不僅擴充建模了上述局部知識點之間的時間影響,同時把知識點的空間關系融入知識點的表示,實驗結果表明,TSKT模型的準確率提高了3.6%,驗證了TSKT模型建模知識點時空相關表示的有效性,以及在實際學習環境中的效果。進一步地,相較于只建模了知識點空間關系的GKT和SKT模型,TSKT模型在此基礎上還刻畫了歷史知識點對當前知識點的影響,計算出知識點的時空相關表示。實驗結果表明,TSKT模型的建模方式在準確率方面分別提高了0.8%和1.9%。上述實際環境中的對比結果能夠證明TSKT模型對實際學習情況的建模更加準確,驗證了該模型在實際學習環境中的可用性。
4 結束語
本文提出了一個時空相關性融合表征的知識追蹤模型,用于解決現有研究尚未從時間和空間的角度建模知識點表示及其相互作用的問題。TSKT模型首先以知識點之間的時間相關程度為基礎,描述了歷史知識點對當前知識點的影響,提煉出知識點的時間相關表示;其次使用圖神經網絡建模了習題中知識點之間的空間作用,得到包含時間和空間信息的知識點表示;最后聚合習題中的知識點,與答題結果結合,采用自注意力機制建模知識狀態,并把歷史知識狀態融合到當前知識狀態。與五個對比模型在四個真實數據集上的實驗結果表明,TSKT模型的性能較為出色,同時驗證了包含時間和空間信息的知識點表示的有效性。綜上所述,TSKT模型達到了更好的效果和效率,驗證了建模知識點之間相互作用的必要性和可行性。未來將繼續深入研究知識點的表示及其相互作用關系,以及知識點間的相互作用對習題表征帶來的影響。
參考文獻:
[1]劉恒宇,張天成,武培文,等. 知識追蹤綜述 [J]. 華東師范大學學報: 自然科學版,2019(5): 1-15. (Liu Hengyu,Zhang Tiancheng,Wu Peiwen,et al. A review of knowledge tracing [J]. Journal of East China Normal University: Natural Science,2019(5): 1-15.)
[2]曾凡智,許露倩,周燕,等. 面向智慧教育的知識追蹤模型研究綜述 [J]. 計算機科學與探索,2022,16(8): 1742-1763. (Zeng Fanzhi,Xu Luqian,Zhou Yan,et al. Review of knowledge tracing model for intelligent education [J]. Journal of Frontiers of Computer Science and Technology,2022,16(8): 1742-1763.)
[3]張暖,江波. 學習者知識追蹤研究進展綜述 [J]. 計算機科學,2021,48(4): 213-222. (Zhang Nuan,Jiang Bo. Review progress of learner knowledge tracing [J]. Computer Science,2021,48(4): 213-222.)
[4]Piech C,Bassen J,Huang J,et al. Deep knowledge tracing [C]// Proc of the 29th Annual Conference on Neural Information Processing Systems. Red Hook,NY: Curran Associates Inc.,2015: 505-513.
[5]王文濤,馬慧芳,舒躍育,等. 基于上下文表示的知識追蹤方法 [J]. 計算機工程與科學,2022,44(9): 1693-1701. (Wang Wentao,Ma Huifang,Shu Yueyu,et al. Knowledge tracing based on con-textualized representation [J]. Computer Engineering & Science,2022,44(9): 1693-1701.)
[6]魏思,沈雙宏,黃振亞,等. 融合通用題目表征學習的神經知識追蹤方法研究 [J]. 中文信息學報,2022,36(4): 146-155. (Wei Si,Shen Shuanghong,Huang Zhenya,et al. Integrating general exercises representation learning into neural knowledge tracing [J]. Journal of Chinses Information Processing,2022,36(4): 146-155.)
[7]劉坤佳,李欣奕,唐九陽,等. 可解釋深度知識追蹤模型 [J]. 計算機研究與發展,2021,58(12): 2618-2629. (Liu Kunjia,Li Xinyi,Tang Jiuyang,et al. Interpretable deep knowledge tracing [J]. Journal of Computer Research and Development,2021,58(12): 2618-2629.)
[8]Zhang Jiani,Shi Xingjian,King I,et al. Dynamic key-value memory networks for knowledge tracing [C]// Proc of the 26th International Conference on World Wide Web. Geneva: International World Wide Web Conferences Steering Committee,2017: 765-774.
[9]李曉光,魏思齊,張昕,等. LFKT: 學習與遺忘融合的深度知識追蹤模型 [J]. 軟件學報,2021,32(3): 818-830. (Li Xiaoguang,Wei Siqi,Zhang Xin,et al. LFKT: deep knowledge tracing model with learning and forgetting behavior merging [J]. Journal of Software,2021,32(3): 818-830.)
[10]宗曉萍,陶澤澤. 基于掌握速度的知識追蹤模型 [J]. 計算機工程與應用,2021,57(6): 117-123. (Zong Xiaoping,Tao Zeze. Knowledge tracing model based on mastery speed [J]. Computer Engineering and Application,2021,57(6): 117-123.)
[11]王璨,劉朝暉,王蓓,等. TCN-KT:個人基礎與遺忘融合的時間卷積知識追蹤模型 [J]. 計算機應用研究,2022,39(5): 1496-1500. (Wang Can,Liu Zhaohui,Wang Bei,et al. TCN-KT:temporal convolutional know-ledge tracking model based on fusion of personal basis and forgetting [J]. Application Research of Computers,2022,39(5): 1496-1500.)
[12]Shen Shuanghong,Liu Qi,Chen Enhong,et al. Convolutional know-ledge tracing: modeling individualization in student learning process [C]// Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press,2020: 1857-1860.
[13]段建設,崔超然,宋廣樂,等. 基于多尺度注意力融合的知識追蹤方法[J]. 南京大學學報:自然科學版,2021,57(4): 591-598. (Duan Jianshe,Cui Chaoran,Song Guangle,et al. Knowledge tracing based on multi-scale attention fusion [J]. Journal of Nanjing University:Natural Science,2021,57(4): 591-598.)
[14]張凱,覃正楚,劉月,等. 多學習行為協同的知識追蹤模型 [J]. 計算機應用,2023,43(5): 1422-1429. (Zhang Kai,Qin Zhengchu,Liu Yue,et al. Multi-learning behavior collaborated knowledge tracing model [J]. Journal of Computer Applications,2023,43(5): 1422-1429.)
[15]李浩君,方璇,戴海容. 基于自注意力機制和雙向GRU神經網絡的深度知識追蹤優化模型 [J]. 計算機應用研究,2022,39(3): 732-738. (Li Haojun,Fang Xuan,Dai Hairong. Deep knowledge tracking optimization model based on self-attention mechanism and bidirectional GRU neural network [J]. Application Research of Computers,2022,39(3): 732-738.)
[16]Nakagawa H,Iwasawa Y,Matsuo Y. Graph-based knowledge tracing: modeling student proficiency using graph neural network [C]// Proc of IEEE/WIC/ACM International Conference on Web Intelligence. New York: ACM Press,2019: 156-163.
[17]Yang Yang,Shen Jian,Qu Yanru,et al. GIKT: a graph-based interaction model for knowledge tracing [C]// Proc of European Conference on Machine Learning and Knowledge Discovery in Databases. Cham: Springer,2021: 299-315.
[18]董永峰,黃港,薛婉若,等. 融合IRT的圖注意力深度知識追蹤模型 [J]. 計算機科學,2023,50(3): 173-180. (Dong Yongfeng,Huang Gang,Xue Wanruo,et al. Graph attention deep knowledge tracing model integrated with IRT [J]. Computer Science,2023,50(3): 173-180.)
[19]Tong Shiwei,Liu Qi,Huang Wei,et al. Structure-based knowledge tracing: an influence propagation view [C]// Proc of IEEE International Conference on Data Mining. Piscataway,NJ: IEEE Press,2020: 541-550.
[20]鄭浩東,馬華,謝穎超,等. 融合遺忘因素與記憶門的圖神經網絡知識追蹤模型 [J]. 計算機應用,2023,43(9): 2747-2752. (Zheng Haodong,Ma Hua,Xie Yingchao,et al. Knowledge tracing model based on graph neural blending with forgetting factors and memory gate [J]. Journal of Computer Applications,2023,43(9): 2747-2752.)
[21]Feng Mingyu,Heffernan N,Koedinger K. Addressing the assessment challenge with an online system that tutors as it assesses [J]. User Modeling and User-Adapted Interaction,2009,19(8): 243-266.
[22]Wang Yutao,Heffernan N T,Heffernan C. Towards better affect detectors: effect of missing skills,class features and common wrong answers [C]// Proc of the 5th International Conference on Learning Analytics and Knowledge. New York: ACM Press,2015: 31-35.
[23]Papouek J,Pelánek R,Stanislav V. Adaptive geography practice data set [J]. Journal of Learning Analytics,2016,3(2): 317-321.
[24]Chang H S,Hsu H J,Chen K T. Modeling exercise relationships in E-learning: a unified approach [C]// Proc of the 8th International Conference on Educational Data Mining. 2015: 532-535.