一、前言
近年來,隨著教育信息化的發展,地方高校教學管理平臺逐步引入數據挖掘技術,以提升個性化教學水平。在線教育平臺(如MOOC、智能導學系統等)積累了海量學習行為數據,為分析學生認知狀態、優化習題推薦提供了基礎[-2]。然而,現有平臺在習題難度動態評估和個性化推薦精準度方面仍存在不足,尤其是針對地方高校學生的適應性較差[3]。
教育數據挖掘(EDM)技術通過分析學生答題記錄,可構建認知診斷模型(如DINA模型[4),但傳統方法難以動態反映學生對知識點的掌握程度。為此,本文結合地方高校教學管理平臺的實際需求,提出一種基于自適應認知診斷(ACDF)的個性化習題推薦算法,重點解決以下問題。
習題難度動態計算:根據學生答題數據自適應調整題目難度系數。
學生知識缺陷量化:通過錯誤率分析精準診斷知識點掌握水平。
個性化推薦優化:結合難度適配與缺陷預測生成針對性習題集。
本文研究結果可為地方高校教學管理平臺的智能化升級提供技術支撐,推動數據驅動型個性化教學的實踐應用。
二、在線教學的數據挖掘
(一)本文研究框架如圖1所示,圍繞三個維度展開。
試題維度:采用自適應習題難度計算方法,動態優化題目難度系數,以更準確反映學生實際學習水平。
學生維度:構建自適應認知診斷框架(ACDF),通過量化知識缺陷指數,實現對學生知識點掌握程度的連續化評估。
教學維度:設計個性化習題推薦算法,結合動態難度調整與認知狀態分析,生成適配學生個體需求的習題集。
(二)習題分析
習題是教學過程中的核心資源,其科學表征直接影響學習效果評估。本研究以“C語言程序設計”課程為例,構建了基于知識點的習題表征體系。
初始難度標定:由教師預設,并通過自適應算法動態修正。
知識點關聯建模:采用Q矩陣表示習題一知識點映射關系,由領域專家標注,如圖2所示。
如圖2所示,該題所關聯的知識點為“函數的定義”。
習題 p1 關聯知識點 k2 和 k5 見表1。
學生認知診斷研究:學生認知狀態的精準評估是在線教育系統實現個性化教學的核心基礎。本研究基于認知診斷評價(CognitiveDiagnosisAssessment,CDA)理論框架,重點解決傳統模型的局限性問題。
圖1研究的基本框架


傳統DINA模型采用二元表征評估知識點掌握狀態,即輸出的1、0值分別表示學生在某個知識點上掌握或未掌握,存在離散化局限,如表2所示。
針對高等教育中知識點復雜度高、離散化診斷不準確的問題,本文提出自適應認知診斷框架(AdaptiveCognitiveDiagnosticFramework,ACDF)。通過知識缺陷指數(Dij)量化學生對知識點的連續掌握程度,并實現認知狀態的動態追蹤,隨著學生的不斷學習,對知識點的缺陷指數會不斷發生變化,從而克服傳統二元診斷模型的不足。
表1習題一知識點關聯矩陣Q示例

表2學生一知識點掌握矩陣示例

表3學生知識缺陷矩陣D示例

1.建立用戶的知識缺陷模型
知識缺陷指數 Dij 為第i個學生在第j個知識點上的缺陷指數,定義如下:

其中: N 為當天用戶進行答題的總次數; mkj 為當天用戶進行第 k 次答題時,與第j個知識點有關的錯題數;Mkj 為當天用戶進行第 k 次答題時,與第j個知識點有關的所有習題數。
Dij 越大意味著用戶對第j個知識越不了解,缺陷越大。同時也是第i個學生做錯和第j個知識點有關題目的概率。
表3為兩位學生在知識點上的掌握程度示例。
在ACDF模型中,可以定義學生i對知識點j的掌握度(即第i個學生答對與第j個知識點有關題目的概率)為:
Yij=1-Dij
對于一個包含K個知識點的習題t,學生i答對的概率 Fit 可以表示為:

圖3基于ACDF模型認知診斷的個性化習題推薦框架

即ACDF模型認為,學生i正確回答習題t是學生i正確回答與習題t包含的總共K個知識點相關習題的積事件。
2.自適應難度計算
在系統中,習題的初始難度系數由專家給定,針對專家預設難度與學生實際表現的偏差,基于答題數據的自適應難度計算方法,通過動態調整習題難度系數,使其更準確反映學生的真實認知水平。
3.習題預測矩陣
為實現精準的習題推薦與學生答題結果預測,構造習題預測矩陣F,該矩陣為 k×d 矩陣,k為系統中的學生人數,d為系統中的題目總數(k,d均為正整數)。F中的第i行、第j列的元素 Fij 即為第i個學生答對第j個題目的概率 Fij
4.自適應計算習題難度系數
在完成習題預測矩陣F后,根據矩陣計算習題t的自定義難度系數 Ft ,即為系統中所有學生做錯該題的平均概率,難度系數越大,意味著學生做錯的概率越大。F的定義如下:

其中,N為學生總人數, Fit 為習題預測矩陣中第i行、第t列的元素。
(三)基于ACDF模型認知診斷的個性化習題推薦
針對ACDF模型在個性化教學中的應用,其個性化習題推薦框架如圖3所示。
基于ACDF模型認知診斷的個性化習題推薦主要包括數據輸入、學生認知診斷、生成預推送習題集及輸出等四個步驟。首先利用知識缺陷矩陣D對學生的認知狀態進行量化評估。系統采用自適應算法動態計算習題難度,并結合預設的期望分數生成初步推薦習題集,通過預測模型評估學生的潛在得分表現。在最終推薦階段,系統根據個性化難度閾值對習題進行篩選,同時支持智能推薦與自主選擇兩種模式。智能模式基于預測得分與期望自標的匹配度自動優化題自難度,手動模式則允許學生根據自身需求選擇基礎鞏固或能力提升等不同難度等級,從而實現教學精準性與學習自主性的有機結合[7]。該推薦機制有效解決了傳統方法在難度適配和個性化需求響應方面的不足,為智能化教學提供了可靠的技術支持。
三、實驗仿真
實驗將基于ACDF模型認知診斷的個性化習題推薦框架應用于兩組高校電子信息科學與技術專業的學生在“C語言程序設計”課程上的實際答題記錄,并進行個性化的習題推薦。從圖4(a)(b)所示結果均可看出,基于ACDF框架向學生推薦不同期望分數的習題時,實際得分與期望分數最吻合,意味著推薦的效果最好(即基于ACDF框架的推薦結果更符合學生的實際學習水平)。
四、結語
高等教育智能化的深入推進催生了自適應學習和個性化教學等新型智慧學習需求,而在線教育平臺的快速發展則為教育數據挖掘研究提供了重要支撐。本研究通過融合教育心理學、認知心理學與計算科學技術,構建了基于ACDF模型的自適應認知診斷框架,從習題難度動態計算和學生認知狀態評估兩個維度,提出了高等教育智能化背景下數據挖掘的創新解決方案。
圖4不同推薦方式的效果對比

該領域的下一步研究可在以下方向持續深化:建立更完善的多維認知因素模型,除答題正確率外,還需整合答題時間、粗心程度和猜測概率等影響因素,以提升知識缺陷診斷的精確度。跨學科知識圖譜構建與學習分析的研究,通過挖掘專業課程間的內在關聯,實現對學生綜合學習能力的全面評估。智能技術與傳統教學深度融合,既發揮線上系統的數據分析優勢,又保留教師線下教學的核心價值,形成人機協同的新型教學模式。
隨著教育信息化建設的持續推進,數據挖掘技術在教育領域的應用前景廣闊。未來研究應著力突破現有認知診斷技術的局限,構建更加智能化、個性化的學習支持系統,為高等教育質量提升提供堅實的技術保障。這一交叉學科領域的發展,不僅需要技術創新,更需要教育理論研究者與技術開發者的深度合作,共同推進智慧教育的變革與創新[8]。
參考文獻
[1]BRESLOW L,PRITCHARD D E,DEBOER J,et al.Studying learning in the worldwide classroom:Research into edX's first MOOC[J].Researchamp;Practice in Assessment,2013(08):13-25.
[2]POLSON M, RICHARDSON J J. The role of human-computer interaction in intelligent tutoring systems[M]/omputer science andeducation,2013.
[3]陳池,王宇鵬,李超,等.面向在線教育領域的大數據研究及應用[J].計算機研究與發展,2014,51(S1):67-74.
[4]管佳,李奇濤.中國在線教育發展現狀、趨勢及經驗借鑒[J].中國電化教育,2014(08):62-66.
[5]DIBELLO L V,ROUSSOS L A,STOUT W.31A reviewof cognitively diagnostic assessment and a summary of psychometric models[M]//Handbook of statistics.2006,26:979-1030.
[6]DE_ LA TORRE J.DINA model and parameter estimation:A didactic[J].Journalof Educational andBehavioral Statistics,2009, 34(01): 115-130.
[7]劉淇,陳恩紅,黃振亞,等.面向個性化學習的學生認知能力分析[J].中國計算機學會通訊,20174(13):28-34.
[8]劉淇,陳恩紅,黃振亞,等.面向在線智慧學習的教育數據挖掘技術研究[J].模式識別與人工智能,2018.31(01):77-90
基金項目:2022年度廣西高校中青年教師科研基礎能力提升項目教育信息化專項項目“數據治理背景下地方高校的教學管理服務平臺研究”(項目編號:2022XXH0002)
作者單位:桂林理工大學
責任編輯:王穎振鄭凱津