周靜 熊駿 陳澤
(江漢大學人工智能學院,湖北武漢 430056)
近年來,國內外學者已廣泛開展對在線課程平臺數據資源的挖掘與分析。國外學者基于COURSERA等大型慕課平臺積累的學習數據,對平臺的“學生互評”評價方式做了分析,論證其合理性和有效性[1-3],對在線課程平臺的數據資源分析已經展開了深入研究,并對在線課程教學的理論探究到課程實踐進行了反思和創新。國內關于在線課程平臺的數據資源的研究大多集中在2012年之后。北京、上海等地已經提供基本公共在線教育服務,并初步建立在線教育數據挖掘與分析子系統。
綜合國內外研究現狀,目前基于教學數據的研究與分析基本只針對在線學習平臺上的學習特征數據,缺乏對傳統課堂數據的融合與分析;所采用的數據分析方法基本是傳統的線性數據挖掘方法,缺乏對非線性核方法的研究與應用,且鮮少考慮建立以學生個體為主體的分級質量評價體系。本文將采集的本校傳統課堂和在線課程的混合教學數據進行有效整合,形成教學個體的完整學習特征數據鏈,采用非線性核主成分分析法(KPCA)提取出影響學生個體學習質量的主要群集特征;同時,通過學生學習行為的理化指標和學習效果指標建立以學生為主體的分級評價指標體系與分級模型。
本校的混合教學[4-6]包括線下傳統教學和網絡平臺的線上教學,所采集的混合教學數據包括有表征學生學習行為特征的理化指標數據和表征學生個體學習效果的指標數據。其中學生個體的理化指標數據包括有學生在網絡在線教學平臺上的測試成績、任務點完成情況、訪問數得分、觀看視頻得分及學生在線下課堂上的考勤、實驗、作業、測驗數據,學生的學習效果指標數據包括有學生的線下課堂的期末考試成績和線上教學平臺上的綜合考試成績。
在由混合教學數據融合構成的學習行為特征數據集中,隸屬度高的學習行為特征指標可構成群集。連接于同一群集中的各個學習特征指標數據的權重較大,因此找出教育特征數據中的各個群集,即可找到影響學生個體質量的核心學習行為特征。
本文采用核主成分分析法(KPCA)提取混合數據的核心群集特征[7]。核方法的基礎是實現向量的內積變換,如式(1)所示。

在特征空間F中的協方差矩陣為:

由混合教學數據中表征學生個體的理化指標數據構成的矩陣記為X,X 表示由M 個學生樣本和N 個學習行為特征構成的數據集矩陣;對由X求得的高斯協方差矩陣進行KPCA分解得到特征向量,即系數矩陣V,其維度為N×K,即得到了K個群集,且群集V的第j行第k列的數值記為Vjk,Vjk表示第j個學習行為特征指標隸屬于第k個群集的權值系數。Vjk值越大,說明第j個學習特征指標隸屬于第k個群集的程度越高,因此可找到高度隸屬于第k個群集的特征指標。同理,由混合教學數據中學習效果指標數據構成X′矩陣,對X′進行K P C A 分解得到系數矩陣V′,由V′也可得到隸屬于各學習效果群集的指標權值。
對我校公共課—計算機基礎的混合教學數據中的學生學習行為特征理化指標數據進行KPCA分解,得到3個群集。表征各學習特征指標分別隸屬于3個群集的系數矩陣V的第1列的第8、第5、第4、第2、第1行的值均高,說明第8、5、4、2、1個指標隸屬于群集1的程度較高,即隸屬于群集1的指標按照隸屬程度高低分別是:線下作業分數、任務點完成得分、訪問數得分、課程測驗得分、課程視頻得分。由此可知學生個體行為指標中的核心指標按重要程度依次分別是線下作業分數、任務點完成得分、訪問數得分、課程測驗得分、課程視頻得分。同理隸屬于群集2的指標按照隸屬權值高低分別是:線下實驗、考勤分數;隸屬于群集3的指標按照權值大小分別是:線上作業得分。同理,對該混合數據中的學生學習效果指標構成的高斯協方差矩陣進行分解降維,可得到一個核心群集及隸屬于該群集的特征指標為:線上綜合考試成績和期末考試成績,即學生學習效果指標中最為重要的指標是期末考試成績。
綜上可知,學生個體學習行為特征的理化指標、學習效果指標是評價學生個體質量的一級指標,其進一步分解得到群集1至群集3的3個二級指標,學習效果指標分解得到1個群集,即1個二級指標。3個二級指標和1個二級指標下面又分別進一步分為8個和2個三級指標,故三級指標共10個。依次選取多級學習行為理化特征和學習效果指標即可構成混合教學模式下的學生個體綜合評價指標體系。

圖1 學生個體分級分布圖
為確定學生個體綜合評價指標體系中各指標對學生質量分級的影響,本文采用分級綜合評價法確定各級指標的權值系數,并對學生個體質量進行綜合評價和分級。由KPCA分解得到的各指標間的權值系數,可表征各個指標間的相對重要程度,即可求得分級綜合評價法中的相關矩陣。得到相關矩陣后,求得其最大特征向量,將該特征向量歸一化處理后即可得到各影響分級程度指標的權向量。學生個體質量綜合評價模型是通過一定的數學模型或算法將多個指標的評價值“合成”一個綜合評價值,實現對學生質量的綜合評價[8]。以學生個體的綜合評價值對學生進行分級,建立分級階梯模型來確定學生質量的級別數。求得各學生個體樣本的綜合評價指標值與分級值,并得出189個學生個體樣本分屬于10級的分布圖如圖1所示。圖1與學生期末考試成績分布圖的趨勢基本一致,證明了本文所提出的綜合評價模型和分級方法的有效性。
本文融合線上和線下的混合數據形成完整的學生個體學習特征鏈,研究了基于非線性核主成分分析法的混合教學數據中學生學習行為的理化指標、學習效果指標的群集特征提取方法,提取出影響本校公共課—計算機基礎的混合教學模式下學生個體質量的核心指標:按重要程度依次分別是課程視頻得分、任務點完成得分、課程測驗得分、訪問數得分;并基于所提取的各群集特征的權值大小,依次選取多級特征指標構建了混合教學模式下學生個體質量的綜合評價指標體系;采用綜合評價法構建學生個體質量綜合評價模型和分級模型,并對本校混合教學中學生個體進行了有效分級。本文提出的完整的評價體系構建方法和分級模型對提高混合教學質量和個性化教學具有很好的指導作用。