





摘 要 面臨高考改革分批進行,大學新生知識水平、結構差異增大,現(xiàn)有評價方案較少關注到對學生認知具有重要影響的知識結構,進而較難精準辨別出存在學習困難的學生。對此,本文基于學生知識掌握情況將學生在大中銜接中的類型分為銜接優(yōu)良均衡型、銜接優(yōu)良不均衡型、銜接一般均衡型、銜接一般不均衡型;分別使用單向、雙向的Apriori算法對本科新生物理學習數(shù)據(jù)進行挖掘、生成關聯(lián)規(guī)則;之后,使用基于教材的學科知識圖譜對關聯(lián)規(guī)則進行篩選,形成不同類型學生的個性化認知圖譜。研究結果表明,學生在大中銜接過程中知識結構與學生成績基本呈正相關,四種類型學生的知識結構有明顯差異。此外,本文還基于研究結果對新高考改革背景下學生精準評價策略提供建議。
關鍵詞 認知圖譜;關聯(lián)規(guī)則;知識圖譜;機器學習;個性化學習
2014年國務院發(fā)布《關于深化考試招生制度改革的實施意見》(簡稱《意見》),新高考改革逐漸在全國推行,目前,全國已有29個省份公布了新高考改革方案,將分五批完成新高考改革。《意見》中強調,須通過多元的考試招生模式、公平合理的體制機制實現(xiàn)各級教育的銜接與溝通,學生在不同階段取得的學習成果均可被認可,建設終身學習的社會環(huán)境[1]。
然而,當下大學與中學教育的銜接并不如人意,尤其對于難度較大的物理學科,第一、二批高考改革的省份實施“3+3”選考模式,選考物理人數(shù)急劇下降。吸取試點省份的經(jīng)驗,后續(xù)高考改革的省份實施“3+2+1”模式,物理和歷史成為必選科目。由于不同省份的改革實施模式不同,造成生源結構多樣化、生源質量差異大等問題出現(xiàn),大學入學的理工類專業(yè)學生知識水平參差不齊[2]。而大學物理作為大多理工類專業(yè)本科新生入學第一學期的課程,與高中物理在教學方式、教學理念中存在較大差異,如:大學物理課程量較大,教師以講授為主,較少進行討論與習題講解,對學生學習習慣和自學能力都提出了更高的要求,在這種情況下,學生更容易產(chǎn)生學習困難[3]。
因此,精準的評價方式才能更有效地辨別存在學習困難的學生,而目前大學物理課程較多將考試成績作為評價學生知識掌握程度的標準,較少關注到對學生認知具有重要影響的知識結構[4]。本研究旨在通過機器學習的方法,采用Kmeans算法基于知識掌握程度、綜合應用能力對學生進行聚類,發(fā)現(xiàn)四種不同大中銜接類型的學生,使用兩種Apriori算法對不同類型學生作業(yè)、考試數(shù)據(jù)進行挖掘,生成不同類型學生的個性化認知圖譜,通過分析不同銜接類型學生的知識結構,為提高新高考改革背景下學生的學習適應性,幫助學生更順利地完成大中銜接提供建議。
1 相關理論研究
1.1 新手學習者和專家具有不同的知識結構
建構主義的學習觀認為學生學習是在原有經(jīng)驗的基礎上主動進行意義建構的過程,在此過程中,學生通過同化、順應完成學習過程,形成自己的知識結構,而區(qū)分專家和新手學習者的一大關鍵要素就是知識結構的連通性[5]。Chi等[6]發(fā)現(xiàn),專家和新手學習者具有不同的知識結構,并且該結構在解決問題時發(fā)揮作用,對于專家而言,其知識結構中包含潛在的問題解決方案。具體到物理學習中也是如此,物理學專家認為物理是由一些最基本的定律構成,大量的概念和原理都以這些基本定律為核心,在學習物理時必須理解概念、原理和基本定律之間的本質聯(lián)系,當學生在學習物理時先思考這些本質聯(lián)系的時候,學生就向專家型思維轉變了。[7]Hammer等[8]認為研究人員應該向教師提供關于學生知識之間連通重要性的本質理解,學生對物理知識之間的推理能力直接影響學生的學習結果,正如部分學生在高中階段形成的思維定式使得一些學生認為物理概念之間是孤立的,學習物理只需要機械地記憶模型和公式,而成熟的學習者通常會反思學習內(nèi)容并且主動將新知識與已有知識經(jīng)驗相結合,以一種“建構主義”的方式去理解學習資源而不是將其視為一種“傳播材料”。Chen等[5]發(fā)現(xiàn)中國大部分大學生知識結構正處于新手學習者和專家學習者過渡的早期階段,因此把握好大學階段幫助新手學習者形成主動在學習中建立知識結構的思維模式非常重要,如果這一階段沒有得到重視很可能會使新手學習者在面臨更困難、更深入的學習資料時產(chǎn)生學習困難,從而降低學習積極性,甚至形成學業(yè)不適。
1.2 認知圖譜相關研究
認知圖譜在2019年被應用到了計算機科學領域推理中,相較于知識圖譜對知識進行編碼、檢索,認知圖譜強調對問題進行推理[9]。具體到教育領域,余勝泉等[4]認為教育領域認知圖譜的內(nèi)涵應與計算機科學領域有所區(qū)別,提出了學習認知圖譜的概念:學習認知圖譜是在教育知識圖譜的基礎上疊加學習者認知狀態(tài)要素,可以看作是學習者知識結構及其知識狀態(tài)的認知表征與推理。其中,知識結構指知識之間的關系,知識狀態(tài)指學習者有關知識的認知層次及掌握程度。
近年來,教育領域出現(xiàn)較多關于使用認知圖譜將知識與學習者認知狀態(tài)結合起來表征的研究。周東岱等[12]構建了刻畫學生核心素養(yǎng)的認知圖譜,每位學生在單元測試后系統(tǒng)會形成特定的時間戳,根據(jù)該時間學生各學科素養(yǎng)的形成程度構建認知圖譜,包含結合知識元落實的核心素養(yǎng)之間的關系和學科核心素養(yǎng)之間的關系;余勝泉等[13]將學習者認知狀態(tài)要素疊加在學科知識點上,形成個性化學習認知地圖,認知地圖上既呈現(xiàn)知識點之間的關系,也呈現(xiàn)某學習者對知識點的掌握情況,分為薄弱知識點、優(yōu)勢知識點和未學知識點,對于未學知識點將采用知識追蹤模型診斷預測學習狀態(tài),并以不同灰度在個性化學習認知地圖中可視化;Lv等[14]基于專家標注建立的學科知識圖譜表征知識點之間的前驅后繼關系,并根據(jù)學生的答題記錄標記學生每個知識點的掌握程度,將個體學生的知識點掌握程度與專家標注的學科圖譜融合形成加權知識圖譜,這個知識圖譜是學生學習個性化結果的表征,也可以看成個體學習者的認知圖譜;Hao等[12]認為教育知識圖譜應該與個性化學習者特征相結合,表征個體學生學習過程中涉及的知識點,每個學習者的個性化認知圖譜以其學習過程中的第一個知識點為起點、最后一個知識點為終點形成一個有向無環(huán)圖,其關系為知識點之間的前驅、后繼、廣義前驅、廣義后繼等關系。
綜上所述,教育領域構建認知圖譜的研究主要可以分為兩類:將知識與學習者認知狀態(tài)結合起來表征的研究,較多為專家標注學科圖譜疊加學習者認知狀態(tài),即在人工標注的知識圖譜上顯示學習者學習狀態(tài)[4];另一類研究關注個性化學習者特征的研究,即個體學習者的學習狀態(tài)和知識點掌握情況,形成個體學生認知圖譜[10]。這些研究大多應用于學習者模型構建,為學生提供更完整的學習者畫像,從而促進學生使用學習平臺個性化學習。本研究將認知圖譜應用于教育評價中,并結合聚類算法,探索不同大中銜接類型學生知識結構,結合學生認知圖譜對學生進行精準化評價。
1.3 關聯(lián)規(guī)則算法在教育領域應用的相關研究
數(shù)據(jù)挖掘(data mining)是從大量真實數(shù)據(jù)中提取隱含信息、知識的過程。教育領域應用數(shù)據(jù)挖掘可以從教師教學、學生學習過程中分析出有用的信息。關聯(lián)規(guī)則挖掘算法是數(shù)據(jù)挖掘的重要方法之一,其中Apriori算法是關聯(lián)規(guī)則算法中最經(jīng)典的一種,也是教育領域應用較多的算法[13]。算法通過每一層的迭代找出數(shù)據(jù)中項集之間的關系進而形成關聯(lián)規(guī)則,主要包含兩步:(1)逐層迭代檢索出數(shù)據(jù)集中所有頻繁項集,即支持度大于用戶設定最小支持度(min support)的項集;(2)利用頻繁項集構建滿足大于用戶設置的最小置信度(min confidence)的關聯(lián)規(guī)則。傳統(tǒng)Apriori算法中候選項集是逐層產(chǎn)生的,因此每產(chǎn)生一層頻繁項集就需要掃描整個數(shù)據(jù)庫,該過程不僅消耗大量時間還會產(chǎn)生較多頻繁項集[14]。因此,需要對關聯(lián)規(guī)則的價值進行衡量,選擇對用戶有用的、有價值的規(guī)則,其中較常用的衡量方法有:數(shù)據(jù)約束、規(guī)則約束。數(shù)據(jù)約束是用戶指定對部分數(shù)據(jù)進行挖掘,即對生成頻繁項集的效率進行優(yōu)化或篩選生成項集的數(shù)量。規(guī)則約束是指引入模板(template),使用模板來對生成的關聯(lián)規(guī)則進行篩選,從而選擇我們需要的規(guī)則。在教育領域中,較多研究者采用數(shù)據(jù)約束的方法,通過一定的篩選機制生成更精準的頻繁項集和更符合教學邏輯的關聯(lián)規(guī)則[15]。Yang等[16]提出了一種改進的關聯(lián)規(guī)則算法,在生成候選項集時只需要掃描一次原始數(shù)據(jù)庫,節(jié)省了生成頻繁項集的時間,提高了算法效率,并將其應用于課程排序中,幫助決策者制訂更合理的教學計劃;Jha等[17]提出了一種基于自底而上方法和支持矩陣的Apriori算法,該算法有效減少了頻繁項集生成的時間,同時還用基于標準差的函數(shù)模型代替了傳統(tǒng)Apriori算法的用戶自定義最小閾值,不熟悉數(shù)據(jù)挖掘的普通教育工作者也可以使用該模型。也有部分研究者通過規(guī)則約束的方法改善生成的規(guī)則,Zhan等[18]提出了通過引入穩(wěn)定性、難度來對生成的關聯(lián)規(guī)則進行篩選,從而減少了不符合教學邏輯的關聯(lián)規(guī)則,提高了規(guī)則的準確率。郭鵬等[13]使用引入興趣度的關聯(lián)規(guī)則算法分析不同課程學生取得成績之間的關系,結果發(fā)現(xiàn)相較于傳統(tǒng)關聯(lián)規(guī)則算法,引入興趣度算法的結果能夠得到更少誤導性或無意義的規(guī)則。
綜上所述,使用規(guī)則約束和數(shù)據(jù)約束都可以減少無用關聯(lián)規(guī)則的生成,生成更多有用的、有價值的關聯(lián)規(guī)則。本研究使用規(guī)則約束的方法,將教材標注學科圖譜作為模板,對關聯(lián)規(guī)則算法的結果進行過濾,最終輸出對有意義的規(guī)則,將這些知識點之間的關聯(lián)規(guī)則用于構建學生認知圖譜。