葉海智 楊柳 黃宏濤 梅鈺皎



[摘? ?要]認(rèn)知診斷與教育的深度融合能夠促進個性化學(xué)習(xí)的發(fā)展。認(rèn)知診斷測試中,學(xué)習(xí)者能力與測試題難度的匹配程度直接影響診斷結(jié)果的精確性。然而,目前認(rèn)知診斷選題策略尚無法精確標(biāo)定學(xué)習(xí)者能力及測試題目難度,導(dǎo)致教師不能準(zhǔn)確掌握學(xué)生的學(xué)習(xí)狀態(tài)。為解決該問題,構(gòu)建了面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型,首先運用Rasch模型對題庫原始數(shù)據(jù)進行對數(shù)轉(zhuǎn)換,在同一等距量尺中標(biāo)定出測試題目的難度等級和學(xué)習(xí)者的初始能力等級,在診斷測試過程中為不同能力等級的學(xué)習(xí)者推送相應(yīng)難度等級的測試題目,然后在每次測試結(jié)束后更新學(xué)習(xí)者能力等級。實踐結(jié)果表明:面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型能夠使得測試題目難度與學(xué)習(xí)者能力精確匹配,進一步提高了認(rèn)知診斷的精確性,提高了學(xué)生的學(xué)習(xí)效率,促進了教育向個性化方向的發(fā)展。
[關(guān)鍵詞] 認(rèn)知診斷; Rasch模型; 能力等級自適應(yīng); 試題推送模型; 個性化學(xué)習(xí)
[中圖分類號] G434? ? ? ? ? ? [文獻標(biāo)志碼] A
[作者簡介] 葉海智(1963—),男,河南欒川人。教授,博士,主要從事教育信息化方面的研究。E-mail:yhz87@163.com。
一、引? ?言
《教育信息化十年發(fā)展規(guī)劃(2011—2020年)》提出,“要為所有學(xué)生提供個性化學(xué)習(xí)的信息化環(huán)境和服務(wù)”[1]。利用信息技術(shù)促進教育的個性化發(fā)展是當(dāng)前我國教育信息化發(fā)展的主要目標(biāo)之一[2]。個性化學(xué)習(xí)尊重學(xué)生個體差異,促進學(xué)生個性發(fā)展,是未來教育發(fā)展的方向[3]。
認(rèn)知診斷是實現(xiàn)個性化學(xué)習(xí)的前提和基礎(chǔ),進行診斷測試時可以通過學(xué)習(xí)者在測試題目上的反應(yīng)模式推知其不可觀察的知識狀態(tài),及時發(fā)現(xiàn)學(xué)習(xí)者自身存在的認(rèn)知缺陷,從而有針對性地開展補救學(xué)習(xí)。測試題目是開展認(rèn)知診斷測驗的必要條件,也是影響診斷結(jié)果精確性的關(guān)鍵因素。而在實際教學(xué)過程中,目前的認(rèn)知診斷測試題目通常是依據(jù)特定知識點生成的固定題目或者通過題庫隨機抽取,這些推送試題的方法都無法使測試題目的難度精確匹配學(xué)習(xí)者的能力水平。為所有學(xué)習(xí)者推送相同且大量的測試題,不僅加重了學(xué)習(xí)者的負(fù)擔(dān),而且容易降低診斷結(jié)果的精確性。認(rèn)知診斷計算機化自適應(yīng)測驗(Computerized Adaptive Test for Cognitive Diagnosis,CD-CAT)可以在測試中依據(jù)學(xué)習(xí)者的答題情況自動為其選擇最適合的試題,對學(xué)習(xí)者能力作出恰當(dāng)?shù)墓烙嫞獵D-CAT需要大量的試題,才能保證對被試能力估計的精確性。
為了在小規(guī)模的認(rèn)知診斷測試過程中使測試題目的難度與學(xué)習(xí)者的能力水平更為契合,實現(xiàn)依據(jù)學(xué)習(xí)者能力的自適應(yīng)試題推送,本文利用Rasch模型對認(rèn)知診斷試題推送過程進行調(diào)整與優(yōu)化,該模型可以通過對題庫原始數(shù)據(jù)進行分析,標(biāo)定出測試題目難度等級及學(xué)習(xí)者初始能力等級,并通過被試的答題情況在同一等距量尺中不斷更新學(xué)習(xí)者的能力水平,在最短時間內(nèi)為不同能力等級的學(xué)習(xí)者推送相應(yīng)難度等級的測試題,實現(xiàn)小規(guī)模的能力等級自適應(yīng)試題推送,從而使得認(rèn)知診斷的測試過程更具針對性、診斷結(jié)果更為精確。因此,利用Rasch模型對認(rèn)知診斷測試的試題推送過程進行優(yōu)化是提高診斷精確性的一個方向。
二、相關(guān)研究
近年來,認(rèn)知診斷在實際教學(xué)中的應(yīng)用越來越廣泛,促進了傳統(tǒng)教學(xué)向個性化方向的發(fā)展。實現(xiàn)個性化學(xué)習(xí)的基礎(chǔ)是精準(zhǔn)診斷學(xué)習(xí)者的相關(guān)特征屬性,以此為依據(jù)提供適應(yīng)性的支持反饋[4]。在認(rèn)知診斷過程中,精確診斷出學(xué)習(xí)者的能力水平并推送符合其能力水平的測試題目是提高診斷精確性的關(guān)鍵環(huán)節(jié)。單瑞婷等結(jié)合DINA診斷模型與協(xié)同過濾算法,通過對學(xué)習(xí)者的知識點掌握情況及群體相似度進行分析,同時考慮了個體的學(xué)習(xí)狀態(tài)和群體的共性特征,實現(xiàn)了個性化的試題推薦[5]。Henson等運用認(rèn)知診斷模型診斷出學(xué)習(xí)者的知識狀態(tài),并基于概率分析以Kullback-Leibler信息量的大小為依據(jù),從題庫中為學(xué)習(xí)者選擇下一道要作答的測試題目[6]。該方法能夠使推送的試題更符合學(xué)習(xí)者的當(dāng)前學(xué)習(xí)狀態(tài),提高了學(xué)生的學(xué)習(xí)效率。一些學(xué)者在此基礎(chǔ)上進一步引入了自適應(yīng)思想,提出基于認(rèn)知診斷的計算機化自適應(yīng)測驗,CD-CAT可以根據(jù)被試的反應(yīng)特征調(diào)整測試題目的范圍,為其推送相適應(yīng)的測試題目,做到“因人施測”。羅照盛等提出了基于屬性掌握概率的PPWKL和PHKL選題策略,通過被試對每個屬性的掌握概率來估計學(xué)習(xí)者的當(dāng)前能力值,根據(jù)PWKL信息量為學(xué)習(xí)者推送相應(yīng)的試題,提高了題庫的利用率[7]。然而,這些方法只能從題庫中選擇難度與學(xué)習(xí)者能力水平大體相近的測試題目,無法確保試題難度和學(xué)習(xí)者能力水平之間匹配程度的精確性。因此,本文引入Rasch模型來對兩者進行精準(zhǔn)標(biāo)定與比較。
Rasch模型是丹麥數(shù)學(xué)家喬治·拉希(Georg Rasch)提出的一種基于概率的潛在特質(zhì)模型,該模型可以實現(xiàn)測試題目難度與學(xué)習(xí)者能力水平的同時等距標(biāo)定。Bin Abd Razak N等運用Rasch模型對題庫原始數(shù)據(jù)進行分析,通過直觀比較測試題目與學(xué)習(xí)者能力之間的關(guān)系,對測試題目進行了更準(zhǔn)確的質(zhì)量分析[8]。該方法可以根據(jù)數(shù)據(jù)分析結(jié)果篩選出符合學(xué)習(xí)者能力水平的測試題目,為高質(zhì)量題庫的開發(fā)提供了依據(jù)。王麗萍等通過Rasch模型對學(xué)生能力水平和主題難度初始值進行個性化設(shè)置,并依據(jù)學(xué)生對主題中所有參數(shù)化測試題的反應(yīng),實現(xiàn)對主題難度的定量估計[9]。該方法能夠準(zhǔn)確估計出測試題的難度,為教師在確定主題難度時提供依據(jù)。袁潔將Rasch模型作為檢驗和改進分級考試的有效工具,通過對試題難度分布與學(xué)習(xí)者整體水平分布的比較,對大學(xué)英語考試質(zhì)量進行量化分析[10]。該方法對學(xué)績測驗作出了準(zhǔn)確的評價,使得分級標(biāo)準(zhǔn)更加準(zhǔn)確。上述方法表明,Rasch模型可以將學(xué)習(xí)者能力水平和測試題目的難度等級放在同一量尺中進行標(biāo)定,直接比較兩者之間的關(guān)系。所以,本研究在認(rèn)知診斷基礎(chǔ)上引入Rasch模型,精準(zhǔn)標(biāo)定測試題目難度及學(xué)習(xí)者初始能力等級,并在每次診斷測試后更新學(xué)習(xí)者的能力等級,使系統(tǒng)推送的試題難度更符合學(xué)習(xí)者的能力水平,從而有效地提高診斷結(jié)果的精確性。
三、面向認(rèn)知診斷的能力等級自適應(yīng)
試題推送模型構(gòu)建
(一)相關(guān)概念
1. 認(rèn)知診斷
認(rèn)知診斷通過學(xué)習(xí)者可觀察的答題情況推測出不可觀察的知識結(jié)構(gòu)[11],及時反映學(xué)生的知識狀態(tài),從而為開展個性化補救學(xué)習(xí)提供依據(jù)。學(xué)習(xí)者完成測試是認(rèn)知診斷的前提,測試題目的難度能否精準(zhǔn)匹配學(xué)習(xí)者的能力直接影響診斷結(jié)果的精確性。
2. Rasch模型
Rasch模型是一種描述考生能力水平與題目參數(shù)之間關(guān)系的測量學(xué)模型[12]。該模型可以在客觀等距量尺中同時估計項目難度和學(xué)習(xí)者的能力,直觀比較學(xué)習(xí)者之間、測試題目之間以及學(xué)習(xí)者與測試題目之間的關(guān)系。Rasch模型通過項目特征曲線(Item Characteristic Curve,ICC)反映測試者在測驗項目上的反應(yīng)行為與測試者潛在特性之間的關(guān)系[13],預(yù)測學(xué)習(xí)者在未作答題目上的答對概率。
(二)Rasch模型特征
1. 直觀等距
Rasch模型通過對數(shù)轉(zhuǎn)換將學(xué)習(xí)者數(shù)據(jù)轉(zhuǎn)化為等距的Logit值,可以將測試題目難度和學(xué)習(xí)者能力標(biāo)定在同一等距量尺之上,用特定的Logit值表示兩者的等級,從而實現(xiàn)測試題目難度和學(xué)習(xí)者能力的直觀標(biāo)定與比較,便于系統(tǒng)為不同能力等級的學(xué)習(xí)者推送相應(yīng)難度等級的測試題目,實現(xiàn)兩者的精準(zhǔn)匹配。
2. 樣本獨立
題目難度的標(biāo)定獨立于考生樣本。題目的參數(shù)估計只取決于考生總體,經(jīng)過等值處理后的題目參數(shù)不會因為考生樣本的不同而發(fā)生變化[14]。Rasch模型的這一特征為題庫測試題目難度標(biāo)定和測試等值提供了理論依據(jù)。
(三)Rasch模型工作原理
Rasch模型用函數(shù)表示學(xué)習(xí)者能力及測試題目難度之間的關(guān)系,如公式(1)所示,其中θ表示學(xué)習(xí)者的能力參數(shù),b表示試題的難度參數(shù),P表示能力為θ的學(xué)習(xí)者對難度為b的題目的概率。Rasch模型客觀性以一組假定為前提:a.每位學(xué)生有其特定的能力值;b.每道測試題有特定的難度值;c.人的能力值和試題的難度值,以數(shù)值的形式呈現(xiàn)在同一個尺度上;d.通過人在試題上的得分值,可以推算出某個人在某個試題上的正確反應(yīng)概率[15]。該模型的核心算法是對原始數(shù)據(jù)進行對數(shù)轉(zhuǎn)換,通過迭代,不斷對試題難度和學(xué)習(xí)者能力等級進行調(diào)整,直至得到穩(wěn)定的值,并同時在同一等距客觀的量尺中標(biāo)定出兩者的等級,從而為不同能力等級的學(xué)習(xí)者推送相應(yīng)難度的試題提供依據(jù)。
P =1/(1+e^(θ-b))? ? ? ? ? ? ? ? ? ? ? 公式(1)
(四)面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型
本文通過引入Rasch模型應(yīng)用于認(rèn)知診斷系統(tǒng),形成面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型,通過為不同能力等級的學(xué)習(xí)者推送相應(yīng)難度等級的測試題目,提高診斷結(jié)果的精確性,為開展個性化學(xué)習(xí)奠定基礎(chǔ)。該模型的原理如圖1所示。
1. Rasch模型標(biāo)定測試題目難度
運用Ministep軟件將題庫原始數(shù)據(jù)進行對數(shù)轉(zhuǎn)換,并在同一等距量尺中對學(xué)習(xí)者能力及測試題目難度進行比較,用相同的區(qū)間來表示能力及難度的量級。能力及難度的標(biāo)定結(jié)果是范圍為[-2,2]~[-5,5]的區(qū)間,區(qū)間范圍根據(jù)樣本數(shù)據(jù)大小有一定的變化。為便于標(biāo)定學(xué)習(xí)者能力及測試題目難度的等級,將區(qū)間由低到高劃分為不同的等級,如Ministep軟件得出結(jié)果范圍為[-2,2]的區(qū)間,則標(biāo)定[-2,-1]區(qū)間內(nèi)的測試題等級為1,[-1,0]區(qū)間內(nèi)的測試題等級為2,[1,2]區(qū)間內(nèi)的測試題等級為4,以此類推標(biāo)定出每道測試題的難度等級。
2. 學(xué)習(xí)者能力等級初始化
每位學(xué)習(xí)者都有其特定的初始能力,開展正式測試時,學(xué)習(xí)者如進行過Rasch模型測試,則直接為其推送題庫中相應(yīng)難度等級的測試題目,如果沒有則首先通過認(rèn)知診斷系統(tǒng)從題庫中隨機為其推送測試題,運用Rasch模型對測試結(jié)果進行分析,在等距量尺中標(biāo)定出學(xué)習(xí)者的初始能力等級。
3. 學(xué)習(xí)者能力等級自適應(yīng)試題推送
為了實現(xiàn)個性化的學(xué)習(xí)者能力等級自適應(yīng)試題推送過程,將上述兩者的等級標(biāo)定結(jié)果集成于認(rèn)知診斷測試系統(tǒng),系統(tǒng)依據(jù)能力等級為學(xué)習(xí)者推送相應(yīng)難度等級的測試題目,完成認(rèn)知診斷測試后,得到學(xué)習(xí)者認(rèn)知診斷報告,學(xué)生可及時得知自身存在的認(rèn)知缺陷,教師可依據(jù)診斷報告為其推送個性化補救資源。
4. Rasch模型更新學(xué)習(xí)者能力等級
每次測試結(jié)束教師得到學(xué)習(xí)者的成績及診斷報告后,經(jīng)由Rasch模型對學(xué)生測試成績進行分析與轉(zhuǎn)換,得到學(xué)習(xí)者新的能力等級,并在認(rèn)知診斷系統(tǒng)中實時更新,進而在下一次測試時,系統(tǒng)依據(jù)學(xué)習(xí)者新的能力等級為其推送與之能力相匹配的測試題,形成面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型。
四、應(yīng)用方案
為驗證面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型在教學(xué)實踐中能否為不同能力等級的學(xué)習(xí)者推送更為匹配的測試題目,開展測試題目難度及學(xué)習(xí)者初始能力等級標(biāo)定、面向認(rèn)知診斷的能力等級自適應(yīng)試題推送、補救教學(xué)三個階段的教學(xué)實踐,涉及以下方面:
(一)應(yīng)用對象及內(nèi)容
本研究以河南師范大學(xué)2017級100名本科生作為研究對象,開展為期8周的教學(xué)應(yīng)用活動。其中教育技術(shù)學(xué)專業(yè)50人為實驗組,數(shù)字媒體技術(shù)專業(yè)50人為對照組,平均年齡18歲,男女比例約為1:5,兩組成員在構(gòu)成上大致相同。選取《Java語言程序設(shè)計》教材第三章“標(biāo)識符和基本數(shù)據(jù)類型”相關(guān)知識點作為教學(xué)內(nèi)容,并由此開展教學(xué)實踐活動。
(二)應(yīng)用環(huán)境
本次認(rèn)知診斷教學(xué)活動在機房進行,運用Ministep軟件對原始數(shù)據(jù)進行對數(shù)轉(zhuǎn)換,標(biāo)定測試題目的難度等級及初始能力等級,并在實踐活動中不斷更新學(xué)習(xí)者的能力等級,通過基于認(rèn)知診斷的可編程教學(xué)輔助系統(tǒng)(Cognigive Diagnosis based Programmable Teaching Support System,DPTSS)實現(xiàn)對實驗組學(xué)習(xí)者的測試和診斷,同時,由CDPTSS負(fù)責(zé)收集學(xué)習(xí)者完成診斷測試后的數(shù)據(jù),并由SPSS22.0對數(shù)據(jù)進行分析。
(三)應(yīng)用過程
本次教學(xué)實踐活動持續(xù)8周,第一周對兩組學(xué)生進行前測,測試學(xué)生的初始能力水平。同時,運用Ministep軟件對上屆學(xué)生及題庫測試題數(shù)據(jù)進行分析,將測試題目難度及學(xué)習(xí)者能力水平標(biāo)定在同一區(qū)間內(nèi)進行比較,剔除異常試題,并標(biāo)定出每道測試題目的難度等級。由題庫隨機為實驗組學(xué)生推送測試題,由Ministep軟件得到實驗組學(xué)生的初始能力等級。第2~7周分別對兩組學(xué)生開展教學(xué)活動,對照組采用傳統(tǒng)課堂教學(xué)模式,實驗組教學(xué)實踐安排如下:開展6次認(rèn)知診斷測試,由CDPTSS為不同能力等級的學(xué)生推送相應(yīng)難度等級的測試題目,每次測試結(jié)束后得到學(xué)習(xí)者診斷報告并由Rasch模型更新學(xué)習(xí)者的能力等級,統(tǒng)計學(xué)生存在的認(rèn)知缺陷,并在課后依據(jù)診斷報告及學(xué)習(xí)者能力等級進行補救教學(xué)。每次測試都依據(jù)最新能力等級標(biāo)定結(jié)果為學(xué)習(xí)者推送測試題目。第8周發(fā)放與回收調(diào)查問卷,調(diào)查實驗組對面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型應(yīng)用的滿意度,最后,整理分析相關(guān)數(shù)據(jù)和調(diào)查問卷結(jié)果。實驗組與對照組除診斷測試及補救教學(xué)方式不同外,其他無關(guān)變量均保持一致。實驗組8周實踐教學(xué)活動過程及時間安排如圖2所示。
下面以第三次教學(xué)活動為例,介紹實驗組應(yīng)用面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型的教學(xué)案例。本小節(jié)教學(xué)內(nèi)容包含兩個學(xué)時,共90分鐘,課前由教師確定內(nèi)容,并將相關(guān)學(xué)習(xí)資料上傳到CDPTSS中,由課前準(zhǔn)備工作得到的數(shù)據(jù)可知,題庫中與本節(jié)課內(nèi)容相關(guān)的測試題難度等級標(biāo)定結(jié)果如圖3所示:本次教學(xué)活動包含10道測試題,第六題最簡單,難度等級為2,第五題最難,難度等級為8,難度分布均勻。在第二次測試時得到學(xué)習(xí)者的能力等級如圖4所示:為方便數(shù)據(jù)的呈現(xiàn),隨機抽取15名學(xué)生的數(shù)據(jù)進行分析,剔除全部答對和全部答錯的數(shù)據(jù),在測試中得到14位學(xué)習(xí)者的能力水平,學(xué)號為14的學(xué)生能力最低,等級標(biāo)定為1,學(xué)號為13的學(xué)生能力最高,等級標(biāo)定為8,將等級標(biāo)定結(jié)果集成到CDPTSS中。之后30分鐘由教師講授本章節(jié)知識點,學(xué)生學(xué)習(xí)相關(guān)知識,30分鐘進行隨堂測試,由CDPTSS依據(jù)學(xué)習(xí)者能力等級為實驗組推送相應(yīng)難度等級的測試題目,如圖3、圖4可知13號學(xué)生能力和第五題難度在同一區(qū)間,等級都為8,則系統(tǒng)為13號學(xué)生推送第五題。學(xué)習(xí)者完成測試后,一分鐘內(nèi)由CDPTSS得到認(rèn)知診斷報告,5分鐘內(nèi)由Rasch模型的Ministep軟件得到新的學(xué)習(xí)者能力等級,并將其集成到診斷系統(tǒng)中,為下次測試題的推送提供依據(jù),之后25分鐘小組交流、討論,解決個性問題,教師依據(jù)認(rèn)知診斷報告進行集中講解,解決學(xué)生共性問題。課后,系統(tǒng)依據(jù)診斷報告及學(xué)習(xí)者能力等級為其推送相應(yīng)的補救學(xué)習(xí)資源,并收集、分析數(shù)據(jù),統(tǒng)計分析使用SPSS22.0。
(四)應(yīng)用結(jié)果及分析
在8周教學(xué)實踐結(jié)束后,對系統(tǒng)收集的數(shù)據(jù)及問卷調(diào)查數(shù)據(jù)進行分析,評價面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型的應(yīng)用效果,分析主要涉及試題難度與學(xué)習(xí)者能力匹配度、學(xué)習(xí)成績及學(xué)生滿意度三個方面。
1. 試題難度與學(xué)習(xí)者能力匹配度分析
為驗證該模型推送的測試題目是否更匹配學(xué)習(xí)者的能力,對兩組學(xué)生的6次后測成績進行正態(tài)分布檢驗,檢驗結(jié)果表明實驗組前兩次測試正態(tài)分布不明顯,后4次測試數(shù)據(jù)結(jié)果都符合正態(tài)分布。原因是學(xué)習(xí)者剛開始使用CDPTSS進行答題,操作不熟練,且前兩次測試由Rasch模型得到的學(xué)習(xí)者能力等級尚不穩(wěn)定。以實驗組第3次后測成績?yōu)槔蒘PSS22.0對測試結(jié)果進行常態(tài)檢驗分析,由于本次實際教學(xué)活動包含樣本量較少,因此,以K-S結(jié)果為準(zhǔn),sig.=0.200>0.05,表明實驗組成績符合正態(tài)分布,具體數(shù)據(jù)見表1。
另由SPSS22.0得到實驗組正態(tài)分布直方圖,如圖5所示,實驗組第三次測試數(shù)據(jù)直方圖也呈正態(tài)分布。以上分析表明,面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型推送的測試題目難度符合學(xué)習(xí)者的能力水平。
2. 學(xué)習(xí)成績
為保證對兩組學(xué)習(xí)者學(xué)習(xí)成績評價的有效性,對兩組學(xué)生的前測成績進行t檢驗,比較實驗組與對照組在開展本次教學(xué)應(yīng)用前的初始知識水平。前測檢驗結(jié)果中T的Sig值為0.65,遠大于0.05,表明兩組學(xué)生的前測初始能力差異不大。說明在開展本次教學(xué)應(yīng)用前,兩組學(xué)生的初始知識水平相當(dāng),可以避免由于學(xué)生初始知識水平不同而造成的診斷結(jié)果誤差。
對兩組學(xué)習(xí)者6次后測成績進行配對樣本t檢驗,比較兩者每次測試的得分差異,具體結(jié)果見表2。在后測成績1和2中,兩組學(xué)生的成績差異不顯著。原因是前兩次教學(xué)活動需要通過測試由Rasch模型得到學(xué)習(xí)者穩(wěn)定的能力值,進而為不同能力等級的學(xué)習(xí)者推送相應(yīng)難度等級的測試題目。后測3~6中,實驗組與對照組后測成績存在顯著差異,且實驗組相對于對照組成績明顯提高,其原因在于,診斷系統(tǒng)為實驗組推送的測試題目難度與其能力等級精確匹配,且課后針對性的補救學(xué)習(xí)也能夠及時解決學(xué)習(xí)中存在的問題,因此,學(xué)習(xí)者學(xué)習(xí)效率顯著提高。而對照組僅由題庫隨機推送試題,且缺乏后續(xù)針對性的補救資源推送,所以成績提升不明顯。由以上分析可知:面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型在實際教學(xué)中的應(yīng)用使得診斷系統(tǒng)推送的測試題目難度與學(xué)習(xí)者能力水平精準(zhǔn)匹配,提高了實驗組的學(xué)習(xí)成績。
3. 調(diào)查問卷
本研究調(diào)查了實驗組對面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型教學(xué)應(yīng)用的滿意度,共發(fā)放60份問卷,回收有價值的問卷58份,有效率為96.67%。問卷采用李克特五級量表(從1分“強烈不同意”到5分“強烈同意”),針對“等級標(biāo)定精準(zhǔn)度”“試題難度滿意度”“試題推送模型實用性”“教學(xué)效果滿意度”四個維度設(shè)計了20個項目,對實驗組學(xué)生態(tài)度進行問卷調(diào)查,具體分析結(jié)果見表3。由表3的Cronbachs α信度系數(shù)可知,“等級標(biāo)定精準(zhǔn)度”的均值接近量表的最高等級即非常滿意[16],說明學(xué)生對Rasch模型的等級標(biāo)定結(jié)果非常滿意,“試題難度滿意度”“試題推送模型實用性”“教學(xué)效果滿意度”的項目均值都大于4,表明學(xué)生對試題推送模型及整個教學(xué)應(yīng)用過程持較高的滿意度。
五、總結(jié)與展望
為了優(yōu)化認(rèn)知診斷測試的試題推送過程,提高認(rèn)知診斷測試結(jié)果的精確性,文章提出面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型,并由此開展認(rèn)知診斷教學(xué)活動。由教學(xué)實踐得到的數(shù)據(jù)分析結(jié)果可知,面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型通過對數(shù)轉(zhuǎn)換,對題庫測試題難度等級及學(xué)習(xí)者初始能力等級進行標(biāo)定,并在每次診斷測試結(jié)束后更新學(xué)習(xí)者的能力等級,從而使診斷系統(tǒng)推送與學(xué)習(xí)者能力等級精確匹配的測試題目,有效地提高了診斷的精確性及學(xué)生的學(xué)習(xí)效率,大部分學(xué)生對系統(tǒng)依據(jù)其能力推送的測試題目難度及整個教學(xué)應(yīng)用過程表現(xiàn)出較高的滿意度。
面向認(rèn)知診斷的能力等級自適應(yīng)試題推送模型能夠直觀標(biāo)定與比較學(xué)習(xí)者能力之間、測試題目之間及學(xué)習(xí)者能力和測試題目之間的關(guān)系,有效提高診斷結(jié)果的精確性,促進教學(xué)向個性化方向的發(fā)展。后續(xù)研究將重點集中在深度分析不同能力等級學(xué)生在答題過程中的差異、診斷測試題庫建設(shè)及利用Rasch模型為學(xué)習(xí)者制定更為精準(zhǔn)的個性化補救方案上。
[參考文獻]
[1] 中華人民共和國教育部. 教育信息化十年發(fā)展規(guī)劃[EB/OL].[2015-06-26]. http://moe.gov.cn/public files/busi Ness/htmlfiles/moe/s3342/201203/xxgk_133322.html.
[2] 馬玉慧,王珠珠,王碩爍,郭炯. 面向智慧教育的學(xué)習(xí)分析與智能導(dǎo)學(xué)研究——基于RSM的個性化學(xué)習(xí)資源推送方法[J]. 電化教育研究,2018,39(10):47-52,82.
[3] 黃宏濤,李世珍,李世玉,宋婷鴿,蘇明驁. 基于BP神經(jīng)網(wǎng)絡(luò)的認(rèn)知診斷方法在個性化教學(xué)中的應(yīng)用[J]. 中國遠程教育,2019(1):86-91.
[4] 王玨,解月光. 基于前概念體系的學(xué)習(xí)者認(rèn)知診斷方法研究——以初中物理“力與運動”主題為例[J]. 電化教育研究,2017,38(9):122-128.
[5] 單瑞婷,羅益承,孫翼. 基于認(rèn)知診斷的協(xié)同過濾試題推薦[J]. 計算機系統(tǒng)應(yīng)用,2018,27(3):136-142.
[6] HENSON R, DOUGLAS J. Test construction for cognitive diagnosis[J]. Applied psychological measurement,2005(4):262-277.
[7] 羅照盛,喻曉鋒,高椿雷,李喻駿,彭亞風(fēng),王睿,王鈺彤. 基于屬性掌握概率的認(rèn)知診斷計算機化自適應(yīng)測驗選題策略[J]. 心理學(xué)報,2015,47(5):679-688.
[8] BIN ABD RAZAK N,BIN KHAIRANI A Z,THIEN L M. Examining quality of mathemtics test items using rasch model: preminarily analysis [J]. Procedia-social and behavioral sciences,2012(69):2205-2214.
[9] 王麗萍,趙蔚,魏久鴻. 自適應(yīng)學(xué)習(xí)系統(tǒng)中基于Rasch的主題難度估計[J]. 現(xiàn)代教育技術(shù),2017,27(6):115-121.
[10] 袁潔. 基于Rasch模型的大學(xué)英語分級考試質(zhì)量分析[J]. 東南大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2016,18(S1):142-145.
[11] 辛濤,樂美玲,郭艷芳,等. 學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的建立途徑:基于認(rèn)知診斷的學(xué)習(xí)進階方法[J].教育學(xué)報,2015(5):72-79.
[12] WRIGHT D B, STONE H. Best test design:rasch measurement[M]. Chicago,IL:MESA Press,1979.
[13] RONALD K H, HARIHARAN S. Item response theory: principles and applications[M]. Boston/Dordrecht/Lancaster: Springer Science & Business Media f, Kluwer Nijhoff,1985:39-48.
[14] 楊志明. 打通題庫建設(shè)瓶頸的關(guān)鍵手段——基于Rasch模型的題目參數(shù)等值技術(shù)[J]. 教育測量與評價,2017(1):5-11.
[15] BOND T G, FOX C M. Applying the rasch model:fundamental measurement in the human sciences[M]. Mahwah,NJ:Lawrence Erlbaum Associates,2007.
[16]卜彩麗,張文蘭,張寶輝,等. 面向教師培訓(xùn)的翻轉(zhuǎn)課堂探究——以“PPT課件制作”課程為例[J]. 現(xiàn)代教育技術(shù),2017,27(1):81-87.
Construction and Application of An Adaptive Test Push Model for Cognitive Diagnosis
YE Haizhi,? YANG Liu,? HUANG Hongtao,? MEI Yujiao
(Institute of Education, Henan Normal University, Xinxiang Henan 453007)
[Abstract] The deep integration of cognitive diagnosis and education can promote the development of personalized learning. In the cognitive diagnostic test, the matching degree between the learner's ability and test difficulty directly affects the accuracy of diagnostic results. However, at present, the cognitive diagnosis cannot accurately calibrate the learner's ability and test difficulty, which leads to teachers' inability to accurately judge students' learning status. In order to solve that problem, a text push model adapted by the student's ability level for cognitive diagnosis is constructed. First, the Rasch model is used to perform logarithmic transformation on the raw data of the item bank, then the difficulty level of the test item and the learner's initial ability level are calibrated in the same isometric ruler. Learners with different ability levels are provided with corresponding test questions in the test, and the learner's ability level will be updated after each test. The result indicates that the text push model adapted by the student's ability level for cognitive diagnosis can make the difficulty of test items exactly match the learner's ability, further improve the accuracy of cognitive diagnosis, improves the learning efficiency of students and promotes the development of personalized education.
[Keywords] Cognitive Diagnosis; Rasch Model; Adaptive Ability Level; Test Push Model; Personalized Learning