邱忠娟
摘 要:本文旨在基于項目反應(yīng)理論(IRT),以高中三角函數(shù)為例,編制了一份診斷性測試卷. 首先根據(jù)課標(biāo)、考試大綱等文本材料確定三角函數(shù)考試要點,從歷年高考試題中選取了15個項目,對40名學(xué)生進行預(yù)測試,發(fā)現(xiàn)項目1的難度參數(shù)為-8.99,不在(-3,3)內(nèi),且其項目信息函數(shù)曲線出現(xiàn)異常,予與刪除,同時也說明項目反應(yīng)理論克服了經(jīng)典測量理論的缺點,在診斷性測試卷的編制上具有突出優(yōu)勢.
關(guān)鍵詞:項目反應(yīng)理論;測試卷;三角函數(shù)
引言
如同醫(yī)學(xué)上CT等診斷工具,如何編制一份信度可靠、效度較高的診斷性測試卷是重要問題. 傳統(tǒng)的診斷性測驗的編制主要依據(jù)經(jīng)典測量理論,但它具有信度估計精度不高、誤差指標(biāo)單一、參數(shù)估計對樣本依賴性太大等缺點. 而項目反應(yīng)理論(IRT)突破了經(jīng)典公理體系,避免了由于先天不足而產(chǎn)生的許多限制的弱點,具有題目的跨群體不變性、參數(shù)設(shè)計的科學(xué)性、信息函數(shù)可加性等優(yōu)點. 本研究試圖應(yīng)用項目反應(yīng)理論中的邏輯斯蒂雙參數(shù)模型指導(dǎo)三角函數(shù)內(nèi)容診斷性測驗的編制,以此來控制診斷性測試題的精度,從而減少測量的誤差.
模型介紹
美國著名的測量學(xué)家洛德通過對ETS大量實測資料做了深入分析,提出了數(shù)學(xué)上的邏輯斯蒂函數(shù)(項目反應(yīng)函數(shù))來刻畫被試答對概率與能力水平及項目特性的關(guān)系,雙參數(shù)模型函數(shù)表達(dá)式如下:
Pi(θ)=.
其中,Pi(θ)是能力水平為θ的被試在項目i上的答對概率,ai,bi分別為項目的區(qū)分度、難度,D為一個常數(shù),取值為1.7.可以看出,被試在項目上的答對概率Pi(θ),是被試能力水平個項目難度的差值的函數(shù).
研究設(shè)計
1. 內(nèi)容選取
本文基于高中數(shù)學(xué)課程標(biāo)準(zhǔn)、考試大綱、高考試題等文本材料構(gòu)建了三角函數(shù)內(nèi)容的屬性模型,并采用問卷調(diào)查的方法向一線教師征求意見,得到如下表1:
2. 預(yù)編制
歷年高考數(shù)學(xué)試題據(jù)具有較高的信度和效度,所以關(guān)于三角函數(shù)的高考測試題是本研究所編測試項目的主要來源,初步選編了17個題目,選編好試題后,征求了測試對象的數(shù)學(xué)教師的意見,并根據(jù)他們的反饋意見刪除了部分項目,并對部分測試項目做了修改,共保留了15道題.
3. 測試
本研究被試來自重慶一所中學(xué),這些被試均是高一學(xué)生,完成了三角函數(shù)內(nèi)容的學(xué)習(xí),根據(jù)隨機抽樣的原則,選取了其中一個班,共計40名同學(xué)進行預(yù)測試. 測試由該班級的數(shù)學(xué)教師擔(dān)任主試,測試前跟學(xué)生交代這是一次考試,但不限制作答時間,做完測試題即可上交,從實際情況來看,一節(jié)課左右完成居多. 由于測試題均為客觀題,故改卷時以0、1計分,答對計1分,答錯或者沒有作答均計0分.
4. 數(shù)據(jù)處理
本研究采用R軟件進行項目參數(shù)的估計、測驗等值及項目信息函數(shù)的估計.
研究結(jié)果
根據(jù)雙參數(shù)模型,得到每個項目的難度、區(qū)分度和信息量等參數(shù),如表2和圖1.
從圖2和表2可以看出,項目1的難度參數(shù)為-8.99,不在(-3,3)內(nèi),且其項目信息函數(shù)曲線出現(xiàn)異常,因此刪除題目1,最后共保留了14個項目.
結(jié)束語
本文基于項目反應(yīng)理論嘗試編制一套高中三角函數(shù)診斷性測試卷,采用邏輯斯蒂雙參數(shù)模型,克服了以經(jīng)典測量理論嚴(yán)重依賴于被試,項目的難度用學(xué)生的通過率表示,項目的區(qū)分度則以題目與總分的相關(guān)或高低能力組的通過率之差表示,測驗信度建立在平行測驗基礎(chǔ)之上. 本文也存在不足,未對試題進行單維性檢驗,為此還需要做更深的探討.