張 軍
(北京語言大學漢語進修學院,北京100083)
單維項目反應理論模型分參數(shù)型(Parametric Item Response Theory,PIRT)與非參數(shù)型(Nonparametric Item Response Theory,NIRT)兩種。PIRT 模型適合于等距量表或比率量表水平的測量;而NIRT的測量限于順序量表水平。(Meijer,Sijtsma,&Smid,1990;Sijtsma & Verweij,1992)前者使用難度、區(qū)分度、猜測度等若干項目參數(shù)刻畫項目特征曲線,描寫項目的測量特性;而后者不要求反應數(shù)據(jù)符合某種特定函數(shù)形態(tài),比前者限制要少,只使用量表適宜性系數(shù)H(scalability coefficients)衡量項目測量被試的適宜性。
關(guān)于PIRT 與NIRT 兩種模型下項目參數(shù)之間的關(guān)系,有的研究者做了有益的分析。Roskam 等(1986)、Jansen(1982)和Mokken 等(1986)認為H 系數(shù)是一個能反映項目綜合性能的統(tǒng)計量,它與潛在能力的方差、難度的全距(the spread of item difficulties)和區(qū)分度三個因素有關(guān),當其中兩個因素保持不變,H系數(shù)就是另一個因素的遞增函數(shù),但是一個特定的H值并不能提供有關(guān)三個因素的具體信息。
Sijtsma,Emons,Bouwmeester 和Ivan(2008)認為Hi 系數(shù)的取值取決于項目區(qū)分度、難度與潛在變量分布的交互作用。他們模擬了分布情況分別為(均值= -2,標準差=1)和(均值=1,標準差=1)兩種能力群體對5 個多級項目的反應數(shù)據(jù),樣本容量都是5000 人,這5 個項目的三個等級的難度各不相同,區(qū)分度都是1.4。經(jīng)計算,雖然項目的區(qū)分度相同,但Hi 系數(shù)卻因為能力分布與難度的不同而大小不同。張軍(2010)使用自動選題策略分析試卷維度時,發(fā)現(xiàn)項目的區(qū)分度對通過H 系數(shù)進行的量表構(gòu)建過程有較大影響。除以上三個因素以外,是否還存在其他因素與H 系數(shù)有關(guān),如潛在能力分布的均值、難度分布的均值等,以及潛在能力、難度、區(qū)分度三個因素如何綜合影響H 系數(shù),這些問題尚未有研究涉及。……