張 軍
(北京語言大學漢語進修學院,北京100083)
單維項目反應理論模型分參數型(Parametric Item Response Theory,PIRT)與非參數型(Nonparametric Item Response Theory,NIRT)兩種。PIRT 模型適合于等距量表或比率量表水平的測量;而NIRT的測量限于順序量表水平。(Meijer,Sijtsma,&Smid,1990;Sijtsma & Verweij,1992)前者使用難度、區分度、猜測度等若干項目參數刻畫項目特征曲線,描寫項目的測量特性;而后者不要求反應數據符合某種特定函數形態,比前者限制要少,只使用量表適宜性系數H(scalability coefficients)衡量項目測量被試的適宜性。
關于PIRT 與NIRT 兩種模型下項目參數之間的關系,有的研究者做了有益的分析。Roskam 等(1986)、Jansen(1982)和Mokken 等(1986)認為H 系數是一個能反映項目綜合性能的統計量,它與潛在能力的方差、難度的全距(the spread of item difficulties)和區分度三個因素有關,當其中兩個因素保持不變,H系數就是另一個因素的遞增函數,但是一個特定的H值并不能提供有關三個因素的具體信息。
Sijtsma,Emons,Bouwmeester 和Ivan(2008)認為Hi 系數的取值取決于項目區分度、難度與潛在變量分布的交互作用。他們模擬了分布情況分別為(均值= -2,標準差=1)和(均值=1,標準差=1)兩種能力群體對5 個多級項目的反應數據,樣本容量都是5000 人,這5 個項目的三個等級的難度各不相同,區分度都是1.4。經計算,雖然項目的區分度相同,但Hi 系數卻因為能力分布與難度的不同而大小不同。張軍(2010)使用自動選題策略分析試卷維度時,發現項目的區分度對通過H 系數進行的量表構建過程有較大影響。除以上三個因素以外,是否還存在其他因素與H 系數有關,如潛在能力分布的均值、難度分布的均值等,以及潛在能力、難度、區分度三個因素如何綜合影響H 系數,這些問題尚未有研究涉及。……