付志慧,李 斌
(沈陽師范大學 數學與系統科學學院,沈陽 110034)
項目反應理論在心理與教育測量領域中具有廣闊的應用前景[1-2]。它以潛在特質理論為基礎,核心內容是研究潛在心理特質和反應行為之間的關系,在此基礎上,可以分析出被試潛在心理特質(即能力)與項目特性(難度、區分度等)之間的相互影響。項目反應模型按照能力維度可分為單維和多維。單維項目反應模型假定測驗的所有題目只考查同一種潛在特質。但是實際心理過程是非常復雜的,且考試(教育測驗)通常考查多個能力。本文主要研究多維二參數Logistic(2PLM)的Gibbs抽樣方法。
項目反應理論參數估計方法有4種[4],條件極大似然估計(CMLE:condition maximum likelihood estimation),邊際極大似然估計與EM 算法[4-5](MMLE/EM:marginal maximum likelihood estimation and an EM algorithm),聯合極大似然估計(JMLE:joint maximum likelihood estimation),Bayes估計。CMLE以一種參數已知為條件,即項目參數已知求能力值或能力參數已知求項目值。能力的條件估計適用于抽取題庫項目來估計被試能力,若在題庫未建立前,項目參數和能力參數皆是未知,CMLE不再適用。Birnbaum提出了聯合極大似然估計。JMLE可在一定假設下,轉化為項目參數的估計和能力參數的估計。兩種估計是一個不斷互相校正的過程,反復迭代求取穩定值,可以看成是兩步估計的過程。但聯合極大似然估計有其固有的缺陷:給定長度測試中(即項目個數是固定的),隨著被試人數的增加,能力參數的個數也相應增加,稱之伴隨參數;不隨被試人數增加而增加的項目參數,稱之為結構參數;當同時估計能力參數和項目參數時,伴隨參數可能不存在充分統計量,因此得出估計不一定滿足相合性。消除JLME固有的缺陷只有消除伴隨參數的影響。MMLE/EM算法將能力參數邊際化,給定能力的先驗分布,對能力參數進行積分,從而來消除能力參數,在一般條件下該算法可以收斂,計算比較簡單,但它對能力需要進行數值積分近似計算,在能力維數較高時,會給計算帶來很大困難[6]。為了提高估計的質量,除了當前樣本數據,還可以利用客觀信息和經驗積累的信息,先驗信息的加入,參數估計更加穩定,也更合理和符合實際。Albert(1992)給出了二參數正態卵形的一種Gibbs抽樣方法[7]。Sahu(2002)將其推廣到三參數正態卵形模型[8]。Van der Linden(2007)針對結合反應時間和反應速度的測驗,用對數正態模型來擬合被試的反應時間,用三參數正態卵形IRT模型擬合反應得分,將二者結合后給出了Gibbs抽樣方法[9]。本文考慮更為一般的多維2PLM,給出了一種基于增加數據的Gibbs抽樣方法,易于求出每個參數的后驗分布,從而直接給出參數的Bayes后驗估計。
假定有N個被試,n個項目,yij表示第j個被試對第i個項目的反應,答對取值為1,答錯取值為0。令pij表示第j個被試對第i個項目正確反應的概率,我們采用多變量Logistic反應函數,形式為:

其中,i=1,2,…,n,j=1,2,…,N,θj=(θj1,…,θjk,…,θjm)為被試j的能力,各維度能力取值范圍均為-∞<θjk<∞,j=1,2,…,N,k=1,2,…,m;ai=(ai1,…,aik,…,aim),aik>0,i=1,2,…,n,k=1,2,…,m是由項目i在各維度能力上的載荷aik生成的向量,稱為區分度參數;bi=(bi1,…,bik,…,bim).-∞<bik<∞,i=1,2,…,n,k=1,2,…,m,為項目i的難度參數向量;特別地,當m=1時,模型(1)退化為單維2PLM。
令ζ=(θ,a,b,σ),其中a=(aik)n×m,b=(bik)n×m,且(·)n×m表示n×m矩陣。多維2PLM 下,參數ζ的后驗分布為:其中D為比例常數。

對應于反應數據yij,引入2個相互獨立的隨機變量uij。其中uij服從均勻分布,uij~Uniform(0,1)。由模型(1)易知,潛變量μij要受到yij取值的約束,令

令u=(uij)n×N,y=(yij)n×N,隨著潛變量u的引入,(ζ,u)的聯合后驗密度為:


進而,由式(3),有

首先,在給定反應數據和其他參數的情形下,抽取uij。在算法的每一步都要滿足式(2)。1)uij的滿條件分布為

2)給定a,b,σ2的滿條件分布為

由式(3),對于任意i,k,令

3)則給定其他所有參數和u,r,y,,i=1,2,…,n,k=1,2,…,m的滿條件分布為

4)同理,θjk,j=1,2,…,N,k=1,2,…,.m的滿條件分布為

其中,θj(k)是向量θj將第k個元素θjk刪除后得到的余向量,即

N(vk,)是θjk在給定θj(k)下的條件分布,條件均值和條件方差分別為

(關于vk和的詳細計算過程見附錄),且

5)給定其他所有參數和u,r,y,aik,i=1,2,…,n,k=1,2,…,m的滿條件分布為

其中
以下給出了具體的Gibbs抽樣步驟(具體程序由Matlab軟件編寫)。
第1步 從式(5)中抽取u;
第2步 從式(6)中抽取σ2;
第3步 從式(7)中抽取b;
第4步 從式(8)中抽取θ;
第5步 從式(11)中抽取a。
以上討論了多維二參數LOGISTIC模型的Gibbs抽樣問題,采用本文討論的方法,可簡單解決該模型的參數估計問題,這一結果對IRT的發展,對多維項目在測驗中的應用是很有意義的,在此基礎上,還可以進一步討論多維項目反應模型的其他問題,如縱向測驗[10-11]、多層IRT測驗[12]、參數估計優化問題[13-15]等。
附錄
條件均值及方差的詳細計算過程
若要計算θjk的條件均值vk和條件方差(公式(10)),首先對θj進行置換。令

Pk1=(pst)m×m為置換陣,第(s,t)個元素為

由θj~Nm(μ,Σθ)有(k)~Nm(μ*(k),(k)),其中

為了求θjk的條件分布,將向量(k)分成兩塊,因此得:

(μj(k)為θj(k)的數學期望,即μj(k)=E(θj(k))。且

因此在給定時的條件分布為:


[1]BEAUJEAN A A,STEVEN J O.Using item response theory to assess the flynn effect in the national Longitudinal study of youth 79children and young[J].Adults Ddata Intell,2008,36(3):455-463.
[2]CHANG C H,REEVE B B.Item response theory and its applications to patient-reported outcomes measurement[J].Eval Health Prof,2005,28(3):264-282.
[3]BAKER F B,KIM S H.Item response theory:parameter Estimation Techniques[M].2nd Ed.New York:Marcel Dekker,2004.
[4]BOCK R D,AITKIN M.Marginal maximum likelihood estimation of item parameters:An application of an EM-algorithm[J].Psychometrika,1981,46(3):443-459.
[5]DAVIER M V,SINHARAY S.An importance sampling EM algorithm for latent regression models[J].J Educ Behav Stat,2007,32(3):233-251.
[6]FIEUWS S.High dimensional multivariate mixed models for binary questionnaire data[J].Appl Stat,2006,55(4):449-460.
[7]ALBERT J H.Bayesian estimation of normal ogive item response curves using Gibbs Sampling[J].J Educ Stat,1992,17(3):251-269.
[8]SAHU S K.Bayesian estimation and model choice in item response models[J].J Stat Comput and Simul,2002,72(3):217-232.
[9]LINDEN V D.A hierarchical framework for modeling speed and accuracy on test items[J].Psychometrika,2007,72(3):287-308.
[10]JANNEKE M.Application of multidimensional item response theory models to longitudinal data[J].Educ Psycho Meas,2006,66(1):5-34.
[11]FU Zhihui,TAO Jian,SHI Ningzhong.Analyzing longitudinal item response data via the pairwise fitting method[J].Multivariate Behav Res,2011,46(4):669-690.
[12]FOX J P,GLAS C A W.Bayesian estimation of a multilevel IRT model using Gibbs sampling[J].Psychometrika,2001,66(2):271-288.
[13]甘源媛,余嘉元.改進3PL模型參數估計的 MCMC算法[J].心理科學,2010,33(5):1212-1215.
[14]涂冬波,漆書青,蔡艷,等.IRT參數模型估計的新方法——MCMC算法[J].心理科學,2008,31(1):177-180.
[15]PATZ R J,JUNKER B W.Applications and extensions of MCMC in IRT:multiple item types,missing data,and rated responses[J].J Educ Behav Stat,1999,24(2):146-178.