耿智琳,張麗麗,張耀峰,張志剛
(湖北經濟學院a.統計與數學學院;b.湖北數據與分析中心,武漢 430205)
隨著科學不斷發展,探尋事物之間的因果關系逐漸深入到自然科學和社會科學的各個學科中,如何識別處理效應也成為研究熱點之一。處理效應的標準識別方法為嚴格的隨機對照試驗,但在解決現實問題時,由于倫理、成本或其他現實因素限制,無法滿足隨機對照試驗的隨機性[1]。
為了從觀測性研究數據中獲得無偏處理效應,研究者們通常選擇基于傾向得分的方法[2]和基于回歸分析的方法[3]平衡偏倚。當給定可忽略性假定時,基于傾向得分的方法和基于回歸分析的方法才有可能得到無偏平均處理效應,其中基于傾向得分的方法應用更為廣泛。傾向得分是平衡得分的一種形式,是給定協變量時個體接受處理的概率。平衡得分的主要思想是將對照組和處理組之間的相似個體劃分到一個子集中進行比較,傾向得分在滿足平衡得分基本思想的情況下,將總體盡可能劃分為更少子集,以確保每個子集中樣本盡可能多。因此在傾向得分相似的子集中,對照組和處理組個體具有相似協變量分布。傾向得分能平衡觀測性研究數據中處理組和對照組之間的偏差,得到偏差較小的處理效應估計。基于傾向得分的方法既可以使用傾向得分進行匹配[4],也可以使用傾向得分進行加權[5]。
傾向得分方法能夠平衡處理組和對照組個體間的差異,但仍存在協變量間重要性的不平衡。……