黃婉娟,羅雙華,張成毅
(1.西安工程大學 理學院,陜西 西安 710048;2.西安交通大學 經濟與金融學院,陜西 西安 710049)
在科學研究領域,常常由于一些抽樣個體不愿意提供所需信息,以及一些不可控的因素或調研人員本身原因,造成收集的數據缺失。因此,在進行統計分析時經常會遇到帶有缺失數據的回歸模型,尤其是生物領域和社會科學領域。針對缺失數據的研究已有很多[1-4]。在統計分析缺失數據的回歸模型時,通常假設數據隨機缺失,普遍使用逆概率加權的方法:ROBINS提出使用逆概率加權的方法去對協變量缺失的回歸模型進行參數估計[5];WANG等提出對協變量隨機缺失的廣義線性模型使用局部逆概率加權方法[6];LIANG等考慮對協變量缺失的部分線性模型使用逆概率加權方法進行參數估計[7];SHEN等基于響應數據缺失下的線性回歸模型,使用逆概率加權方法進行參數估計[8]。
許多加權估計方法是基于最小二乘法展開研究的。由于最小二乘法的模型誤差具有重尾或偏斜分布時可能會產生不可靠的估計,所以對于數據隨機缺失的回歸模型,最小二乘法估計的有效性和穩健性仍面臨巨大挑戰。與僅依賴數據中心趨勢的均值回歸方法相比,KOENKER和BASSETT提出的分位數回歸對異常值不太敏感,因而更穩健。于是,SHERWOOD等提出了缺失協變量的逆概率加權分位數回歸模型[9];TANG等針對數據隨機缺失的線性回歸模型,考慮將分位數信息與最小二乘相結合以提高估計效率[10];……