王緊杰,羅雙華
(西安工程大學 理學院,陜西 西安 710048)
數據缺失問題廣泛存在于經濟學、金融學、醫(yī)學和生態(tài)學等領域中,人們經常采用變系數模型或分位數回歸模型來研究此類問題[1-2].但是,對此問題采用變系數分位數回歸模型研究較少,由于變系數分位數回歸模型具有良好的性質,因而,研究缺失數據下的變系數分位數回歸模型不但具有重要的理論意義,而且也有很好的實際應用價值.Hastie等[3]首次提出了變系數回歸模型,它比線性模型具有更強的適應性和建模能力,同時變系數模型又避免了“維數禍根”問題.變系數分位數模型是經典線性回歸模型的延伸.Zhao等[4]在不可忽略缺失數據下研究了分位數回歸模型的逆概率加權方法;Tang等[5]在缺失數據下研究了分位數和最小二乘回歸的估計和推斷;Jin等[6]在協(xié)變量缺失下討論了部分線性變系數模型的懲罰加權復合分位數回歸估計;Wang[7]討論了變系數分位數回歸模型的系數估計和檢驗方法.
在協(xié)變量隨機缺失的情形下,考慮變系數分位數回歸模型的廣義擬似然比檢驗問題.首先,用Jackknife方法對變系數分位數回歸模型的系數進行估計.其次,構造缺失數據下的廣義擬似然檢驗統(tǒng)計量去檢驗變系數分位數回歸模型的系數的形式.最后,在一定條件下證明了所構造統(tǒng)計量的大樣本性質.
考慮變系數分位數回歸模型為
Y=Aτ(U)TX+ε
(1)
其中Y∈R是響應變量,U∈Rd被稱為光滑的向量,ε和(X,U)相互獨立,Aτ(U)=(a0,τ(u),…,ap,τ(u))T是光滑系數函數,考慮U是一維的情形.設(Yt,Tt,δtVt,Ut)是模型(1)中的一個隨機樣本,其中Xt=(Tt,δtVt)T,Yt,Tt和Ut可以完全被觀察到,Vt有部分缺失,若Vt缺失,則δt=0,否則δt=1.假設Vt是隨機缺失,則有
P(δt=1|Yt,Tt,Vt,Ut)=P(δt=1|Yt,Tt,Ut)=π(Zt),其中Zt=(Yt,Tt,Ut)T.
估計系數函數A(·)采用Jackknife方法局部線性擬合.假設A(U)具有連續(xù)二階導數,對于Ut鄰域內的Ui,應用泰勒公式近似估計A(Ui),則有
A(Ui)≈a0+a1(Ui-Ut),
(2)
其中a0=A(Ut),a1=A′(Ut)是A(Ut)的一階導數.Jackknife方法是在估計A(Ut)時,使用除第t個觀測值以外的所有觀測值.則得到的局部線性加權損失函數為
(3)

檢驗變系數是否具有某種特定的函數形式,等價于下面的假設檢驗問題:
H01∶Aτ(u)=A0,τ(u)與Ha1∶Aτ(u)≠A0,τ(u),
(4)
其中A0,τ(u)是已知的函數向量.
按照Wang[7]完整數據下的廣義擬似然比檢驗思想,構造模型(1)的廣義擬似然比檢驗統(tǒng)計量為
Tn1=(Ha1)-(H01),

式(4)中若A0,τ(u)是常數向量,等價于下面的假設檢驗問題:
H02∶Aτ(u)=A0,τ與Ha2∶Aτ(u)≠A0,τ,
(5)
其中A0,τ是已知的常數向量,同理可得模型(1)的廣義擬似然比檢驗統(tǒng)計量,其表達式為
Tn2=(Ha2)-(H02),

首先給出結論成立所需要的一組假設條件A.
(A1) 對任意給定的網格點u0,Aτ(u)=(a0,τ(u),…,ap,τ(u))′在u0鄰域內連續(xù)兩次可微.
(A2)fu(u)連續(xù),且fu(u0)>0.
(A3)fy|u,x(y)有界且滿足Lipschitz條件.
(A4) 核函數K(·)是具有有界支撐的對稱概率密度函數,是Lipschitz連續(xù)的.


(A7)Ω(u0),Ω*(u0)在u0的一個鄰域內是正定、連續(xù)的.
(A8) 帶寬h滿足h→0,nh→∞且n1/2-δ/4hδ/δ*-1/2-δ/4=Ο(1).
(A10)E|ε|4<∞.
定理1 在A0,τ(u)是已知的函數向量下,假設條件A成立,當H01為真時,有
(6)


證明在A0,τ(u)是已知的函數向量下,當H01成立時,檢驗統(tǒng)計量Tn1如下:

由于B2=E(B2)+(B2-EB2)=C1+C2,由大數定律可得C2=οp(1).
因為εt=Yt-A0(Ut)TXt,可得
因此檢驗統(tǒng)計量Tn1如下:
其中ηt=τ-I(Yt-A0(Ut)TXt<0),由Wang[7]中的定理2.1和Cai等[8]中的結論可知
因此可得檢驗統(tǒng)計量Tn1為



應用Zhang[9]中的引理3.3.2,可得
所以
因此
Tn1+dn=Tn1+T2-T4-T5=T3+op(1)


通過應用Peter[10]命題3.2可得


定理2 在A0,τ是已知的常數向量下,假設條件A成立,當H02為真時,有
(7)
證明在A0,τ是已知常數向量下,當H02成立時,檢驗統(tǒng)計量Tn2為
其中A0為常數向量.

根據定理1中的推導可以把檢驗統(tǒng)計量Tn2可化解為
由證明定理1推導過程中的結論有
因此可得Tn2服從漸近正態(tài)分布.