甘勝進 游文杰
摘 要 提出中心K階條件矩降維子空間,指出與中心K階中心矩子空間的關系,并給出迭代的海塞變換估計,該方法僅僅需要線性條件,綜合了最小二乘和海塞主方向方法.
關鍵詞 降維;CKCMS;OLS;PHD;迭代海塞變換
中圖分類號 O213文獻標識碼 A文章編號 10002537(2016)02009005
Iterative Hessian Transformation Estimation of
Central Kth Conditional Moment Subspace
GAN Shengjin*, YOU Wenjie
(School of Electronical and Information Engineering, Fuqing Branch of Fujian Normal University, Fuqing 350300, China)
Abstract This paper defines the central Kth moment subspace, and has derived its relationship with CKCMS. In addition, iterative Hessian transformation estimation has been proposed, which is a combination of ordinary least square estimation and principal Hessian directions applied only to the linear condition.
Key words dimension reduction; CKCMS; OLS; PHD; IHT
在高維空間中進行統計建模,往往會碰到“維數災難”(curse of dimensionality)問題,因此降維作為建模之前的數據預處理階段,顯得十分重要.常見的降維方法有主成分回歸分析、偏最小二乘回歸和投影尋蹤等,主成分回歸僅僅考慮了自變量之間的相關信息,忽略了與因變量之間的關系,而偏最小二乘雖然同時考慮自變量與因變量之間相關關系,但是僅僅局限于線性關系,沒有考慮非線性關系,另外投影尋蹤需要估計連接函數,超出數據預處理的范圍.
對于一維響應變量Y和p維解釋變量X=(X1,X2,…,Xp),考慮它們之間的回歸問題本質上是討論在X給定條件下,Y的條件分布FY|X如何隨X變化.Li(1991)[1]提出切片逆回歸(sliced inverse regression,簡稱SIR),即如果存在p×k(k
則FY|X(y|x)=FY|ηTX(y|ηTx),Y對X條件分布是k維的,如果k遠小于p,就達到了降維的目的,特別地,當k=1或2時,便可從可視化角度來分析Y與X之間的回歸關系,由于Y‖X|ηTXY‖X|(ηB)TX,其中B為k階可逆方陣,η與ηB所形成的子空間一樣,所以關心的是span{η},而不是η本身,并稱span{η}為降維子空間.如果滿足(1)的所有η的交集仍然滿足(1),則稱之為中心降維子空間(central dimension reduction subspace,簡稱CS),記為SY|X,rank(SY|X)稱為結構維數.一般來說,在很弱條件下CS總是存在的.有時候感興趣的是E(Y|X),Cook和Li(2002)[2]提出中心均值子空間,即:
類似CS,若所有滿足(2)的……