999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Stein嶺型主成分估計下多個數(shù)據(jù)刪除模型的強影響分析

2015-12-08 03:42:45朱寧嚴冠東劉慶華
汕頭大學學報(自然科學版) 2015年2期
關(guān)鍵詞:影響模型

朱寧,嚴冠東,劉慶華

(桂林電子科技大學數(shù)學與計算科學學院,廣西桂林541004)

Stein嶺型主成分估計下多個數(shù)據(jù)刪除模型的強影響分析

朱寧,嚴冠東,劉慶華

(桂林電子科技大學數(shù)學與計算科學學院,廣西桂林541004)

基于Stein嶺型主成分估計下研究多個數(shù)據(jù)刪除模型,探討數(shù)據(jù)刪除模型估計量的有關(guān)性質(zhì),并給出了多個數(shù)據(jù)刪除模型的CRi統(tǒng)計量、APi統(tǒng)計量、Di統(tǒng)計量的新表達式.

Stein嶺型主成分估計;多個數(shù)據(jù)刪除模型;多個強影響點;診斷統(tǒng)計量

0 引言

考慮一般線性模型:

其中,y為n×1階觀測向量,X為n×p階列滿秩設(shè)計陣,β為p×q階未知參數(shù)向量,ε為n×1階隨機誤差,I為n階單位矩陣.

在統(tǒng)計診斷中,通常需要尋找和判斷對回歸系數(shù)影響較大的數(shù)據(jù)點,如果刪除這些強影響點,回歸模型的系數(shù)會受到很大影響,數(shù)值會發(fā)生較大變化.這時候需要檢驗是人為因素造成還是數(shù)據(jù)集本身造成的.解決這類問題的方法,在統(tǒng)計診斷學中稱為影響分析.為了研究數(shù)據(jù)集每組數(shù)據(jù)點對模型的影響程度大小,為此通常采用數(shù)據(jù)刪除模型.

記i的m個指標集為J={i1,i2,…,im},對于模型(1)中,把J中的指標對應(yīng)的數(shù)據(jù)刪除以后,與模型(1)相對應(yīng)的數(shù)據(jù)刪除模型的各個量分別記為X(J),y(J)和ε(J),其中y(J)和ε(J)為(n-m)維向量,X(J)為(n-m)×p階矩陣,則此時的數(shù)據(jù)刪除模型表示為

此時的最小二乘估計為

文獻[1]在最小二乘估計下討論數(shù)據(jù)刪除模型的影響度量矩陣和高杠桿點度量;文獻

[2]在廣義嶺估計下討論刪除單個點數(shù)據(jù)刪除模型的影響度量和高杠桿點度量;文獻[3]在廣義嶺估計下討論刪除單個點數(shù)據(jù)刪除模型的影響度量和高杠桿點度量.本文在前人基礎(chǔ)上,推廣到刪除多個數(shù)據(jù)點數(shù)據(jù)刪除模型,定義新的影響度量矩陣HJ和數(shù)據(jù)刪除模型高杠桿點度量意義,同時把文獻的結(jié)論推廣到一般形式.

1 主要結(jié)果

考慮模型(1)和(2)定義新的影響度量矩陣為

其中XJ為刪除數(shù)據(jù)矩陣.顯然HJ為m×m階矩陣,它的元素為

當i,k埸J時,所有的hik正好構(gòu)成了模型(2)的帽子矩陣,即

可得

首先給出引理1.

引理1[4]在模型(1)下提出了未知參數(shù)β的Stein嶺型主成分估計,即在嶺-壓縮組合估計的基礎(chǔ)上再進行Stein估計,叫做Stein嶺型主成分估計(有偏嶺-壓縮組合估計),記作:,

其中,

證明:

性質(zhì)2在線性模型y=Xβ+ε,ε~N(0,σ2I),刪除數(shù)據(jù)集J={i1,i2,…,im}得到模型y(J)=X(J)β(J)+ε(J),由Stein嶺型主成分估計,則y贊J可以表示為和yJ的線性組合.

證明:

性質(zhì)3在線性模型y=Xβ+ε,ε~N(0,σ2I),刪除數(shù)據(jù)集J={i1,i2,…,im}得到模型y(J)=X(J)β(J)+ε(J),由表示數(shù)據(jù)刪除模型未知參數(shù)β的Stein嶺型主成分估計,則刪除數(shù)據(jù)集J={i1,i2,…,im}的預(yù)測殘差和普通殘差的關(guān)系有:

性質(zhì)4線性模型y=Xβ+ε,ε~N(0,σ2I),刪除數(shù)據(jù)集J={i1,i2,…,im}得到模型y(J)=

當刪除了數(shù)據(jù)集J中m個點時,相對應(yīng)的HJ就是一個高杠桿點度量,HJ越大,刪除后的數(shù)據(jù)對原模型的影響就越大.

在多個數(shù)據(jù)刪除模型中,為了研究數(shù)據(jù)集與模型的擬合程度,下面對Hii(J)進行探討,當矩陣X有一列為常數(shù)1時,考慮

其中1為所有元素為1的相應(yīng)維數(shù)的列向量.

從上述內(nèi)容可以看出,若刪除m個數(shù)據(jù)點后,其他樣本點中心的距離越遠,Hii(J)越大,因而Hii(J)是一個度量m個數(shù)據(jù)點對模型影響大小的統(tǒng)計量,我們定義為高杠桿值.

所以,性質(zhì)5是把單個數(shù)據(jù)刪除模型推廣到m個數(shù)據(jù)刪除模型的高杠桿度量的一般情況.

2 統(tǒng)計量

2.1 PRESS統(tǒng)計量

Allen[5](1971)提出PRESS統(tǒng)計量,用來度量模型擬合的好壞.

2.2 協(xié)方差比統(tǒng)計量

性質(zhì)4在Stein嶺型主成分估計下,協(xié)方差比統(tǒng)計量

引理2[7]模型Y(J)=X(J)β(J)+ε(J)中β和σ2的最小二乘估計與模型(1)的相應(yīng)估計有如下關(guān)系:,其中.

由于

2.3 AP統(tǒng)計量

AP統(tǒng)計量是由Andrew,D.F.和Pregibon,D.[8]提出的,在協(xié)方差比的基礎(chǔ)上進一步考慮對的影響.Drape和John[9]對AP統(tǒng)計量進行分解,提出探測異常點的統(tǒng)計量新形式.

引理3[7]模型y(J)=X(J)β(J)+ε(J)中β和σ2的最小二乘估計與模型(1)的相應(yīng)估計有如下關(guān)系:.

證明:

結(jié)論得證.

定理2設(shè)X**=(X*,Y),X*=(X,Y),則AP統(tǒng)計量可以表示為

2.4 Cook統(tǒng)計量

Cook統(tǒng)計量是Cook[10](1977)提出Cook統(tǒng)計量作為度量第i個數(shù)據(jù)點影響大小的數(shù)量指標.

引理4[7]廣義Cook統(tǒng)計量為.

定義3在Stein嶺型主成分估計下,定義Cook統(tǒng)計量為

定理3在Stein嶺型主成分估計下,Cook統(tǒng)計量可表示為.

證明:

推論在Stein嶺型主成分估計下,Cook統(tǒng)計量可表示為

證明:由引理和定理3可得,

[1]楊虎,邵華.線性回歸診斷中的高杠桿點度量[J].工程數(shù)學學報,2009,26(1):123-132.

[2]錢峰,石麗娟.數(shù)據(jù)刪除模型對于廣義嶺估計的影響[J].南通大學學報:自然科學版,2008,7(1):75-78.

[3]朱寧,黃黎平,李紹波,等.數(shù)據(jù)刪除模型下的高杠桿點度量[J].統(tǒng)計與決策,2012(5):32-34.

[4]朱寧,李建軍,李兵.一種有偏嶺-壓縮組合估計的新形式[C]//曾玲,劉克.第八屆中國青年運籌信息管理學者大會論文集.桂林:桂林電子科技大學,2006:287-290.

[5]Allen D M.Mean square error of prediction as a criterion for selecting variables[J].Technometrics,1971,13(3):469-475.

[6]張堯庭,方開泰.多元統(tǒng)計分析引論[M].北京:科學出版社,1982.

[7]韋博成.統(tǒng)計診斷引論[M].南京:東南大學出版社,1991.

[8]Andrews D F,Pregibon D.Finding the outliers that matter[J].J R Statist Soc B,1978,40:87-93.

[9]Draper N R,John J A.Influence observations and outliers in regression[J].Technometrics,1981,23(1):21-26.

[10]Cook R D.Detection of influential observations in linear regression[J].Technometrics,1977,42(1):65-68.

Strong Im pact Analysis of M ultip le Data Delete M odel Based on Stein Ridge and Principal Com ponents Estimator

ZHU Ning,YAN Guandong,LIU Qinghua
(School of Mathematics and Computing Science,Guilin University of Electronic Technology, Guilin 541004,Guangxi,China)

Strong impact analysis of multiple data delete model based on stein ridge and principal components estimator is studied.A strong impact on the analysis model under biased estimator is proposed.The property of estimators of the data deletion model is also discussed.Besides,the new expressions of CRi,APiand Dibased on multiple data delete model,are given.

stein ridge and principal components estimate;multiple data deletion model;multiple influential point;diagnostic statistics

O 212.1

A

1001-4217(2015)02-0020-08

2014-10-13

朱寧(1957-),男,湖南寧鄉(xiāng)人,教授,研究方向:線性統(tǒng)計模型.E-mail:znqx@guet.edu.cn

桂林電子科技大學研究生創(chuàng)新項目(GDYCSZ201471)

猜你喜歡
影響模型
一半模型
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
沒錯,痛經(jīng)有時也會影響懷孕
媽媽寶寶(2017年3期)2017-02-21 01:22:28
3D打印中的模型分割與打包
擴鏈劑聯(lián)用對PETG擴鏈反應(yīng)與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
基于Simulink的跟蹤干擾對跳頻通信的影響
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 九九香蕉视频| 久久不卡国产精品无码| 精品自拍视频在线观看| 国内精品视频在线| 毛片久久久| 国产色伊人| 国产呦精品一区二区三区网站| 欧美、日韩、国产综合一区| 国产成人高清亚洲一区久久| 国产毛片一区| 国产成人艳妇AA视频在线| 亚洲美女一区| 91精品小视频| 91麻豆久久久| 亚洲男人天堂久久| 国产手机在线观看| 五月丁香伊人啪啪手机免费观看| 国产综合色在线视频播放线视| 亚洲码在线中文在线观看| 国产拍在线| 国产日韩精品欧美一区喷| 亚洲高清日韩heyzo| 欧美亚洲日韩不卡在线在线观看| 亚洲精品无码日韩国产不卡| 91九色最新地址| 国产成人综合亚洲网址| 亚洲小视频网站| 92精品国产自产在线观看| 91啪在线| 国产一级妓女av网站| 老司机精品久久| 在线看片中文字幕| 无码丝袜人妻| a国产精品| 广东一级毛片| 国产十八禁在线观看免费| 日本不卡在线| 日韩精品毛片| 国产99精品久久| 老色鬼久久亚洲AV综合| 亚洲一级毛片在线观播放| 亚洲综合狠狠| 国产精品对白刺激| 中文字幕 91| 久久久久九九精品影院 | 日本欧美视频在线观看| 四虎永久在线| 精品国产99久久| 性色在线视频精品| 丁香五月激情图片| 久久综合伊人 六十路| 免费人成黄页在线观看国产| 九九这里只有精品视频| 操美女免费网站| 亚洲国产成人久久精品软件| 再看日本中文字幕在线观看| 亚洲专区一区二区在线观看| 成人精品在线观看| 日韩精品一区二区深田咏美| 中文字幕在线永久在线视频2020| 免费a在线观看播放| av一区二区无码在线| 在线a网站| 亚洲最大看欧美片网站地址| 美女无遮挡免费网站| 91久草视频| 成人亚洲国产| 在线免费不卡视频| 日本午夜在线视频| 欧美日本中文| 在线va视频| 国产欧美日韩精品综合在线| 98超碰在线观看| 成人福利在线视频免费观看| 午夜激情婷婷| 国产精品内射视频| 色天天综合久久久久综合片| 欧美19综合中文字幕| 国产成人精彩在线视频50| 亚洲国产天堂久久九九九| 免费国产黄线在线观看| 亚洲欧美一区在线|