999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于偏相關(guān)系數(shù)和平行檢驗(yàn)的主成分抽取數(shù)量的確定方法

2011-10-24 06:35:12
統(tǒng)計(jì)與決策 2011年4期
關(guān)鍵詞:方法模型

尹 波

(成都東軟學(xué)院,成都 611481)

基于偏相關(guān)系數(shù)和平行檢驗(yàn)的主成分抽取數(shù)量的確定方法

尹 波

(成都東軟學(xué)院,成都 611481)

主成分抽取數(shù)量的確定是主成分分析中的關(guān)鍵問題。文章提出了一種新確定方法:首先基于原樣本數(shù)據(jù)采用偏相關(guān)系數(shù)準(zhǔn)則來確定主成分抽取的數(shù)量;然后基于再抽樣樣本數(shù)據(jù)來驗(yàn)證主成分?jǐn)?shù)量模型的穩(wěn)定性,并在SPSS環(huán)境下實(shí)現(xiàn)了該方法。實(shí)例應(yīng)用表明該方法相比特征值大于1、Cattle Scree等準(zhǔn)則,結(jié)果更客觀、準(zhǔn)確和穩(wěn)定,可廣泛應(yīng)用于主成分分析、因子分析等相關(guān)研究中。

主成分抽取數(shù)量準(zhǔn)則;特征根大于1;偏相關(guān)系數(shù);平行檢驗(yàn)

0 引言

在管理科學(xué)的研究中,經(jīng)常需要通過問卷調(diào)查等方式來獲得樣本數(shù)據(jù),并對(duì)樣本數(shù)據(jù)進(jìn)行主成分抽取或因子抽?。ㄒ韵陆y(tǒng)稱主成分抽?。r(shí),這里必然要涉及的一個(gè)重要問題就是主成分抽取數(shù)量的確定[1,2,3]。不少研究者常常采用SPSS或SAS軟件包中內(nèi)置的降維模塊來確定主成分抽取的數(shù)量,并進(jìn)而構(gòu)建結(jié)構(gòu)模型。比如SPSS15.0 for Windows中確定主成分抽取數(shù)量的準(zhǔn)則主要有兩個(gè):一是特征根大于1;二是預(yù)先確定要抽取的主成分?jǐn)?shù)量。由于常常預(yù)先難以確定主成分抽取的數(shù)量,國(guó)內(nèi)不少研究者是采用特征根大于1的抽取準(zhǔn)則(Kaiser準(zhǔn)則)[4,5,6,],以《管理世界》為例,2001~2006 年涉及主成分和因子抽取的文章36篇,其中使用Kaiser準(zhǔn)則的32篇。事實(shí)上,Kaiser準(zhǔn)則作為主成分抽取的常用準(zhǔn)則[7],往往過多地抽取主成分[2,3],導(dǎo)致部分主成分難以賦予合適的意義,成為“噪音”;或采用解釋總方差比例(比如大于85%)作為主成分抽取的準(zhǔn)則[8]。這些方法不免主觀和武斷,缺乏足夠的科學(xué)依據(jù)。

由于Kaiser準(zhǔn)則等的不足,國(guó)內(nèi)外不少學(xué)者對(duì)于主成分抽取數(shù)量確定的準(zhǔn)則作了研究和改進(jìn)。比如Cattell Scree準(zhǔn)則,是通過觀察Scree Plot圖形的“肘部”來判斷主成分抽取數(shù)量的一種直觀方法,該準(zhǔn)則可以提高主成分確定數(shù)量的準(zhǔn)確性,但存在的問題是有時(shí)候“肘部”不容易清楚判斷或者有幾個(gè)“肘部”[9];文獻(xiàn)[10、11]在探索性階段預(yù)先確定主成分?jǐn)?shù)量的備選范圍,在驗(yàn)證性階段檢驗(yàn)主成分?jǐn)?shù)量和相應(yīng)結(jié)構(gòu)模型,較好地提高了主成分?jǐn)?shù)量確定的科學(xué)性和相應(yīng)結(jié)構(gòu)模型的穩(wěn)定性,但這些方法還存在以下問題:一是備選主成分?jǐn)?shù)量如何有效確定;二是模型的吻合情況只針對(duì)了樣本數(shù)據(jù),得到的主成分?jǐn)?shù)量模型對(duì)于總體數(shù)據(jù)而言可能有一定甚至較大的偏差。

基于以上研究,本文擬提出確定主成分抽取數(shù)量的新方法:首先基于原樣本數(shù)據(jù)采用Velicer偏相關(guān)系數(shù)準(zhǔn)則來確定主成分抽取的數(shù)量;然后基于再抽樣樣本數(shù)據(jù)采用Horn平行檢驗(yàn)來驗(yàn)證主成分?jǐn)?shù)量模型的穩(wěn)定性,并在SPSS環(huán)境下編程實(shí)現(xiàn)了該方法。該方法將較好地解決文獻(xiàn)[4、5、6、8、10、11]方法中存在的問題,在樣本數(shù)據(jù)一定的情況下,可減少主成分?jǐn)?shù)量模型的系統(tǒng)誤差,提高模型的泛化性和穩(wěn)定性,是對(duì)目前廣為使用的Kaiser準(zhǔn)則等的改進(jìn),可應(yīng)用于主成分分析和因子分析等相關(guān)研究中。

1 主成分抽取數(shù)量確定的方法

主成分抽取的目標(biāo)是以盡可能少的主成分來盡可能充分地反映原樣本空間的信息。主成分?jǐn)?shù)量抽取太少,就難以充分地反映原有信息。主成分抽取數(shù)量過多,反映的原樣本空間信息多,但較多的主成分難以給予恰當(dāng)?shù)谋尘耙饬x?!氨M可能少”的主成分和“盡可能多”信息之間的平衡是主成分抽取的關(guān)鍵和困難所在。這里我們提出確定主成分抽取數(shù)量的新方法,其步驟為:

(1)基于樣本數(shù)據(jù),選擇良好的判斷準(zhǔn)則,確定主成分抽取的數(shù)量。

(2)采用同一總體數(shù)據(jù)中不同樣本數(shù)據(jù),選擇良好的檢驗(yàn)方法,對(duì)(1)所確定的主成分?jǐn)?shù)量模型進(jìn)行檢驗(yàn)。

(3)如檢驗(yàn)通過,主成分?jǐn)?shù)量模型確定;如檢驗(yàn)未通過,尋找其他方法來確定主成分?jǐn)?shù)量。

1.1 基于樣本數(shù)據(jù)的Velicer判別準(zhǔn)則

目前基于樣本數(shù)據(jù)的判別準(zhǔn)則多樣,如Kaiser準(zhǔn)則、Cattle Scree準(zhǔn)則、解釋的總方差比例、Bartlett's Sphericity檢驗(yàn)和Velicer偏相關(guān)系數(shù)等。從算法的理論基礎(chǔ)、目標(biāo)、主成分?jǐn)?shù)量結(jié)構(gòu)的顯著性等方面來考察,不同的準(zhǔn)則有不同的優(yōu)缺點(diǎn),總體而言,Velicer偏相關(guān)系數(shù)作為一種對(duì)于數(shù)據(jù)分布無假設(shè)、統(tǒng)計(jì)計(jì)算量不大的統(tǒng)計(jì)方法,是普遍公認(rèn)的最好方法[12、13],其方法可以表述為:

設(shè)向量矩陣X=(x1,x2,…,xp),從X中抽取m個(gè)主成分Z=(z1,z2,…,zm)。 矩陣[X,Z]的相關(guān)系數(shù)矩陣為這里C11是X的相關(guān)系數(shù)矩陣,C22是Z的相關(guān)系數(shù)矩陣,從向量矩陣 X=(x1,x2,…,xp)中去除 m 個(gè)主成分所得矩陣的相關(guān)系數(shù)矩陣為

這里rij*是矩陣R11*第i行和第j列的元素。當(dāng)fm的值最小時(shí),對(duì)應(yīng)的m的值即抽取的主成分?jǐn)?shù)量,這里m取值從1到p-1。2000年Velicer,W.F.等對(duì)于最小平均平方根偏相關(guān)系數(shù)準(zhǔn)則進(jìn)行了改進(jìn),提出了最小平均1/4次方偏相關(guān)系數(shù)準(zhǔn)則,基于真實(shí)數(shù)據(jù)和仿真數(shù)據(jù)的研究表明兩種最小平均偏相關(guān)系數(shù)檢驗(yàn)結(jié)果極其相似,但后者更加準(zhǔn)確和靈敏[14]。

1.2 基于同一總體數(shù)據(jù)中不同樣本數(shù)據(jù)的檢驗(yàn)

如果樣本數(shù)據(jù)充分,我們可以從全體樣本數(shù)據(jù)中隨機(jī)抽取一些樣本數(shù)據(jù)用于主成分分析來確定抽取的主成分?jǐn)?shù)量(通常是總樣本數(shù)據(jù)的2/3),另外一部分?jǐn)?shù)據(jù)用于主成分?jǐn)?shù)量模型的檢驗(yàn)。實(shí)際應(yīng)用中,通常樣本數(shù)據(jù)較少,因此需要我們采用Bootstrap方法產(chǎn)生再抽樣數(shù)據(jù)進(jìn)行主成分?jǐn)?shù)量模型的檢驗(yàn)。

基于再抽樣樣本數(shù)據(jù)的檢驗(yàn)方法我們選擇Horn平行檢驗(yàn)。Horn平行檢驗(yàn)首先計(jì)算再抽樣樣本集合的特征值的平均值λmean,并與基于原樣本數(shù)據(jù)的特征值λraw分布相比較,觀察λraw≥λmean,對(duì)應(yīng)的主成分?jǐn)?shù)量的最大值就是最優(yōu)決策;進(jìn)一步考慮在 95%置信區(qū)間下的 λm,比較 λm與 λraw,觀察 λraw≥λm,對(duì)應(yīng)的主成分?jǐn)?shù)量的最大值就是更穩(wěn)定的主成分?jǐn)?shù)量決策[15、16],這也是美國(guó)教育與心理測(cè)量雜志大力推廣的確定主成分抽取數(shù)量的方法[17]。這個(gè)方法的缺點(diǎn)是再抽樣數(shù)據(jù)在某種意義上而言是偽數(shù)據(jù),特別是當(dāng)抽樣調(diào)查方法不盡科學(xué)合理時(shí),數(shù)據(jù)的偏差會(huì)更大。單一使用Horn平行檢驗(yàn)來確定主成分抽取的數(shù)量有較大的樣本風(fēng)險(xiǎn),因此我們僅僅使用Horn平行檢驗(yàn)來驗(yàn)證基于原樣本數(shù)據(jù)所確定的主成分?jǐn)?shù)量模型。

1.3 檢驗(yàn)通過或未通過的情形

如檢驗(yàn)通過,主成分?jǐn)?shù)量模型確定;如檢驗(yàn)未通過,需要尋找其他方法,如Bootstrap Bias Corrected and Accelerated(BCa)等更復(fù)雜的模型來尋找最優(yōu)解[18,19]。

綜合1.1,1.2,1.3所述,我們確定主成分抽取數(shù)量的方法為:

(1)基于樣本數(shù)據(jù),選擇Velicer偏相關(guān)系數(shù)準(zhǔn)則,確定主成分抽取的數(shù)量。

(2)基于Bootstrap再抽樣樣本數(shù)據(jù),選擇Horn平行檢驗(yàn),對(duì)(1)確定的主成分?jǐn)?shù)量模型 進(jìn)行檢驗(yàn)。

(3)如檢驗(yàn)通過,主成分?jǐn)?shù)量模型確定;即同時(shí)滿足公式(3)、(4)的解為要抽取的主成分?jǐn)?shù)量。

這里λi是基于原樣本數(shù)據(jù)的第i個(gè)特征值,LSi是對(duì)應(yīng)第i個(gè)特征值的基于Bootstrap再抽樣數(shù)據(jù)的特征根均值或95%的置信區(qū)間的統(tǒng)計(jì)值等。如聯(lián)立公式(3)、(4)無解,需要尋求其他方法如BCa等來確定主成分抽取數(shù)量。

由于Kaiser準(zhǔn)則、Cattle Scree準(zhǔn)則、解釋的總方差比例等都可以通過統(tǒng)計(jì)軟件SPSS來實(shí)現(xiàn),因此我們選擇在SPSS環(huán)境下編程實(shí)現(xiàn)Velicer偏相關(guān)系數(shù)準(zhǔn)則和Horn平行檢驗(yàn)來完整實(shí)現(xiàn)該方法。

接下來,我們應(yīng)用這一方法對(duì)筆者的一次國(guó)際酒店企業(yè)文化調(diào)查問卷確定需要抽取的主成分抽數(shù)量,并與Kaiser準(zhǔn)則、Scree碎石準(zhǔn)則、解釋的總方差比例等通行方法做一個(gè)比較,以檢驗(yàn)該方法的可行性和有效性。

2 應(yīng)用

2006~2007年期間筆者對(duì)成都一國(guó)際酒店進(jìn)行了一次企業(yè)文化問卷調(diào)查。調(diào)查問卷發(fā)放過程中盡可能覆蓋各個(gè)部門,不同年齡、不同性別和不同層次等等,得到一個(gè)50×15的樣本矩陣。在對(duì)問卷調(diào)查進(jìn)行主成分分析前,首先我們觀察變量間相關(guān)系數(shù)矩陣(Correlation Matrix),可知不少變量之間存在高度相關(guān);其次觀測(cè)KMO值和 Bartlett球型檢驗(yàn)情況,KMO值為0.869,說明目前的變量能夠較好地被主成分所解釋。Bartlett Sphercity檢驗(yàn)拒絕單位矩陣的假設(shè),檢驗(yàn)結(jié)果表明問卷數(shù)據(jù)適合做主成分分析。

表1 Velicer偏相關(guān)系數(shù)

表2 原樣本數(shù)據(jù)特征值&再抽樣樣本數(shù)據(jù)特征值均值 &95%置信區(qū)間下的特征值均值

2.1 基于樣本數(shù)據(jù)的主成分抽取數(shù)量的確定

我們采用Velicer 偏相關(guān)系數(shù)準(zhǔn)則來求解主成分?jǐn)?shù)量,結(jié)果如表1所示。最小平均平方根偏相關(guān)系數(shù)是0.0404,抽取的主成分?jǐn)?shù)量為 2;最小平均1/4次方偏相關(guān)系數(shù)是0.0048,也說明抽取的主成分?jǐn)?shù)量應(yīng)為2。

圖1 基于原樣本數(shù)據(jù)和再抽樣樣本數(shù)據(jù)的主成分?jǐn)?shù)量

2.2 基于再抽樣樣本數(shù)據(jù)的檢驗(yàn)

本文采用Bootstrap方法生成再抽樣樣本數(shù)據(jù)1000組,應(yīng)用Horn平行檢驗(yàn)來加以驗(yàn)證,結(jié)果如表2和圖1所示。

基于1000組再抽樣樣本數(shù)據(jù),確定應(yīng)抽取2個(gè)主成分。檢驗(yàn)結(jié)果表明:基于原樣本數(shù)據(jù)的Velicer偏相關(guān)系數(shù)準(zhǔn)則所確定的主成分?jǐn)?shù)量模型(2個(gè)主成分)具有良好的穩(wěn)定性和泛化性。另外圖1中的RAWDATA曲線就是Scree Plot圖,從該曲線可以觀察出,曲線的肘部在主成分?jǐn)?shù)量為2處;如采用Kaiser準(zhǔn)則,應(yīng)抽取5個(gè)主成分。進(jìn)一步驗(yàn)證了文獻(xiàn)[2、3]等指出的kaiser法則過多抽取主成分和文獻(xiàn)[2、12、13]等指出的基于樣本數(shù)據(jù)的判別準(zhǔn)則Velicer偏相關(guān)系數(shù)是最好的結(jié)論。綜合以上分析,可以得到表3。

表3 不同判斷準(zhǔn)則得出的主成分?jǐn)?shù)量①限于篇幅,特征根解釋的總方差比例直接給出。

3 結(jié)論

本文針對(duì)當(dāng)前主成分抽取數(shù)量確定方法中廣泛使用的特征值大于1、解釋的總方差比例、Cattle Scree等準(zhǔn)則所存在的一些不足,提出了一種新的確定方法。該方法首先基于樣本數(shù)據(jù)采用Velicer偏相關(guān)系數(shù)準(zhǔn)則來確定主成分抽取的數(shù)量,然后基于Bootstrap再抽樣數(shù)據(jù)采用Horn平行檢驗(yàn)來驗(yàn)證主成分?jǐn)?shù)量模型的穩(wěn)定性,并在SPSS環(huán)境下實(shí)現(xiàn)了該方法。

本文應(yīng)用該方法對(duì)筆者的一次國(guó)際酒店企業(yè)文化調(diào)查問卷確定主成分抽取的數(shù)量,結(jié)果表明相比特征值大于1、解釋的總方差比例、Cattle Scree等方法,本文所得結(jié)論更客觀、準(zhǔn)確和泛化;進(jìn)一步支持文獻(xiàn)研究關(guān)于Kaiser準(zhǔn)則過多抽取主成分的結(jié)論。

本文提出的方法是對(duì)目前特征值大于1等準(zhǔn)則的改進(jìn),可廣泛應(yīng)用于主成分分析、因子分析等相關(guān)研究中。

[1]Franklin,S.,Gibson,D.,Robertson,P.,Pohlmann,J.,Fralish,J.Parallel Analysis:A Method for Determining Significant Components[J].Journal of Vegetation Science,1995,(1).

[2]Jackson D.Stopping Rules in Principal Components Analysis:a Comparison of Heuristical and Statistical Approaches[J].Ecology,1993,(8).

[3]Rencher,A.Multivariate Statistical Inference and Applications[M].New York:John Wiley&Sons Inc,1998.

[4]王國(guó)順,張仕璟,邵留國(guó).企業(yè)文化測(cè)量模型研究——基于Dension模型的改進(jìn)及實(shí)證[J].中國(guó)軟科學(xué),2006,(3).

[5]任勝鋼,彭建華.基于因子分析法的中國(guó)區(qū)域創(chuàng)新能力的評(píng)價(jià)及比較[J].系統(tǒng)工程,2007,(2).

[6]黃善東,楊淑娥.公司治理與財(cái)務(wù)困境預(yù)測(cè)[J].預(yù)測(cè),2007,(2).

[7]Kaiser,H.F.The Application of Electronic Computers to Factor Analysis[J].Educational and Psychological Measurement,1960,(1).

[8]賀穎.2001~2004年中國(guó)管理類期刊學(xué)術(shù)影響力綜合評(píng)價(jià)[J].中國(guó)軟科學(xué),2007,(1).

[9]Cattell B.The Scree Test for the Number of Factors[J].Multivariate Behavioral Research,1966,(2).

[10]柯江林,孫鍵敏,石金濤,顧琴軒.企業(yè)R&D 團(tuán)隊(duì)之社會(huì)資本與團(tuán)隊(duì)效能關(guān)系的實(shí)證研究[J].管理世界,2007,(3).

[11]唐炎華,石金濤.我國(guó)知識(shí)型員工知識(shí)轉(zhuǎn)移的動(dòng)機(jī)實(shí)證研究[J].管理工程學(xué)報(bào),2007,(1).

[12]Velicer W.Determining the Number of Principal Components from the Matrix of Partial Correlations[J].Psychometrika,1976,(3).

[13]Ferre L.Selection of Components in Principal Component Analysis:A Comparison of Methods[J].Computational Statistics and Data Analysis,1995,(6).

[14]Vellcer,W.F.,Eaton,C.A.,Fava,J.L.Construct Explication Through Factor or Component Analysis:A Review and Evaluation of Alternative Procedures for Determining the Number of Factors or Components[A].Problems and Solutions in Human Assessment[M].Boston:Kluwer,2000.

[15]John L.,Horn.A Rationale and Test for the Number of Factors in Factor Analysis[J].Psychometrica,1965,(2).

[16]Glorfeld,L.W.An Improvement on Horn’s Parallel Analysis Methodology for Selecting the Correct Number of Factors to Retain[J].Educational and Psychological Measurement,1995,(3).

[17]Thompson,B.,Daniel,L.G.Factor Analytic Evidence for the Construct Validity of Scores:A Historical Overview and Some Guidelines[J].Educational and Psychological Measurement,1996,(2).

[18]Efron,B.Better Bootstrap Confidence Intervals[J].Journal of the American Statistical Association,1987,(3).

[19]Hall,P.Theoretical Comparison of Bootstrap Confidence Intervals[J].The Annals of Statistics,1988,(3).

F222

A

1002-6487(2011)04-0007-03

尹 波(1971-),男,江西吉安人,博士,教授,研究方向:組織文化與計(jì)量管理。

(責(zé)任編輯/亦 民)

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
學(xué)習(xí)方法
3D打印中的模型分割與打包
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: a毛片在线| 手机永久AV在线播放| 国产成人综合日韩精品无码不卡| 午夜激情福利视频| 成人福利在线视频| 国产精品999在线| 91精品福利自产拍在线观看| 青青热久麻豆精品视频在线观看| 日韩精品一区二区三区免费在线观看| 国产在线小视频| 亚洲日本一本dvd高清| 亚洲无码一区在线观看| 无码内射在线| 国产一区二区三区精品久久呦| 18禁色诱爆乳网站| 欧美国产视频| 国产人妖视频一区在线观看| 国产亚洲精品自在线| 国产原创演绎剧情有字幕的| 一本综合久久| 亚洲精品国产成人7777| AV网站中文| 国产精品真实对白精彩久久 | 18禁影院亚洲专区| 中国精品久久| 99久久婷婷国产综合精| 麻豆国产精品视频| 综合网天天| 国产精品网拍在线| 激情無極限的亚洲一区免费| 久久国产成人精品国产成人亚洲| 午夜国产在线观看| 看看一级毛片| 国产极品嫩模在线观看91| 美女黄网十八禁免费看| 国产综合色在线视频播放线视| 亚洲日韩精品欧美中文字幕| 精品伊人久久久大香线蕉欧美| 97se亚洲| 天堂亚洲网| 婷婷亚洲天堂| 亚洲精品在线观看91| 国产在线八区| 波多野结衣国产精品| 亚洲狼网站狼狼鲁亚洲下载| 国产乱人伦AV在线A| 国产福利不卡视频| 毛片在线播放网址| 国产xx在线观看| 国内精品久久久久久久久久影视| 国产99欧美精品久久精品久久| 91无码人妻精品一区二区蜜桃| 日韩av在线直播| 98精品全国免费观看视频| 巨熟乳波霸若妻中文观看免费 | 国产在线视频自拍| 欧美成人综合视频| 一级全黄毛片| 亚洲国产91人成在线| 国产成年女人特黄特色大片免费| 国产成人无码Av在线播放无广告| 久久人与动人物A级毛片| 国产福利不卡视频| 亚洲欧美激情小说另类| 国产玖玖视频| 第一页亚洲| 午夜视频www| 国产香蕉在线视频| 456亚洲人成高清在线| 色老二精品视频在线观看| 久久精品66| 色AV色 综合网站| 色婷婷亚洲综合五月| 青草娱乐极品免费视频| 国产成人精品第一区二区| 奇米影视狠狠精品7777| 91国内外精品自在线播放| 国产九九精品视频| 国内视频精品| 国产国语一级毛片在线视频| 久久综合一个色综合网| 国产女人综合久久精品视|