孫玲玲


【摘 要】主成分分析法與因子分析法都是尋找各變量之間的共性因素的統計方法。本文通過案例研究,分別用主成分分析法與因子分析法對案例進行分析,得出兩種方法之間具有密切的聯系。
【關鍵詞】主成分分析;因子分析;多元統計方法;公因子
中圖分類號: G642.0 文獻標識碼: A 文章編號: 2095-2457(2018)21-0226-002
DOI:10.19694/j.cnki.issn2095-2457.2018.21.104
【Abstract】The principal component analysis and the factor analysis are statistical methods to find the common factors among the variables.In this paper,we study the case by the methods of principal component analysis method and the factor analysis method,and we obtain that there are close relationship between the two methods.
【Key words】Principal component analysis;Factor analysis;Multiple statistical methods;Common factor
0 前言
主成分分析法與因子分析法是醫學研究中的常用統計分析方法,其中王文博[1]探討了多指標綜合評價中主成分分析與因子分析方法中的比較,龔燕冰[2]研究了因子分析法在臨床中的應用,林海明[3]、熊志斌[4]研究了主成分分析法在綜合評價中應注意的問題。本文主要應用兩種分析方法得出兒童心臟生長發育的各項指標中起主要作用的指標。
1 主成分分析法與因子分析法的介紹
主成分分析是運用降低原始變量維度的方法,將n個變量指標化為p個互不相關的綜合指標的統計方法,其中0
設有n個指標Y1,Y2,…,Yn欲尋找可以概括這幾個指標的主要信息綜合指標W1,W2,…,Wn即尋找一組常數ki1,ki2,…,kin,i=1,2,…,n使這n個指標的線性組合:
因子分析是在主成分分析的基礎上進行推廣,在(1)式中,找出起主要作用的綜合因子,使得這些因子在每個原始指標上的公共度都達到較為滿意的水。因子分析法仍需對各原始數據標準化,求出相關系數矩陣RX如下:
將相關矩陣的對角元換為公因子方差h2i即得約相關矩陣R*,此時當h2i=1,則Rx=R*,相應的解即為主成分解,與主成分分析的結果完全一致,此時的主成分即是公因子;若h2i≠1,則相應的解為主因子解,此時需要先估計的h2i值,一般地,h2i取RX第i行上各相關系數絕對值的最大值(主對角元除外),即得約相關矩陣
進一步求出因子載荷陣。
本文以下述案例為主,討論主成分分析法、因子分析法在醫學研究中的應用。
案例:某研究者在兒童生長發育調查中測量了許多指標,其中關于心臟的指標為心臟橫徑Y1、心臟縱徑Y2、心臟寬徑Y3、胸腔橫徑Y4和心臟面積Y5,具體數據見下表:
2 主成分分析法相關結果
由總方差解釋陣可知,只有第一個特征值為4.229大于1,故保留第一個特征值,此時累計貢獻率為84.573%,接近85%。
此時主成分的表達式如下:
由主成分分析對樣本進行綜合評價,相應的得分為:
一般地,綜合評分越高,則表明該樣本的綜合效果越好,例如:原序號32的綜合評價值為3.05,總分最高,即該兒童的心臟發育總體水平最好;當綜合評價值為負數時,這不一定說明該兒童心臟不正常,此時僅表示該兒童的心臟發育水平與這33名兒童的水平位置關系,所以出現負數是由于將原始指標值標準化的緣故。
3 因子分析法相關結果
當h2i=1時,Rx=R*,相應的解即為主成分解,與主成分分析的結果完全一致,其中碎石圖如下:
由碎石圖知,在第二個特征值處發生轉折,之后較為平穩,由特征值的選取原理,完全符合理論原則,即只需選擇第一個特征值。
當h2i≠1,則相應的解為主因子解,此時計算出R*的特征值仍然只有第一個特征值大于1,故保留該特征值,其貢獻率與主成分分析法一致,接近85%,說明第一主成分概括了原始指標值的綜合信息。當用因子分析法求得的公因子的專業意義不清楚時,可以通過因子旋轉的方法來解決,此案例中,因子分析的結果顯示公因子第一主成分已經能夠很好地反映個指標所包含的大部分信息,故無需做因子旋轉。
4 結語
由以上分析可知,因子分析是在主成分分析的基礎上進行推廣,因子分析的解與約相關矩陣由關,當約相關矩陣取法不唯一時,因子分析的解也不唯;當約相關矩陣與相關矩陣相同時,因子分析法的解與主成分分析法的解完全一致。兩種方法都能很好地反映各指標的綜合信息,是醫學研究的重要統計分析方法。
【參考文獻】
[1]王文博,陳秀芝.多指標綜合評價中主成分分析和因子分析方法的比較[J].統計與信息論壇,2006(05):19-22.
[2]龔燕冰,羅增剛,高思華,倪青,易丹輝,謝雁鳴,王永炎.運用因子分析方法探索2型糖尿病證候要素及其靶位特征[J].中醫雜志,2011,52(13):1100-110
[3]林海明,杜子芳.主成分分析綜合評價應該注意的問題[J].統計研究,2013,30(08):25-31.
[4]熊志斌.基于非線性主成分分析的信用評估模型研究[J].數量經濟技術經濟研究,2013,30(10):138-150.
[5]趙耐青.醫學統計學.第2版.人民衛生出版社,2005:423-440.