郝瑞 張悅
【摘要】在股票投資市場不斷發展的今天,由于各種限制因素,可供廣大投資者選擇的價值投資方式都存在不同程度上的缺陷。本文選擇滬深300指數成分股作為樣本,運用SPSS軟件因子分析與聚類分析的方法將樣本股票排名、分組,對排名高低與各個分組的股票進行了特征分析,以此探索出了一種新的股票基本面分析方法,可以在較低維度綜合考慮若干股票分析指標,并把股票分類,適應不同偏好的廣大投資者的投資需求。
【關鍵詞】因子分析 聚類分析 股票分析方法
一、引言
隨著中國金融市場的發展,股票投資在中國早已成為了廣大投資者投資組合的重要組成部分。但是,散戶投資者由于信息成本等原因大多更多的側重于技術分析,一定程度上忽視了基本面分析;其次,西方現代股票定價理論如CAPM、Fama-French三因子模型、APT理論、MM理論,甚至DCF現金流貼現法都存在著各自不容忽視的不足,以及欠缺在實踐中的可行性;再次,國內機構投資者的選股理論存在較高運行成本或初始投資要求,散戶投資者難以采用;國內目前實際中廣泛采用的價值投資方法為主觀賦權法,但此方法需要考慮的財務指標與財務數據很多,人為給定的權數客觀性較弱會影響模型的準確性,也不適合散戶投資者運用。基于以上的原因,提供出一個適用于新時代背景下證券投資市場的證券分析方法具有充足的必要性。
本文將分析樣本定為滬深300指數成分股,運用資產總計、產權比率、每股收益等十個指標進行因子分析,將原有十個指標降維成三個公共因子,然后基于降維后的數據,采用聚類分析的方法對樣本股票進行分類處理,得到具有不同特征的股票分類,最后構造出一個在更低維度下綜合考慮多項價值分析指標的適用于具有不同偏好的投資者的股票分析方法。
二、數據來源與處理
本文的研究樣本為滬深300指數的三百只成分股,數據來源為Wind數據庫中相應股票2013財年年度業績報告數據,原始數據矩陣從略。為了數據的可參考性,對樣本中的唯一一只ST股票“*ST大荒”進行了剔除。原因為該股票的利潤總額與凈利潤兩項指標均為負,且都是非常大的異常值,會對因子分析的結果產生顯著的負面影響。
本文初始使用的十個股票基本面分析指標如下:
表1 因子分析模型指標
三、多變量方法
根據何曉群[1],因子分析主要用于對指標降維,聚類分析主要用于對樣品分類。本文利用因子分析和聚類分析來構建股票分析方法。下面對這兩種多變量統計分析方法作簡要介紹。
(一)因子分析
因子分析模型是利用降維的思想,由研究原始變量相關矩陣內部的依賴關系出發,把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法。最早由英國心理學家C.E.斯皮爾曼提出。他發現學生的各科成績之間存在著一定的相關性,單科成績好的學生,往往其他各科成績也比較好,從而推想是否存在某些潛在的共性因子,或稱某些一般智力條件影響著學生的學習成績。因子分析可在許多變量中找出隱藏的具有代表性的因子。將相同本質的變量歸入一個因子,可減少變量數目,還可檢驗變量間具有某種潛在關系的假設。
設原有p個變量,…,且每個變量(或經標準化處理)的均值為0,標準差均為1。現將每個原有變量用m(m
X
=a
F
+a
F+…
+a
F+
ε
X
=a
F
+a
F+…
+a
F+ε
……………………………………
X
=a
F
+a
F+…
+a
F+
ε
也可用矩陣形式表示為:
X=AF+ε
其中:
A=
F稱為X的公共因子,矩陣A中的元素稱為因子載荷,的絕對值大,表明與的相依程度越大,或稱公共因子對于的載荷量越大,ε稱為特殊因子,表示了原有變量不能被因子解釋的部分。
因子分析模型的建立步驟大致為:
第一,建立指標體系,構成原始矩陣Z,在保證全部指標同向化的基礎上對樣本數據進行標準化處理,公式如下:
Z=(i=1,2,...,p;j=1,2,...,n)
=X,S=(X-)(i=1,2,...,p;j=1,2,...,n)
得到標準化矩陣,計算變量的簡單相關系數矩陣R。
第二,解特征方程|R-λE|=0,計算相關矩陣的特征值λ,若
λ1≥λ2≥…λp,以λp≥1為標準確定公共因子個數P。
第三,計算初始因子載荷矩陣和公共因子方差,用正交或斜交旋轉的方法求得正交或斜交因子載荷矩陣;根據正交或斜交因子載荷矩陣相關系數絕對值,確定并命名公共因子。
最后,計算公共因子得分和綜合得分。在最小二乘法的意義下,可以得到F的估計值:
=A'R-1X
式中,A為因子載荷矩陣,R為原始變量的相關陣,S為原始變量向量。
根據各因子的方差貢獻率占p個因子總方差貢獻率的比重作為權重進行加權匯總,得出各樣本的綜合得分。
(二)聚類分析
聚類分析是一種多元統計方法,它將個體或對象分類,使得同一類中的對象之間的相似性比與其他類的對象的相似性更強。目的在于使類間對象的同質性最大化和類與類間對象的異質性最大化。
我們認為,所研究的樣品或指標(變量)之間是存在著程度不同的相似性(親疏關系)。于是根據一批樣品的多個觀測指標,具體找出一些能夠度量樣品或指標之間的相似程度的統計量,以這些統計量為劃分類型的依據,把一些相似程度較大的樣品(或指標)聚合為一類,把另外一些彼此之間相似程度較大的樣品(或指標)又聚合為另外一類。
聚類方法主要有系統聚類法和K-均值法,K-均值法主要應用于比系統聚類法大得多的數據組。由于要對299只股票進行分類,本文的實證分析使用了K-均值法。
K-均值法的思想是把每個樣品聚集到其最近形心(均值)類中去。這個過程由下列三步所組成:首先,把樣品粗略分成K個初始類;然后進行修改,逐個分派樣品到其最近均值的類中去(通常用標準化數據或非標準化數據計算歐氏距離)。重新計算接受新樣品的類和失去樣品的類的形心(均值);重復第2步,直到各類無元素進出。
四、實證分析
股票投資中的基本面分析的共同缺點為同時需要考慮的指標過多且數據非常龐雜,不適合普通投資者使用,所以本文首先運用因子分析的方法對初始選定的十個指標進行降維處理,縮減為三個指標,在每個指標下對樣本中的299只股票給出得分并構造分別的排名與綜合排名。最后,運用快速聚類的方法對樣本中的股票進行分類處理,使本文所構建的股票分析方法適用于具有不同投資偏好的投資者。
(一)因子分析
1.數據預處理。首先,本文所選指標并非所有都為正向指標,根據范坤等[2]提供的方法,我們對逆向指標和適中指標進行正向化處理。指標產權比率是逆向指標,它是負債總額與所有者權益總額的比率,產權比率高,是高風險、高報酬的財務結構;產權比率低,是低風險、低報酬的財務結構,因之,我們將該指標下所有數據取負。指標資產負債率是一種適中指標,它是企業負債總額在資產總額的占比,公認的適宜水平為40%~60%。我們設定50%作為閾值,將數據與50%的差的絕對值取負。
其次,由于本文選取的各指標數值大小存在較大差異,單位不盡相同,需要對各指標進行標準化處理。標準化后的數據矩陣如表2,從中可以看出,十個指標變量中大部分變量之間存在高度相關,故適合進行因子分析。
表2 標準化后的數據矩陣
2.確定公共因子個數并進行因子旋轉。從樣本相關矩陣出發進行因子分析,計算得出特征值和特征向量,選出三個特征值大于1的公共因子并對因子進行方差最大正交旋轉后進行分析,輸出結果如表3和表4所示:
表3 因子提取及總方差貢獻率
表4 旋轉后因子載荷陣
在表3中可以看到因子模型具有三個公因子如第一、二、三行所示,累計總方差貢獻率達到了83.55%,代表著因子分析模型在保持可以解釋83.55%的總方差的同時達到了降維的效果。
表4中的二、三、四列分別是三個特征值所對應的特征向量。可以看到表中的前六個指標:利潤總額、凈利潤、總股本、資產總計、主營業務利潤,以及主營業務收入在第一公因子1上都具有大的正載荷,可以成為公司規模因子;第七、八個指標:資產負債率與產權比率在第二公因子2上均有大的正載荷,可以成為公司償債能力因子;第九、十指標:每股收益和凈資產收益率在第三公因子3上為大的正載荷,則可以解釋為公司盈利能力因子。
3.因子得分。基于以上分析,采用回歸最小二乘法則可以得出旋轉后因子得分矩陣,如表5所示:
表5 旋轉后因子得分矩陣
基于表5就可得出因子得分方程:
1=0.207zscore(利潤總額)+0.205zscore(凈利潤)+0.218zscore(總股本)+0.512zscore(資產總計)+0.180zscore(主營業務利潤)+ 0.221zscore(主營業務收入)
-0.022zscore(每股收益)-0.005zscore(凈資產收益率)+ 0.081zscore(產權比率)+0.158zscore(資產負債率)
2=0.038zscore(利潤總額)+0.031zscore(凈利潤)+0.061zscore(總股本)+0.098zscore(資產總計)+0.014zscore(主營業務利潤)+ 0.284zscore(主營業務收入)
-0.049zscore(每股收益)-0.050zscore(凈資產收益率)+ 0.510zscore(產權比率)+0.590zscore(資產負債率)
3=0.014zscore(利潤總額)+0.010zscore(凈利潤)+0.046zscore(總股本)+0.039zscore(資產總計)+0.003zscore(主營業務利潤)+ 0.037zscore(主營業務收入)
-0.568zscore(每股收益)-0.556zscore(凈資產收益率)+ 0.062zscore(產權比率)+0.011zscore(資產負債率)
將原始變量下標準化之后的數據代入上述方程就可以計算出每一只股票的各個因子的評價得分,然后以各因子方差貢獻率占三個因子總方差貢獻率比重作為權重進行加權匯總,得出每只股票的綜合得分,即:
F=(48.537F1+18.79F2+16.217F3)、83.549
最后根據綜合得分就可以得到299家上市公司的綜合得分排名,為從簡,該表列示了前后十名的股票:
表6 三因子綜合得分排名
4.結果分析。從SPSS軟件輸出結果來看,三個因子和綜合得分的取值范圍為:-0.817≤1≤8.861,-3.047≤2≤0.585,-0.412≤2≤0.536,-1.092≤綜合得分≤4.710。第一因子1越大表明上市公司的規模越大,反之越小;第二因子2越大表示上市公司的償債能力越強,反之越弱;第三因子3越大說明上市公司的盈利能力越好,反之越差。
在因子一,規模因子的排名中,國有四大行工商銀行、農業銀行、中國銀行、建設銀行,及中石油、中石化包攬了前六名,同時這六家上市公司也是綜合排名的前六名。影響綜合排名的主要因素還是因子一,即使由于因子一的權重較大,但究其根本,還是由于上市公司的規模大小起到了決定性作用。考慮到我國股票市場現實,規模較大的公司擁有天然的較強的風險承受力與抵御力,也擁有較低的融資成本與充足的消費者資源儲備,比較適合風險厭惡程度比較高的投資者,當整個市場下挫的時候這一類公司仍然有能力使其股價保持穩定。
在因子二,償債能力的排名中,由于資產負債率與產權比率較高,包括四大行在內的商業銀行的排名均較為靠后。排名靠前的股票是中石油、中石化、上汽集團之類的大型上市公司,而且這些公司大多有一個共同的特點:規模大、盈利能力中等,綜合排名靠前。根據曹裕等[3]提到的生命周期理論,這些公司均處于成熟期,與別的發展初期的企業相比,由于規模較大,得出在盈利能力方面不占優勢的結論也屬合理。投資這一類股票面臨的金融風險較小,但由于盈利能力處于一般水平,短期之內股票價格可能不會產生較大增長。綜合來講,這類股票比較適合注重長期增長的風險厭惡的投資者。
在因子三,盈利能力排名中可以看出盈利能力好的股票在規模與償債能力上不一定有較大優勢,但在綜合排名中大多處于較為靠前的位置,這說明盈利能力也是對股票綜合排名貢獻較大的一類指標。這類股票在短期之內股價可能會有較快較高的增長,但持續時間會比較短,適合偏好流動性,投資周期比較短的投資者。
(二)K-均值法聚類分析
我們需要在樣本中的299只股票中將具有相同、相近性質的股票聚合為一個類。由于在因子分析中已經對樣本數據進行了處理,且將分析指標濃縮為了三個維度,我們就可以直接利用三個公共因子對股票進行聚類分析。
1.第一次聚類分析。首先,運用SPSS軟件將樣本分為四個類別,各個分組中的股票數量如表7所示:
表7 分組情況
其中,第一組的成員為貴州茅臺,第二組的成員為工商銀行、中國銀行、農業銀行,以及建設銀行,第三組為中國石油與中國石化,第四組為其他所有292只股票。最后的各分類重心如表8所示:
表8 最后各分類重心
第一組的貴州茅臺在規模與償債能力上均表現一般,但突出的盈利能力使其單成一組;第二組的成員國有四大行在規模因子的得分遠遠超過其他股票,但償債能力較差,盈利水平一般;第三組中石油與中石化在規模上相比第一組稍差,但在償債能力上非常突出。
由于將分組定為四個,其中第四組尚有292只股票,實際并沒有達到聚類分析的目的,所以基于此種情況,我們對第四組股票樣本進行了第二次快速聚類分析。
2.第二次聚類分析。將分類數定為3,第一次聚類中的第四組的292只股票的聚類情況如下:
表9 分組情況
表10 最后各分類重心
如表9、10所示,第一類股票有27只,包括平安銀行、招商銀行、華夏銀行等,特點為規模較大,盈利能力稍強,償債能力處于一般水平;第二類股票有86只,包括美的集團、東阿阿膠、云南白藥等,特點為規模較小,償債能力與盈利能力均優秀;第三類股票有179只,包括比亞迪、三一重工、長江電力等,較前兩類而言規模最小,償債能力較好,盈利能力較弱。
3.結果分析。綜上,將第二次聚類結果中的三類股票作為綜合的第四、五、六類股票,給出兩次聚類分析得到的六類股票的橫向比較,如下表所示:
表11 兩次聚類分析最后各分類重心
最終,根據因子分析以及兩步聚類分析的結果,我們可以得出如下結論:
第一類股票是貴州茅臺。在樣本中,相比其他股票,規模較小,償債能力處于一般水平,但其盈利能力非常突出,適合偏好流動性以及短線投資的投資者。
第二類股票是國有四大行:工商銀行、農業銀行、中國銀行,以及建設銀行。在規模上與其他股票相比絕對領先,但在償債能力與盈利能力上表現都不突出。適合風險厭惡程度較高的股票投資者進行投資。
第三類股票是中國石油與中國石化,在規模上與第二類相比稍差,但在樣本中也處于領先的位置,在償債能力上非常優秀,盈利能力一般。這兩只股票短期內可能不會在股市上有很優秀的表現,但由于其出色的償債能力以及較大的規模,非常適于風險厭惡且偏好長期投資的投資者。
第四類股票規模一般,償債能力較差,盈利能力較好。其中主要包括一些規模相對較小的輕資產型商業銀行。這類股票在保證了一定增長能力的同時,股價在一段時間內會比較穩定。上行市場中股價不會有太大上漲,同時下挫市場中也不會有太大的下跌,比較適合穩健型的投資者進行投資。
第五類股票規模較小,償債能力與盈利能力均較為優秀,適于偏好流動性、投資周期較短的投資者進行投資。
第六類股票規模較小,償債能力處于一般水平,盈利能力較差。因此,此類股票在一定時間內不適宜投資者進行投資。
五、結論
基于SPSS軟件的因子分析的方法可以有效地減少分析上市公司股票公開報告時需要考慮的指標數目,而后的聚類分析可以清晰的將具有不同因子特征的上市公司分類,找出與某類投資者投資偏好相符的股票。
本方法的優點在于:第一,可以濃縮上市公司公開的財務指標,用很少的因子代替繁雜的指標種類,使投資者對上市公司有一個簡明、清晰的認識;第二,投資者可以清晰的看到每個因子下每只股票的得分排名情況以及綜合得分排名情況,便于比較上市公司在經營管理能力等各方面的優劣;第三,投資者可以輕易的找到適宜達到自己投資決策的目標類型的股票來補充自己的投資組合。總之,本文對于不同投資者或投資機構分析股票以及構建投資組合都有一定的參考和指導意義。
參考文獻
[1]何曉群.多元統計分析[M].北京:中國人民大學出版社,2012.
[2]范坤,馮長煥.因子分析中指標數據如何正確預處理[J].財會月刊:理論版,2013(003):85-88.
[3]曹裕,陳曉紅,王傅強.我國上市公司生命周期劃分方法實證比較研究[J].系統管理學報,2010(3):313-322.
作者簡介:郝瑞(1992-),男,北京人,對外經貿大學投資學本科在讀,研究方向:財務管理;張悅(1993-),女,北京人,對外經貿大學經濟與金融本科在讀,研究方向:金融經濟學。