張慧媛 馮婧 劉天生 王蕊 雷亮

【摘要】隨著中國金融市場的迅速發展,股票已經成為廣大投資者投資組合的主要方式,如何選擇表現優秀的股票、規避風險等成為投資者普遍關注的問題。本文從大數據角度,以中證800指數2011年~2015年的股票數據為基礎,將其細分為33個行業,建立股票組合投資模型。首先設計MATLAB快速算法計算各行業的Pearson相關系數進而整合出行業組合;然后通過研究股票漲跌幅、開盤價和收盤價等指標,計算出各行業及內部股票表現力指數;擬合行業內部股票漲跌的時間分布圖。投資者進而根據行業表現力指數,選擇對應的行業組合,結合各行業代表性股票時間分布圖選出科學的股票投資方案,規避傳統經驗選股方法的不足。
【關鍵詞】因子分析 Pearson相關系數 股票組合投資
股票組合投資模型的建立與求解
一、數據的預處理
(1)對數據進行分析,發現中證800共有33個行業,531只股票。我們將每個行業有股票分別對應。
(2)由于考慮到531只股票。根據2010~2015的日數據,利用MATLABB編程,建立快速算法,計算出每只股票的年收盤價均值。并算出年漲跌幅。
(當前交易日最新成交價(或收盤價)-前一交易日收盤價)/前一交易日收盤價
(3)計算行業指數,經查閱資料,我們發現以收盤價的比值計算出的漲跌幅可以較準確表示為行業指數。行業指數是反映不同時點上股價變動情況的相對指標。
行業指數=n個樣本行業指數之和/n
二、根據年均漲跌幅擇出優秀行業
因子分析是一種有效的降維和信息濃縮技術,是主成分分析模型的進一步推進。為了精確分析2011-2015年各個行業漲跌幅,選擇因子分析模型。
設xi(i=1,2,...,p)p個向量,如果表示為:即X=AF+?著F1,F2,...,Fm稱為公共因子,是不可觀測的變量,A=(aij)p×m稱為因子載荷陣,aij表示第i個變量在第j個因子上的載荷,?著i是特殊因子,是不能被前m個公共因子包含的部分,并且滿足Cov(F,?著)=0,F,?著不相關。
三、強弱的時間分布特征
利用Excel繪制各個行業以及中證800從2011到2015的年漲跌幅,通過不同行業在不同年度漲跌幅與中證800的比較,得到行業強弱的時間分布特征:
(1)2011年:相對上年,中證800下跌,各行業表現有增有減,其中化工原料、小金屬、汽車配件、工程機械、水泥等表現優秀。
(2)2012年:相對上年,中證800下跌,行業表現整體呈下降趨勢,各行業在此時都處于弱勢。
(3)2013年:中證800上漲,行業表現整體呈上升趨勢,各行業情況好轉。但其中,煤炭開采、小金屬、有色金屬、服飾、工程機械、水泥、普鋼這幾個行業相對上年下跌。
(4)2014年:中證800下跌,行業表現大都呈上升趨勢,其中軟件服務、通信設備、汽車配件、專用機械、港口等行業的漲幅較大,表現較好。
(5)2015年:中證800上漲,所有行業表現均有上升好轉。其中,軟件服務、證券、建筑施工、火力發電、區域地產處于優勢地位。
四、根據年均漲跌幅分析各個行業的相關性
影響股票價格的因素繁多導致股票市場變動的的不可預測。本文選取Pearson相關系數模型分析同一板塊中不同行業的相互影響,繼而判斷各個行業之間關系的強弱。設yij為每個行業的年均漲跌率,i為年數,j為行業數。然后建立Pearson相關系數模型。Pearson相關系數的計算公式:
共有33個行業,使用每個行業五年的年均漲跌幅利用MATLAB編寫程序得出33個行業之間的兩兩關系建立的相關性矩陣,每個行業選取相關性排名前2位的行業進行分析。
五、科學選股及模型的應用
本文采用短線交易,短期持倉的方式,由相關性排名前兩名的行業,三個行業一組,作為股票的組合。隨機抽取2013年股票組合33為例,以歷史漲幅作為制定權重的主要指標,計算利潤,如下表:
參考文獻
[1]汪曉銀,周保平.數學建模與數學實驗[M],北京:科學出版社.
[2]王學民.因子分析在股票評價中的應用,中圖分類號:0212 ,文獻標識碼:A.
作者簡介:張慧媛(1994-),女,內蒙古自治區巴彥淖爾市人,民族:蒙古族,學歷:大學本科在讀 ,研究方向:金融工程、數學建模,計量經濟學。