祁敏書

摘要:文章運用量化投資策略思想,通過數學、計算機軟件、統計學等學科的綜合運用,量化出股票價格走勢的大致曲線,對股票的未來價格走勢做出大致的預測,使人們的投資思想得以實現,并取得超越市場平均水平的收益率,即戰勝市場。在當前中國的無效市場,或弱有效市場的背景下,文章通過數量化的方式,結合各個學科的知識,從一定程度上是可以取得超額收益的。文章基于這樣的一個理念展開了相關的邏輯推理,并使用各種科學方法,通過計算機軟件實現我們的投資策略。
關鍵詞:量化投資;多因素模型;投資策略
一、研究方法
本報告的量化投資策略所采用的方法有以下幾種:線性回歸;多因素模型;資本資產定價模型;假設檢驗與置信區間估計;蒙特卡洛模擬;風險價值方法;Matlab技術。主體內容主要分為四大部分。
第一、模型建立階段,選擇股票收益率的相關因素。然而,并不是所有的因素都需要被考慮,因為影響股票收益率的主要因素在各個上市公司之間有所不同,本文通過量化的方法選出合適的、符合每個公司自身特點的收益率的因素,并建立多因素模型,得出影響個股收益率的方程,對個股的未來收益做出預期判斷。
第二、主要是挑選出收益率靠前的股票,并運用CAPM模型組合搭配,來剔除非系統性風險,使股票收益達到最大化。
第三、采用統計學的知識,對上述建立的模型的相關參數進行范圍上與概率上的估計,對股票的風險與收益做出客觀的評判。
第四、模型評價階段,即對該模型做出全面的解釋,包括如何進行實際的投資以及模型的不足之處,并力求改正。
二、策略步驟
(一)模型建立階段
1. 影響收益率的因子初選。
本文采用以下收益率因子。
估值因子:賬面市值比、盈利收益率、PEG、股息率、現金收益率
成長因子:ROE、ROA、EPS增長、主營收入增長率、收入凈利率、再投資率
資本結構因子:資產負債率、固定資產比例、流通市值
技術面因子:12個月動量、1個月反轉、換手率、換手率變動、震動指標
以上影響收益率的四大類因子,較好地包括了影響收益率的主要因素。雖然從宏觀層面上我們挑選出了一些影響收益率的主要因子,然而,在現實過程中,影響某個具體公司收益率的因素很可能只是其中某幾個。比如,一家交易農產品的公司可能會對天氣、環境比較敏感,而一家鋼鐵生產公司則對天氣的敏感程度要低。因此,基于這樣的一個理念,應當試圖找出影響每個股票的收益率的個別關鍵因素,這里采用matlab技術以及線性回歸的方法,以融捷股份(002192)與暴風科技(300431)為例進行說明。
將深圳證券交易所統計的數據導入到matlab中,以市盈率為橫軸、收益率為縱軸,建立圖形關系后,進而在matlab得到兩組數據的相關系數。運行的結果如下:
Cor =1.0000 0.3056
0.3056 1.0000
R2 =1.0000 0.0934
0.0934 1.0000
從上述運行結果可知,市盈率與股票收益率之間的R2只有0.0934,遠小于1,因此市盈率這一項指標在融捷股份里并不能對收益率的變動起到決定性作用。真實點與估計的曲線的偏離程度較大,線性關系并不十分明顯。
類似地,我們建立暴風科技公司的股票市盈率與收益率的圖像, 通過matlab作圖,可得相關系數為:
Cor =1.0000 0.2947
0.2947 1.0000
R2 =1.0000 0.0869
0.0869 1.0000
可以看出,雖然暴風科技公司股票的收益率與市盈率之間的相關性也很弱,其收益率與市盈率出現了兩極分化。因此我們分別對其低市盈率與高市盈率進行線性擬合,上述曲線的R2均較高,因此,可以得出如下結論:暴風科技公司在近期股票收益率與其市盈率之間存在著一定的相關關系,根據擬合出的曲線,我們可以對未來一段時間的收益率進行估計。
類似的,可對所有的因子進行相同的操作方法。
2. 多因素模型體系的建立。
在進行完影響收益率的因子選擇之后,便是最為重要的建立綜合評分體系,用來解釋股票收益率與因子之間的具體變化。挑選出的影響收益率的關鍵因子為:累計收益、年化復合收益、年化超額收益、信息比率、月最大超額收益、月最小超額收益、跑贏基準月份占比、上升市場跑贏基準月份占比、下跌市場跑贏基準月份占比、正收益月份占比。
通過matlab實現多因素模型可得到以下結果。
特征值/貢獻率/累積貢獻率:
DS =7.8821 0.7882 0.7882
1.2637 0.1264 0.9146
0.6038 0.0604 0.9750
0.2504 0.0250 1.0000
0.0000 0.0000 1.0000
-0.000 -0.0000 1.0000
-0.000 -0.0000 1.0000
-0.000 -0.0000 1.0000
-0.000 -0.0000 1.0000
-0.000 -0.0000 1.0000
信息保留率T對應的主成分與特征向量:
Com_num =2
Pv=0.3468 -0.1311
0.3501 -0.0600
0.3517 -0.0858
0.3533 0.1051
0.2713 -0.570
0.3402 -0.0566
0.3294 -0.2054
0.3170 0.2590
0.3318 0.2818
得分及排序:
Result =
-2.4817 -0.8026 -3.2842 5.0000
-2.9612 0.5523 -2.4089 4.0000
-0.2807 0.0989 -0.1818 3.0000
2.5953 1.5047 4.1000 2.0000
3.1283 -1.3533 1.7750 1.0000
通過對上述運行結果的分析可以看出,月最大超額收益的影響最大,而累計收益的影響最小。這樣,便量化出了影響該股票收益率的方程式。
(二)交易標的股票的選取
1. 選取收益率前20%的股票
為了使收益最大化,優中選優,選取了每個版塊的20支股票,盡可能使收益保持最大化。
2. 利用CAPM模型進行資產組合
資本資產定價模型的核心即為以下等式:
E(Rn)=Rf+β(E(Rm)-Rf)
通過該理論,可以建立多個資產的不同搭配情況。下面以兩種股票為例進行說明,在股票A與股票G之間,我們可以根據投資者自身不同的風險偏好程度,決定資產的配置比例。其中C點為全球最小方差組合點,反映了在引入無風險資產組合之前的風險最小點。通過加入國債等無風險資產,可以進一步降低組合的風險,而此時的有效前沿變成了一條直線,在市場組合點與無風險收益之間的這部分曲線為加入國債等資產的組合的可能點,而在市場組合點之外,則為進行杠杠融資的結果。
三、風險控制
(一)對各項參數進行區間估計和假設檢驗
前兩章重點闡述組合的收益狀況,要求在弱勢有效市場的情況下,使收益達到最大化。收益與風險是投資組合的最基本的衡量指標。因此對風險的估計和度量仍然非常重要,要將二者進行聯合評估。下面將介紹怎樣利用統計學知識,對風險與收益的取值范圍做出估計。
假設由第一部分模擬出的收益率方程滿足如下等式:
Yi=-4.451+2.057*X1i+2.008*X2i
可以看到,等式中出現了三個參數,分別是截距項、X1i、X2i。然而,模擬有會一定誤差,此時需要對誤差進行度量。特別是對于X1i與X2i的參數的估計,其改變直接決定了Yi的變化的方向以及程度。在這里,我們運用假設檢驗與置信區間估計的方式,判斷究竟有多大的概率,該參數是可以滿足我們的要求。
用統計軟件得出相關統計學分析,可以知道R2(R-squared)為0.934,并且調整后的R2(Adj R-squared)為0.890,說明該式的所有系數,作為一個整體,對Yi具有較好的解釋力度。其中ESS(Explained Sum of Squared)為模型模擬出的曲線與平均值的差的平方和,而SSR(Squared Sum of Residual)為真實點與估計點的差的平方和。2.057所處的95%置信區間范圍為0.984-3.130??梢酝ㄟ^查對應的t分布圖來找到對應值。比如說,要判斷Experience的參數在95%的概率條件下的合理性,計算出其t統計量2.66,觀察對應的置信區間范圍是否包括了這個數值,答案是包括的。因此可以得出如下的結論:Experience的系數2.008在95%的置信水平下是無法拒絕的。
(二)基于蒙特卡洛模擬的風險控制
蒙特卡洛模擬,是對資產的所有可能的取值來進行一次隨機數模擬,方便計算產品價格和產品風險度量的大小。在此將詳細來說明如何進行基于蒙特卡洛模擬的風險的度量。
利用matlab模擬四次,得出不同收益率的圖形,每次模擬都可以得到一條收益率的曲線,當我們從股票收益率的總體曲線中隨機抽出N個樣本的收益率曲線,對其進行算術平均,可以得到最終模擬出的收益率曲線。
四、模型的評價與總結
(一)模型評價
以上是筆者所構建的量化投資策略的總體框架,若讀者按照上述量化投資策略進行投資,定會獲得超額的投資收益率。量化分析比傳統的基本面分析、技術分析有更加標準化、科學化的特點,有更加合理之處。
當然,該模型仍有一定的缺陷性。模型本身采用的是線性回歸的方法,即最高次冪為1次冪。而現實過程中,大多金融產品的收益曲線并不是一條嚴格的直線,而更多的是具有二階導的曲線。
二階導的曲線中是包含了期權時間價值在內的利潤圖,在引進期權的時間價值以后,其圖形不再是直線,而是帶有弧度的。因此,針對本模型的局限性,可以引入二階導來進行估計。這一點可以通過matlab不斷擬合收益率的曲線來進一步精確估計收益率未來的變化趨勢。
(二)總結
通過上述的分析,可以構建出一整套較為合理的量化投資策略,來模擬股票的收益率的漲跌。筆者首先找影響收益率的四大類因子,再經過科學篩選,挑選出最關鍵的因子。具體是通過matlab方法來實現對關鍵因素的選取。其次之后,要對選取的因子之間的相關性進行分析,進行線性檢驗。本文使用matlab找出因子間關系,并消除相關關系后,建立出了多因素回歸模型。之后,運用假設檢驗與置信區間估計的方法,對多因素回歸模型的相關參數的合理性做出判斷和解釋。再者,使用蒙特卡洛模擬方法,對資產組合的風險大小進行描述。尤其是在市場發生劇烈波動的時候,可以避免傳統線性VaR方法帶來的低估風險的錯誤。最后,本文采用一系列評估指標,來衡量對應一定風險的收益水平的大小。
參考文獻:
[1]汪軍,林美艷.CAPM模型在項目風險管理中的應用[J].遼寧工程技術大學學報(社會科學版),2008(01).
[2]張慶海,張瓊.Matlab在數學建模中的應用[J].中國集體經濟,2008(06).
[3]龐陽.資產證券化產品的量化投資策略分析[J].金卡工程,2016(10).
[4]葉飛陽.2017年量化投資策略研究[J].現代商貿工業,2017(31).
[5]張厚先,施柏楠.基于蒙特卡洛方法的網絡計劃資源優化[J].數學的實踐與認識,2015(06).
(作者單位:安徽財經大學金融學院)