摘 要:投資組合問題是當前金融學研究的熱點內容,主要面對的問題是在滿足給定收益下將固定數目的資金分配到多種資產上使得風險最小化。與VaR風險測度相比,CVaR具有更好的數理統計性質,CVaR滿足次可加性、正齊次性、單調性及傳遞不變性,因而CVaR是一種一致性的風險計量方法。因此,可以利用CVaR與VaR度量風險,優化投資組合的問題。針對遺傳算法全局搜索能力強,但僅限于求最大值,且求解單變量的缺陷,進一步改進了原有的GA算法,使得優化后的遺傳算法可以支持高維數據的估計,以及下降法優化損失函數。實驗結果表明,新方法GA-CVaR能有效優化組合模型,可以使投資組合的風險降到最低。
關鍵詞:遺傳算法;CVaR;機器學習;投資組合
中圖分類號:F239 文獻標志碼:A 文章編號:1673-291X(2024)13-0071-04
一、研究背景
對于交易者來說,在決策的第一時間及時了解不同交易標的基本面、技術面等相關屬性可以降低交易者自身風險。但實際上,交易者對于風險的認識是不清楚的。交易者缺少對于投資組合的合理配置,例如,在選擇不同股票的時候并沒有進行合理的資產配置。對于交易者來說,在決策的第一時間及時了解不同產品風險、收益等相關屬性,可以讓交易本身產生更大的穩健型效果。而對于不同產品的定量風險性分析并加以量化組合,可以達到對于投資組合風險性的控制。
關于控制風險的量化方法,過去度量金融風險主要運用的是方差,但方差只能代表這一段時期的資產價格波動,而波動并不能代表是風險,于是這個方法慢慢地就被淘汰了。當前量化風險指標的方法主要有度量風險價值(VaR)和條件風險價值(CVaR)等,但兩者通過解析直接求解異常困難。
隨著各種啟發式算法的興起,為求解帶來了新的思路。一些學者開始采用各種多目標進化算法對收益和風險兩個目標進行直接求解,如宋慧慧等人利用向量評估遺傳算法對基于CVaR有交易費率的多目標函數求解[1]。楊天山等利用多目標粒子群算法對基于CVaR的多目標函數進行求解[2]。沈潔等[3]利用約束方法求解,但對于投資者而言,他們往往想要得到的是在一定收益下的最小風險,而不是在多組數據中選擇合適的投資組合。而侯勝杰等基于熵模型結合CVaR進行風險度量并且得到了在夏普比率、平均絕對偏差比等性能指標更好的效果[4]。
現有的文獻研究中,主要是以遺傳算法的單維度以及梯度向上的方法進行優化。對于很多算法的移植具有很大的約束性,需要一種非線性下降并且可以進行多維度運算的仿生遺傳算法,本文將在前人的基礎上對遺傳算3cba518039708d81341a3325c3cb0cf503aa1f9507ea83582f885f42e3fa5e31法進行改進。經過優化的遺傳算法可以一次性計算多個維度,并且可以進行下降方向的計算,進而進行CVaR的優化計算。
二、優化的遺傳算法
(一)遺傳算法簡介
遺傳算法最早由John holland在1970年提出,遺傳算法是一種仿生類算法,類似的算法有粒子群算法、魚群算法、布谷鳥算法等。遺傳算法的最大特點在于模仿了達爾文生物自然選擇和遺傳學機理。類似于生物進化過程中的自然選擇和生殖繁衍。
在算法中具有幾大特色算法模塊,分別為自然選擇模塊,用來淘汰適應度較低的個體;生殖模塊,用來進行染色體交叉并復制覆蓋原個體;變異模塊,用來進行個體上染色體片段上編碼的變異。具有這三種模塊,可以很好地去模擬整個進化過程。遺傳算法經過多年的發展,在各個領域都有較為成熟的應用。例如,機器學習、信號處理、自適應控制和人工生命等領域。
(二)優化后的遺傳算法
傳統的遺傳算法采取“輪盤賭”的方式進行自然選擇,由較高適應度的個體進行傳播繁衍后代的任務。想象有一個輪盤,現在我們將它分成n個部分,這里的m 代表我們種群中所有個體染色體的個數。
表1 不同個體適應度得分
圖1 自然選擇輪盤示意圖
表1為相對個體的適應度,而圖1則是我們的輪盤,圖中固定指針將會通過輪盤轉動得到兩個親本進行染色體的交叉復制,并且選取較高適應度的新個體去替換適應度較低的原個體。
在優化后的遺傳算法中,主要優化了適應度篩選過程。由于選擇了梯度下降方向,所以決定繁衍的輪盤變成了死亡輪盤,適應度得分較高個體反而需要被消滅。圖中固定指針將會通過輪盤轉動得到兩個準備殺死的個體,而由于適應度得分高的個體本身被轉到的概率高,因此被消滅的概率極大,同時也盡可能維護了種群的多樣性。
(三)遺傳算法的優勢
遺傳算法正是模擬達爾文生物進化論的自然選擇和遺傳學機理的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優解的方法。
我們將目標函數當作這個生存的“環境”,將待求解W作為這個物種,使得目標函數值越小的就越容易活下來,反之越容易被淘汰,進而隨著一代代的進化,優良的品種會越來越多,直到最后充滿整個物種數量,最終得到一個收斂的狀態。也就是此時找到那個最優秀的個體,它攜帶的基因組合所表達的內容就是我們所求解的W。
通過遺傳算法我們可以輕松在求最優的問題時,避免局部最優的問題。通過迭代,可以求得二維以及三維函數的最優解。
三、CVaR投資組合優化模型
(一)基本投資組合理論
1952年3月,馬克維茨在其博士論文《資產選擇:投資的有效分散化》中說明了在多風險的市場下如何進行投資組合方式的最優選擇。他運用隨機收益率的期望與方差的定量指標衡量資產收益以及風險,發現標的物間有一定的相關性,利用投資組合思想可以減少投資的風險。于是依據這種思想建立了均值—方差數學模型。此模型是第一次從定量角度衡量風險,由于其具有很強可處理性和較高的風險可預測性,在一段時間內在金融風險方面得到較大范圍的應用。
(二)投資組合目標函數建立步驟
資產的流動性和波動性是選擇持有期的原則,資產流動性的含義是資產在不損失原有價值的前提下快速變現的能力。通常來說對于流動性越高的資產,投資者能依據金融市場波動情況及時調整資產頭寸的能力越強,要選擇跨度較小的持有期。
而資產的波動性的含義指金融市場的不確定性因素引起資產價值發生變動的可能性大小,一般情況下資產的波動性隨著資產的持有期變長而增大,對應的VaR值也增大。投資期的選取需要綜合評定。
1.我們把第n個股票的第t天收益率表示為P
2.通過差分得到每只股票每日收益率
3.我們把組合中股票的比重表示為
4.很容易可以得到組合收益矩陣
5.根據(3)我們可以得到投資組合收益序列
6.根據(4)定義在險價值,alpha代表投資者風險厭水平
7.根據(4)(5)我們定義CVaR
8.根據(2)(3)(4)(6)我們得到
9.根據(2)(7)我們最終得到CVaR目標函數
10.根據(2)進行約束條件的處理
11.根據(5)(8)(9)我們最終得到VaR和CVaR的待優化函數
四、GA-CVaR求解最優投資組合
(一)樣本數目以及樣本股票選擇
學者Fama在投資組合研究過程中,發現投資組合風險與資產種類間存在一定關系,當資產種類增加時,組合風險并不會一直減少。經過實證研究表明,當投資組合資產種類從1增加至10時,投資組合風險降低作用非常顯著;當繼續增加種類時,降低的作用就不太明顯,甚至會導致增加風險降低的邊際效果下降。基于實證理論,本文選擇10種股票對模型進行實證研究。
本文從雅虎財經隨機選擇10只上市較久、基礎面較為成熟的股票作為實驗研究對象,選取了2017年1月1日至2021年5月1日共五個交易年1 051個交易日收盤價數據,其中前700個作為訓練集,后351個作為測試集,具體參數如下表所示。
本文的編程環境是Python3,編譯器為Jupyter Notebook,PC機操作系統參數如下:64位Mac OS操作系統、Intel Core i5 CPU@1.1 GHz、內存8GB。
(二)改進后的GA參數設定
由于時間有限,主要進行全局優化能力參數優化,迭代次數和種群數量設置為1 000次與500個,適應性參數設定為10,搜索上限與下限設定為0及5,基因長度設置為8,主要觀察死亡率、雜交率、變異率的調整對于最終優化性能的影響。
為了方便可視化展示,我們將以下述二元函數為例進行GA參數調優,我們的目標是盡可能獲得曲面和Z=0相切的點的坐標,函數為Sin(X)2+COS(X)4
根據以上初步結論,設定關于死亡率、雜交率、變異率的參數配置表,進行逐個實驗(見表2):
將死亡率Death Rate設定為0軸,交叉率pc設定為1軸,變異率pm設定為2軸,根據0軸與1軸繪制熱力圖,其中的適應度為了便于識別均取絕對值的負數,經過調整,可以得到以下結論。
在不同的參數配置下,適應度最終表現具有不同的效果,三者與最終適應度表現變化呈現出非線性變化。從一定程度687707413f000bf64a8a3af9dadcd13b上說較低的變異系數或較高的變異系數都會制約全局搜索能力導致無法達到全局最優解,而交叉率與死亡率又會在不同的變異系數下產生不同的結果,根據實驗結論選取死亡率0.4、交叉率0.5、變異系數0.000 05的參數。
在此參數下的模型收斂效果以及全局搜索能力都是較為穩定的。在整個進化的過程中,隨著進化的迭代,最優個體的適應度不斷增加,當達到目標值時,即圖2中求得的坐標Z值與水平面之間的誤差不斷減小并趨向于0。
(三)GA-CVaR流程設計
利用優化后GA的下降效果解決CVaR求解最優的優化問題,僅需將GA中目標函數轉換為第三章中公式(10)以及(11),其中閾值alpha取1%,具體操作流程如下頁圖2。
驗證模型是否對于整體投資組合優化效果有效,僅需觀察訓練集以及預測集中CVaR以及VaR的大小差異。將訓練好的權重向量帶入預測集中計算收益,根據預測周期內的收益數據計算CVaR以及VaR,若預測集中的數值均小于訓練集,那么可以認為該配置方案是有效的。
(四)GA-CVaR實驗結論及分析
由于優化過的遺傳計算幾乎在每一步都具有算法上的隨機性,例如初始種群的隨機性,迭代過程中死亡、雜交、變異的隨機性,導致同一個數據可能會出現各種結果,列出四種在調優參數后的算法對于4.1訓練樣本的擬合效果,在不同的隨機狀態下,四種最終迭代的適應度略有不一。
在四次試驗下,模型的優化過程達到梯度下降的效果,橫坐標的適應度即代表每一次迭代后的CVaR,可以證實,在不斷的持倉比例優化的過程中,從震蕩的整體方向看,在險價值不斷下降。由于改進后的GA依然具有較大的全局搜索能力,也就降低了最優個體的表現能力,在一定概率下會容易錯過最優的持倉比例。但由于整體的適應度表現都在可接受范圍,因此由于隨機所帶來的一定誤差在可以接受范圍之內。
選取其中一個訓練好的模型用于預測,并計算對應周期內的CVaR與VaR,將兩個指標再與訓練集的指標進行對比,可以發現預測集中的CVaR以及VaR均小于訓練集中的CVaR和VaR。為了進一步驗證模型的準確度,又對alpha取3%以及5%的情況下進行了實驗。
在兩種閾值情況下,迭代效果均達到梯度下降的效果,并且還處于繼續向下優化的趨勢,將最終優化得到的組合比率帶入預測集,分析得到如下結果(見表3)。
表3 實驗結論對比
可以發現,除了在1%的閾值情況,在3%以及5%的閾值下,均能達到實驗目標,即根據過往的收益率,可以在預設風險期望的標準下,可以達到未來投資的風控標準。以5%為例,經過700交易日訓練集樣本的訓練,可以達到以下投資效果。在未來351交易日給投資組合帶來的總虧損中,單日會虧損超過1.2%的概率為5%,一旦虧損超過1.2%,平均損失為1.6%。
五、結論與展望
(一)主要結論
本文采用CVaR模型對有證券比例上限等約束條件的投資組合建模,采用優化的遺傳算法求解該離散型問題。標準梯度下降容易陷入局部極值,本文對其進行改進,提出優化的遺傳算法解決該類問題,通過實驗分析表明,改進遺傳算法對求解該問題有優化精度高、跳出局部最優的能力強。通過實驗證明了改進的遺傳算法可以有效輔助CVaR以及VaR求解并降低投資組合風險。
(二)研究展望
遺傳算法作為一種高效的群智能仿生算法,已被國內外眾多學者研究和應用于許多領域。比如,工程、控制等領域,但算法性能的改進和應用還尚待進步的完善和發展。本文應用優化的遺傳算法求解基于CVaR模型建模問題,對于遺傳算法的穩定性具有較大考驗,在實驗過程中也存在隨機的初始值可能會造成最后收斂效果的少量差異,后期會進一步加強這方面的研究,攻克模型穩定性。
參考文獻:
[1] 宋慧慧,龍憲軍.龍強.基于CVaR帶有改進的典型交易成本的多目標投資組合模型[J].重慶師范大學學報(自然科學版),2019,36(3):16-20.
[2] 楊天山,韋增欣,雷震,等.基于CVaR的多目標投資組合模型[J].數學的實踐與認識,2015,45(2):82-88.
[3] 沈潔,趙予嘉,姜興睿,等.基于CVaR投資組合優化的迫近束方法子問題及其對偶[J].遼寧師范大學學報(自然科學版),2020,43(2):156-161.
[4] 侯勝杰,關忠誠,董雪璠.基于熵和CVaR的多目標投資組合模型及實證研究[J].系統科學與數學,2021,41(3):640-652.
[責任編輯 白 雪]