999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

隨機森林算法在多因子選股上的應用

2017-04-29 00:00:00李齊楊君岐
經營管理者·下旬刊 2017年2期

摘 要::量化對沖基金發展在國內國際發展迅速,機器學習在量化投資中運用廣泛,通過隨機森林算法,評價因子選取股票,實現28%的年化收益,超越同時期hs300指數。

關鍵詞:多因子 隨機森林 選股

一、引言

截止至2016年第四季度,全球對沖基金管理資產規模從1997年的1182億美元發展到2016年四季度的2.85億美元。結合管理期貨基金(CTA),全球量化對沖基金(不含FOF)管理資產規模已經接近3.2萬億美元。截止至2016年12月份,橋水聯合、AQR資本管理、曼氏居全球對沖基金規模榜單的前三位。在國外對沖基金大發展的背景之下,國內基金行業的量化對沖基金也在突飛猛進。截止2016年第三季度,國內量化對沖基金接近600億。當前國內量化對沖基金有兩大類型,第一,中性策略產品,即股票多空策略產品:利用多因子模型優選相對股指具有超額收益的股票組合,買入股票組合的同時做空股指,在對沖掉系統性風險后獲取超額收益。第二,量化套利策略產品,量化套利策略指在價格具有很強相關性的產品之間尋找價差,當價差達到一定程度時對產品進行反向操作,以獲取價差部分的收益。當前的量化套利策略主要有期限套利、ETF 套利、固定收益套利、可轉債套利、分級基金套利等。在第一類中,通過多因子選股并在相應在股指做空的中性策略成為量化對沖基金的主流。

二、機器學習

在機器學習領域的主要目標就是開發能夠實現各種學習形式的計算方法,尤其是能夠從樣本或數據中歸納出知識的機制。機器學習往往能找出人類直觀感覺無法探測的規律模式,從而輔助人們進行決策分析。機器學習的一般框架如圖一所示。學習系統旨在根據提供的一組概念樣本和背景知識,確定特定概念的描述。基于機器學習的多因子選股模型本質上是一個二元分類問題。將股票池中表現好的個股標為類1,而表現不好的標類-1。建立分類器從而描述因子池中各因子與下期收益表現的關系。模型的輸入一般表現為預測該樣本為某類的概率,或者稱為信任得分,信任得分越大則為該類的可能性越大。因此模型的構建主要分為兩步:(1)根據各股歷史下一期收益率劃分類標,歷史當期因子數據對分類器進行訓練得到相關參數。(2)代入實際當期各股因子數據對各股進行分類,得到各股的信任得分。那么模型的關鍵落在分類的選擇。傳統的分類器包括決策樹分類器,基于規則的分類器,最近鄰分類器,神經網絡,支持向量機等。

三、隨機森林

隨機森林在運算量沒有顯著提高的前提下提高了預測精度。隨機森林對多元貢獻性不敏感,結果對缺失數據和非平衡的數據比較穩健,可以很好地預測多達幾千個解釋變量的作用。

1. Gin importance值和Permutation importance值。隨機森林方法的一個重要特性是能夠計算每個變量的重要性值,RF提供兩種基本的變量重要性值:Gini importance值和 Permutation importance值。(1)Gini importance值。在節點分裂過程中用Gini系數來衡量各節點的樣本純度,Gini系數定為:

任取一個屬性變量,對森林中的所有選擇該變量為分裂變量的節點計算不純度降低量的總和,可獲得的Gini importance,即:

(2)Permutation importance值。通過隨機森林T中的每棵樹t對樣本計算預測準確率。將預測準確率的改變量對T取算術平均,可獲得該變量的Permutation importance,即:

2.隨機森林算法條件控制。森林中所要生長出的樹的個數ntree,生長每棵樹中節點分裂隨機選擇的變量子集中變量的個數mtry,以及每棵樹的規模,在用于樣本的預測分類的情況下,每個樣本所占的權重也可以設置。mtry越大,自由度越小。參數ntree值越大越好。限制樹的規模有一定的效應,因為可以加快計算的速度,特別是對于有很多噪聲變量的情況下,可以減少多余的節點分裂而生成僅含有重要變量的更小規模的分類回歸樹。

四、實證研究

選取2007至2015年9年A股數據,包括主板、中小板和創業板。由于A股溢價效應明顯,選股標準為上市時間超過180天。

1.構建因子庫。通過參考海通證券因子庫,構建因子如下,規模:市值、流通市值。盈利能力:凈資產收益率、總資產凈利率、凈利潤率。償債能力:流動比率、速動比率、資產負債率。股東獲利能力:市盈率、市凈率、每股凈收益、上市以來分紅率。成長能力:營業收入增長率、凈利潤增長率、總資產增長率、固定資產擴張增長率、wind一致預期凈利潤同比。營運能力:存貨周轉率、總資產周轉率。其他因子:Z值。一共20個因子。

2.因子選擇。通過訓練就九年的數據,在2007年選取時間段為2007年5月1日至2008年5月1日,因為每年的上市公司的年報在4月30日之前必須披露。選取的時間5月1日為節點更加合理。選取收益率為前300名的股票為標記為1,300名以后的股票標記為-1。每一年基尼系數最大的得分為20,以此類推,最后一名為1。經過計算9年的因子得分情況如下表所示:

通過上表可以發現凈利潤增長率、市值和營業收入增長率在20個因子當中表現最突出。

3.多因子選股。通過訓練前一年數據,根據后一年的年報選股,在因子選擇中,凈利潤增長率為最重要的因子,所以在選取的股票中按照凈利潤增長率排名,選取前50只股票,并參照同時期hs300指數對比,如圖1所示:

在2007年5月1日至2016年5月1日期間累計凈值為9.2315,總收益為823%,年化超過28%的收益。而在此期間hs300的累計凈值為0.8870,收益為-11.3%。

參考文獻:

[1]劉洋,夏思雨,胡思瑞,林思亮. GARP數量化選股及馬爾科夫鏈擇時策略研究[J]. 金融與經濟,2016,(05):66-71.

[2]王玨,張新民. 基于bootstrap分析方法的我國基金經理選股能力研究[J]. 中國軟科學,2013,(11):139-150.

作者簡介:李齊(1992—),男,漢,河南駐馬店人,陜西科技大學經濟與管理學院金融專業碩士,主要從事量化投資研究。楊君岐(1962—),男,漢,陜西岐山縣人,陜西科技大學經濟與管理學院教授,研究生導師,主要從事數量經濟學與量化投資研究。

主站蜘蛛池模板: 新SSS无码手机在线观看| 欧美一级99在线观看国产| 一本大道无码日韩精品影视| 欧美三级自拍| 色成人亚洲| 婷婷综合色| 国产精品高清国产三级囯产AV| 波多野结衣中文字幕一区二区| 77777亚洲午夜久久多人| 国模沟沟一区二区三区| 欧美视频在线不卡| 亚洲精品无码日韩国产不卡| 亚洲视频三级| 国产精品页| 午夜性刺激在线观看免费| 亚洲毛片网站| 她的性爱视频| 伊人中文网| 毛片视频网址| 91精品久久久无码中文字幕vr| 国产中文一区二区苍井空| 91精品亚洲| 日韩人妻少妇一区二区| 亚洲中文无码av永久伊人| 亚洲欧美不卡视频| 91青青草视频在线观看的| 久久一色本道亚洲| 亚洲精品波多野结衣| 蜜臀AVWWW国产天堂| 综合网天天| av一区二区三区在线观看| 99re66精品视频在线观看| 亚洲男人的天堂久久香蕉| 澳门av无码| 国产精品高清国产三级囯产AV| 成人亚洲视频| 国产精品一区二区在线播放| 久久99精品国产麻豆宅宅| 日韩少妇激情一区二区| 99在线国产| 婷婷综合缴情亚洲五月伊| 日本a级免费| 人与鲁专区| 国产精品美乳| 无码人妻热线精品视频| 国产福利不卡视频| 午夜福利在线观看入口| 一级看片免费视频| 欧美激情视频一区| 一本大道香蕉中文日本不卡高清二区| 久久大香伊蕉在人线观看热2| 久草国产在线观看| 91在线视频福利| 亚洲人成在线免费观看| 欧美a级完整在线观看| www亚洲精品| 欧美午夜在线播放| 亚洲三级影院| 2022国产91精品久久久久久| 综合人妻久久一区二区精品| 欧美无专区| 久青草免费在线视频| 欧美激情视频二区| 国产av无码日韩av无码网站| 国产精品女人呻吟在线观看| 亚洲不卡无码av中文字幕| 爆操波多野结衣| 熟妇无码人妻| 欧美日韩久久综合| 亚洲无码精品在线播放 | 久久国产精品国产自线拍| 国产成人成人一区二区| 尤物在线观看乱码| 国产亚洲精久久久久久无码AV | 日本人又色又爽的视频| 亚洲一区二区精品无码久久久| 不卡色老大久久综合网| 国产玖玖视频| 露脸真实国语乱在线观看| 亚洲欧美一区二区三区蜜芽| 欧美中文一区| 老司机午夜精品网站在线观看|