張雪芳 溫 馨
(武漢郵電科學(xué)研究院 武漢 430074)
在我國(guó)經(jīng)濟(jì)快速發(fā)展的背景下,股票市場(chǎng)應(yīng)運(yùn)而生。股市是股票發(fā)行流通的平臺(tái),同時(shí)也是上市公司募集資本的重要途經(jīng)之一。另一方面,隨著人民經(jīng)濟(jì)水平的提高和股票市場(chǎng)的發(fā)展,進(jìn)行股票投資也成為了人們的主要理財(cái)方式之一。股票投資的目的是,如何在最小化風(fēng)險(xiǎn)的情況下獲得投資收益的最大化,而如何選擇投資策略,成為眾多投資者面臨的主要問(wèn)題。本文選擇XGBoost 算法作為基礎(chǔ),構(gòu)建股票指數(shù)漲跌預(yù)測(cè)模型。通過(guò)以往的研究結(jié)果,選取財(cái)報(bào)中的相關(guān)數(shù)據(jù)作為輸入特征,對(duì)后一天的漲跌情況進(jìn)行預(yù)測(cè),并通過(guò)網(wǎng)格搜索法確立最佳權(quán)重。本文用二元數(shù)據(jù)表示模型預(yù)測(cè)的結(jié)果,“+1”即為上漲,“-1”即為下跌,并對(duì)不同年份、不同模型的效果進(jìn)行比較,判斷模型的預(yù)測(cè)效果。本文進(jìn)一步比較了LR算法、SVM算法、隨機(jī)森林算法和XGBoost 算法的優(yōu)劣,證明XGBoost 模型在股指預(yù)測(cè)中有較優(yōu)的效果,最后得出基于XGBoost 模型量化分析的結(jié)論建議。
XGBoost 算法是基于Adaboost 和GBDT 等提升樹(shù)算法基礎(chǔ)上進(jìn)行優(yōu)化的算法,它是通過(guò)集成多個(gè)弱分類(lèi)器來(lái)實(shí)現(xiàn)學(xué)習(xí)的。通過(guò)一個(gè)含有n 條記錄以及m 個(gè)解釋變量的訓(xùn)練集D={(xi,yi)},|D|=n,xi∈Rm,yi∈R,第i個(gè)樣本所預(yù)測(cè)的值,可以表示為由k個(gè)決策樹(shù)聯(lián)合的模型,記作:其中,fk代表第k個(gè)決策樹(shù),F(xiàn)是函數(shù)空間,代表所有決策樹(shù)的集合。
與GBDT 的目標(biāo)函數(shù)不同,XGBoost 在原有的目標(biāo)函數(shù)之上增加了正則化項(xiàng),來(lái)減弱過(guò)擬合,增強(qiáng)泛化性。……