999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于集成算法的股票指數預測*

2018-12-18 11:49:06孫德山
經濟數學 2018年4期
關鍵詞:開盤價訓練樣本股票市場

王 玥,孫德山

(遼寧師范大學 數學學院 ,遼寧 大連 116029)

1 引 言

隨著經濟的不斷發展,股票市場逐漸在人們的生活中占據了重要的位置.經過一定時期的發展,股票市場已趨于穩定,但還存在一定的問題和缺陷.目前,股票市場已成為眾多學者和投資者的研究對象.政府如何有效地對市場進行監管、防范金融風險;投資者如何最小化投資風險的同時獲得最大收益,這些問題都跟股票的準確預測有關.

股票價格起伏不定,觀察股票的漲跌情況主要是關注股票指數的浮動情況.股市指數是由證券交易所或金融服務機構編制的表明股票行市變動的一種供參考的指示數字.具體某一種股票的價格變化,投資者方便了解;對于多種股票的價格變化,可以參考大盤的走勢.為了適應這種情況和需要,一些金融服務機構根據市場的情況,編制出股票價格指數,公開發布,作為市場價格變動的指標.投資者據此就可以檢驗自己投資的效果,并用以預測股票市場的動向.

合理的預測股票趨勢可以給投資者提供一定的參考,近些年來,人們對股市研究越來越多,研究方法也越來越多[1].文獻[2]運用Bayes決策法分析股票價格,得出此方法在分析中是可行的.文獻[3]運用逐步回歸分析法對鋼鐵業股票價格進行了研究,最優方程擬合程度達到了80%.文獻[4-5]使用了SVM來預測股票開盤價,并對參數選取作了一定的實驗.與上述方法不同,集成算法以簡單且效果良好被廣泛應用,選取集成算法通過股票前一天的數據來預測后一天的開盤價漲跌趨勢,并將結果進行比較分析.

2 集成算法介紹

2.1 Bagging

Bagging是一種基于Bootstrap的統計方法[6],從總體中取出多個訓練集,在每個訓練集中重復取樣,假定給定一個訓練樣本包含m個數據集,先隨機取出一部分樣本進行實驗,再把該樣本放回數據集中.假定,這個樣本下次有可能在被選中.經過m次隨機重復操作,得到m個樣本的采樣集.對每個采樣集,分別訓練出一個學習器,再將這些學習器結合,就是Bagging的基本流程.

其基本思想為:

1)給定一個弱學習算法和一個訓練集;

2)單個弱學習算法準確率不高;

3)將該學習算法使用多次,得出預測函數序列,進行投票;

4)最后結果準確率將得到提高.

2.2 Boosting

與Bagging相似,Boosting包含了眾多決策樹的結合,是可將弱學習器提升為強學習器的算法.首先,通過boosting框架對訓練樣本集的操作,得到不同的訓練樣本子集,在訓練出這些樣本的基學習器.再根據基學習器的表現對訓練樣本的分布進行調整,然后將調整后的樣本分布來訓練下一個基學習器.將這些學習器進行加權融合,產生最后的分類器.單個的分類器識別率不一定很好,但是聯合后的結果會有很好的識別率,從而提高了弱學習器的識別率.

2.3 Random Forest

Random Forest由貝爾實驗室的Tin Kam Ho于2001年提出,這個方法是結合Breimans 的 "Bootstrap aggregating"和 Ho 的"random subspace method"想法以建造決策樹的集合.隨機森林分類器是由單棵樹分類{h(x,βk),k=1,2,…}集合構成的組合分類器[7],其中x是輸入向量,βk是獨立同分布的隨機變量序列.其中每個分類器是獨立于輸入向量的隨機向量生成的,每棵樹為最普遍的類別投票來進行分類.

和其他算法相比,Random Forest具有以下優點:

1)可以有效的處理高維度數據;

2)在對缺失數據進行估計時,就算存在大量的數據缺失,隨機森林也能較好地保持精確性;

3)對于不平衡的數據集來說,可以平衡誤差.

3 實證分析

采用R語言程序,選用gbm,random Forest, ipred三個程序包來實現3種集成算法.數據選取股票市場中的上證指數,深證指數,中小板指數,創業板指數的近期數據.分別采用上述3種方法將數據進行分析,用前一天的開盤價、收盤價、成交量、MA5(5日均線)、CCI(順勢指標)、OBV(能量潮)6個數據,來預測后一天的開盤價.如果,前一天的開盤價比后一天的開盤價高,則用“1”表示;如果,前一天的開盤價比后一天的開盤價低,則用“0”表示.

隨機選取中小板指的200個數據(2017.01.24-2017.11.20),深證成指的200個數據(2016.12.01-2017.09.21),上證指數的200個數據(2017.05.05-2018.02.27),創業板指的200個數據(2017.06.06-2018.03.27),來實現實驗,結果見表1.上述數據的開盤價圖像如圖1~4.

表1 分類結果

圖1 中小扳指開盤價

圖2 深證成指開盤價

圖3 上證指數開盤價(200個數據)

觀察表1可知,Boosting在預測創業板指上結果最好,準確率是所有結果里最好的;Random Forest在預測中小板指、上證指數上結果最好;Bagging相比其他兩種方法則適用于預測深證成指.

選取中小板中的大連重工、深證A股的中南建設、上證A股的中國醫藥、創業板的東方國信四支股票;選取數據時間范圍為2017.07.21-2018.05.17.用上述方法進行分析,得到表2結果.

圖4 創業板指開盤價

股票指數名稱數據個數BoostingRandomForestBagging大連重工2000.6750.750.775中南建設2000.7250.750.7中國醫藥2000.7250.750.7東方國信2000.6250.8250.725

從表2中可以看出,集成算法在數據個數為200的時候,可以對第二天的開盤價進行較好的預測.

4 結 論

通過實驗分析三種不同的集成算法的結果,預測不同股票的開盤價漲跌,可知,不同的集成分類方法適用于不同的股票指數的分類.在研究過程中,合理的選取參數會對實驗結果產生一定的影響,但是運算量較大,時間較長,以后會對選取參數方法進行研究.對于進行短期的預測,上述方法較為合適.但是對于長期預測,股票市場具有不穩定性,以及不排除突發因素的影響,需要人們更加深入的研究.

猜你喜歡
開盤價訓練樣本股票市場
人工智能
中國股票市場對外開放進入下半場
中國外匯(2019年20期)2019-11-25 09:54:58
貨幣政策與股票市場流動性的互相關關系研究
智富時代(2019年6期)2019-07-24 10:33:16
我國股票市場的有效性研究
智富時代(2018年11期)2018-01-15 09:52:06
基于協整的統計套利在中國股票市場的實證研究
智富時代(2017年1期)2017-03-10 20:33:43
寬帶光譜成像系統最優訓練樣本選擇方法研究
融合原始樣本和虛擬樣本的人臉識別算法
電視技術(2016年9期)2016-10-17 09:13:41
基于稀疏重構的機載雷達訓練樣本挑選方法
全國5大商鋪收益率對比
主站蜘蛛池模板: 日韩乱码免费一区二区三区| 国产极品美女在线观看| 亚洲美女高潮久久久久久久| 亚洲欧美另类久久久精品播放的| 日本五区在线不卡精品| 99精品国产电影| 亚洲天堂成人| 成AV人片一区二区三区久久| 国产区91| 国产成人无码Av在线播放无广告| 亚洲成人在线免费观看| 热久久这里是精品6免费观看| 亚洲第一视频区| 91国语视频| 青草视频在线观看国产| 日韩av高清无码一区二区三区| 国产成人精品一区二区三区| 中文字幕无码制服中字| 色天天综合| 亚洲精品视频网| 巨熟乳波霸若妻中文观看免费| 国产97公开成人免费视频| 国产精品亚洲αv天堂无码| 五月激激激综合网色播免费| 在线免费观看a视频| 国产精品无码久久久久久| 国产精品成人AⅤ在线一二三四| 久久国产V一级毛多内射| 国产农村妇女精品一二区| 日韩天堂网| 全午夜免费一级毛片| 国产女人在线| 波多野结衣一区二区三区四区| 亚洲黄网在线| 国产成人精品亚洲77美色| 国产午夜小视频| 亚洲精品国产精品乱码不卞| 日韩国产精品无码一区二区三区| 欧美性猛交一区二区三区| 久久99国产精品成人欧美| 天堂网亚洲系列亚洲系列| 伊人色天堂| 91在线激情在线观看| 国产免费黄| 国禁国产you女视频网站| 99热国产在线精品99| 内射人妻无码色AV天堂| 国产美女人喷水在线观看| 高清精品美女在线播放| 国产在线观看成人91| 91精品日韩人妻无码久久| 2020极品精品国产| 色婷婷视频在线| 精品综合久久久久久97| 超清无码一区二区三区| 毛片免费在线视频| 精品撒尿视频一区二区三区| 久久www视频| 欧美在线黄| www精品久久| 免费国产不卡午夜福在线观看| 国产福利微拍精品一区二区| 日韩 欧美 国产 精品 综合| 国内黄色精品| 午夜一区二区三区| 亚洲人成网站色7777| JIZZ亚洲国产| 99热这里只有精品国产99| 久久频这里精品99香蕉久网址| 国产免费羞羞视频| 91精品国产自产91精品资源| 露脸国产精品自产在线播| 国产毛片一区| 免费在线看黄网址| 91成人在线观看| 欧美性爱精品一区二区三区| 欧美一级一级做性视频| 国产18在线播放| 成人国产精品一级毛片天堂| 小蝌蚪亚洲精品国产| 婷婷六月综合网| 四虎成人精品在永久免费|