999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于模糊近似支持向量回歸的股價預測研究

2021-04-06 10:53:08王冰玉劉勇軍
計算機技術與發展 2021年3期
關鍵詞:模型

王冰玉,劉勇軍

(華南理工大學,廣東 廣州 510640)

0 引 言

股價預測主要基于相關預測模型預測股價的未來變化趨勢以捕捉相應的市場行情,從而促進股票選擇。近年來,股價預測是熱點問題。許多學者和業界人士都從理論和實踐層面對其股價預測模型進行相關研究,其研究方法包括GARCH[1-3]、模糊時間序列[4-5]、ARIMA[6-8]等。由于計算機技術的發展和廣泛應用,各種機器學習和量化投資模型也被逐漸地應用到股票預測領域,例如支持向量機、人工神經網絡、遺傳算法和差分進化算法等股價預測模型。

Yu和Yan基于PSR方法和DL的長短期記憶網絡(LSTMs),設計了一種基于DNN的股價預測模型,并對不同時期的多個股票指數進行預測[9]。Onoh等利用協調搜索(HS)和遺傳算法,建立混合人工神經網絡模型,并根據數據集的統計和財務表現進行實證分析[10]。Moghaddam等研究人工神經網絡對納斯達克股票日匯率的預測能力,從而對用反向傳播算法訓練的幾種前饋神經網絡進行了評估[11]。Hjek等將情緒與財務指標相結合,使用一個多層感知器神經網絡來預測異常股票回報率[12]。綦方中等提出一種基于PCA-IFOA-BP神經網絡的股票價格預測模型,并借助上證指數進行預測[13]。孟葉等選取K-近鄰、梯度提升和自適應提升這3個分類器,通過改進的投票算法聚合成一個新的分類器模型,對指數行情數據進行學習分類[14]。

雖然基于神經網絡的混合模型是預測股票市場指數的有效預測方法,但是卻存在著諸如黑箱技術、過擬合、收斂速度慢、陷入局部極小等局限性。為了克服這些局限性,Cortes和Vapnik提出的支持向量機(SVM)方法已經成為股票市場指數預測領域的一種流行研究方法,它采用結構風險最小化的原則,以最小化泛化誤差的上界。通過應用支持向量機,不太可能出現過擬合,而且最優解也可能是全局的[15]。Nayak等構建一種支持向量機與K近鄰法相結合的混合框架,用于印度股市指數的短期、中期和長期預測[16]。Chen等引入特征加權向量,進一步提出特征加權支持向量機和特征加權K最近鄰的基本混合框架,以有效地預測股票市場指數[17]。Xiao等提出一種將SVM和SSA相結合的組合模型,并建立基準模型進行對比分析[18]。Lee創建一種基于支持向量機(SVM)和混合特征選擇方法的股市趨勢預測模型[19]。Fung等提出一種新的近端支持向量機(PSVM)模型,并使用公開的數據集上的計算結果表明,PSVM不僅具有與SVM相當的測試集正確性,而且具有相當快的計算時間[20]。姚瀟和余樂安在PSVM的基礎上,引入模糊隸屬度的思想,提出模糊近似支持向量機(FPSVM),并利用兩個公開的信用數據集進行實證研究驗證該模型的有效性[21]。張貴生等針對股價的非線性特點,提出基于近鄰互信息特征選擇SVM-GARCH的股價預測模型[22]。張冰等提出具有局部信息挖掘功能的DNN加權算法對eplion-TSVR模型進行改進,并借助上證A股的高頻數據進行實證預測[23]。

綜上所述,首先雖然SVR能夠在股價預測中發揮更好的表現力,但是都未考慮股票數據中所含的噪聲信息對股價預測的影響,其次現有研究未曾考慮投資者對兩種預測誤差((1)預測值>實際值;(2)預測值<實際值)的不同偏好。有的投資者更注重收益,而有的投資者更關注損失,因此,不能簡單直接地使用SVR模型進行股價預測,而是應該根據實際情況,針對投資者的不同目標賦予不同的偏好值,構建有效的股價預測模型進行股票價格的準確預測。

綜合考慮以上研究現狀和存在的不足之處,該文構建信噪比特征向量,并借用現有文獻表明的相關股價預測指標,選取歷史數據、趨向、反趨向、能量、量價、波動和信噪比等其他七個方面的指標作為輸入變量,考慮到投資者對預測誤差的不同偏好,引入模糊隸屬度和雙邊權重測量方法,構建基于信噪比的模糊近似支持向量回歸模型進行股價預測。

1 模糊近似支持向量機

模糊近似支持向量機(FPSVM)是由姚瀟和余樂安在2012年提出的[21]。該模型是為了減小訓練樣本的奇異點和噪聲對模型的干擾,在PSVM的基礎上,引入了模糊隸屬度。設含有N個訓練樣本的訓練集樣本對{(x1,y1),(x2,y2),…,(xN,yN)},其中xi∈Rd為第i個訓練樣本的輸入向量,d為樣本空間維度,yi∈{+1,-1}為對應輸出值,則FPSVM模型的具體形式如下:

(1)

其中,C>0為錯誤項的懲罰參數,εi為松弛變量,Φ(x)為非線性映射函數,wT為特征空間維數,b為待定的標量參數,mi為隸屬度,表示第i個樣本點對超平面的貢獻率。mi越小,則誤差項所占的比例越小,在整個模型的影響就越小。當所有的mi=1時,FPSVM就退化為PSVM。

2 股價預測輸入指標的獲取

由于買賣反彈,價格變化的離散性、交易規模的差異和訂單流的戰略組成部分等因素導致所觀察到的價格過程是一個包含噪聲的過程[24]?,F實生活中,一般所觀察的對數價格過程包含對數有效價格和噪聲兩部分,相應的股價對數形式為:

(2)

(3)

噪聲的存在會影響股價預測。若該文能在SVM方程的構建中進一步消除噪聲,則可提高股價預測精度。信噪比(SNR)是描述信號中有效成分與噪聲成分的比例關系參數,可以有效地對噪聲進行處理[25]。該文考慮引入SNR降低噪聲干擾。根據現有文獻,可得到信噪比(SNR)的計算公式[26]:

(4)

此外,股票市場中,開盤價、最低價、最高價和總交易量歷史數據通常被用做輸入指標。最近相關學者研究表明一些技術指標有助于更好地預測股價[17]。故該文同時借助相關的技術指標作為輸入變量,具體將這些指標分為:

(1)趨向指標:移動平均線(MA)、指數移動平均線(EMA)、異同移動平均線(MACD)和動量指標(MTM);

(2)反趨向指標:相對強度指數(RSI);

(3)能量指標:AR、BR和成交量變異率(VR);

(4)量價指標:多空比率凈額(DK);

(5)波動指標:平均真實范圍(ATR)。

3 基于FPSVR的股價預測模型構建

3.1 FPSVR模型構建

直接采用SVR模型進行股票預測會存在以下不足:首先原有的SVR模型都未考慮投資者對股價預測誤差的不同偏好情況,默認投資者對預測誤差的偏好是一致的,使得預測結果不能準確反映投資者的投資策略,其次SVR模型無法處理噪聲和奇異點對模型的干擾狀況,影響模型的預測準確度。

故而,該文得到基于模糊近似支持向量回歸的股價預測模型,其具體形式如下:

(5)

其中,i為所選取股票的第i個樣本,N為訓練樣本總數,xi為第i個輸入向量,xi=(xi1,xi2,…,xi15)分別代表開盤價、最高價、最低價、總交易量、移動平均線、指數移動平均線、異同移動平均線、動量指標、相對強弱指數、人氣指標、意愿指標、成交量比率、多空比率額、真實波動幅度均值和信噪比,yi為實際股票收盤價。

通過構造拉格朗日函數對式(5)進行求解,得到:

(6)

分別對w,b,mi,ni求偏導,得:

(7)

對式(7)求解得到:

(8)

故上述規劃問題變為:

(9)

f(x)=w*Φ(x)+b=

(10)

3.2 隸屬度的獲取

(11)

4 實證分析

4.1 數據的選取

選擇滬深300成份股的股票日數據進行股票收盤價的實證分析,相應時間序列的日期為2008年1月1日至2019年12月31日,數據來源于東方財富數據庫。滬深300成份股共包括300只股票,故該文總共選取300只股票作為總樣本,并從中隨機選取30只股票進行股票收盤價預測。所有的實證均在同一系統環境下運行,系統運行環境為PC(CPU 2.60 GHz,4.00 GB RAM),操作系統為Windows 10,仿真軟件為Matlab R2016b。此外,采用libsvm處理SVR。并將樣本數據集分為訓練樣本數據集和測試樣本數據集,選擇樣本數據的前80%作為訓練樣本,后20%作為測試樣本。

滬深300成份股是滬深證券交易所于2005年4月8日聯合發布的反映A股市場整體走勢的指數,由上海和深圳證券市場中選取300只A股作為樣本,其中滬市有179只,深市121只,綜合反映深交所上市A股的股價走勢。它具有業績優于整體、對家方案較優、股改行情明顯等優勢,經常被研究者用于股價預測。

為了更好地反映所提出的基于信噪比的FPSVR股價預測模型的有效性,將所選取的股票時間序列按照股市的波動情況(牛市、震蕩市和熊市)分為三個階段,進行階段式預測。為了更清晰地展示股市狀況,以招商銀行為例,對階段式預測進行說明,如圖1所示。

圖1 招商銀行2008-2019年日收盤價的變化趨勢

從圖1可看出,招商銀行的收盤價變化趨勢可分為三個階段,其中H代表熊市階段,為階段1;N代表牛市階段,為階段2;其余時間的指數變化趨勢大致代表震蕩市階段,為階段3。

本研究為確保所有的輸入特征位于相同參數范圍內,以防止大范圍的輸入特征壓倒其他輸入特征,采用式(12)對數據進行標準化處理:

(12)

其中,xij為第i個樣本的第j個輸入特征值,xminj為樣本數據第j個輸入特征的最小值,xmaxj為樣本數據第j個輸入特征的最大值。

4.2 相關性分析

Spearman相關系數不但可以衡量存在非線性關系的相關變量之間的相關程度,而且未對數據有嚴格的假設要求,故本節采用Spearman相關系數進行輸入特征變量與股票收盤價之間的相關性分析。為了更清晰地說明特征變量與股票收盤價之間的相關性,進一步地以招商銀行為例展示輸入特征與股票收盤價的相關性分析結果,如表1所示。

由表1可看出:

(1)在置信度為0.01時,開盤價、最高價、最低價、MA和EMA都與股票收盤價之間的Spearman相關系數>0.95,說明這些指標都與股票收盤價存在很強的正相關性,這些輸入指標數值增加時,股票收盤價也增加。

表1 各指標相關性分析

(2)在置信度為0.01時,SNR與股票收盤價的Spearman相關系數>0.6,說明SVR與股票收盤價之間存在中等程度的正相關性,當SNR增大時,股票收盤價隨之增大。

(3)不管是在置信度為0.01時,還是在置信度為0.05時,MACD、BR、VR和OBV都與股票收盤價存在非相關關系,但是這些指標與其他指標之間存在相關關系,說明這些指標可以影響其他指標,從而間接影響股票收盤價的變化。

從上述發現中可得到以下結論:①SNR與預測變量股票收盤價之間存在直接的正相關性,進而說明所構建的SNR特征變量是有效的;②這些輸入特征之間存在緊密的相關性,且都與預測變量股票收盤價之間存在直接或間接的相關關系。

4.3 評估準則

眾所周知,誤差是指測量值與真實值或實際值之間的差值,主要用來衡量測量結果的準確度,其中平均絕對百分比誤差因能避免誤差相互抵消的問題,可以準確反映實際預測誤差的大小,均方根誤差不僅能對一組測量中的特大或特小誤差反映非常敏感,而且能夠很好地反映出測量的精密度,故經常被用于預測模型的準確度測量。該文將平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)作為股價預測模型的評估準則,其表達式如下所示:

(13)

(14)

考慮到上述實驗條件,對于所有RMSE和MAPE,它們的值越小,所構建的股票收盤價預測模型的預測性能越好。

4.4 結果分析

為了驗證所提出的基于信噪比的FPSVR股價預測模型的有效性,在收盤價預測的過程中,選用三種基準模型預測方法,分別為模型1:未加入信噪比的支持向量回歸(未加入SNR的SVR);模型2:加入信噪比的支持向量回歸(加入SNR的SVR);模型3:未加入信噪比的FPSVR,并將這三種預測方法與文中所提的模型4—基于信噪比的FPSVR模型進行對比分析。

由于金融時間序列的動態特性是非線性的,文中將FPSVR模型應用于收盤價預測時,使用高斯核函數作為核函數,因為高斯核函數在一般的平滑假設下往往會有很好的性能[27]。此外,本節采用基于十折交叉驗證的網格搜索方法,對傳統的支持向量回歸參數進行了選擇,并對FWSVR模型也使用同樣的參數,所使用的參數如表2所示。

表2 基于信噪比的FPSVR模型所使用的最優參數

此外,采用遺傳算法(GA)對FPSVR股價預測模型進行求解,GA中所使用的相關參數為G=2 000,popsize=50,其中G為進化代數,popsize為種群規模,相應的適應度函數變化情況如圖2所示。

圖2 GA的適應度函數的變化情況

從圖2中可看出,在進化代數為2 000時,隨著GA算法的進化代數增加,適應度函數趨于穩定,從而說明這種情況下,GA算法可以很好地對FPSVR進行求解。

下面根據上述所建立的四種不同模型對滬深300成份股中隨機選擇的30只股票時間序列進行收盤價預測,并給出了四種模型在不同階段的預測誤差,如表3所示。

從上述實驗結果中可以看出:

(1)與模型1和模型2相比,模型3和模型4的預測誤差更低,說明加入模糊隸屬度和雙邊權重的FPSVR模型可以更好地實現股價預測。

(2)模型2和模型4的預測誤差分別低于模型1和模型3的預測誤差,從而表明加入信噪比特征變量后的股價預測模型準確度更高。

(3)分階段來看,不管是SVR股價預測模型還是FPSVR的股價預測模型,在階段1和階段2的預測誤差均較高于階段3的預測誤差,說明在震蕩時期,這兩種模型更適用于股價預測。

(4)分階段來看,在階段1和階段2時期,FPSVR的股價預測模型的預測誤差要遠低于SVR股價預測模型的預測誤差,從而表明,該文所構建的FPSVR模型可以彌補SVR模型在階段1和階段2時期的股價預測誤差較大的不足,可以更好地實現股價預測。

表3 模型對比分析結果

5 結束語

為了更好地實現股價的精準預測,提出了基于信噪比的模糊近似支持向量回歸(FPSVR)的股價預測模型,并通過實證研究、相關性分析和對比分析三個方面實現和驗證所提模型的準確性。研究結果表明,與現有模型相比,該模型不僅在震蕩期,而且在牛市和熊市期均可實現股價的精準預測。該模型通過對滬深成份股2008年至2019年的股票日數據進行研究和分析,實現對股票的準確預測,為投資者提供一種更有效的預測方法,從而有助于投資者的投資決策。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美日本激情| 国产欧美视频综合二区| 亚洲全网成人资源在线观看| 波多野结衣一二三| 丝袜久久剧情精品国产| 一区二区三区四区在线| 91视频国产高清| 色婷婷成人| 欧美成人aⅴ| 亚洲精品视频免费观看| 亚洲视频欧美不卡| 国产成人在线无码免费视频| 免费看久久精品99| 91精品视频播放| 国产亚洲精品va在线| 日韩小视频网站hq| 91久草视频| 久久公开视频| 一级爆乳无码av| 多人乱p欧美在线观看| 91热爆在线| 永久免费av网站可以直接看的| 久久久久久久97| 国产成人av大片在线播放| 亚洲Va中文字幕久久一区 | 精品国产污污免费网站| 免费人成网站在线观看欧美| 欧美亚洲激情| 好紧太爽了视频免费无码| 黄色一级视频欧美| 香蕉网久久| 亚洲无码一区在线观看| 91欧洲国产日韩在线人成| 亚洲成人网在线播放| 国产黄网站在线观看| 香蕉eeww99国产精选播放| 国产系列在线| 精品一区二区三区自慰喷水| 一本无码在线观看| 嫩草影院在线观看精品视频| 丝袜高跟美脚国产1区| 成人字幕网视频在线观看| 国产毛片基地| 四虎永久在线精品国产免费| 国产探花在线视频| 日韩成人高清无码| 国产91麻豆免费观看| 四虎国产精品永久一区| 69视频国产| 国产91无码福利在线| 亚洲AⅤ综合在线欧美一区| 久久夜色精品| 国产精品成人一区二区| 伊人婷婷色香五月综合缴缴情| 另类重口100页在线播放| 国产欧美亚洲精品第3页在线| 免费A∨中文乱码专区| 71pao成人国产永久免费视频| AV色爱天堂网| 亚洲国产成人麻豆精品| 成人综合在线观看| 最新亚洲人成无码网站欣赏网| 欧美亚洲第一页| 免费激情网站| 色噜噜在线观看| 国产精品观看视频免费完整版| 日韩人妻少妇一区二区| 亚洲第一极品精品无码| 日本高清有码人妻| 看国产毛片| 91在线日韩在线播放| 无码综合天天久久综合网| a毛片在线播放| 在线视频亚洲色图| 高清大学生毛片一级| 最新国产成人剧情在线播放| 尤物午夜福利视频| 婷婷99视频精品全部在线观看| 在线观看网站国产| 国产区精品高清在线观看| 亚洲不卡av中文在线| 国产成人高清精品免费5388|