999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SVM和ARIMA-EGARCH的股票收益預測研究

2023-04-29 00:00:00陳麒吉許學軍
經濟研究導刊 2023年21期

摘" "要:股票市場被視為一個國家實體經濟的重要活動指標之一,它引導資金并將儲戶與投資者聯系起來,最終促進經濟增長,股票的收益波動也逐漸成為眾多機構投資者和散戶投資者最為關心的事情。從過往研究來看,計量經濟學所具有的傳統模型并不能夠在長期過程中實現股價的預測。基于此,創新性地從人工神經網絡算法的支持向量機模型SVM和ARIMA-EGARCH模型出發,選取上市公司A股中遠海特作為研究對象,利用python這一流行的編程工具來進行算法和模型的實現,旨在比較新興的人工神經網絡算法與傳統計量經濟學模型在股票收益預測方面的優劣,并提出相應的優化改進建議。

關鍵詞:股票收益預測;人工神經網絡算法;優化改進

中圖分類號:F832.48" " " "文獻標志碼:A" " " 文章編號:1673-291X(2023)21-0084-03

一、研究背景

近年來,股票收益預測這一經久不衰的話題越發火熱,但同時股票市場出現前所未有的波動,使得股票收益預測越發艱難。基于傳統計量經濟學的諸多模型在情況日益復雜的當代雖然仍有其不可替代的一面,但不得不承認的是,其諸多模型已經很難準確預測股價。而隨著人工智能技術的不斷發展,人工智能的諸多算法具有相當強的自主學習性,其在系統科學領域已開始嶄露頭角。本文引入了當前機器學習領域火熱的人工神經網絡算法中的支持向量機模型,并將其與ARIMA-EGARCH模型進行比較,提出改進意見。

二、理論介紹

(一)ARIMA-EGARCH

ARIMA模型的建模過程可具體解析為四個步驟:第一,是將獲取的時間序列數據進行一次嚴謹的平穩性檢驗,如果得到的結果是非平穩的,那么需要考慮通過差分化或者其他處理方式讓該時間序列數據趨于平穩,使其滿足平穩的基本性條件。第二,確定模型,我們選擇某種統計量來描述選定的時間序列數據的特征并將該統計量完整地計算出來,結合BIC準則來進一步明確ARIMA模型的階數。第三,利用最小二乘法估計模型的參數,合理性檢驗也是要進行的關鍵一步。最后,進行診斷分析,通過生成的模型對數據進行預測,并將實際數據與之進行對比。①

值得一提的是,為了消除異方差性,本次實驗在ARIMA模型后還聯立建立了EGARCH模型。

(二)SVM(人工神經網絡算法)

支持向量機模型屬于人工神經網絡算法中較為經典的一種,常在系統科學領域看到關于SVM模型的身影。在系統科學領域,信號具有逆向傳播和正向傳播兩種傳播路徑,同樣地,誤差也有兩種相同的傳播路徑。在實際操作過程中,期望輸出和實際輸出往往會出現差異過大的情況,這通常意味著此時已經進入了信號誤差反向傳播階段。在這一過程中,輸出誤差會反方向走一遍信號正向傳播的路徑,實驗者可由此監測每一層中不同節點的顯示誤差的有關信號,依據此信號修改網絡的連接權值。反復進行以上操作,即信號反復進行正向傳播,誤差逆向反復進行逆向傳播,監測到預先設定的閾值在網絡誤差之上的情形后或者預先設置的學習次數已經完成或者超額完成時,這意味著可以停止以上操作。②

股票價格或者收益率序列數據由于受眾多人為因素的干擾,因此這種序列數據并非是線性的。基于這一基本特點,結合人工神經網絡算法處理非線性序列數據的獨特優勢,考慮將人工神經網絡算法引入到股票收益的預測之中。本文以上市公司A股中遠海特為例,結合人工神經網絡算法,評測人工神經網絡的預測能力。

三、實證過程

本次研究主要采用以下兩種處理方式處理數據:剔除部分缺失值、缺失值均值補充。處理后的數據為中遠海特A股2014年7月23日至2021年10月29日的時間序列數據,然后再將獲取的數據對數化,以便后續獲得收益率數據。

(一)ARIMA-EGARCH模型①

1.數據平穩性判斷。從數據平穩性條件來看,一個平穩的時間序列數據在數據時序圖的表現往往是一個圍繞它的平均值不斷上下波動的具體過程;與此相反的是,非平穩序列數據在圖形上的表現便是均值會隨著時間段的調整而上下波動(如持續上升或持續下降),即并沒有一個大致均值可供數據圍繞其上下波動。基于這一理論原則,利用所獲數據做出數據時序圖,根據時序圖判斷,所得數據并不平穩。

2.平穩化結果。ADF檢驗常被用于檢測時間序列數據的平穩性:如果ADF統計量小于ADF統計量的臨界值,這意味著可在既定顯著性水平下,拒絕原假設,即認為原時間序列數據存在單位根,由此可判斷原時間序列平穩。本次在對既得時間序列數據的平穩化過程中,經過十六次試驗,確定了采用一階差分法平穩化數據是最好的選擇,差分后的數據通過平穩性檢驗。

3.ACF PACF圖判斷模型。根據python所繪出的自相關系數圖和偏自相關系數圖,由于不知道最優模型的具體形態,根據ACF圖和PACF圖可以暫定ARIMA(17,1,1)能夠最好表達該時間序列數據,備選模型為:ARIMA(1,1,1,),ARIMA(2,1,1),ARIMA(3,1,1),ARIMA(4,1,1),ARIMA(5,1,1),……ARIMA(16,1,1)。

4.根據AIC最小準則,選取模型ARIMA(1,1,1)。

5.殘差檢驗。下面主要針對殘差進行正態性檢驗和自相關性檢驗。殘差滿足正態性,主要是為了殘差集中于某一個數值,如果該值與0很接近,則它實際服從的分布是正態分布,均值為0。從這一點出發,可以斷定。

6.ARCH效應存在性檢驗。從ARCH 效應檢驗結果可以看出,F統計量和Obs*R-squared 統計量分別為223.5215和197.3857,相對應的概率都為0.000,都小于給定的三種置信水平,所以拒絕原假設,拒絕不存在自相關條件異方差的現象,這樣才具備了建立GARCH 模型的基礎。

表2" ARCH效應檢驗結果

7.ARIMA(1,1,1)-EGARCH(1,1)。分別檢驗GARCH(1,1),GARCH-M,TGARCH,EGARCH在t分布和GED分布下的結果,根據AIC及SC最小的原則,LL最大的原則,比較可得ARIMA(1,1,1)-EGARCH(1,1)在GED分布下可以較好的擬合。

8.預測。利用ARIMA(1,1,1)-EGARCH(1,1)模型預測的值和真實值短期來看問題不大,長期仍有一定的差距。②

圖1" ARIMA(1,1,1)-EGARCH(1,1)預測圖

(二)SVM(人工神經網絡算法)

此算法以中遠海特的收盤價為處理對象。在具體數據方面,有4個在設置好的預測時段得到的收益率RDP5、RDP10、RDP15、RDP20,同時結合轉變后的收盤價EMA15,這五個變量組成了輸入向量。EMAn通過當天收盤價減去該天前n天的價格指數滑動平均值而獲得。輸出變量RDP是首先分別將當天與其后第5天的原始收盤價轉換為各自前3天的指數滑動平均值MEA3(i),然后再根據轉換的新值求收益率。

在支持向量機模型的基礎之上進行時間序列數據預測的第一步就應該合理選擇核函數的具體種類。在所處理數據性質不太明朗的前提下,選用高斯核函數RBF是最優的選擇,因為在大多數情況下,這種原則通常會讓實驗者獲得較為理想的結果,甚至所獲結果超出預期。因此本文采用了廣為人知的高斯函數作為核函數。

經過訓練后,這個模型的均方誤差(MSE)為1.9618;平均絕對誤差(MAE)為1.0685。

最后,可以說該算法在這一股票的預測應用具有很強的適應性,所得到的結果同現實情況基本無二。

四、結束語

關于股票收益率的預測是一個古老的問題,不少學者都已對其進行過研究,但從來沒有一種方法可以完全預測股價的走勢,可見股價的預測是多么復雜。

本次研究表明,ARIMA-EGARCH模型對股價進行短期預測有不錯表現,能夠為股市投資者提供些許幫助。但是ARIMA-EGARCH模型相比人工神經網絡算法來說,無論從模型準度以及預測效果等方面,ARIMA-EGARCH模型都明顯劣于人工神經網絡算法中的SVM模型。

并行協同處理能力并非在所有研究系統中都能實現,但是這在客觀實際上的確構成了人工神經網絡的最大優點,并且這種處理能力是大規模的,換句話說,這一算法可以承載以億計的數據量。同樣對應的,訓練集的構架也需要大量數據。它的每一個神經元具有并不復雜的結構,功能也相對單一并且簡單。然而,單一神經元匯聚起來,達成一個完成的整體體態時,它擁有超越一般計量模型的數據處理能力。值得一提的是,由于它復雜的神經網絡并非一環扣一環,因此某個神經節點出現問題對結果的影響微乎其微,這種龐大的容錯能力更是使這個算法脫穎而出,成為新興的研究方法之一。在這個網絡中,信息處理和信息儲存并不存在誰先誰后的爭執,它實現了兩種操作的并駕齊驅,即同時進行信息的兩種操作,由此,整個網絡遍布著信息的存放和處理結果。值得一提的是,強大的容錯能力迫使網絡當中某些節點在操作失誤的情況下不幸被破壞時,信息存取的工作并不會因此而停下腳步。也就是說,系統的正常工作并不意味著系統是完美的,也有可能系統已經遭到未知的某種破壞,只不過你并不能通過系統是否正常工作來判斷這一點。這對于非線性的股票收益率預測來說,無疑是解決了經濟學家頭疼的一大難題。

誠然,系統可以遭受各種破壞不會影響系統的產出,但是訓練好的網絡并不能隨心所欲地進行更改。對于大部分網絡來說,信息存放的地點并非單一,信息是多點分布的,所以當這些網絡完成了學習任務后再讓它學習新的事物,原來訓練好的神經元便會被破壞。換句話說,過去學過的事物便不復完整。

人工神經網絡描述了所研究系統的非線性運動,它是非線性動力系統中極具代表性的典范,它繼承了非線性動力系統所有的共性,比如對于系統未來走向的無法預測、耗散性、高維性、不可逆性、廣泛連接性和自適應性等優點,使得它在股票收益預測領域脫穎而出,較之ARIMA-EGARCH為代表的傳統計量模型具有較強的優越性。

當然,這并不意味著全部否認傳統計量模型,只是在越發復雜的現實因素誘導下,傳統計量模型并未將現實因素全盤考慮在內,故其有一定的局限性。而人工神經網絡算法也并非萬能,人工神經網絡算法需要大量的數據,處理過程之復雜遠勝于傳統計量模型。以上實證過程中,還可以引入波羅的海指數及原油期貨指數等影響因素以期獲取更多數據,來優化模型的主動學習能力,在此不過多贅述。

總的來說,在日益動蕩的A股市場,我們完全可以將人工神經網絡算法結合傳統計量模型來進行股價及其風險的預測。

參考文獻:

[1]" "李方圓,張濤.基于HMM-XGBoost的股價預測[J].桂林航天工業學院學報,2021,26(4):484-488.

[2]" "李曉瑜.評“基于混合量子-經典神經網絡模型的股價預測”[J].電子科技大學學報,2022,51(1):1.

[3]" "徐晨萌,方華.運用ARMA模型對股價預測的實證研究[J].經濟研究導刊,2019(31):77-82.

[4]" "馮旭日,崔潔.基于灰色Elman神經網絡的股價預測[J].遼寧工程技術大學學報(社會科學版),2019,21(4):246-252.

[5]" "林升,綦科,魏楷聰,等.機器學習在股價預測中的研究綜述[J].經濟師,2019(3):71-73.

[6]" "張曉婷,何朗,黃樟燦,等.基于MFR-GEP的高階常微分方程預測模型[J].計算機工程與應用,2019,55(21):247-253.

[7]" "楊春靜.基于時間序列模型的股價預測[J].西部皮革,2018,40(12):98-99.

[8]" "趙建喜,李雪飛,易丹輝,等.基于曲線段特征匹配的股價預測研究[J].數學的實踐與認識,2018,48(1):75-82.

[9]" "薛倩男,高岳林.基于PSO-BP神經網絡股價預測模型研究[J].智富時代,2017(8):17.

[10]" "郭建峰,李玉,安東.基于LM遺傳神經網絡的短期股價預測[J].計算機技術與發展,2017,27(1):152-155.

[責任編輯" "立" "夏]

主站蜘蛛池模板: 久操线在视频在线观看| 99久久精品视香蕉蕉| 国产在线观看一区精品| 国产精品一区二区不卡的视频| 欧美成人一级| 国产欧美日韩va另类在线播放| 国产女人综合久久精品视| 91精品国产麻豆国产自产在线| 中文字幕在线看| 欧洲一区二区三区无码| 自慰网址在线观看| 亚洲午夜福利在线| 国产激情第一页| 国产高潮视频在线观看| 色哟哟国产精品| 国产精品女同一区三区五区| 免费 国产 无码久久久| 一区二区欧美日韩高清免费| 毛片免费在线| 国产主播福利在线观看| 99久久国产综合精品2020| 国产免费怡红院视频| 3344在线观看无码| 亚洲视频三级| a级免费视频| 国产精品护士| 综合天天色| 欧美激情第一欧美在线| 亚洲国产日韩一区| 国内嫩模私拍精品视频| 久久这里只有精品66| 亚洲日韩国产精品无码专区| 在线国产资源| 欧美国产日韩一区二区三区精品影视 | 欧美在线三级| 精品国产乱码久久久久久一区二区| 免费国产小视频在线观看| 高清国产在线| 亚洲妓女综合网995久久 | 久久综合亚洲鲁鲁九月天| 成人免费午夜视频| 波多野结衣在线se| 久久久久国产一区二区| 国产美女免费| 69综合网| 国产真实乱子伦视频播放| 尤物视频一区| 992tv国产人成在线观看| 福利小视频在线播放| 亚洲高清无在码在线无弹窗| 国产一级在线播放| 欧美在线一二区| 美女被操黄色视频网站| 久久www视频| 国产亚洲视频中文字幕视频| 亚洲一区二区日韩欧美gif| 2018日日摸夜夜添狠狠躁| 国产一级毛片在线| 在线欧美日韩国产| 国产成人AV男人的天堂| 国产黄色爱视频| 亚洲综合香蕉| 毛片在线播放网址| 老司国产精品视频| 国内精品免费| 999精品免费视频| 国产极品美女在线| 制服丝袜 91视频| 成年人午夜免费视频| 国产99在线| 2020最新国产精品视频| 天天综合天天综合| 国产成人精品高清不卡在线| 2022国产91精品久久久久久| 日本欧美一二三区色视频| 毛片免费观看视频| 狠狠色丁香婷婷综合| 国产成人凹凸视频在线| 亚洲品质国产精品无码| 三上悠亚一区二区| 久久人体视频| 日本高清视频在线www色|