999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GA-SVM的股指期貨預測研究

2016-09-20 07:22:30張德江程習武梁元浩劉元梓四川大學計算機學院成都610065
現代計算機 2016年7期

張德江,程習武,梁元浩,劉元梓(四川大學計算機學院,成都 610065)

ZHANG De-jiang,CHENG Xi-wu,LIANG Yuan-hao,LIU Yuan-zi(College of Computer Science,Sichuan University,Chengdu 610065)

基于GA-SVM的股指期貨預測研究

張德江,程習武,梁元浩,劉元梓
(四川大學計算機學院,成都610065)

0 引言

股指期貨交易市場瞬息萬變,投資人希望達到效益最大化,而其首先必須做到的就是對預定交易時刻指數的準確預測。但是目前大部分股指期貨預測存在以下一些不足:一是各項預測以股指期貨的技術指標作為基礎數據,脫離交易本身所產生的交易信息進行預測;二是以反轉點等指標作為預測目的,而不是直接對指數進行預測;三是使用默認參數的支持向量機對股指期貨指數進行預測,效果不理想。

針對以上若干問題,本文采用某證券期貨交易公司所提供的2010年4月16日至2014年3月4日的近3000萬條滬深300股指期貨成交明細數據,在對大量交易信息進行一系列數據處理后,使用GA-SVM進行回歸預測研究。

1 實驗設計思路

本實驗的設計思路即為針對前文提出的幾大不足做出改進,一是輸入數據采用交易本身信息,如買賣價格,成交價格等;二是以股指期貨的指數作為預測的目標;三是對SVM進行參數優化,達到最優預測。實驗設計思路如圖1所示。

圖1 實驗流程圖

2 實驗數據預處理

2.1原始數據采集

本文所采用的數據是由某證券公司提供的2010 年4月16日至2014年3月4日的滬深300股指期貨當月合約TICK數據,通常也被稱作股指期貨當月合約成交明細數據。根據實驗的需求,對上述的原始數據集進行了加工提取。選取每天最后一個TICK數據,即每天15:15:00的第二個TICK數據作為一天的收盤情況。從2010年4月16日至2014年3月4日,共取得924條數據。如表1所示。

成交價、當前價:表示目前交易成交時刻的最新價格(在本數據集中,兩者相等)。其中,成交價即是所謂股指期貨的“指數”,也是本文預測的目標。

表1 日數據集樣例

表2 交易數據

買一量、賣一量:表示目前交易的掛單情況,單位為手。

買一價、賣一價:表示完成對應交易所需要支付的每手單價。

成交量:表示持續至當前時刻為止的成交總量。

持倉量:表示買賣雙方未平合約的總量。持倉量能夠反映市場上看多看空力量的大小、變化,以及多空力量的更新情況。

2.2輸入樣本選取

在本文實驗數據集之中,共有10個維度的數據。其中,成交價是回歸預測的目標變量。另外,對于日期與時間兩個維度的數據,直接認定它們與成交價呈不相關關系。當前價與成交價完全相等,因此這個維度的信息也應該排除。有效變量的維度縮小到6維。令:

X=<買一價;買一量;賣一價;賣一量;成交量;持倉量>

Y=<成交價>。

因此回歸模型的基本形式為:

<成交價>=f(<買一價;買一量;賣一價;賣一量;成交量;持倉量>)

假設數據集的最小時間間隔為t,即對于原始數據集,對于日數據集,t的長度為一天。那么:

對于模型Yt=f(Xt),顯然只具有數學上的意義。由于f的映射過程需要一定時間的消耗,所以該模型僅僅有“回歸”的作用,而起不到“預測”的效果。

因此,一個有意義的回歸預測模型至少應該滿足:

Yt+k=f(Xt)(k>0),即可以通過t時刻的X值,給出t+ k時刻的Y值。

在本文的實驗中取k=1,因此一條基本的有意義的數據樣本的格式應該滿足:(<成交價>t+1,<買一價;買一量;賣一價;賣一量;成交量;持倉量>t),

例如,對于以下兩條數據(如表2)。

可以得到一條有意義的輸入數據為:

表3 交易數據

依此規則選取一定數量的數據樣本,就能構成一個預測模型的訓練集。

2.3數據歸一化處理

由于樣本中的各個維度的數據代表著不同的意義,每一維的數據帶有的量綱也各不相同,如果直接使用這類數據,會導致與因變量在比例上相近的數據的影響因子變相加大,回歸預測出現偏差甚至錯誤。因此,需要對各維度數據進行歸一化處理,將其統一到某個固定區間,消除量綱帶來的影響。本文采用最小-最大標準化(Min-Max Normalization)方法進行標準化處理,這種標準化通過數據的線性變換,能夠把結果放縮到[a,b]的范圍。轉換公式表示如下:

其中,x是初始輸入值,x*是轉換后的值,max、min分別對應輸入樣本中的最大值與最小值。實驗對自變量X及因變量Y分別進行歸一化處理:X的歸一化范圍為[-1,1];Y的歸一化范圍為[0,1]。自變量X歸一化后的部分數據樣例如表4所示。

2.4主城份分析

主成分分析(Principal Component Analysis,PCA),是一種統計學上對數據進行降維處理的常用方法。主成分分析通過將原來的數據向量按照一定計算規則重新組合為一組數量較少,并且相互之間獨立的幾個綜合指標向量來替換原來的指標向量,這些綜合指標能夠反映原來數據所包含的主要信息。

表4 自變量X的歸一化效果

使用主成分分析對自變量進行降維處理,能夠有效提升支持向量機的預測精度。主成分分析的算法過程如表5所示。

表5 主成分分析算法流程

此處以表1數據為例進行主成分分析處理:

(1)求得的協方差系數矩陣為:

表6 協方差系數矩陣

(2)各個成分的貢獻率分別為:

成分一 0.510674、成分二 0.262372、成分三0.106219、成分四0.09159、成分五0.028825、成分六0.00032。

(3)如圖2所示,原本6個維度的數據在主成分取得95%的情況下降低到4個維度。

3 基于改進GA-SVM的日數據集預測研究

3.1遺傳算法綜述

遺傳算法(Genetic Algorithms,GA),是源于人們對生物遺傳行為原理的研究。達爾文的進化論、孟德爾的遺傳理論還有魏慈曼的物種選擇學說都對其產生起到了重要的借鑒意義。在近一百年到兩百年的時間里,人們將物種進化論運用到各個的領域,例如醫學、仿生學、機械工程、管理學、計算機等。二十世紀八十年代起,計算機領域的快速發展,多種類生物行為的智能研究如機器學習、神經網絡等開始步入欣欣向榮的發展時期,各學科的交叉應用也越來越頻繁,這恰恰給遺傳算法的研究和應用帶來了新的契機。1962年,密歇根大學的John Holland提出利用群體進化的思想。他指出“新的種群應基于當前種群的有效性而產生”,同時也給出了遺傳算法中常用的一些概念,如使用交叉、復制、變異、選擇等。此后,J.D.Bagley與1967年在他的博士論文中首次提到“遺傳算法”一詞,該詞的用法也由此沿用至今。

圖2 主成分分析成分圖

3.2尋優目標確認

實驗說明,當使用默認參數的支持向量機對股指期貨指數進行預測時,預測效果較差。為了獲得更合理的參數,需要對參數進行尋優。參數尋優最為簡單的方法即是通過暴力查找的方式,對參數的每一個可能值進行嘗試。這種算法的弊端顯而易見,一是需要耗費大量的尋優時間;二是對于參數在取值范圍內是連續值而非離散值的時候,不能覆蓋所有的參數取值情況。由于遺傳算法具有動態搜索的特性,能夠克服暴力查找的缺點,此處使用遺傳算法對支持向量機的參數進行尋優,構建GA-SVM預測模型。

對于RBF核函數所要尋優的參數有c、g。Poly核函數的參數較為復雜,實際研究中經常令d=3,r=1。剩余需要要尋優的參數同為c、g。

另外,參數ε對支持向量的個數有影響,支持向量的數量與預測模型有直接關系,因此,合理的尋優辦法應該把ε也納入尋優范圍。綜上所述,參數尋優的目標為參數對(c、g、ε)。

3.3結合參數尋優的預測流程

GA-SVM模型的預測流程如表7所示。

表7 GA-SVM模型預測流程

GA-SVM詳細流程圖如圖3所示。

圖3 GA-SVM詳細流程圖

3.4基于 GA-SVM 的參數尋優及預測效果結果為:

訓練集MSE=0.000701,r2=0.986797;測試集MSE= 0.000295,r2=0.924759。

圖4 遺傳算法尋優過程

②Poly核函數

使用Poly核函數尋優得到的最佳參數對(c,g,ε)= (0.4167,0.1404,0.0112),在該參數條件下的預測結果為:

訓練集MSE=0.000908,r2=0.906647;測試集MSE= 0.000953,r2=0.883146。

對于使用RBF核函數和Poly核函數的GA-SVM,其預測性能都達到了十分優秀的水準,足以用于實際的預測。

4 實驗結果與分析

本次實驗得到的結果為:

圖5 RBF核函數預測結果

本實驗使用前述的日數據集進行研究。將前800個數據作為訓練集,后123個數據作為測試集。

①RBF核函數:

使用遺傳算法的尋優過程如圖4所示。

最終得到的最佳參數對(c,g,ε)=(2.7997,0.0673,0.0114),使用該參數對重新對訓練集進行并進行預測,

其中,步驟2的設置情況如下:

①遺傳算法:

進化代數=50,種群規模=20,交叉概率為0.7,變異概率為0.01,參數ε的范圍設置為[0,1]。

前文對于c、g的范圍做過定性測試,以之為參考:

對于RBF核函數,參數c的范圍設置為[0,100],參數g的范圍設置為[0,100]。

對于Poly核函數,參數c的范圍設置為[0,10],參數g的范圍設置為[0,10]。

適應度函數fitness=MSE。

①預測精度:從工程角度看,GA-SVM在日數據集上的預測MSE達到了10-3的數量級,這是一個十分準確的預測結果。完全可以用來進行實際操作。

②算法時間效率:在訓練樣本集容量為800,交叉驗證折數為5的情況下,遺傳算法耗費的時間分別為459.2283秒(RBF核)和417.1579秒(Poly核)。

圖5為預測效果示意圖,圖中藍色曲線為實際走勢,紅色曲線是根據預測算法計算后的預測曲線,從圖中可看出預測曲線與實際走勢基本一致,由于數據是隨機選取的,所以可以得出結論,在股指期貨的日數據集上,通過對原始交易數據的選取、歸一化、主成份分析等預處理手段,采用經過遺傳算法優化過參數的支持向量機對其進行預測,可以得到較好的預測效果。

[1]聞杰.滬深300股指期貨對我國股票市場的影響分析[J].企業導報,2014,(11):14-15.

[2]羅文輝.力量天平傾斜 期指金額超現貨.第一財經日報,2010.4,20.

[3]陳艷,褚光磊.關聯規則挖掘算法在股票預測中的應用研究——基于遺傳網絡規劃的方法[J].管理現代化,2014,34(3):13-15. DOI:10.3969/j.issn.1003-1154.2014.03.005.

[4]Manish Kumar.Forecasting Stock Index Movement:A Comparison of Support Vector Machines and Random Forest[C].Indian Institute of Capital Markets 9th Capital Markets Conference Paper.

[5]Dai S Y,Li N.Using SVM to Predict Stock Price Changes from Online Financial News[J].Mechatronics&Applied Mechanics,2012, 157-158:1586-1590.

[6]Publishing S R.Stock Market Prediction Using Heat of Related Keywords on Micro Blog[J].Journal of Software Engineering&Applications,2013,(3):37-41.

Quantitative Trading;SVM;Genetic Algorithm;Prediction

Prediction of Stock Index Future s Based on GA-SVM

1007-1423(2016)07-0026-05

10.3969/j.issn.1007-1423.2016.07.006

張德江(1985-),男,新疆烏魯木齊人,在讀碩士,助教,研究方向為計算金融

程習武(1985-),男,湖北天門人,在讀碩士,助理工程師,研究方向為面向設計與制造的軟件工程

梁元浩(1988-),男,福建廈門人,碩士,職員,研究方向為計算金融

劉元梓(1984-),男,重慶人,在讀碩士,助理工程師,研究方向為信息安全

2016-01-05

2016-02-18

ZHANG De-jiang,CHENG Xi-wu,LIANG Yuan-hao,LIU Yuan-zi
(College of Computer Science,Sichuan University,Chengdu 610065)

近幾年來,跨學科交叉融合日益發展,許多非金融業界的研究者也投入到證券預測之中,各種數學模型被用來進行投資預測,其中尤其以機器學習方法應用最為廣泛。將對滬深300的交易信息進行數據加工,采用GA-SVM對股指期貨進行交易預測,該方法能夠有效地對股指期貨日交易進行預測。

量化交易;支持向量機;遺傳算法;預測

In recent years,with the growing of interdisciplinary integration,many non-financial industry researchers also predict into stocks among various mathematical models are used for investment forecasts,which especially the most widely used machine learning methods.Uses CSI 300 index for data processing,the use of GA-SVM prediction model for stock index futures trading can effectively predict the date of the transaction.

主站蜘蛛池模板: 国产黄色爱视频| 亚洲精品国产综合99| 亚洲精品成人片在线观看| 亚洲免费毛片| 久久99蜜桃精品久久久久小说| 中文字幕免费视频| 亚洲日韩AV无码精品| 久久男人视频| 99精品久久精品| 最近最新中文字幕免费的一页| 亚洲国产精品一区二区第一页免 | 午夜电影在线观看国产1区| 亚洲有无码中文网| 国产99在线观看| 久久伊人久久亚洲综合| 狠狠色婷婷丁香综合久久韩国| 久久毛片网| 国产成人无码Av在线播放无广告| 久久久久人妻一区精品色奶水| 99青青青精品视频在线| 婷婷亚洲最大| 一区二区三区四区在线| 亚洲精品片911| 国产成a人片在线播放| 又粗又硬又大又爽免费视频播放| 亚洲自偷自拍另类小说| 亚洲欧美日韩另类在线一| 欧美精品aⅴ在线视频| 最新日本中文字幕| 国产精品成人第一区| 亚洲国产系列| 国产综合亚洲欧洲区精品无码| 欧美黄色网站在线看| 国产精品成人免费综合| a级毛片免费看| 动漫精品中文字幕无码| 亚洲不卡影院| 永久免费无码成人网站| 人人爱天天做夜夜爽| 露脸国产精品自产在线播| 欧美第一页在线| 精品伊人久久久香线蕉| 97视频免费在线观看| 成人精品视频一区二区在线| 久久香蕉国产线看精品| 国产精品久久精品| 日韩美女福利视频| 成人福利在线视频| 无套av在线| 18禁黄无遮挡免费动漫网站| 人人看人人鲁狠狠高清| 久久国产拍爱| 国产本道久久一区二区三区| 国内精品视频| 欧美激情,国产精品| 999精品视频在线| 亚洲无码视频图片| jijzzizz老师出水喷水喷出| 国产精品黄色片| 亚洲精品视频免费观看| 国产亚洲视频播放9000| 丝袜美女被出水视频一区| 国产91蝌蚪窝| 欧美激情视频一区| 亚洲精品动漫在线观看| 欧美国产在线精品17p| 国产第一页屁屁影院| 国产成人毛片| 亚洲婷婷丁香| 亚洲综合极品香蕉久久网| 国产精品人人做人人爽人人添| 99久久精品视香蕉蕉| 99久久精品免费观看国产| 成人在线观看不卡| 国产理论精品| 国产成人精品亚洲77美色| 国产av无码日韩av无码网站| 亚洲一区二区无码视频| 亚洲天堂网视频| 青青青草国产| 欧美福利在线播放| 18禁高潮出水呻吟娇喘蜜芽|