999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

GA-SVM對上證綜指走勢的預測研究

2012-12-27 03:51:10李泓儀蘭書梅
東北師大學報(自然科學版) 2012年1期
關鍵詞:特征優化方法

張 偉,李泓儀,蘭書梅,張 潔

(1.吉林大學計算機科學與技術學院,吉林長春 130012;2.吉林大學經濟學院,吉林長春 130012)

GA-SVM對上證綜指走勢的預測研究

張 偉1,李泓儀2,蘭書梅1,張 潔1

(1.吉林大學計算機科學與技術學院,吉林長春 130012;2.吉林大學經濟學院,吉林長春 130012)

將支持向量機和遺傳算法結合,建立了一種智能數據挖掘技術(GA-SVM),并用于對上證綜指市場走勢進行了探索.在這個混合的數據挖掘方法中,GA用于RBF參數的設定以及特征集的選擇,從而智能的找到SVM的最佳參數,減少SVM特征值的復雜度,提高了SVM算法速度.SVM用于判斷未來股票市場的走勢,并與統計模型、時間序列模型方法、神經網絡進行了對比.實驗證明,GA-SVM優于其他幾種方法,這種方法對于股票上漲或下跌的預測研究是有效的.

支持向量機;遺傳算法;GA-SVM;股票走勢預測

自股票誕生以來,對股票趨勢的預測便成為眾多投資者密切關注的問題.眾多金融、計算機學界的專家、學者對此投入了極大的熱情.由于股市高復雜和高噪聲的特點,研究股票市場的走勢被認為是一項具有挑戰的工作.早期通過人工神經網絡(Artificial Neural Networks,簡稱ANNs)對股票市場進行了預測,但ANNs有諸多不足,結構難以確定,訓練過程學習率等參數不好確定,計算量大、算法收斂速度慢,易于陷入局部極值和過學習的問題[1-2].

針對ANNs的局限性,近年來,人們提出了SVM方法預測證券市場趨勢[3-4].SVM在理論上充分保證了模型的泛化能力,克服了局部極值和過學習的問題,計算復雜度大大降低.為了提高預測率和運行速度,本文提出了一種新穎的GA-SVM智能算法,該方法利用GA的全局自動尋優能力智能的找到SVM的最佳參數、最優的輸入特征,優化了核函數的參數,剔除了冗余特征,提高了預測的命中率,減少了計算量和預測時間.

1 建模

1.1 建立SVM模型

SVM是由Vapnik提出的支持向量分類(SVC).SVM建立在統計學習和結構風險最小化理論基礎之上,其基本思想是利用線性模型通過非線性映射將向量統一到高維空間[5].一個非線性邊界在新的高維平面中可以構造成線性模型.在新的空間,一個可分超平臺將會被建立.因此,SVM是著名的尋找最優超平面邊界即線性模型的算法.最優超平面對二分類問題最有效,這種最接近最優超平面的向量叫做支持向量(Support Vector,簡稱SV),見圖1所示.

SVM是通過核函數來實現從低維線性不可分向高維線性可分即最優超平面映射.這時,SVM核函數可記為

核函數的選取對于創建最優超平面意義重大,本文根據股票數據特點確定采用徑向基核函數,公式為

1.2 遺傳算法的基礎理論

遺傳算法(Genetic Algorithm,簡稱GA)是一類借鑒自然界生物進化和遺傳機理而發展起來的自適應全局優化隨機搜索算法,其本質是一種不依賴具體問題的直接搜索方法[6].GA作為具有高性能計算、建模、尋優的方法漸趨成熟.GA的基本流程圖如圖2所示.

圖1 SVM二分類問題的原理圖

圖2 GA基本流程圖

1.3 建立GA-SVM模型

利用GA對SVM分類器進行改進的關鍵是正確建立GA模型,以優化特征選擇問題為例,對建立GA模型進行介紹.

圖3 特征編碼示意圖

1.3.1 編碼

每一個特征被定義為一位基因,如圖3所示.所有特征用一個長度為特征個數的二進制串表示,這個二進制串就是染色體.如果染色體的第k位為1,就表示第k個特征被選中,如果為0,則表示這個特征被屏蔽.在這里,每一個染色體代表不同的特征子集.

1.3.2 初始化

通常初始種群是由隨機產生的,這也是較為常用的方式.例如,種群中染色體的每一位可以用拋硬幣的方式確定.然而通過這種方式獲得的種群,每一個染色體的“1”或者“0”的數量是大致相同的,每個染色體的特征數量大致相同.但是,我們想獲得代表不同數量特征的染色體種群.于是,本文用2次隨機化方式,首先隨機產生每個染色體所含“1”的個數,然后再把這些“1”隨機分布在對應的染色體中.采用這種方法能更有效地反映特征的多樣性.

1.3.3 適應度的評價

選擇特征子集的目的是使用較少的特征達到相同或更好的分類效果,因此評價適應度應從兩方面考慮:(1)分類的準確率;(2)分類器輸入的特征子集的特征數量.不同的特征子集包含不同數量的特征,如果2個特征子集驗證產生的準確率相同,那么特征數量比較少的子集就被選中.當訓練分類器時,我們僅使用特征子集中確定的特征來訓練,用分類結果評價分類器的性能,并以此來指導GA的進一步搜索.

本文在確定適應度函數時,綜合考慮了準確率和特征數量這2個因素,其中重點考慮的仍然是準確率,但并非只是簡單地將適應度等同于準確率.

結合以上內容,GA的適應度函數可表示為:

1.3.4 遺傳操作

本文沒有使用傳統的一點交叉的方法,因為如果不知道特征之間的依賴關系,一點交叉的方法可能會分離染色體相互依賴的特征.為了避免上述情況的發生,在這里使用均勻交叉的方法.

變異操作的作用是使種群突變,跳出局部極值,它僅改變染色體的一位,并且概率非常小.

選擇是從父代中選擇個體組成新的一代,選擇既要保證優勝劣汰,即適應度高的個體被選中,又要考慮種群的多樣性,避免“早熟”.我們選擇操作方法采用經典的賭輪法.

利用GA尋找SVM中最佳的尺度參數σ和懲罰因子C,其方法與上面基本相同,主要區別是染色體編碼上.首先定義染色體中基因個數為20,并按經驗設定尺度參數σ和懲罰因子C的范圍;然后按設定的范圍進行離散化及二進制編碼,如σ∈(0,10],步長為10/1 024,二進制編碼為0000000001~1111111111,這樣二進制的每一位可以看作是一個基因,得到尺度參數σ的二進制串為X=x1x2…x10.懲罰因子C∈(0,100],步長為100/1 024,二進制串為0000000001~1111111111,得到Y=y1y2…y10,于是染色體為XY=x1x2…x10y1y2…y10,映射函數記為σ=fσ·X,C=f C·Y,其中fσ和f C為參數與二進制編碼間的映射關系.結束后還需要進行解碼,將染色體轉換成實際的尺度參數σ和懲罰因子C.

1.4 GA-SVM模型方法

為方便起見,我們把GA優化SVM參數和特征的方法稱為GA-SVM方法.在GA-SVM方法中雖然兩處優化都用到了GA算法,但這2處優化不能同時進行.為了獲得最佳效果,采用先優化參數再優化特征的辦法.步驟如下:

Step1:選定原始特征向量;

Step2:按照1.3.2的步驟用對參數進行優化,獲得最優尺度參數σ和懲罰因子C;

Step3:按照1.3.1的步驟用對特征向量進行優化,獲得最佳特征向量集;

Step4:用改進后的SVM對測試集進行測試,得到準確率.

2 實例研究

2.1 實際過程

綜合考慮影響數據的各方面因素,采用2000年1月1日到2010年3月24日的上證綜指數據作為樣本,并將該樣本中未來三日漲幅超過1%的樣本標記為“+1”,跌幅超過1%的樣本標記為“0”,其他樣本暫不作考慮.

每一個樣本選用20個特征,建立訓練樣本集合S=((x1,y1),…,(x20,y20))?(X×Y)20,并用“+1”和“0”對數據進行標記.在標記好的樣本數據中,漲跌數據各取20組作為訓練樣本存入訓練集中.20種技術指標的公式見表1[7].

表1 股票分析的重要指標及表達式

續表1

為了評價GA-SVM模型的預測能力,我們將該方法與一些常用的方法進行比較,如靜態時間序列模型和神經網絡模型,以及不帶GA優化的獨立SVM模型和其他優化SVM模型的方法.我們選擇了隨機漫步模型(RW),自動回歸綜合移動平均模型(ARIMA),獨立BP神經網絡(BPNN)模型,獨立SVM模型和蟻群優化的SVM模型作為基準.實驗模型的主要參數設置見表2—4.

表2 SVM主要參數

表3 GA主要參數

對于GA-SVM模型,首先通過GA找到適合樣本特性的RBF核參數σ和懲罰因子C,從而消除了因SVM參數設置不當導致的預測準確率低下的風險.然后用GA對輸入SVM分類器的特征進行選擇,濾掉大部分與股票預測無關或關聯不大的特征,找到最佳特征集.這對沒有先驗知識的使用者來說是極具意義的,同時這也加速了SVM分類搜索的過程.

2.2 交叉驗證

采用10折交叉驗證,先將全部實驗數據平均分成10份,取其中后20套上漲數據、20套下跌數據,共40套數據作為訓練樣本,其余數據作為測試數據,對所確定的參數及特征進行交叉驗證,對所得準確率求數學平均值,得到最終結論.

2.3 實驗結果

分別用以上模型對上證綜指進行預測驗證,得到實驗結果見表5—7.

表4 ANNs主要參數

表5 SVM與其他股票預測效果比較 %

表6 SVM與GA優化的SVM的預測效果比較

表7 GA-SVM與其他主要非線性預測方法效果比較

由表5—7可見,通過對比各模型對上證綜指的預測效果,發現GA-SVM模型表現是最好的.其準確性最高,預測的時效性也最好,這同時也說明GA-SVM的預測模型可以應用于對股票市場趨勢的預測研究.

[1]RAY TSAIH,YENSHAN HSU,CHARIES C LAI.Forecasting S&P 500 stock index futures with a hybrid AI system[J].Decision Support System,1998,23:161-174.

[2]GRUDNITSKE G,OSBURN L.Foreeasting S&P and gold future prices an application of neural networks[J].Futures Markets,1993,13(6):631-643.

[3]KIN KYOUNG-JAE.Financial time series forecasting using support vector machines[J].Neurocomputing,2003,55:307-319.

[4]MUKHEJEE S,OSUNA E GIROSI F.Nonlinear prediction of chaotic time series using support vector machines[C]//Proceedings of the IEEE Workshop on Neural Networks for Signal Processing,State of Florida:Amelia Island,1997:511-520.

[5]VAPNIK V.The Nature of statistical learning theory[M].New York:Springer-Verlag,1995:203-232.

[6]周明,孫樹棟.遺傳算法原理及應用[M].北京:國防工業出版,1999:121-185.

[7]YU L A,WANG S Y,LAI K K.Mining stock market tendency using GA-based support vector machines[C].WINE 2005,LNCS 3828.Berlin:Springer,2005:336-345.

A study on prediction of market tendency on the shanghai stock index based on GA-SVM method

ZHANG Wei1,LI Hong-yi2,LAN Shu-mei1,ZHANG Jie1

(1.College of Computer Science and Technology,Jilin University,Changchun 130012,China;2.College of Economics,Jilin University,Changchun 130012,China)

Support vector machine is an effective data mining technology for limited sample data,genetic algorithm is an excellent tool for global optimization.In this study,a hybrid data mining model which combine support vector machine with genetic algorithm(GA-SVM)is proposed to the prediction of market tendency on the shanghai stock index.In this hybrid data mining approach,GA is used to select the RBF parameters and the features,so that to find the best parameters of SVM.That can reduce model complexity of SVM and improve the speed of SVM;SVM is used to judge the future movement direction of the stock market based on the use of historical data.To validate GA-SVM method,we compared its performance with that of other methods(such as statistical method,time series method and neural network method).The experimental results show that GA-SVM is superior to other methods,implying that the GA-SVM approach is a promising alternative to stock market tendency prediction.

support vector machine;genetic algorithm;GA-SVM;stock market tendency prediction

TP 301

520·2040

A

1000-1832(2012)01-0055-05

2011-10-27

國家科技支撐計劃子課題資助項目(2006BAJ18B02-06).

張偉(1977—),男,碩士研究生,講師;通訊作者:蘭書梅(1963-),女,碩士,副教授,主要從事計算機應用研究.

石紹慶)

猜你喜歡
特征優化方法
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 国产色偷丝袜婷婷无码麻豆制服| 91午夜福利在线观看| 精品国产Ⅴ无码大片在线观看81| 国产91av在线| 亚洲成综合人影院在院播放| 午夜精品久久久久久久无码软件| 18禁不卡免费网站| 尤物亚洲最大AV无码网站| av一区二区三区在线观看 | 亚洲天堂免费观看| 久久国产香蕉| 99人体免费视频| 91九色国产porny| 免费人成网站在线观看欧美| 91精品国产无线乱码在线| 青青极品在线| 亚洲无码熟妇人妻AV在线| 精品福利视频网| 日韩国产综合精选| 国产污视频在线观看| 在线国产三级| 99热这里只有免费国产精品| 亚洲视屏在线观看| 亚洲综合九九| 国产精品亚洲一区二区在线观看| 免费看久久精品99| 亚洲视频免费在线| 亚洲AⅤ波多系列中文字幕| 亚洲国产在一区二区三区| 亚洲综合色在线| 亚洲中文无码av永久伊人| 欧美无专区| 自慰高潮喷白浆在线观看| 亚洲一区二区三区麻豆| 伊人蕉久影院| 亚洲精品视频在线观看视频| 在线国产欧美| 国产日韩AV高潮在线| 国产激爽爽爽大片在线观看| 青青青伊人色综合久久| 国产精品无码一二三视频| 免费看av在线网站网址| 色综合中文| 欧美.成人.综合在线| 国产玖玖视频| 亚洲无码视频图片| 欧美曰批视频免费播放免费| 美女内射视频WWW网站午夜| 精品久久久久无码| 国产精品自在在线午夜区app| 国产精品无码久久久久AV| 国产成a人片在线播放| 99福利视频导航| 999国内精品视频免费| 国产性爱网站| 夜夜爽免费视频| 99久久国产综合精品2023| 免费观看男人免费桶女人视频| 日韩精品欧美国产在线| 日本黄色a视频| 国产SUV精品一区二区| 亚洲欧洲日韩综合| 国产浮力第一页永久地址| 色噜噜综合网| 国产成人91精品| 亚洲永久色| 国产激情无码一区二区APP| 波多野结衣中文字幕久久| 国产精品19p| 尤物亚洲最大AV无码网站| 日韩 欧美 小说 综合网 另类| 免费jjzz在在线播放国产| 久久精品国产电影| 精品伊人久久久大香线蕉欧美| 久久人人97超碰人人澡爱香蕉 | 伊人久久久久久久| 亚洲黄色成人| 97狠狠操| 97超碰精品成人国产| аⅴ资源中文在线天堂| 日本免费精品| 国产精品尤物在线|