高欽姣 張勝剛 賈曉薇
【摘要】支持向量機(jī)(support vector machine, SVM)是數(shù)據(jù)挖掘中的一項(xiàng)新技術(shù),是借助于最優(yōu)化方法解決機(jī)器學(xué)習(xí)問(wèn)題的新工具。 支持向量機(jī)目前主要用來(lái)解決分類問(wèn)題(模式識(shí)別,判別分析)和回歸問(wèn)題。而股市行為預(yù)測(cè)通常為預(yù)測(cè)股市數(shù)據(jù)的走勢(shì)和預(yù)測(cè)股市數(shù)據(jù)的未來(lái)數(shù)值。而當(dāng)我們將走勢(shì)看作兩種狀態(tài)(漲、跌),問(wèn)題便轉(zhuǎn)化為分類問(wèn)題,而預(yù)測(cè)股市未來(lái)的價(jià)格是指為典型的回歸問(wèn)題。本文旨在于介紹預(yù)測(cè)股票價(jià)格走勢(shì)的SVM簡(jiǎn)單預(yù)測(cè)模型。 該模型可以用來(lái)預(yù)測(cè)未來(lái)若干天股票價(jià)格的大體走勢(shì),這對(duì)于股票投資可以起到很好的指導(dǎo)性作用。
【關(guān)鍵詞】支持向量機(jī) 股票價(jià)格預(yù)測(cè) 量化分析
【中圖分類號(hào)】G64 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2016)10-0227-01
一、引言
隨著金融市場(chǎng)的逐步完善,證券交易所的交易量也在不斷的提升,預(yù)測(cè)未來(lái)一段時(shí)間內(nèi)的證券價(jià)格成為廣大投資者密切關(guān)注的問(wèn)題,同時(shí)產(chǎn)生了許多優(yōu)秀的證券分析預(yù)測(cè)方法[1],如基本分析和技術(shù)分析(K線圖、移動(dòng)平均線和OBV線等)。然而這些方法從本質(zhì)上來(lái)講只是分析方法,其預(yù)測(cè)結(jié)果不很理想。近年來(lái),國(guó)內(nèi)外學(xué)者紛紛采用人工神經(jīng)網(wǎng)絡(luò)[2]、支持向量機(jī)[3]等方法對(duì)證券交易數(shù)據(jù),特別是股票市場(chǎng)的數(shù)據(jù)進(jìn)行處理,試圖揭示證券交易數(shù)據(jù)背后所蘊(yùn)含的意義,并對(duì)其價(jià)格進(jìn)行預(yù)測(cè)。目前,國(guó)內(nèi)外關(guān)于證券價(jià)格預(yù)測(cè)的方法主要有證券投資分析法、時(shí)間序列分析法、人工神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)方法[4]等。
自2000年以來(lái),國(guó)內(nèi)外對(duì)支持向量機(jī)的研究不斷地增加,SVM應(yīng)用于證券價(jià)格預(yù)測(cè)領(lǐng)域的優(yōu)勢(shì)可概括為:
(1)SVM具有堅(jiān)實(shí)的數(shù)學(xué)理論基礎(chǔ),是專門針對(duì)小樣本學(xué)習(xí)問(wèn)題提出的。
(2)從本質(zhì)上講,SVM算法是一個(gè)凸二次規(guī)劃問(wèn)題,可以保證得到的解是全局最優(yōu)解。
(3)SVM采用核函數(shù)方法,有效的解決了復(fù)雜計(jì)算問(wèn)題。
(4)SVM應(yīng)用了結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,因而具有很好的推廣能力。
基于以上優(yōu)點(diǎn),我們可以相信SVM在證券價(jià)格預(yù)測(cè)領(lǐng)域?qū)⒃絹?lái)越受推崇。
二、支持向量機(jī)簡(jiǎn)介
支持向量機(jī)分類的目標(biāo)是能在某特征空間中學(xué)習(xí)到一個(gè)分類超平面,使得在這個(gè)空間中能夠?qū)?shù)據(jù)線性分開(kāi)。支持向量機(jī)的研究最初是針對(duì)模式識(shí)別中的二類線性可分問(wèn)題提出來(lái)的。由于股市的數(shù)據(jù)是非線性的,SVM對(duì)數(shù)據(jù)進(jìn)行非線性映射,通過(guò)映射?覬:X→F ,將數(shù)據(jù)映射到一個(gè)合適的特征空間F中,從而使數(shù)據(jù)線性可分,然后在F中構(gòu)造最優(yōu)超平面。由于優(yōu)化函數(shù)和分類函數(shù)都涉及樣本空間的內(nèi)積運(yùn)算, 因此在變換后的高維特征空間E中需進(jìn)行內(nèi)積運(yùn)算<?覬(xi),?覬(xj)>,根據(jù)滿足Mercer定理,對(duì)應(yīng)線性變換空間中的內(nèi)積,<?覬(xi),?覬(xj)>=k(xi,xj)。采用適當(dāng)?shù)暮撕瘮?shù)k(xi,xj),就能代替向高維空間中的非線性映射,實(shí)現(xiàn)非線性變換后的線性分類。
三、支持向量機(jī)在股票價(jià)格預(yù)測(cè)中的應(yīng)用
(1)支持向量機(jī)核函數(shù)的選取問(wèn)題
支持向量機(jī)方法是將數(shù)據(jù)映射到一個(gè)Hilbert特征空間中,然后在此特征空間中對(duì)數(shù)據(jù)進(jìn)行處理,數(shù)據(jù)分類時(shí)選擇合適的核函數(shù)非常重要。目前的方法大部分是使用一種徑向基函數(shù)Guass核函數(shù),同樣可以作為核函數(shù)的還有徑向基函數(shù)吳函數(shù)和Wendland函數(shù),在對(duì)徑向基函數(shù)和Guass核函數(shù)做了充分研究的基礎(chǔ)上,對(duì)支持向量機(jī)中的核函數(shù)可以進(jìn)行分析和改進(jìn)。
(2)將改進(jìn)的分類方法應(yīng)用到股票價(jià)格預(yù)測(cè)中
將分類方法應(yīng)用到股票價(jià)格預(yù)測(cè)中時(shí),要面臨以下問(wèn)題: 一是變量的選取問(wèn)題, 我們希望在選擇盡量少的向量的基礎(chǔ)上達(dá)到做好的預(yù)測(cè)效果。 二是變量的處理問(wèn)題, 目的是不能出現(xiàn)向量被覆蓋的問(wèn)題。
四、總結(jié)
隨著非線性理論、統(tǒng)計(jì)學(xué)、系統(tǒng)論、信息論、控制論和人工智能技術(shù)的空前發(fā)展,證券價(jià)格預(yù)測(cè)也開(kāi)辟了新思路。支持向量機(jī)作為一種新的機(jī)器學(xué)習(xí)方法,它基于嚴(yán)格完備的數(shù)學(xué)理論,引入結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,可以得到全局最優(yōu)解,解決了陷入局部極小點(diǎn)的問(wèn)題,利用支持向量機(jī)對(duì)證券時(shí)間序列進(jìn)行預(yù)測(cè)是目前金融預(yù)測(cè)領(lǐng)域的最好方法之一。
參考文獻(xiàn):
[1]彭麗芳, 孟志青, 姜華等.基于時(shí)間序列的支持向量機(jī)在股票預(yù)測(cè)中的應(yīng)用[J].計(jì)算技術(shù)與自動(dòng)化,2006, 25(3):88-91.
[2]彭望蜀.基于BP神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)的股票指數(shù)預(yù)測(cè)模型比較[J]. 南方金融, 2013(1):71-72.
[3]克里斯蒂亞尼尼.支持向量機(jī)導(dǎo)論[M].電子工業(yè)出版社, 2004.
[4]劉道文, 樊明智.基于支持向量機(jī)股票價(jià)格指數(shù)建模及預(yù)測(cè)[J].統(tǒng)計(jì)與決策, 2013(2):76-78.
作者簡(jiǎn)介:
高欽姣(1986.9—),女,山東日照人,博士,講師,研究方向:應(yīng)用數(shù)學(xué)。