孫建英,王顯昌,陳建云
(1.青島理工大學琴島學院,山東青島 266106;2.大連海洋大學理學院,遼寧大連 116023;3.德樂生軟件有限公司,北京 100020)
馬爾科夫鏈推廣模型在股指預測中的應用*
孫建英1,王顯昌2,陳建云3
(1.青島理工大學琴島學院,山東青島 266106;2.大連海洋大學理學院,遼寧大連 116023;3.德樂生軟件有限公司,北京 100020)
將狀態集空間法引入到馬爾科夫鏈預測模型中,并且分析了狀態集空間對預測結果的影響.同時將這種新型的馬爾科夫推廣模型,應用于股指數據的預測問題.發現這種方法不僅符合馬氏檢驗的條件,而且預測的準確率也有所提高.
馬爾科夫鏈;滬深300;狀態集空間法;馬氏檢驗
馬爾科夫鏈模型,得名于俄羅斯的數學家安德烈·馬爾科夫,是一種非常重要的隨機決策模型.它的最顯著的特性是:預測時刻的狀態只與隨機變量當前的狀態有關,而與歷史狀態無關,這種“無后效性”的特點使得該模型廣泛地應用在投資決策、橋梁技術、植被變化、股票價格、匯率預測[1-4]等方面,并取得了很多令人滿意的成果.
本文引入了狀態集,提出了狀態集空間法,通過將t個狀態作為一個狀態,來預測下一個大盤交易日狀態的方法,結果是準確率隨t的增加大幅上升,這種馬爾科夫鏈推廣算法,應用到滬深300樣本股2010.1.30-2012.4.5的數據,預測2012.1.31-2012.4.5的股指變化情況,發現這種新方法不僅符合馬氏檢驗的條件,而且預測的準確率也有所提高.
1.1 馬爾科夫鏈的定義
定義1:對離散空間I中的隨機序列{Xn,n=0,1,2,…,}若在任意時刻n,以及任意的狀態i0,i1,…,in-1,i,j滿足:

則隨機序列{Xn,n=0,1,2,…}即為馬爾科夫鏈,簡記{Xn,n≥0}.馬爾科夫鏈是最簡單的一類馬爾科夫過程.
1.2 一步轉移概率
定義2:設{Xn,n≥0}為一馬氏鏈,條件概率

稱為在時刻n的一步轉移概率.
由于從狀態i出發,經過一步轉移以后,必須到達狀態空間I的一個狀態,且只能夠到達一個狀態,故一步轉移概率pij(n)應滿足下列條件:

若馬氏鏈的一步轉移pij(n)與n無關,則稱此馬氏鏈為齊次馬氏鏈,這時,記pij為元素構成的矩陣

稱為一步轉移概率矩陣.
若狀態空間I是有限集.則稱{Xn,n≥0}為有限馬氏鏈.
1.3 馬爾科夫鏈預測模型
定理1:設{Xn,n≥0}是一個齊次馬氏鏈,具有初始概率分布p0(i),i∈I,且其n步轉移概率為p(n)ij,i,j∈I,n≥0,則

式中(1)式表明,在n時刻的絕對概率分布完全被初始概率分布和n步轉移概率所確定,式中(2)式就是著名的查普曼-科爾莫格羅夫(Chapman-Kolmogorov)方程,(2)式的矩陣形式即為:

由上式進一步得到:P(n)=(P(1))n,由此可見,n步轉移概率矩陣可由一步轉移概率矩陣獲得.
2.1 數據集
數據來源:http://www2.resset.cn/product/
訓練數據集:滬深300樣本股2010.1.30-2012.4.5
預測數據集:滬深300樣本股2012.1.30-2012.4.5
2.2 狀態集空間法
狀態集空間法是將T作為一個狀態,用T這個狀態來預測下一個大盤交易日的股指期貨的變化情況.T=1,2,3,…,n.
T=1表示將一天的數據作為初始狀態矩陣,再和狀態轉移矩陣相乘來預測下一交易日的變化情況.T=2表示,將連續兩個大盤交易日的數據作為一個狀態,來預測下一交易日的股指期貨的變化情況,依次類推.
通過實驗分析,T越大,預測準確率也會越大.我們將狀態空間分為三個狀態,規定大盤指數下降超過20點為大跌,記為3;下降點數在20點到上漲20點之間保持不變,記為2;上漲在20點以上為大漲,記為1.隨T變化此方法預測的準確率匯總表見表1(MATLAB6.5).

表1 狀態集空間法預測準確率統計表
由上表我們可見狀態集空間法的馬爾科夫鏈對股指的預測有很好的效果,在一定范圍內,T越大,準確率越高.
2.3 狀態轉移矩陣
由狀態集空間法,我們研究將連續兩天的狀態作為初始狀態,來預測下一個大盤交易日的漲跌情況.
由初始可能出現的狀態1到下一個狀態的轉移情況,在此狀態空間有3*3種情況,在將這兩個已知狀態作為初始狀態預測下一個交易日的狀態,共有3*3*3種情況,也就是說狀態轉移矩陣S為3*3*3的三維矩陣.利用訓練數據集,我們求出狀態轉移矩陣為

s(:,:,1)表示有已知兩個狀態轉向狀態1,即大漲的頻數.

s(:,:,2)表示有已知兩個狀態轉向狀態2,即保持不變的頻數.

s(:,:,3)表示有已知兩個狀態轉向狀態3,即大跌的頻數.
將上述三個矩陣合起來就是狀態轉移矩陣.
2.4 狀態轉移概率矩陣
狀態轉移概率矩陣也是一步轉移概率矩陣,在狀態集空間法下,我們把已知的兩個狀態作為初始狀態,來看轉向下一狀態的概率,由狀態轉移矩陣分析,我們可知狀態轉移概率矩陣也為

根據概率的性質,有:

狀態轉移概率矩陣為:

p(:,:,3)表示有已知兩個狀態轉向狀態3,即下跌的概率.
我們對狀態轉移概率矩陣進行分析,對 p(:,:,1)、p(:,:,2)和p(:,:,3)進行分析,這三個3*3的矩陣對應相同位置表示由已知前兩個狀態轉移到狀態1、2和3的概率,且其概率和為1.
由此我們可知相同位置上概率最大的就是前兩個狀態最可能轉移到那個狀態,我們取出這三個矩陣中每個位置概率最大的值重新組成一個新矩陣fmax.

由fmax矩陣,我們可以得出前兩個狀態對應最可能轉移到那個狀態值,狀態值組成矩陣Q.

從而我們可以通過已知的初始狀態預測其下一個可能轉移的狀態.
2.5 數據分析
我們以2012/2/21和2012/2/22日的大盤交易狀態為初始狀態集對2012/2/23到2012/4/6日的大盤交易的數據進行預測,結果如表2所示.

表2 2012.2.21-2012.4.05期間31個大盤交易日的預測狀態與實際狀態對比
通過統計得出其準確率為50%,其準確率相對較高,說明此種改進的馬爾科夫鏈方法對股指期貨的預測效果還是明顯的.
2.6 馬氏檢驗
在此我們將馬氏檢驗的公式進行推廣:
設nijr(k)表示k期X1,X2,…,Xn從狀態集(i,j)經過一步轉移到狀態k的頻數,并記頻數矩陣:

在此Pijr表示狀態轉移矩陣的第(i,j,r)個元素,即由狀態i轉移到j再轉移到r的概率.

統計量服從自由度為(m-1)(n-1)(h-1)(t-1)的χ2分布.選定置信度α,查表得χ2α((m-1)(n-1)(h-1)(t-1)),令

通過對改進算法進行的馬氏檢驗和準確率分析可知,改進后的算法有可行性,此種算法可以應用到其他經濟決策領域中.但是不可否認,馬爾科夫鏈模型只是一種概率預測模型,只是說明未來的一種趨勢,而不是絕對的狀態.同時狀態集的劃分和樣本容量的大小等都會對預測的準確性有一定的影響,在應用過程中要注意具體問題具體分析,靈活運用.
[1]耿波,王君杰,張謝東.橋梁技術狀況預測的灰色馬爾科夫鏈模型研究[J].武漢理工大學學報,2007,(1):107-110.
[2]李暉,白楊,楊樹華,等.基于馬爾科夫模型在怒江流域中段植被動態變化預測[J].生態學雜志,2009,(2):371-1376.
[3]劉宗明,賈志洵,李興莉.基于灰色馬爾科夫鏈模型的交通量預測[J].華東交通大學學報,2012,(1):30-34.
[4]陳渝,謝天添,林濤,等.兩種馬爾科夫鏈菜單預測模型建模[J].四川大學學報(自然科學版),2013,(2):255-260.
(責任編校:晴川)
App lication of M arkov Chain Expansion M odel in the Predication of Stock M arket
SUN Jianying1,WANG Xianchang2,CHEN Jianyun3
(1.Qindao College,Qingdao Technological University,Qingdao Shandong 266106,China;2.College of Science,Dalian Ocean University,Liaoning Dalian 116023,China;3.CRM-factory,Beijing 100020,China)
A new concept of State of Spacemethod is introduced in Markov chain predication model and its effect on predication result is analyzed in this paper.The new method is applied to the predication of stock market.It is not only in conformity with the Markov test,and the prediction accuracy is also improved.
Markov chain;Hu-Shen 300;state of spacemethod;Markov chain test
F064
A
1008-4681(2014)05-0100-03
2014-08-15
孫建英(1979-),女,山東煙臺人,青島理工大學琴島學院講師,碩士.研究方向:應用數學.