摘要:依據建模理論的不同,可將股票價格預測模型分為兩大類,:一類是以統計理論為基礎的傳統型的價格波動預測模型;另一類是以神經網絡、灰色理論、支持向量機等為理論基礎的創新型預測模型。運用這兩類模型對股票價格進行預測時各有特點。本文對這兩類模型及其研究現狀進行系統研究,將兩類模型的特點進行比較分析,探討股票價格預測模型在我國應用中存在的問題,并對未來發展方向提出建議。
關鍵詞:股票價格預測;GARCH模型;SV模型;神經網絡;灰色模型;支持向量機
中圖分類號:F830.9
文獻標識碼:A
文章編號:1000-176X(2009)07-0089-05
股票作為金融市場最主要的金融工具之一,其價格波動能否預測、以及用何種方法進行預測,一直以來都是金融領域研究的焦點問題之一。
20世紀80年代以前,Markowitz的資產組合理論、Sharpe的資本資產定價理論、Fama的有效市場假說等傳統的金融理論在金融領域占主導地位。傳統金融理論認為:投資人是完全理性的;金融資產收益具有獨立、同分布和正態分布三個最為本質的特征;股票價格波動是鞅(Martingale)過程,無法預測。但是,20世紀80年代初非線性理論、行為金融理論和人工智能方法的出現與發展,對傳統金融理論所持的上述觀點產生了顛覆性沖擊。
非線性理論中最具影響力的是Mandelbrot于1977年創立的分形(Fractal)理論,其中提出“自相似”和“分數維”兩個重要概念。分形在價格波動特征研究中的應用是:將“自相似”概念引入到統計學的“分形統計學”,即研究一個時間序列中局部與整體之間是否存在統計的自相似性。1982年Engle正是在分形理論的基礎上,對股票價格波動特征進行研究,開創性地提出了自回歸條件異方差模型((Autoregressive Conditional Heteroskedasticity,簡稱ARCH模型)。GARCH模型說明:股票收益不像傳統金融理論描述的那樣屬于正態分布,而是有波動性和叢聚性,存在尖峰厚尾現象;GARCH模型較好地模擬了股票波動中存在的這種叢聚性和時變性,由于股票價格波動在統計上存在“自相似”,因此,股票價格波動是可以預測的。
行為金融理論著重分析金融市場中由于心理因素引起的投資者的失誤偏差和市場的反常。1985年,Werner De Bondt, Richard H.Thaler發表了《股票市場過度反應了嗎?》一文,從而引發了行為金融理論研究的熱潮,被視為金融學行為金融研究的正式開端。行為金融學研究的一系列成果表明;金融市場存在反應過度和反應不足;存在許多異常現象:例如小公司現象、規模現象等;存在羊群效應、流行效應等。行為金融學研究表明:投資人不是完全理性,而是部分理性。股票價格波動是有一定規律可尋的,是可以部分預測的。
分形理論和行為金融理論,在理論上支持了股票價格波動的可預測性,同時,在20世紀80年代,計算機智能算法大量涌現,神經網絡、支持向量機、遺傳算法、信號理論,粗集算法等,在計算技術層面上對股票預測給予了強有力的支持,解決了預測過程中許多實際的技術問題。這種理論和技術的相互支撐和相互印證,使得對股票價格波動預測方面的研究產生了前所未有的爆發力。20世紀90年代至今20年左右的時間里,涌現出大量的對股票進行預測的研究文獻。國內外許多學者運用各類預測模型和方法對股票價格波動進行實證分析和預測,希望能夠從中得到有益的啟示和可以遵循的規律,從而為政府對股市進行調控與管理、投資者回避投資風險等提供借鑒與依據。
從國內外對股票價格波動進行預測的模型種類很多。但依據其建模理論不同,可將這些預測模型劃分為兩個大類:一類是以統計原理為基礎的傳統型波動率預測模型,目前較為流行且具有代表性的模型包括ARCH模型和SV模型;另一類是以神經網絡、灰色理論、支持向量機等為基礎的創新型預測模型。這兩類模型在對股票價格波動性進行預測時各有特點,但同時也存在至今難以解決的一些問題。比如:如何提高股票價格波動率的預測精準度,如何將影響股票價格波動的非量化因素加入到數量化模型之中等等。對這些問題的進一步研究以及提出相應的解決方法,成為股票價格波動預測方法研究的前沿問題。
一、國內外研究動態
1.基于統計原理的預測模型的研究情況
(1)GARCH模型
1982年Engle開創性地提出了自回歸條件異方差模型(簡稱ARCH模型)[1],較好地模擬了股票波動中存在的叢聚性和時變性。
國外研究者利用GARCH模型進行了大量的研究,表明GARCH模型及其擴展形式對描述金融時間序列的波動性具有非常好的效果。French、Schwert 和 Stambaugh(1987)用GARCH模型估計美國股市預期收益和波動的關系,發現預期收益與股票的可預測波動成正相關。同年Engle等運用GARCH-M模型進行研究發現,條件方差可以較好地解釋標準普爾500指數預期收益的變動情況。1991年Bollerslev和Engle的研究也發現風險溢價和波動性之間存在正相關關系。股價波動的杠桿效應在Nelson(1991),Glosten、Jagannathan and Runkle(1993),Engle and Ng(1993)以及 Fornari and Mele(1997)的論文中得到多次證實。此外,很多實證應用等都證實GARCH能夠提供較理想的數據模擬與預測效果。
國內也有不少學者對GARCH模型進行研究和應用。魏巍賢、周小明(1999)運用GARCH模型對中國股市波動性進行了預測。丁華(1999),周哲芳和李子奈(2000),唐齊鳴和陳健(2001)等對我國股市的ARCH效應進行了分析,并進行了股指波動的擬合。岳朝龍(2001)、陳千里(2002)、周少甫(2002) 利用GARCH模型對我國股市收益的波動集簇性和不對稱性進行了實證研究。張世英和柯珂對ARCH模型體系做了系統的評述 [2]。李勝利(2002) 、樓迎軍(2003) 探討了我國股票市場的杠桿效應。張永東、畢秋香做了上海股市波動性預測模型的實證比較[3]。
(2)SV模型
1986年,Taylor提出了隨機波動模型(Stochastic Volatility Model,簡記為SV模型)。隨機波動性模型的提出是與金融資產中定價的擴散過程直接相關的,認為不僅標的資產的價格可以用維納過程來描述,而且波動率也可以用維納過程來描述,SV模型是一類極具應用前景的金融波動模型。
國外學者對SV模型研究也比較多。例如,Ghysels,Harvey和Renault(1995)對資產市場隨機波動模型的起源、估計方法、模型擴展及波動持續性的相關研究文獻進行了詳細的綜述。So、Lam、Li和Smith把馬爾可夫結構轉換機制引入到SV模型中,得到具有馬爾可夫結構轉換機制的隨機波動模型(MRS-SV模型)。Kalimipalli、Susmel提出了與So、Lam、Li不同的馬爾可夫結構轉換隨機波動模型來刻畫短期利率的水平和波動。Jun、Yu利用基本SV模型對新西蘭股市進行了預測分析,發現基本SV模型具有很好的預測能力[4]。G..B.Durham(2007)利用SV-mix 模型對標準普爾500指數做了預測,認為預測效果較好。
國內學者白幌和張世英(2001)利用擴展的SV模型對深圳股票市場的波動性進行了實證研究,指出擴展的SV模型比標準的SV模型在描述金融波動性方面更有優越性。楊克磊、毛明來等用SV模型對上證和深證波動性進行分析,結果表明上海股市風險大于深圳[5]。王春峰(2005)對均值條件分布為正態分布的SV模型與條件厚尾分布的SV模型進行比較,實證結果表明厚尾分布的SV模型能夠更好地描述我國股市波動特征。錢浩韻(2006)采用SV和A-SV模型對上證綜合指數、深圳成份指數和香港恒生指數的日收益率進行擬合,結果表明A-SV要優于SV。吳啟權等(2006)運用SV模型研究我國股票市場政策效應現象。毛明來等(2006)對SV類模型體系進行了全面探討。周彥、張世英(2007)利用基于Markov 鏈的Monte Carb模擬積分方法對連續時間的SV模型進行估計,選取上海股市的日綜合指數進行實證研究,結果證明了模型與方法的有效性。
比較國內外學者的研究結果可以發現國外學者采用美國或其它西方國家股市的相關數據帶入GARCH模型或SV模型進行數據擬合或預測,其效果普遍要好于國內學者采用國內股市相關數據進行的同類研究。
2.基于非統計原理的預測模型的研究情況
(1)灰色模型
由我國學者鄧聚龍教授提出的灰色預測模型,已經被廣泛應用于多種領域的短期預測,如糧食產量預測、電力負荷預測等。灰色GM(1,1)模型是最常用的一種灰色模型,它是由只包含單變量的一階微分方程構成的模型,是GM(1,n)模型的特例。
國外運用灰色模型進行短期股票波動率方面的相關預測文獻較少。而在國內,很多研究者已將灰色模型應用到股票預測領域中。
陳海明、段進東(2002)將GM(1,1)模型和馬爾可夫模型結合起來,建立灰色-馬爾可夫預測模型,對上證綜合指數進行預測,得出灰色-馬爾可夫模型精度高于GM(1,1)的結論。施久玉等(2004)運用GM(1,1)模型建立了上海證券指數65日平均值運行軌道的最高點預測模型,其預測值與市場值非常吻合。覃思乾(2006)應用灰色GM(1,1)模型對股票價格進行短期預測,并與ARIMA模型進行擬合比較,得出灰色模型精度高于ARIMA的結論。
(2)神經網絡
人工神經網絡的理論是一門新興的邊緣和交叉學科。它有表示任意非線性關系和學習等能力,給解決很多具有復雜的不確定性和時變性的實際問題提供了新思想和新方法。在預測領域,1987年Lapeds和Farber首先應用神經網絡進行預測,開創了人工神經網絡預測的先河。
Matsuba(1991)率先將神經網絡引入股票市場的價格預測上。此后,許多研究者運用神經網絡模型對股市進行了預測。Hill等將神經網絡與六種傳統的統計預測方法進行對比,他們用111個時間序列進行預測,其結果表明采用短期(月度、季度)數據預測時,神經網絡明顯優于傳統統計模型;采用長期(年度)數據預測時,結果相差不多[6]。
我國運用神經網絡進行股市預測的學者也相對較多。李敏強、孟祥澤(1997)在模糊神經網絡基礎上采用遺傳學算法對股市投資策略進行了研究。吳微等利用多層前饋BP網絡較好的分類能力,結合國內股票市場的特征,對股票漲跌進行了預測[7]。吳成東、王長濤(2002)運用人工神經元BP網絡對股市進行了預測。劉永福、伍海華(2003)等建立BP神經網絡預測模型,對上證指數進行了預測,發現模型收斂速度快,學習能力強,預測精度高,誤差率較小,對股指的短期預測十分有效。尚俊松(2004)、龍建成(2005)、胡靜(2007)等都運用神經網絡模型進行了股市預測研究。我國學者的實證研究表明,人工神經網絡應用于我國股票市場的預測是可行和有效的,有良好的前景。
(3)支持向量機(SVM)
Vapnik等(1995,1998)根據統計學習原理提出支持向量機(簡稱SVM)學習方法。這種方法通過尋求結構風險化最小、實現經驗風險和置信范圍的最小,從而達到在統計樣本較少的情況下,亦能獲得良好統計規律的目的。SVM算法是一個凸優化問題,因此局部最優解一定是全局最優解。SVM算法將原空間中線性不可分的數據變換到線性可分的高維特征空間,再用核函數映射到原空間來求解,巧妙地解決了維數災問題,算法的復雜度與輸入樣本的維數無關。但核函數的選取在SVM算法中是一個較為困難的問題。
H.Nakayama(2003)等介紹了SVM中的遞增學習和遺棄數據方法,并將其應用于股票價格預測。W.Huang(2005)等用支持向量機預測股票市場運動方向。P.Pai(2005)等將ARIMA模型和SVM模型結合起來,提出一種組合模型來進行股票價格預測,得出該組合模型優于單個ARIMA或SVM的結論。
從國內相關研究看,楊一文等(2005)利用SVM對上海證券綜合指數序列趨勢做較準確的多步預測。李立輝(2005)等將SMV應用到我國上證180指數預測中。周萬隆、姚艷(2006)將SVM模型用于股票價格短期預測,取得良好效果。張晨希、周萬隆等(2006)利用支持向量機對股票進行短期預測。趙金晶(2007)實驗結果表明,該方法比神經網絡方法以及時間序列方法的預測精度更高。
總體上看,我國學者運用創新型預測模型進行股市方面預測的文獻多于傳統的統計模型,而且從預測效果上看,創新型預測模型的預測精確度要高于傳統型統計類預測模型。在創新型的三個模型中,神經網絡模型被運用得最多,支持向量機被認為預測效果最為精準,而運用灰色模型進行短期預測其方法則最簡便。
二、基于統計原理的預測模型與創新型預測模型的比較分析
1.建模的理論基礎不同
傳統的基于統計原理的股票價格波動預測模型是建立在統計分析理論基礎之上的。而處理基于概率統計的隨機過程要求樣本量越大越好,原始數據越完整、越明確越好。但事實上,在實際中,即使有了大樣本量,也不一定找到規律,即使有了統計規律也不一定是典型的。創新型預測模型則是完全脫離統計理論的基礎,以一種創新型的建模思維來建立預測模型。例如灰色模型是建立在灰色理論基礎之上的,依據廣義能量變化規律,對歷史資料進行累加處理,使其呈現出指數變化規律,然后建模。而人工神經網絡模型是建立在神經網絡理論基礎之上的,它通過模仿人腦神經系統的結構及信息處理和檢索等功能,建立神經網絡模型進行預測。支持向量機則依據的是統計學習的機器學習理論,通過凸優化,使得局部解一定是最優解,克服了神經網絡收斂速度慢和局部極小點等缺陷。
2.對數據的要求與處理不同
基于統計原理的預測模型要求樣本量大并有很好的分布規律,無論是GARCH模型還是SV模型,只有在樣本量足夠大、且分布較好的情況下,其預測效果才會比較理想。例如,運用GARCH模型對美國股指進行預測要比對國內股指進行預測效果理想,原因是我國股市發展的時間相對較短,期間由于宏觀調控和股改等原因,造成股指大起大落,導致數據分布規律性不強,因此我國運用這類模型存在一定局限。而創新型預測模型對樣本量的要求和分布程度的要求均較低。例如灰色模型,只要擁有七八個數據就可對下數據進行預測。在處理技術上,灰色模型要對原始數據進行累加處理,使表面雜亂無章的數據呈現出明顯的指數規律,建模計算之后,再進行累減還原。神經網絡模型則采用數據驅動,黑箱建模,無需先驗信息,能夠在信息資源不完整、不準確等復雜的數據環境下,通過自身結構的調整,提取數據特征,并對未來進行有效預測。
3.模型結構的穩定性與適應性不同
基于統計原理的預測模型一經建立,其模型結構具有較強的穩定性,模型變量之間存在一個穩定的內在關系。無論是GARCH模型還是SV模型,模型結構都相對穩定、簡單,而且都是單因素模型。但在實際中,預測環境復雜多變,一旦系統變量之間出現新的關系,該類模型則無法調整和適應。創新型預測模型則是一種或者多因素、或者可以變結構的模型,其計算相對復雜,但其適應能力要好于基于統計原理的預測模型。如灰色模型,除了有基本的GM(1,1)模型,對于高階系統,灰色理論通過GM(1,n)模型群解決,并且可以綜合考慮多種因素的影響。而神經網絡和支持向量機都是變結構模型,通過網絡對新樣本的學習,調整其內部結構,從而適應系統變量的變化。對于非線性高維、高階問題神經網絡和支持向量機會發揮得更好。
4.預測精準度與外推性強弱不同
比較而言,基于統計原理的預測模型誤差較大,外推性差。因為基于統計原理的預測模型對數據樣本沒有再處理或學習的過程,對樣本的擬合性較低,由此導致其外推性也較差。而創新型預測模型相對而言精確度較高,外推性強。因為創新型預測模型對數據具有再處理或學習的過程。灰色模型是對數據進行了累加處理;而神經網絡模型和支持向量機是對數據進行了學習,然后進行推理、優化。因此,創新型預測模型的擬合度和外推能力都要高于統計類模型。
5.預測難度與預測時間長度不同
基于統計原理的預測模型技術比較成熟,預測過程相對簡單。無論是GARCH模型還是SV模型,其建立模型依據的理論基礎堅實,模型構造相對簡單,計算難度相對較低。由于這類模型采用的數據是較長時間的歷史數據,因此可以對未來進行較長時間的預測。而創新型預測模型預測技術還有改進的余地,且預測難度較大。如利用神經網絡進行股票價格波動預測,其過程相對較難,因為神經網絡需要設定隱層和權重。用支持向量機方法進行預測,涉及到核函數的確定。核函數的確定難度較大。由于創新型預測模型對數據要求不高,一般是小樣本量預測,因此,適用于對預測對象進行短期預測。
三、我國運用股票價格預測模型存在的問題
1.我國運用股票價格預測模型進行股票預測方面的研究成果十分有限,研究難度很大,預測的精準度有待提高
從中國期刊全文數據庫檢索的結果看,1998—2007年10年間我國公開發表的期刊類文獻中,運用GARCH模型進行股票預測的文章有4篇,運用SV模型進行預測的文章有7篇,兩類文章合計有11篇。而運用灰色模型進行預測的文章有5篇,運用神經網絡進行預測的文章有67篇,運用支持向量機進行預測的文章有9篇,三類文章合計有81篇。
將統計類與創新類預測模型方面的文章全部加總,10年間相關文章也不超過100篇。這個數字至少說明兩個問題:一是我國在這個領域的研究還沒有廣泛深入開展起來,相關研究人才和研究成果都十分有限,現有的研究只是處在一個起步的階段。二是對股票價格波動進行預測難度非常大,預測的精準度很難達到研究者的預期水平,因此不排除有相當部分的研究成果因預測失敗而沒有公開發表。
2.運用創新型預測模型對我國股市進行預測的效果要好于基于統計原理的預測模型
從我國目前公開發表的預測類文章的預測結果看,創新型模型預測效果要好于傳統的統計類預測模型。造成這種情況的原因主要是由于基于統計原理的預測模型對原始數據的要求比較嚴格,只有在原始數據分布比較好、資料完整、樣本量大的前提下,其擬合與預測的效果才會比較理想。而我國股市從1990年上證交易所成立并開始交易算起,至今僅有18年的歷史。在這18年中,由于政策、監管、股改等原因影響我國股市經歷了幾次大起大落,加之上市公司數量有限并不斷變化,造成原始數據在分布、樣本量、數據完整性等方面均不理想,因此,在我國,用基于統計原理的預測模型對股票收益率波動情況進行預測效果大都不太理想。而創新型預測模型大都是小樣本、短期預測,對數據要求不像統計類模型那樣嚴格,因此,在我國目前階段,這類模型的預測效果要好于統計類預測模型。
3.我國股票價格預測模型采用的大都是單一預測模型
從現有研究文獻上看,對我國股票價格波動進行預測的預測模型無論是基于統計原理的預測模型還是基于非統計原理的創新型預測模型都采用單一預測模型。運用單一預測模型進行預測的優點是:模型結構相對簡單,影響因素少,預測難度相對較低。但其缺點也是顯而易見的:單一預測模型不可能將所有影響因素全部包含在一個模型中,任何一種單一預測模型都只利用了部分有用信息,同時也拋棄了其它有用的信息。而股市的影響因素是很多的。只用單一模型對股市波動進行預測,其所包含和反映的信息量顯然是不充分的,因此也就不可能較好地對股市的未來走勢進行有效預測。
4.缺乏對非量化因素進行有效處理的技術與方法
影響股票價格波動的因素很復雜。除了受基本面和技術指標等數量性因素影響之外,還要受政策、心理波動、國際突發事件等非量化因素的影響。目前,我們的股票價格波動預測模型大都是純數量化模型,即只將數量化信息帶入模型進行計算,據此得出預測結果。而那些對股票收益波動率影響很大的非量化信息由于受到模型本身處理方法和處理技術的限制,無法被加入到數量模型之中,從而無法達到與實際情況十分吻合的精準預測。
四、我國股票價格預測模型發展方向
1.創新型的智能化預測模型將成為我國股票價格預測的一個發展方向
首先,創新型預測模型能夠克服我國股市數據不完整、波動大、分布不合理等缺點,采用小樣本數據對股市進行短期預測,預測的精準度相對高于傳統的統計類預測模型。其次,創新類模型中的智能化模型,能夠模仿或部分模仿人工智能,對影響股市的多種因素進行復雜的非線性變結構處理,既能克服單因素模型包含信息不充分的缺點,也能克服固定結構模型無法處理突發性事件的缺點,盡量充分地反映影響股市的多種信息和復雜變化,從而增加預測的準確度。
2.組合預測模型將成為我國股票價格預測模型發展的另一個方向
每一種預測模型都有其優點,但同時也存在預測信息獲取方面的局限性。如何發揮不同的預測模型的優點,克服其缺點,提高預測的準確度,也是目前預測理論與技術亟待解決的問題。組合預測是將不同預測模型的預測結果依據一定的原則賦予不同的權重,然后進行加權平均,得出最終的預測結果。這種預測方法可以克服單一預測模型信息量不充分的缺點,充分發揮不同預測模型的優勢,最大限度獲取不同角度的信息量,提高股票收益率預測水平。
3.包含各種非量化信息的預測模型將成為我國股票價格預測模型的一個重要發展方向
目前股票價格預測模型都屬于數量化預測模型,非量化的因素無法融入到模型之中,這就導致預測中丟失了大量的非量化信息,預測的精準度受到很大影響。如何能將各種影響股市的非定量化信息進行技術處理后轉變成量化信息,使之能夠被加入到股票價格預測的模型當中,從而充分反映政策因素、心理因素、突發事件等非量化因素對股票收益率的影響,提高預測的精準度,是股票價格預測模型的一個重要發展方向。
4.新的預測理論和技術的不斷吸收和應用,是我國股票價格預測模型發展的必然趨勢
縱觀股票價格預測模型的發展過程,不難看出,這個過程其實就是新的預測理論和新的預測技術不斷被引入、吸收、消化、應用、完善的一個過程。GARCH模型和SV模型依據的分形理論、灰色模型依據的灰色理論及技術、神經網絡模型依據的神經網絡理論及技術等,無一不經歷了這樣一個被引入、消化與利用的過程。新的預測理論與技術不斷給股票價格預測提供新視角和更完善與全面的技術,使得股票收益波動率預測模型的預測效果更加趨于完美和精準。目前,混沌理論和小波信號技術也開始在股票價格預測中被初步運用,相信隨著這方面研究的深入,會給股票價格預測方面的發展帶來新的思路。
參考文獻:
[1] Engle R F.Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of U.K.Inflation[J].Econometrica,1982,(50):987-1008.
[2] 張世英,柯珂.ARCH模型體系[J].系統工程學報,2002,(6):236-245.
[3] 張永東,畢秋香.上海股市波動性預測模型的實證比較[J].管理工程學,2003,(2):16-19.
[4] Jun,Yu.Forecasting Volatility in the New Zealand Stock Market[J].Journal of Financial Economics,2002,(12):193-202.
[5] 楊克磊,毛明來,徐正國.隨機波動模型的滬深股市比較研究[J].天津大學學報(社會科學版),2004,(10):334-338.
[7] Matsuba,I.Application of Neural Network Sequential Associator to Long-term Stock Price Prediction,IJCNN’91,Singarporee,1991:1196-1202.
[6] Hill T,O’Connor M , Remus W.Neural Network Models for Time Series Forecasts [J].Management Science,1996,42(7):1082-1092.
[7] 吳微,陳維強,劉波.用BP神經網絡預測股票市場漲跌[J].大連理工大學學報,2001,(1):9-12.
[8] 何問陶,趙建群.AR(g)模型的應用研究[J].云南財經大學學報,2008,(3).
[8] W.Wuang,Y.Nakamori,S.Wang.Forecasting Stock Market Movement Direction with Support Vector Machine[J].Computers and Operations Research, 2005,32(10):2513-2522.
[9] Pai,C.Lin.A Hybrid ARIMA and Support Vector Machines Model in Stock Price Forecasting[J].Omega.2005,33(6):497-505.
[10] 楊一文,楊朝軍.基于支持向量機的金融時間序列預測[J].系統工程理論方法應用,2005,14(2): 176-181.
[11] Ghada Abdelmouez et al.Neural Network Vs.Linear Models for Stock Market Sectors Forecasting. Proceedings of international joint conference on neural networks(2007).1-5