999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的股票指數漲跌概率推斷

2012-03-15 00:23:38彭益
統計與決策 2012年16期
關鍵詞:模型

彭益

(湖南大學 金融與統計學院,長沙 410079)

0 引言

股票的價格由股票的價值所決定,價格圍繞價值上下進行波動。通過對股票內在價值以及其價格的表現形態進行分析,可以了解股票價格的波動性。對股票的內在價值進行分析,即基本面的分析,主要是結合公司的經營業績與行業的發展前景,對公司的未來現金流進行預測,從而確定公司未來的價值。當價格高于價值時賣出,當價格低于價值時買入。對價格的表現形態進行分析,即技術分析,主要是對公司股票的歷史價格、成交量等交易數據進行挖掘,找出其規律。在此基礎上,對股票價格走勢進行預測,進而確定當前價位對應的交易策略。基本面分析是一種長期的投資工具,本文欲對短期股指漲跌概率進行推斷,故未考慮基本面分析。

從股票產生之日開始,對股票價格以及股指漲跌的預測是學術界與股票投資者感興趣的問題。對投資者而言,對股價的預測準確度越高,有利于其獲得利潤與回避風險。對國家的經濟金融發展而言,股票市場是國民經濟的晴雨表,股票預測也具有重要的作用。針對這樣的情況,本文提出推斷股指漲跌概率的新方法,通過數據挖掘,用泊松分布擬合股指收益率的動態過程,從而構造股指漲跌概率推斷模型來對股指漲跌概率進行預測。

1 基于數據挖掘的股指漲跌概率推斷模型

股票指數漲跌變化可以看成離散的時間序列,日收盤價是時間的函數。若進行技術分析,實際上是在知道股票指數第t天以前信息基礎上,對第t+1天股票指數 pt+1進行預測。 pt+1是一個非線性的函數,近期的技術分析集中分析收益率動態過程,主要是利用神經網絡以及生存模型對股票價格及股指漲跌進行預測。本文也從收益率動態過程的角度出發,對歷史數據進行挖掘,采取泊松分布對股指漲跌的動態過程進行擬合,并且以該泊松分布為基礎,構建股指漲跌概率推斷模型,從而判斷第t+1天的股指相對第t天是漲還是跌。

1.1 基于歷史數據的泊松分布擬合

對第t+1天股指漲跌進行預測前,可以計算出股指歷史日收益率。第t天股指收益率為rt,收益率計算采用rt=(pt-pt-1)/pt-1,其中 pt表示第t天收盤價,pt-1表示第t-1天收盤價。

我國股票市場存在10%的漲跌停限制,每天股票收益率在-10%與10%之間波動。股票指數采取的是派許加權綜合價格指數方法進行計算,故其日漲跌幅也在-10%與10%之間。將收益率總區間[-10,10]劃分為n等份,則每個區間段的長度為20 n。用i表示區間序號,i取值從1到n,第i區間段表示為Sector(i),則:

在收益率區間劃分為n等份后,可以判斷第t天股指收益率rt所處的區間,若rt在區間a(a∈Sector(i))內,將歷史數據中出現股指收益率處于區間a后第二天數據組成一個集合S,用該集合來進行泊松分布的擬合。用Count(i)表示集合S中股指收益率在區間段Sector(i)元素個數,P(i)表示集合S中股指收益率在區間段Sector(i)中概率,則:

假設第t+1天收益率rt+1服從參數為λ的泊松分布,且

1.2 分布參數的估計

泊松分布的擬合是在收益率區間劃分為n等份基礎上進行的,需要獲得n的最佳值,使得集合S中股票指數收益率盡量服從泊松分布。令n的擬合評估函數為F(n),現在考慮影響F(n)的元素。

最后,我們希望集合S中股指收益率的實際概率分布是盡量光滑的曲線,考慮股指收益率分為n個區間后,集合S股指收益率實際概率出現異常點的情況。如圖1所示,異常點是指在處于某區間的實際概率比其左右臨近區間的概率都要低的情況。圖1中,收益率區間劃分為15個區間段,縱坐標為對應的概率值,則點4為異常點。異常點的個數g(n)越多,表示實際概率分布越不平滑。異常點的個數與 f(n)呈負相關關系。

圖1 異常點示例圖

對異常點g(n)進行定義如下

其中 P(i)表示集合 S中股指收益率在區間段Sector(i)中的實際概率,h表示收益率區間進行等分后,集合S中包含元素最多的區間段,即P(h)=max{P(i)},i∈{1,2...n}。

根據以上三個主要的影響因素,建立了最佳泊松分布的擬合評估函數:

1.3 漲跌概率推斷模型的構建

本文以{G(t+1)>60%|G(t+1)<40%}作為判別條件,當G(t+1)的值大于60%時,我們認為第t+1天股指上漲概率較大;當G(t+1)的值小于40%時,我們認為第t+1天股指下跌的概率較大。

2 股指漲跌概率推斷模型的檢驗

2.1 股票指數與數據的選取

我們選取上證綜合指數(000001),新上證綜指(000017)以及深證新指數(399100)對股指漲跌概率推斷模型進行檢驗。上證綜合指數反映上海證券交易所上市的股票價格的總體趨勢。新上證綜指由滬市所有G股組成,股票在股權分置改革方案實施后的第二個交易日納入指數,該指數與2006年1月4日發布。深證新指數上反映深圳證券交易所流通股票價格的變動情況,其以G股公司為主體編制,于2006年2月16日開始發布。

在對股指第t+1天漲跌情況進行推斷時,采用的歷史數據為2006年2月16日至第t天的數據。歷史數據選取從2006年2月16日開始,是考慮到深圳新指數于2006年2月16日開始發布;另外在計量經濟學中,一般認為時間序列里前期數據對后期數據的影響呈現一個遞減的趨勢,前期數據過多,反而使得數據預測會產生一個失真的效果,上證綜合指數和新上證綜指沒有選取所有的歷史數據進行擬合。從2006年2月16日以后的200個交易日后開始預測,因為如果前期數據過少,會導致集合S中缺乏的足夠數據來進行泊松分布的擬合。總樣本的數據截止于2011年6月30日,即進行預測的最后一天的數據為2011年6月30日。

2.2 模型的簡化與模擬結果

本文采用Microsoft Visual Studio 2005 with C#進行編程,對股票指數漲跌概率進行估算。在本文前面建立的模型基礎上,進行一定的簡化處理。模型中需要遍歷n={1→2000b},但是在實際檢驗過程中,n取值范圍簡化為[15,50]。原因在于模型將收益率總區間進行了均勻分布處理,分區數不能過少,取n的下限值為15;在對部分數據進行處理后,發現n的取值一般在50以內,為了計算機處理的方便,我們取50作為上限值。

上證綜合指數,新上證綜指以及深證新指數的檢驗結果如表1所示。

表1 指數擬合結果

對上證綜合指數而言,第一個符合 {G(t+1)>60%||G(t+1)<40%}的數值出現在2006年12月11日,由于本文為了使擬合的泊松分布接近真實值,故要求在對第一個數據進行擬合之前至少有200天的交易,而初始數據是從2006年2月16日開始,故第一個數據的出現接近2006年年底。n值取42時,擬合評估函數F(n)取得最大值。當n值為42時,該天上證綜合指數收益率服從參數為23.67的泊松分布。根據股指漲跌概率推斷模型,上證綜合指數漲跌的概率G(t+1)為66.18%,上漲的概率比較高,而該天上證綜合指數實際增長率為1.76%,推斷正確。在所有符合{G(t+1)>60%||G(t+1)<40%}的日期里面,根據本文構建的模型判斷上證綜合指數漲跌與實際上證指數漲跌一致的占69.39%,說明該模型對上證綜合指數漲跌的預測具有一定的準確性。

對新上證綜指而言,第一個符合判別條件的數值出現在2006年12月11日。估計擬合函數F(n)取得最大值時,n值為18,該天收益率服從參數為12.33的泊松分布。根據股指收益率概率分布函數,判斷該天新上證綜指漲跌的概率G(t+1)為78.55%,上漲的概率高,而該天新上證綜指實際增長率為1.85%,估計正確。在所有符合判別條件的日期里面,根據本文構建的模型判斷新上證指數漲跌與實際漲跌相同的占到72%,說明該模型對新綜指漲跌的預測具有一定的準確性。

對深證新指數而言,第一個符合 {G(t+1)>60% ||G(t+1)<40%}的數值出現在2006年12月11日,n值為21時,估計擬合函數F(n)取得最大值。該天服從參數為14的泊松分布,從而判斷該天深證新指數漲跌的概率G(t+1)為78.21%,上漲的概率比較高,而該天深證新指數實際增長率為0.2%,估計正確。在符合判斷條件的所有日期里面,根據模型判斷深證新指數漲跌的概率與實際漲跌概率一致的占到64.2%,說明該模型對深證新指數漲跌的預測具有一定的準確性。

在選取的三種指數中,預測準確度最低的是深證新指數,為64.2%,但是其依然優于呂琦采用支持向量機的預測準確度63.3%,說明該方法是可取的。

3 結論

本文基于數據挖掘,構建了用于推斷股指漲跌概率的新模型。通過對上證指數、新綜指和深證新指數的實證檢驗表明該模型具有一定的準確性,其對新上證綜指的擬合程度最好。但是該模型具有一定的缺點,判別條件的要求比較高,故并不能對每天的股指漲跌進行預測,有待進一步的改進。

[1]Cheol-Ho P,Scott H.Irwin.What do we Know about the Profitability of Technical Analysis?[J].Journal of Economic Surveys,2007,21(4).

[2]Kim K,Won B L.Stock Market Prediction Using Artificial Neural Networks with Optimal Feature Transformation[J].Neural Comput&Applic,2004,(13).

[3]Liu W,Zhang W.Stochastic Volatility Model and Technical Analysis of Stock Price[J].Acta Mathematica Sinica,English Series,2004,27(7).

[4]鄧杰,唐國興.中國股票市場技術交易規則有效性的實證分析[J].華東經濟管理,2009,(5).

[5]李莎,李紅剛.股票市場中技術分析有效性的實證研究[J].北京師范大學學報(自然科學版),2009,(2).

[6]雷鳴,葉五一,繆柏其,郭文旌.生存分析與股指漲跌的概率判斷[J].管理科學學報,2010,(4).

[7]呂琦.基于SVM的股票時間序列的預測研究[J].吉林工程技術師范學院學報,2009,(7).

[8]王志剛,曾勇,唐小我.中國股票市場技術分析非線性預測能力的實證檢驗[J].管理工程學報,2009,(1).

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美成人综合视频| 亚洲国产精品不卡在线| 亚洲色图欧美一区| 国产香蕉国产精品偷在线观看| 日韩福利视频导航| 黄色网址手机国内免费在线观看| 久久亚洲国产视频| 免费全部高H视频无码无遮掩| 色呦呦手机在线精品| 日本a级免费| 国产视频资源在线观看| 日韩一级二级三级| 日韩欧美中文字幕一本| 99视频在线免费| 国产精品亚洲va在线观看| 色综合五月| 免费无码一区二区| 1级黄色毛片| 91在线精品麻豆欧美在线| 日韩第九页| 欧美一区中文字幕| 久草视频中文| 国产精品福利导航| 日韩精品欧美国产在线| 成人字幕网视频在线观看| 午夜综合网| 久久亚洲国产最新网站| 亚洲成a人在线播放www| 干中文字幕| 亚洲国产天堂在线观看| 天天婬欲婬香婬色婬视频播放| 中国美女**毛片录像在线 | 国产丰满大乳无码免费播放| 欧美专区在线观看| 成人福利在线看| 97无码免费人妻超级碰碰碰| 日韩欧美在线观看| 亚洲国产看片基地久久1024| 国产成人免费观看在线视频| 女人18毛片水真多国产| 久久国产精品77777| 亚洲色偷偷偷鲁综合| 免费 国产 无码久久久| 亚洲精品人成网线在线| 亚洲A∨无码精品午夜在线观看| 國產尤物AV尤物在線觀看| 国产精品久久久久鬼色| 色婷婷国产精品视频| 人与鲁专区| 日本不卡在线播放| 香蕉国产精品视频| 欧美精品成人一区二区在线观看| 亚洲欧美日韩另类在线一| 久久精品无码一区二区国产区| 不卡国产视频第一页| 色综合天天综合中文网| 久久不卡国产精品无码| 日韩小视频在线播放| 成人毛片在线播放| 国产无遮挡猛进猛出免费软件| 国产精品亚洲专区一区| 国产成人艳妇AA视频在线| 久久久久久久蜜桃| 成人在线观看不卡| 亚洲人成网址| 狠狠色丁香婷婷| 91香蕉国产亚洲一二三区| 亚洲天堂网2014| 天天摸天天操免费播放小视频| 日本在线免费网站| 国产日本欧美在线观看| 在线播放精品一区二区啪视频| 国产欧美一区二区三区视频在线观看| 永久免费精品视频| 国产成人午夜福利免费无码r| 久久特级毛片| 特级毛片8级毛片免费观看| 国产成人精品一区二区| 国产jizz| 亚洲经典在线中文字幕| 国产白浆在线| 人人91人人澡人人妻人人爽|