999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的股票指數漲跌概率推斷

2012-03-15 00:23:38彭益
統計與決策 2012年16期
關鍵詞:模型

彭益

(湖南大學 金融與統計學院,長沙 410079)

0 引言

股票的價格由股票的價值所決定,價格圍繞價值上下進行波動。通過對股票內在價值以及其價格的表現形態進行分析,可以了解股票價格的波動性。對股票的內在價值進行分析,即基本面的分析,主要是結合公司的經營業績與行業的發展前景,對公司的未來現金流進行預測,從而確定公司未來的價值。當價格高于價值時賣出,當價格低于價值時買入。對價格的表現形態進行分析,即技術分析,主要是對公司股票的歷史價格、成交量等交易數據進行挖掘,找出其規律。在此基礎上,對股票價格走勢進行預測,進而確定當前價位對應的交易策略。基本面分析是一種長期的投資工具,本文欲對短期股指漲跌概率進行推斷,故未考慮基本面分析。

從股票產生之日開始,對股票價格以及股指漲跌的預測是學術界與股票投資者感興趣的問題。對投資者而言,對股價的預測準確度越高,有利于其獲得利潤與回避風險。對國家的經濟金融發展而言,股票市場是國民經濟的晴雨表,股票預測也具有重要的作用。針對這樣的情況,本文提出推斷股指漲跌概率的新方法,通過數據挖掘,用泊松分布擬合股指收益率的動態過程,從而構造股指漲跌概率推斷模型來對股指漲跌概率進行預測。

1 基于數據挖掘的股指漲跌概率推斷模型

股票指數漲跌變化可以看成離散的時間序列,日收盤價是時間的函數。若進行技術分析,實際上是在知道股票指數第t天以前信息基礎上,對第t+1天股票指數 pt+1進行預測。 pt+1是一個非線性的函數,近期的技術分析集中分析收益率動態過程,主要是利用神經網絡以及生存模型對股票價格及股指漲跌進行預測。本文也從收益率動態過程的角度出發,對歷史數據進行挖掘,采取泊松分布對股指漲跌的動態過程進行擬合,并且以該泊松分布為基礎,構建股指漲跌概率推斷模型,從而判斷第t+1天的股指相對第t天是漲還是跌。

1.1 基于歷史數據的泊松分布擬合

對第t+1天股指漲跌進行預測前,可以計算出股指歷史日收益率。第t天股指收益率為rt,收益率計算采用rt=(pt-pt-1)/pt-1,其中 pt表示第t天收盤價,pt-1表示第t-1天收盤價。

我國股票市場存在10%的漲跌停限制,每天股票收益率在-10%與10%之間波動。股票指數采取的是派許加權綜合價格指數方法進行計算,故其日漲跌幅也在-10%與10%之間。將收益率總區間[-10,10]劃分為n等份,則每個區間段的長度為20 n。用i表示區間序號,i取值從1到n,第i區間段表示為Sector(i),則:

在收益率區間劃分為n等份后,可以判斷第t天股指收益率rt所處的區間,若rt在區間a(a∈Sector(i))內,將歷史數據中出現股指收益率處于區間a后第二天數據組成一個集合S,用該集合來進行泊松分布的擬合。用Count(i)表示集合S中股指收益率在區間段Sector(i)元素個數,P(i)表示集合S中股指收益率在區間段Sector(i)中概率,則:

假設第t+1天收益率rt+1服從參數為λ的泊松分布,且

1.2 分布參數的估計

泊松分布的擬合是在收益率區間劃分為n等份基礎上進行的,需要獲得n的最佳值,使得集合S中股票指數收益率盡量服從泊松分布。令n的擬合評估函數為F(n),現在考慮影響F(n)的元素。

最后,我們希望集合S中股指收益率的實際概率分布是盡量光滑的曲線,考慮股指收益率分為n個區間后,集合S股指收益率實際概率出現異常點的情況。如圖1所示,異常點是指在處于某區間的實際概率比其左右臨近區間的概率都要低的情況。圖1中,收益率區間劃分為15個區間段,縱坐標為對應的概率值,則點4為異常點。異常點的個數g(n)越多,表示實際概率分布越不平滑。異常點的個數與 f(n)呈負相關關系。

圖1 異常點示例圖

對異常點g(n)進行定義如下

其中 P(i)表示集合 S中股指收益率在區間段Sector(i)中的實際概率,h表示收益率區間進行等分后,集合S中包含元素最多的區間段,即P(h)=max{P(i)},i∈{1,2...n}。

根據以上三個主要的影響因素,建立了最佳泊松分布的擬合評估函數:

1.3 漲跌概率推斷模型的構建

本文以{G(t+1)>60%|G(t+1)<40%}作為判別條件,當G(t+1)的值大于60%時,我們認為第t+1天股指上漲概率較大;當G(t+1)的值小于40%時,我們認為第t+1天股指下跌的概率較大。

2 股指漲跌概率推斷模型的檢驗

2.1 股票指數與數據的選取

我們選取上證綜合指數(000001),新上證綜指(000017)以及深證新指數(399100)對股指漲跌概率推斷模型進行檢驗。上證綜合指數反映上海證券交易所上市的股票價格的總體趨勢。新上證綜指由滬市所有G股組成,股票在股權分置改革方案實施后的第二個交易日納入指數,該指數與2006年1月4日發布。深證新指數上反映深圳證券交易所流通股票價格的變動情況,其以G股公司為主體編制,于2006年2月16日開始發布。

在對股指第t+1天漲跌情況進行推斷時,采用的歷史數據為2006年2月16日至第t天的數據。歷史數據選取從2006年2月16日開始,是考慮到深圳新指數于2006年2月16日開始發布;另外在計量經濟學中,一般認為時間序列里前期數據對后期數據的影響呈現一個遞減的趨勢,前期數據過多,反而使得數據預測會產生一個失真的效果,上證綜合指數和新上證綜指沒有選取所有的歷史數據進行擬合。從2006年2月16日以后的200個交易日后開始預測,因為如果前期數據過少,會導致集合S中缺乏的足夠數據來進行泊松分布的擬合。總樣本的數據截止于2011年6月30日,即進行預測的最后一天的數據為2011年6月30日。

2.2 模型的簡化與模擬結果

本文采用Microsoft Visual Studio 2005 with C#進行編程,對股票指數漲跌概率進行估算。在本文前面建立的模型基礎上,進行一定的簡化處理。模型中需要遍歷n={1→2000b},但是在實際檢驗過程中,n取值范圍簡化為[15,50]。原因在于模型將收益率總區間進行了均勻分布處理,分區數不能過少,取n的下限值為15;在對部分數據進行處理后,發現n的取值一般在50以內,為了計算機處理的方便,我們取50作為上限值。

上證綜合指數,新上證綜指以及深證新指數的檢驗結果如表1所示。

表1 指數擬合結果

對上證綜合指數而言,第一個符合 {G(t+1)>60%||G(t+1)<40%}的數值出現在2006年12月11日,由于本文為了使擬合的泊松分布接近真實值,故要求在對第一個數據進行擬合之前至少有200天的交易,而初始數據是從2006年2月16日開始,故第一個數據的出現接近2006年年底。n值取42時,擬合評估函數F(n)取得最大值。當n值為42時,該天上證綜合指數收益率服從參數為23.67的泊松分布。根據股指漲跌概率推斷模型,上證綜合指數漲跌的概率G(t+1)為66.18%,上漲的概率比較高,而該天上證綜合指數實際增長率為1.76%,推斷正確。在所有符合{G(t+1)>60%||G(t+1)<40%}的日期里面,根據本文構建的模型判斷上證綜合指數漲跌與實際上證指數漲跌一致的占69.39%,說明該模型對上證綜合指數漲跌的預測具有一定的準確性。

對新上證綜指而言,第一個符合判別條件的數值出現在2006年12月11日。估計擬合函數F(n)取得最大值時,n值為18,該天收益率服從參數為12.33的泊松分布。根據股指收益率概率分布函數,判斷該天新上證綜指漲跌的概率G(t+1)為78.55%,上漲的概率高,而該天新上證綜指實際增長率為1.85%,估計正確。在所有符合判別條件的日期里面,根據本文構建的模型判斷新上證指數漲跌與實際漲跌相同的占到72%,說明該模型對新綜指漲跌的預測具有一定的準確性。

對深證新指數而言,第一個符合 {G(t+1)>60% ||G(t+1)<40%}的數值出現在2006年12月11日,n值為21時,估計擬合函數F(n)取得最大值。該天服從參數為14的泊松分布,從而判斷該天深證新指數漲跌的概率G(t+1)為78.21%,上漲的概率比較高,而該天深證新指數實際增長率為0.2%,估計正確。在符合判斷條件的所有日期里面,根據模型判斷深證新指數漲跌的概率與實際漲跌概率一致的占到64.2%,說明該模型對深證新指數漲跌的預測具有一定的準確性。

在選取的三種指數中,預測準確度最低的是深證新指數,為64.2%,但是其依然優于呂琦采用支持向量機的預測準確度63.3%,說明該方法是可取的。

3 結論

本文基于數據挖掘,構建了用于推斷股指漲跌概率的新模型。通過對上證指數、新綜指和深證新指數的實證檢驗表明該模型具有一定的準確性,其對新上證綜指的擬合程度最好。但是該模型具有一定的缺點,判別條件的要求比較高,故并不能對每天的股指漲跌進行預測,有待進一步的改進。

[1]Cheol-Ho P,Scott H.Irwin.What do we Know about the Profitability of Technical Analysis?[J].Journal of Economic Surveys,2007,21(4).

[2]Kim K,Won B L.Stock Market Prediction Using Artificial Neural Networks with Optimal Feature Transformation[J].Neural Comput&Applic,2004,(13).

[3]Liu W,Zhang W.Stochastic Volatility Model and Technical Analysis of Stock Price[J].Acta Mathematica Sinica,English Series,2004,27(7).

[4]鄧杰,唐國興.中國股票市場技術交易規則有效性的實證分析[J].華東經濟管理,2009,(5).

[5]李莎,李紅剛.股票市場中技術分析有效性的實證研究[J].北京師范大學學報(自然科學版),2009,(2).

[6]雷鳴,葉五一,繆柏其,郭文旌.生存分析與股指漲跌的概率判斷[J].管理科學學報,2010,(4).

[7]呂琦.基于SVM的股票時間序列的預測研究[J].吉林工程技術師范學院學報,2009,(7).

[8]王志剛,曾勇,唐小我.中國股票市場技術分析非線性預測能力的實證檢驗[J].管理工程學報,2009,(1).

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 色综合狠狠操| 狠狠综合久久| 全色黄大色大片免费久久老太| 男人天堂亚洲天堂| 亚洲一区二区约美女探花| 国产无码高清视频不卡| 国产99久久亚洲综合精品西瓜tv| 中文字幕 欧美日韩| 午夜小视频在线| 日本午夜精品一本在线观看 | 国产91丝袜在线观看| 免费不卡视频| 国产人人干| 精品福利视频导航| 麻豆国产精品一二三在线观看| 狠狠色丁香婷婷| 国产欧美性爱网| 国产丝袜第一页| 波多野结衣久久高清免费| 影音先锋亚洲无码| 伊人成人在线视频| 国产人人射| 日韩欧美在线观看| 伊人婷婷色香五月综合缴缴情| 91九色国产porny| 青草国产在线视频| 亚洲一区无码在线| 一本久道热中字伊人| 国内熟女少妇一线天| 制服丝袜在线视频香蕉| 日韩专区欧美| 97国产一区二区精品久久呦| 欧美激情视频二区三区| 国产毛片高清一级国语| 免费无遮挡AV| 亚洲国产精品久久久久秋霞影院| 制服无码网站| 在线看AV天堂| 国产在线一区视频| 久久青草免费91线频观看不卡| 伊人久久大香线蕉aⅴ色| 国产欧美在线观看精品一区污| 伊人激情久久综合中文字幕| 91黄色在线观看| 青草视频网站在线观看| 婷婷亚洲视频| 亚洲欧美极品| 久草视频一区| 一本大道东京热无码av| 精品国产免费第一区二区三区日韩| 最新国产精品第1页| 青青草原偷拍视频| 无码高潮喷水专区久久| 国产嫖妓91东北老熟女久久一| 日韩色图区| 日韩在线影院| 国产精品免费电影| 欧美日韩资源| 亚欧美国产综合| 毛片网站在线播放| 在线免费观看a视频| 欧美精品高清| 国产精品lululu在线观看| 国内丰满少妇猛烈精品播 | 99久久精品免费观看国产| 激情综合五月网| 国产精品自拍露脸视频 | 国产主播在线观看| 亚洲六月丁香六月婷婷蜜芽| 欧洲欧美人成免费全部视频| 欧美一级片在线| 国产精品亚洲一区二区三区z| 国产精品成人久久| 高清精品美女在线播放| 综合网久久| 成人欧美日韩| 岛国精品一区免费视频在线观看| 波多野结衣一区二区三区88| 亚洲欧州色色免费AV| 综合天天色| 无码免费的亚洲视频| 亚洲精品日产精品乱码不卡|