趙 越, 宋 立 新, 回 德 俊
(大連理工大學 數(shù)學科學學院,遼寧 大連 116024)
時間序列分析方法是生產(chǎn)和實際中經(jīng)常用到的研究手段,在經(jīng)濟、氣象和水利等領(lǐng)域有著廣泛的應用.本文所要研究的對象是非線性隨機序列,是指從非線性系統(tǒng)獲取的時間序列.當系統(tǒng)具有混沌特征時,前人已論證了對非線性時間序列采用動力系統(tǒng)方法進行預測比較有效[1].實際上,通過觀測或?qū)嶒灚@得的時間序列往往含有噪聲,也可能不平穩(wěn),需要進行降噪處理,對含有隨機因素影響的原始觀測序列提取趨勢項.常用的趨勢項提取方法有最小二乘法、平均斜率法和最佳擬合廣義多項式等方法,這些方法經(jīng)常用在信號處理、檢測技術(shù)等工程中[2、3].本文在趨勢項提取的判斷標準上引入一種新的衡量準則,即基于Copula方法構(gòu)造積分絕對誤差函數(shù),以此來判斷不同方法所提取的趨勢項合理性.最后將動力系統(tǒng)[1]建立在所提取的趨勢項數(shù)據(jù)基礎(chǔ)之上,針對次貸危機以來美國證券市場實際數(shù)據(jù)進行模擬和預測.
在實踐中可以得到容量為n的一組時間序列觀測值,同樣對該樣本序列進行類似的分解,記為.應用不同提取趨勢項的方法,可得到不同的估計,記為面對多組估計,要找到最接近真實的一組,思路如下:由在 得 到 一 組 估 計 值后,將殘差作為的估計值,若它是最接近正態(tài)分布N(0,Σ)的殘差向量,其所對應的即是要找的趨勢項的最優(yōu)估計.通過Copula函數(shù),構(gòu)造了一個衡量模型來衡量積分絕對誤差,目標完成.具體過程如下:對于任意的(u,v)∈I2= [0,1]2,由Sklar定理,可構(gòu)造二元Copula函數(shù),記為CΣ(u,v)[4].設,其中,規(guī)定這里σ0為大于0的常數(shù).此時函數(shù)可寫為

式中:Nρ是二元正態(tài)分布函數(shù),F(xiàn)(·)和G(·)分別為邊緣分布函數(shù),Σ中σ1、σ2和相關(guān)系數(shù)ρ都是未知的.

記的秩為的秩為.則式(1)改寫為



同理對Yi+j≈bi+εi+j′,-h(huán)′≤j′≤h′,可得趨勢項bi的估計.對應一組(h,h′),可得一組趨勢項的估計,(h,h′)究竟取值多少才能使趨勢項的估計最優(yōu),這個問題并沒有解決.設h、h′滿足已知,取最優(yōu)的(h,h′)為此范圍中使IAE達到最小者,此時得到的趨勢項的估計達到最優(yōu).下面介紹本文所要研究的時間序列觀測值,并用h-步平滑法提取趨勢項.
例1h-步平滑法在股市上的應用
選取具有代表性的美國標準普爾500和NASDAQ周收盤價為研究對象,從2007-01-03~2008-12-08共計有102組數(shù)據(jù)中xi為標準普爾500周收盤價,yi為NASDAQ周收盤價.先利用h-步平滑法求出趨勢項的眾多估計值,然后在IAE衡量模型下找到一組使趨勢項的估計最優(yōu)的(h,h′),在(h,h′)= (4,9)下算得趨勢項的估計值并做圖1[5、6].
h-步平滑估計用法簡單,其局限性在于忽略超出觀測時間范圍的那些數(shù)據(jù),這種不對稱平均可能會產(chǎn)生邊界偏倚.通過引進一個加權(quán)設計,可對滑動平均估計進行改善,具體改動如下:其 中 權(quán) 數(shù)同理可得均是大于零的常數(shù).通過IAE法則算出一個最優(yōu)的權(quán)重λ1和λ2,使得積分絕對誤差最小.

例2 指數(shù)加權(quán)平均法在股市上的應用
在IAE法則下尋找一個最優(yōu)的權(quán)重λ1和λ2.圖2是指數(shù)加權(quán)平均法給出的趨勢項的估計值.
在圖3中,虛線代表h-步平滑法提取趨勢項后的殘差波動,實線代表加權(quán)平均法提取趨勢項后的殘差波動.兩者相比,加權(quán)平均法的殘差波動近乎一條0均值的直線.注意,波動幅度越小不代表趨勢項的估計效果越好,亦可能是時間序列中的波動項沒有與趨勢項分離,加權(quán)平均法提取的趨勢項中必然含有方差較大的隨機因素.

圖1 h-步平滑法下針對兩類指數(shù)提取趨勢項Fig.1 Extracting trends of two indexes by h-step smoothing method

圖2 在加權(quán)平均法下分別對兩類指數(shù)提取趨勢項Fig.2 Extracting trends of two indexes by weighted average method

圖3 h-步平滑法與加權(quán)平均法針對兩類指數(shù)提取趨勢項后的殘差圖像的比較Fig.3 Comparison on residual error of extracting trends between the h-step smothing method and weighted average method
針對次貸危機下的美國證券市場系統(tǒng),先從線性的角度來尋找函數(shù)關(guān)系,并進行預測.
模型如下:

其中p是正整數(shù),根據(jù)經(jīng)驗令p=3,α1、α2和α3是
未知參數(shù),有如下形式:

例3 線性回歸法在股市上的應用
以例1中h-步平滑法估計出的趨勢項估計為原始數(shù)據(jù),用趨勢項前半段數(shù)據(jù)得到了模型(5)的3個未知參數(shù)的估計和圖4是由該線性模型模擬的證券市場走勢的圖像.

圖4 線性回歸法對兩類指數(shù)提取趨勢項Fig.4 Extracting trends of two indexes by linear regression method
易見此方法估計出來的市場走勢明顯與事實不符,由此初步斷定美國證券市場系統(tǒng)是非線性的.

其中c1,c2,…,c6未知.應用h- 步平滑法求出趨勢項的估計值c^1,c^2,…,c^6,得二次多項式模型

例4 二次多項式法在股市上的應用
由例1中h-步平滑法估計趨勢項,得到趨勢項的估計值.用h-步平滑法得到的趨勢項估計值的前半段來估計二次多項式模型的6個未知參數(shù).圖5是二次多項式模型趨勢項的估計值圖.
易知線性回歸法和二次多項式法對趨勢項估計很差,下面用分段線性函數(shù)來給美國證券系統(tǒng)建模.

圖5 二次多項式法對兩類指數(shù)提取趨勢項Fig.5 Extracting trends of two indexes by quadratic polynomials
對于來自非線性系統(tǒng)的時間序列來說,分段線性函數(shù)簡單易行,分段線性數(shù)學模型如下:
設α=t0<t1<…<tm=β是區(qū)間[α,β]上的一種分割,記Ij(t)=I(tj-1≤t<tj)(1≤j<m-1),Im(t)=I(tm-1≤t<tm),b= (b0b1…bm)T,記

為依次連接點 (t0,b0),(t1,b1),…,(tm,bm)的分段線性函數(shù),稱b為Gm的系數(shù).
例5 分段線性法在股市上的應用
由例1中h-步平滑法估計趨勢項,在本例中取m=4,用h-步平滑法得到的趨勢項估計值的前半段數(shù)值,來估計分段線性模型的5個未知參數(shù),然后預測后半段并與實際進行比較,詳見圖6.
分段線性方法對趨勢預測比線性回歸法為好.不足之處:一是它沒有反映市場走勢的波動,二是真實市場是劇烈震蕩向下發(fā)展,而預測卻是在高位平緩.由此引入動力系統(tǒng)方法來研究美國股市,最終給出市場的走勢預測.

圖6 分段線性方法對兩類指數(shù)提取趨勢項Fig.6 Extracting trends of two indexes by piecewise linear method
對于未知數(shù)學模型的混沌動力系統(tǒng),通過觀測或?qū)嶒炇侄慰梢垣@得多變量時間序列[7].Takens和Mane的延遲嵌入定理證明了只要適當選取延遲時間間隔τ和嵌入維數(shù)m,原未知數(shù)學模型的混沌動力系統(tǒng)的幾何特征與重構(gòu)的m維狀態(tài)空間的幾何特征是等價的,這意味著原來未知數(shù)學模型的混沌動力系統(tǒng)中的任何微分或拓撲不變量可以在重構(gòu)的狀態(tài)空間中計算,并且可以通過在重構(gòu)的m維狀態(tài)空間中建立數(shù)學模型對原未知數(shù)學模型的動力系統(tǒng)進行預測.
記觀測到的多變量時間序列為{xl,n}Tn=1(l=1,2,…,L),假設T=N+P,前N個數(shù)據(jù)作為構(gòu)造模型所需的樣本,后P個數(shù)據(jù)作為預測精度的度量.采用延遲重構(gòu)法,在相空間中重構(gòu)的狀態(tài)向量為


或者得到多元函數(shù)Gl:Rm→R,滿足

例6 動力系統(tǒng)在股市上的應用
用標準普爾500和NASDAQ周收盤價作為時間序列觀測樣本.觀測的范圍從1988-01-04~2009-02-09,共1102組數(shù)據(jù).將1988-01-04~2008-12-08共計1092組數(shù)據(jù)作為構(gòu)造模型所需的樣本,將最后10個數(shù)據(jù)作為預測精度的度量,用這10個數(shù)據(jù)與動力系統(tǒng)模型的預測結(jié)果進行比較.
首先確定延遲時間間隔τ,采用自相關(guān)函數(shù)法,可得到兩類股市關(guān)于τ的圖像,觀察圖像,得到標準普爾500指數(shù)的CL(τ)第一次取0值時的時間間隔τ1=31,NASDAQ指數(shù)的τ2=30.
其次確定相空間的維數(shù)m,由于觀測數(shù)據(jù)是二維的,有m=m1+m2.于是用虛假鄰點方法估計,得m1=4和m2=5[7].進一步,對于原始時間序列{xl,n}1092n=1(l=1,2),采用延遲重構(gòu)法進行相空間重構(gòu).通過局部多項式預測法對未知系數(shù)進行估計,并對系統(tǒng)的走勢進行了短期預測,為了便于分析截取了包含10個預測數(shù)值的后102個數(shù)據(jù)作圖,最終得到圖7.

圖7 動力系統(tǒng)對兩種指數(shù)短期預測Fig.7 Shortdated prediction on two indexes using dynamical method
圖7中最后一小段10個數(shù)值是動力系統(tǒng)方法對該系統(tǒng)預測值.從圖中直觀上可以看出動力系統(tǒng)方法對NASDAQ指數(shù)市場走勢預測得很好,但是對標準普爾500市場指數(shù)預測得不是很好.原因在于,NASDAQ指數(shù)的特點是收集和發(fā)布包含場外交易非上市股票的證券商報價的平均指數(shù),股指中對股票的選擇變動不大.而標準普爾500是由上市公司股票500只成分股組成的,并且該指數(shù)的成分股是變動的,對美國證券市場的指數(shù)選擇不同對分析結(jié)果可能會有影響.從波動的同步性看,對最后10個數(shù)值預測的走勢與真實數(shù)值的走勢具有比較同步的波動,不論是震蕩的幅度還是方向都與真實的走勢相一致,只是數(shù)值上比真實數(shù)值普遍大400左右.數(shù)值上的差異可以用經(jīng)濟環(huán)境的異常來解釋.最后10個數(shù)值所處的時間段是2008年12月至2009年2月初,這段時間內(nèi)美國的經(jīng)濟徘徊在崩潰的邊緣.銀行機構(gòu)繼華爾投行后又掀起一輪破產(chǎn)潮,美國的實體經(jīng)濟以三大汽車生產(chǎn)商為代表流動性枯竭,政治上美國總統(tǒng)換屆,經(jīng)濟刺激方案面臨著極大的不確定性.面對如此惡劣的經(jīng)濟環(huán)境,標準普爾500指數(shù)的走勢已經(jīng)不再沿著歷史正常波動,所以用20 a的歷史數(shù)據(jù)來建立動力系統(tǒng)模型,是對處于正常狀態(tài)的指數(shù)走勢的預測,那么在異常狀態(tài)下必然會與真實值有所差別.對于異常狀態(tài)的美國股市,經(jīng)濟分析師都會下調(diào)股指走勢的預期,預測值和真實值之間的差別可以很好地處理,用動力系統(tǒng)預測的指數(shù)震蕩的幅度和方向還是比較準確的,因此可以作為經(jīng)濟決策的輔助數(shù)據(jù).從這一點看來,動力系統(tǒng)方法在美國股市這個復雜系統(tǒng)上的預測還是很有意義的.
時間序列趨勢項的提取是時間序列分析研究中的重要課題.本文提出了一種基于Copula函數(shù)構(gòu)造的誤差衡量模型,基于美國股票數(shù)據(jù),對各種提取方法進行評判分析.運用動力系統(tǒng)方法,在美國金融危機的背景下,對兩種股票指數(shù)進行了短期預測,效果較好,為這一領(lǐng)域提供了一個新的研究視角.
[1]王海燕,盧 山.非線性時間序列分析及其應用[M].北京:科學出版社,2006:16-21
[2]王廣斌,劉義倫,金曉宏,等.基于最小二乘原理的趨勢項處理及其 MATLAB的實現(xiàn)[J].有色設備,2005(05):4-8
[3]高品賢.趨勢項對時域參數(shù)識別的影響及消除[J].振動、測試與診斷,1994(02):20-26
[4]NELSEN R B.An Introduction to Copulas[M].2nd ed.New York:Springer,2006:7-42
[5]魏 巍.MATLAB應用數(shù)學工具箱技術(shù)手冊[M].北京:國防工業(yè)出版社,2004:277-328
[6]張善文,雷英杰,馮有前.MATLAB在時間序列分析中的應用[M].西安:西安電子科技大學出版社,2007:20-27
[7]韓 敏.混沌時間序列預測理論與方法[M].北京:中國水利水電出版社,2007:80-91