董雪建
【摘要】很多股民夢寐以求的是能夠預測未來的收益,這樣他們就能夠致富,可是他們大多數對于股市的了解不是很深,所以賺到錢的也不多。本文利用過去的信息來預測未來的收益,講道理的話,如果股市是強勢有效的,可能這樣的的預測效果會很糟糕。我將使用日數據進行建模,所以即使在有效率的市場中我估計我也可能會做出有一定預測能力的模型來,因為使用日數據,言外之意就是給市場的反應時間特別短。如果大家能夠了解,單單使用收益的過去值去預測未來,不是很靠譜的話,那么應該更依靠真實的動態因果關系來對未來做估計。
【關鍵詞】自回歸 F統計量 顯著水平 預測
很多人夢寐以求的是能夠預測明天股票市場的收益,這樣他就可以輕松致富了。但是從專業角度考慮就是,如果人們能夠對股市未來的超額收益做出預測,就說明市場是無效的,或效率不高的,打個比方最近央行降息,可能會對股市產生積極作用,如果市場效率不高,市場在一定時期內會為了消化這個信息而產生收益的持續相關性,這樣人們就可以利用前期的收益信息來預測未來。如果市場效率很高,市場就會在短時間內消化信息,導致人們不能利用過去的信息來預測未來。
下面關于這個問題我將展開討論,我運用的是我國股市2014年12月18日到2015年10月19日的收盤價數據,總共有201個交易日,所以下圖的橫坐標的最后一個為201,下面是我給出的它的走勢圖。
對上證指數的ADF檢驗的P值為0.6210,所以在10%的顯著水平下不能決絕具有單位根的原假設,所以我認為上證指數具有隨機游走趨勢。
如果人們想利用上面的數據建立一個自回歸模型,那么這個模型的預測能力可能不是很好,因為在隨機游走序列中大家可以直接拿昨天的數據作為今天的預測值,這樣效果會更好些。同時,如果一組數據是隨機游走的,那么關于參數的最小二乘統計量的統計檢驗是不可靠的,如果模型是自回歸的,那么其參數的最小二乘估計也是非一致的,那是因為非平穩序列的數據的自回歸模型的參數有特殊分布(和正態分布不同)。另外大家要考慮到,人們總是希望能夠預測股市的未來收益,而不是股市的水平值。所以基于以上兩點理由,應該對數據進行差分,使其變為平穩序列,這樣就可以利用最小二乘方法進行建模了。
在建立自回歸模型之前,請讀者先看一下一階差分之后的數據,此時的數據反應的是股市的收益而不是水平值,由于差分,數據由201個變為200個了。
直觀地看這個圖,讀者可以發現我們不能像在水平值圖里的那樣找到什么趨勢,未來的收益好像難以預測,是的,如果未來那么容易預測,大家早就可以致富了。這個反映各期收益的圖才是真正對于你賺錢與否有意義的圖,那個反映水平值的圖,多少帶有欺騙性。
此外,這幅圖也不是毫無規律的,你能從圖中發現波動的集聚效應,即大幅震蕩的格局扎堆出現,這對于人們去預測股市的風險有很大的幫助,我主要想看能不能預測未來的收益,所以在這里關于風險的東西我不做過多的研究。
其中AR(1)的系數沒有通過5%顯著水平的t檢驗,其P值為0.2506。同樣MA(1)的系數也沒有通過5%顯著水平的t檢驗。不過F統計量為6.997588卻通過了1%的顯著水平的F檢驗,其P值幾乎為0,也就是拒絕系數全部為0的原假設。其中DW值為1.704208和2比較接近。
人們最關心的是這個自回歸模型的預測能力,所以我主要關注Adjusted R-squared,其值為0.108558,也就是說這個模型的預測能力很弱,當然因為F統計量通過了假設檢驗,所以我可以說我用過去的收益來預測未來的收益是可以的,但是Adjusted R-squared值太低了,也就是說這個模型的預測能力十分有限,沒有人會愿意真的這樣做。
人們一般會認為如果不能通過過去的信息來預測超額收益,那么市場就是有效的,換句話說市場會在很短的時間內消化信息,但是具體時間的長短,已有的資料并沒有給出確切的答案。如果能夠利用過去的信息來預測未來的超額收益,人們就認為市場是缺乏效率的。可是很遺憾本文預測的是未來的收益而不是未來的超額收益,所以雖然本文的預測模型通過了F檢驗,但是我也不能說市場是缺乏效率的,況且本文用的是日數據,給市場反映時間非常短,能夠產生預測性也不奇怪。在討論有效性時,現有的資料沒有給出讓市場反映的時間是多少,所以能夠預測未來的兩天的收益可能不代表市場是缺乏效率的,況且這個模型的預測能力還這么低。
由于這個模型是自回歸模型,它依據以前的值來預測未來,其實還可以在模型中加入其他變量,比如市場利率、通貨膨脹率等,也許可以提高模型的預測能力。我不建議加入GDP數據,因為股市是經濟的晴雨表,是先行指標,加入GDP可能起不到顯著的作用。
參考文獻
[1]詹姆斯·H·斯托克.計量經濟學(第三版)[M].2012.
[2]達摩達爾·N·古扎拉蒂.計量經濟學基礎(第五版)[M].2011.