○蘇 匡 羅 元 方楚賢 (武漢理工大學 湖北 武漢 430070)
本文的理論基礎是股市技術分析中道氏理論中的三大假設:其一,市場行為涵蓋一切信息;其二,價格沿趨勢移動;其三,歷史會重演。根據道氏三大假設,股市是可以預測的,至少是短期可預測的。所謂股票的技術分析法是相對于基本面分析法而言的。技術分析法是通過圖表或者技術指標的記錄,研究市場過去以及現在的行為反映,以推測未來的價格變動趨勢。其依據的技術指標的主要內容是由股票價格、成交量和指數的漲跌等數據計算所得。在此就本文中所使用的指標進行簡單的介紹。
均線指標:實際上是移動平均線指標的簡稱。由于該指標是反映價格運行趨勢的重要指標,其運行趨勢一旦形成,將在一段時間內繼續保持,趨勢運行所形成的高點或低點又分別具有阻擋或支撐作用,因此均線指標所在的點位往往是十分重要的支撐或阻力位,這就為我們提供了買進或賣出的有利時機,均線系統的價值也正在于此。
KDJ指標:隨機指標KDJ一般是根據統計學的原理,以最高價、最低價及收盤價為基本數據進行計算,得出的K值、D值和J值分別在指標的坐標上形成的一個點,連接無數個這樣的點位,就形成一個完整的、能反映價格波動趨勢的KDJ指標。它主要是利用價格波動的真實波幅來反映價格走勢的強弱和超買超賣現象,在價格尚未上升或下降之前發出買賣信號的一種技術工具。它在設計過程中主要是研究最高價、最低價和收盤價之間的關系,同時也融合了動量觀念、強弱指標和移動平均線的一些優點,因此,能夠比較迅速、快捷、直觀地研判行情。隨機指標KDJ最早是以KD指標的形式出現,而KD指標是在威廉指標的基礎上發展起來的。不過威廉指標只判斷股票的超買超賣現象,在KDJ指標中則融合了移動平均線速度上的觀念,形成比較準確的買賣信號依據。在實踐中,K線與D線配合J線組成KDJ指標來使用。由于KDJ線本質上是一個隨機波動的觀念,故其對于掌握中短期行情走勢比較準確。。
MACD指標:MACD稱為指數平滑異同移動平均線(Moving Average Convergence and Divergence)。是從雙移動平均線發展而來的,由快的移動平均線減去慢的移動平均線,MACD的意義和雙移動平均線基本相同,但閱讀起來更方便。當MACD從負數轉向正數,是買的信號。當MACD從正數轉向負數,是賣的信號。當MACD以大角度變化,表示快的移動平均線和慢的移動平均線的差距非常迅速的拉開,代表了一個市場大趨勢的轉變。MACD是一項利用短期移動平均線與長期移動平均線之間的聚合與分離狀況,對買進、賣出時機作出研判的技術指標。
神經元是神經網絡中的基本處理單位,圖1是一種典型的神經元模型,它是模擬生物神經元的細胞體、樹突、軸突、突觸等主要部分而構成。

圖1
其中 u1,u2,…un為輸入,k1,k2,…kn為權值,y 為凈輸出,神經元的輸出可表示為:yi=f(Σjwij+θ)。
1、BP算法的基本思想。學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成。正向傳播:輸入樣本->輸入層->各隱層(處理)->輸出層(若輸出層實際輸出與期望輸出不符,則誤差反向傳播過程)。誤差反向傳播:輸出誤差(某種形式)->隱層(逐層)->輸入層。其主要目的是通過將輸出誤差反傳,將誤差分攤給各層所有單元,從而獲得各層單元的誤差信號,進而修正各單元的權值(其本質,是一個權值調整的過程)。權值調整的過程,也就是網絡的學習訓練過程(學習也就是這么的由來,即是權值調整)。
2、BP算法實現步驟。初始化;輸入訓練樣本對,計算各層輸出;計算網絡輸出誤差;計算各層誤差信號;調整各層權值;檢查網絡總誤差是否達到精度要求。滿足,則訓練結束;不滿足,則返回步驟2。
3、多層感知器(基于BP算法)的主要能力。第一,非線性映射:足夠多樣本學習訓練能學習和存儲大量輸入-輸出模式映射關系。只要能提供足夠多的樣本模式對供BP網絡進行學習訓練,它便能完成由n維輸入空間到m維輸出空間的非線性映射。第二,泛化:輸入新樣本->完成正確的輸入、輸出映射。第三,容錯:個別樣本誤差不能左右對權矩陣的調整
4、標準BP算法的缺陷。第一,易形成局部極小(局部最優)而得不到全局最優。第二,訓練次數多使得學習效率低下,收斂速度慢(需做大量運算)。第三,隱節點的選取缺乏理論支持。第四,訓練時學習新樣本有遺忘舊樣本趨勢。
人工神經網絡是由大量神經元的信息處理單元構成,其主要原理是模擬生物神經元之間的激勵過程,通過這一復雜的過程來完成一系列的相關任務,神經網絡具有以下較為突出特點:第一,具有自適應性,有強大的自主學習能力,可以通過訓練樣本根據樣本信息及周圍環境變化改變自身的網絡結構,從而使自身能夠以最有效的形式來模擬訓練樣本所隱含的環境。第二,能從訓練樣本中獲取知識,并具有很好的記憶特征,可以用于處理一些環境復雜,推理并不明確的問題。第三,在非線性時間序列預測中,人工神經網絡實現了非線性關系的隱式表達,不需要建立復雜系統的顯示關系式。第四,神經網絡的容錯性強,可以處理信息不完全的預測問題。第五,由于神經網絡具有一致逼近的能力,訓練后的神經網絡在樣本點上輸出期望值(誤差在允許范圍內),在非樣本點上表現出神經網絡的聯想記憶功能。
股票市場是一個混沌的市場,具有很強的非線性特征:第一,對影響股市波動相同的因素來說,根據其對股市造成影響的時間不同,每次該項因素對股市影響的程度也不同,這與線性系統的特征是不相符的,這也就說明了股票市場的非線性性。第二,股票市場波動的突發性和劇烈程度,足以說明股票市場的非線性性。
通過以上可以看出由于股票市場存在非線性的特征,利用一般的線性分析工具來研究股票市場對研究結果將會造成很大的偏差,但神經網絡理論,以其自身的特點,可以很好地將其運用于解決此類問題。
首先,模型設計的實驗原理是基于具有3層結構的BP神經網絡可以任意地去逼近任何函數,就其本身來說就相當于是一個“黑箱子”,只要你給定其相關的輸入和輸出,通過訓練它就能一定模擬出一個復雜的函數來擬合你的這組輸入和輸出,從而得到滿意的訓練結果。
本文的數據選取的是中國銀行的一些技術分析指標,它來源于大智慧軟件的數據庫,根據技術分析指標的分類結合聚類的思想,在每一類指標中選取具有代表性的一種來代表這一類指標,所以在這個模型中我選取了BIAS,KDJ,MACD,威廉指標和成交量,這幾個指標中有的雖有些相同的性質,但由于它們都是一些常用指標,有一定的實用價值,也不失可作為輸入數據。
本文的數據輸出是每日收盤價的五日以用平均值。之所以選取均值作為輸出主要是因為均值作為輸出值相對來說較為平滑,這樣無論是對訓練還是預測都會得到比較理想的結果。接下來,就是模型的設計。根據問題,在輸入層有5個輸入所以需要有5個神經元,而輸出層只需要一個神經元,根據經驗公式隱含層神經元的個數為2n+1,其中n為輸入層神經元的個數,所以隱含層的神經元個數為11個,這樣一來,模型的基本框架就已經構成,其大致結構如圖2。

圖2
以下是根據該模型用Matlab編的程序的主要部分:
net=new ff(m inmax(P),[11 1],{'tansig','purelin'});
net.trainParam.epochs=1000;
net.trainParam.goal=0.0001;
[net,tr]=train(net,P_train,T_train);
下面對整個程序做一個簡單的介紹:首先,本文選取100組數據作為訓練樣本,對它們進行歸一化處理,接著對它們進行訓練,反歸一化處理得出訓練結果,分析結果再選取三組數據進行泛化性分析。其訓練結果如下圖3所示。然后分別用三組數據來測試訓練結果,看其泛化性能是否好,期預測誤差的結果如表1所示。

圖3

表1
由訓練結果我們可以看出該訓練效果較好,由預測的誤差結果可知它的泛化性能也相對較好,所以我們可以得出以下結論。
從整個實證分析的過程可以看出技術分析在我國股票市場還具有一定的有效性,說明技術分析的一些指標還可以指導投資者進行證券投資。但從中我們也應該看到其中的一些不足:第一,由于該實驗選取的是對單一股票的技術指標的檢測,雖然中國銀行屬于大盤股,不易被莊家所控制,但它作為個股仍不能代表整個市場,所以至于技術分析是否對整個中國股市有效仍具有不確定性。第二,由于BP算法自身的一些缺陷也可能給實驗帶來一些誤差影響。所以,投資者在投資前首先要認清大勢,因為我國股市是一個政策市,它受政府相關政策影響的程度極大,所以投資者在投資前首先要進行基本面的分析,基本面的分析與技術分析的結合使用才是進行證券投資的首選方案。
(注:本文為武漢理工大學自主創新研究基金《基于神經網絡系統分析我國股票市場的有效性》課題的系列研究成果之一,項目編號2010-VA-007JJ。)
[1]Zvi Bodie:投資學[M].機械工業出版社,2006.
[2]曹鳳歧、劉力、姚長輝:證券投資學[M].北京大學出版社,2000.
[3]高雋:人工神經網絡原理及仿真實例[M].機械工業出版社,2007.
[4]苑迪:基于動態神經網絡的股價預測模型研究[D].湖南大學,2009.
[5]Duane Hanselman:精通Matlab7[M].清華大學出版社,2006.