摘要:本文介紹模糊神經網絡對股票價格的預測。本文首先分析了神經網絡和模糊邏輯相結合的可能性,然后介紹了模糊神經網絡的預測模型設計以及網絡參數的設定。最后用實證分析證實了模型預測是可行的。
關鍵詞:模糊神經網絡;股票預測
一、引言
中國股市經過十余年的發展,應該說已經取得十分巨大的成就,但是與國外成熟股市相比仍然是一個新興市場。事實上,探索和研究股票價格波動的復雜性和規律性,是許多經濟工作者,尤其是證券研究者一直追求的目標。
股票交易數據預測是一種時間序列預測方法。時間序列預測法是依據預測對象過去的統計數據,找到其隨時間變化的規律,建立時序模型,以判斷未來數值的預測方法。其基本思想是:過去的變化規律會持續到未來,即未來是過去的延伸。一般一維時間序列預測方法有移動平均與分解方法、指數平滑方法、狀態空間模型等。這些預測方法經過長期的發展,在定量預測模型和定性預測模型等方面都有長足的進步。但是,當系統具有較強的非線性時,這些方法的適應性卻是有限的,在實際的預測環境中常常失去效用,因此用這些傳統的預測方法解決這類問題十分困難。
二、神經網絡和模糊邏輯結合的可能性
神經網絡的興趣在于人腦的微觀結構。并通過有自學習、自組識、自適應功能的神經網絡上的非線性并行分散動力學,對無法語言化的模式信息進行處理。模糊邏輯根據人為定義的隸屬函數和一系列并串行的規則,用邏輯推理去處理各種模糊性的信息,是通過模仿人的思維方式來表示和分析不確定、不精確信息的方法和工具。盡管“模糊”這個詞在這里容易使人產生誤解,實際上在模糊邏輯控制中的每一個特定的輸入都對應著一個實際的輸出。所以模糊邏輯本身并不模糊,模糊邏輯并不是“模糊的”邏輯,而是用來對“模糊”進行處理以達到消除模糊的邏輯,它是一種精確解決不精確、不完全信息的方法,其最大特點就是用它可以比較自然地處理人的概念,是一種更人性化的方法。在處理數據時,模糊邏輯更能容忍噪音干擾和元器件的變化,使系統適應性更好模。糊邏輯還對使產品開發周期縮短而編程更容易。通過模糊化樣本,提高了樣本集中各樣本的質量,進而改進能量函數。用神經網絡去預測股票,在對信息的推理上還存在相當大的困難;而在信息的獲取方面,模糊技術也顯得十分軟弱。
因此本文根據模糊邏輯和神經網絡的各自長處把它們結合起來,利用這種方法對股票預測進行研究。模糊系統提供了一種推論式語句用來逼近人的推理能力和并且應用到基于知識的系統中。模糊邏輯理論是用一種數學工具來獲取人們認知過程。然而,模糊邏輯中有個共同的瓶頸是它們都依賴于由領域專家給出的規則,而且,不存在正式的框架來選擇模糊系統的各種參數,因此,調整參數的方法是模糊系統的一個重要研究課題。另一方面,神經網絡所具有一些重要的有點,比如學習能力、自適應能力、容錯能力等,所以神經網絡能夠處理復雜的、非線性的以及不確定性問題。正是因為如此,可以相信它們具有構建與人們人之有關的各種行為的潛能。但是神經網絡的主要問題是它沒有明確的物理意義,使用者不知道這些網絡是如何運轉的。這就是為何神經網絡總是被稱為“黑箱”的原因。對以一個訓練好的神經網絡,其連接權值不能清楚地說明網絡是如何處理數據的,其含義是什么。特別是,現在的神經網絡理論還沒有提供一種方法來預測訓練好了的網絡的輸出。因此,在實際應用中造成了一些不確定性。
把模糊系統和神經網絡的結合成為模糊神經網絡,該網絡致力于獲得兩種系統的優點而克服各自的缺點。正如前文提到的,神經網絡的優點在于,第一個是能夠生成不需要明確表現知識的規則;第二個是其強大的自學能力。模糊系統的優點在于,第一個是能用模糊性的語言表達知識;第二個是能用簡單的預算來實現知識的模糊推理。兩者的結合可以解決模糊系統中的只是抽取問題以及專家知識也能很容易融合到神經網絡中,避免了初值選擇的任意性。
三、模糊神經網絡的模型設計
1、模型的結構
模糊神經網絡與一般的神經網絡相類似,通常分為前向型模糊神經網絡和反饋型模糊神經網絡兩類。本文采用的就是前向型模糊神經網絡。該網絡是可以實現模糊映射關系的模糊神經網絡。一個前向型模糊神經網絡可分為五層組成,分別為輸入層、模糊化層、模糊推理層、去模糊化層和輸出層。圖1-1為含有兩個輸入層節點、一個輸出節點的一個基本前向模糊神經網絡結構。
輸入層指的是接受外部輸入信號的一層,并將輸入值傳送給模糊化層的模糊單元;模糊化層的作用是按模糊規則將輸入值轉換為一定的模糊度,是對模糊信息進行預處理的網層。模糊推理層是前向型模糊神經網絡的核心,其網絡參數是由具體問題所確定的;去模糊化層接受經中間層處理的數據,并按照模糊度函數將數據進行非模糊化處理;最后輸出層給出確定性求解結果。
本文采用的是TS模糊神經網絡。該神經網絡分為輸入層、模糊化層、模糊規則計算層和輸出層(包括去模糊化)。輸入層與輸入向量xi連接,節點數與輸入向量的維數相同。模糊化層采用隸屬度函數(公式1-1)對輸入值進行模糊化得到模糊隸屬度值μ。模糊規則計算層采用模糊連乘(公式1-2)計算得到φ。輸出層采用(公式1-3)計算模糊神經網絡的輸出。下面給出各公式:
1-1
式中,分別為隸屬度函數的中心和寬度;k為輸入參數;n為模糊子集數。
1-2
1-3
式中為模糊系統參數。
2、模糊神經網絡的學習算法
(1)誤差計算
式中,yd為網絡期望輸出;yc是網絡實際輸出,e為期望輸出和實際輸出的誤差。
(2)系數修正
式中,為神經網絡系數;α為網絡學習率;xj為網絡輸入參數;φi為輸入參數隸屬度連乘積。
(3)參數修正
式中,、分別為隸屬度函數的中心和寬度。
3、預測模型的結構設計和參數的設定
網絡結構的選擇需要考慮以下因素:軟硬件實現的難易程度、訓練速度和網絡的推廣能力等,其中網絡的推廣能力是最主要的,網絡結構設計至今還沒有確定的方法可循。14世紀的法國修道士 提出過一個最簡單原則:“與己知事實滿意符合(一致)的理論中最簡單者就是最好的理論”,后人稱此原則為“奧克姆剃刀”。由此產生了一個公認的指導原則:“在沒有其他經驗知識時,能與給定樣本滿意符合(一致)的最簡單(規模最小的網絡就是最好的選擇”。這相當于在樣本點的誤差在允許范圍條件下用參數最少的模型去逼近一個未知的非線性映射。
從總體上來說,網絡結構設計并沒有固定可循的步驟,有許多參數要靠經驗選擇,并通過試驗加以比較。規模小的網絡的泛化能力強,同時也易于理解和抽取規則、知識,便于軟硬件實現。通常情況下,由于訓練樣本有限,所以把泛化能力作為主要要求,強調選擇能達到要求的最小網絡。理論證明,一個三層網絡可以任意逼近一個非線性連續函數。
基于T-S模糊神經網絡的算法流程如圖1-2所示。其中模糊神經網絡構建根據訓練樣本維數確定模糊神經網絡的輸入和輸出的節點以及模糊隸屬度函數個數。由于輸入數據為開盤價,最高價,最低價,收盤價這四組數據,所以為n=4維的,輸出的是次日的開盤價格即輸出數據為1維的。在模糊化層中,該層有nm個節點,利用K-means法對樣本進行聚類分析得到模糊規則數以確定m。在聚類分析得出m=2所以得到節點數為8,該模糊神經網絡的結構為4-8-1。在根據T-S的模型,所以選擇5組系數ρi。
雖然權值隨迭代而更新,一般都是收斂的,但是如果初始值設置的太大的話會影響該網絡,會使網絡飽和的很快。初始的權值對收斂速度也會造成影響。實驗表明,初始權值只要不是過大,對網絡整體的性能的影響并不大,一般可選在(-0.5,0.5),本文取權值為0。由于本文的隸屬度函數利用的是高斯函數,所以高斯函數中的中心和寬度隨機得到。
在學習率和網絡參數的選擇上,若選擇的太小,會使網絡參數修改量過小,收斂的速度緩慢;若選擇的太大,雖然可以加快了學習的速度,但是有可能導致在穩定點附近進行持續的振蕩,難以收斂,目前在理論上還沒有明確的確定學習率的方法,對于具體問題需要進行試驗,通過實驗比較出適合的學習率,本文在通過實驗選取學習率為0.025,網絡參數選取0.001,最大迭代次數選取為100。
四、實證分析
1、預測的效果
選取綠景地產(000502)2010年1月20日連續120個交易日的數據作為訓練和預測樣本。其中使用前100個交易日的指標作為訓練樣本訓練網絡,用后20個數據進行樣本預測。
如圖1-3為訓練網絡的效果圖,該結果是用歸一化后的數據。
表 1-1列出真實值和預測值以及預測的相對誤差((真實值-預測值)/真實值):
2、網絡性能的評價
對神經網絡常用的預測性能的評價指標常用的有RRMS,MPE,mpe,PC。選取綠景地產(000502)2010年1月20日連續120個交易日的數據作為訓練和預測樣本。其中使用前100個交易日的指標作為訓練樣本訓練網絡,用后20個數據進行樣本預測。本系統的各項性能指標如下:
相對均方根誤差:RRMS=0.63%最大誤差:MPE=0.19元 正確趨勢率:PCD=65%
從以上指標看出用該模糊神經網絡進行預測是有效的,預測系統式成功的。
五、總結
股票市場是反映經濟的“晴雨表”,其作用不但被政府重視,而且受投資大眾的普遍關注,股票市場中的收益伴隨著風險,以最小風險獲得最大收益是每個投資者的目標,所以研究股票市場內在規律及其預測具有重大的意義和應用的價值。股票交易數據預測是時間序列預測。在股票市場這個極其復雜的系統中,它所具有的非線性和高噪聲等因素決定了股票預測的過程的復雜與困難,傳統預測方法很難應用于此,難以建立有效的數學模型。
神經網絡是一種很好的時間序列預測方法。神經網絡具有逼近任意復雜連續函數關系的能力,而這些能力正是傳統方法所不具有的。本文把模糊邏輯和神經網絡相結合起來,首先介紹了模糊系統和神經網絡的基本知識以及二者結合的可能性。然后建立模糊神經網絡模型并用于股票價格的預測,運用相關分析在剔除了與預測指標相關性較小的指標,簡化了模糊神經網絡的結構,并在實際的試驗中確定了相關網絡系數的初始值,簡要的介紹了建模的工具,并用設立模糊等級對模糊神經網絡的有效性進行了評價,在通過實證分析證實了網絡系統基本上達到了預想的要求。
參考文獻:
[1]胡守仁,神經網絡應用技術[M],國防科技大學出版社,1993
[2]趙振宇,模糊理論和神經網絡的基礎與應用[M],清華大學出版社,1996
[3]劉增良,模糊邏輯與神經網絡[M],北京航空航天大學出版社,1996
[4]吳華星,基于神經網絡的股票價格預測,中國科學院計算技術研究所,1998
[5]姚培福,人工神經網絡在股票預測中的應用與研究,昆明理工大學碩士學位論文,2007
[6]邵航,模糊神經網絡在股票價格短期預測中的應用研究,暨南大學碩士學位論文,2008
(作者單位:安徽財經大學 金融學院)