胥紅敏,郭 湛,李曉宇,習年生
(中國鐵道科學研究院 鐵道科學技術研究發展中心,北京 100081)
基于遺傳算法優化BP神經網絡的道口事故預測
胥紅敏,郭 湛,李曉宇,習年生
(中國鐵道科學研究院 鐵道科學技術研究發展中心,北京 100081)
針對鐵路事故發生的偶然性和事故發生原因的復雜性,提出應用BP神經網絡對鐵路事故進行較長期預測的建議,并以美國高速公路-鐵路道口事故為實例,應用BP神經網絡方法和遺傳算法優化的BP神經網絡方法對美國高速公路—鐵路道口未來3年的事故進行預測,并將預測結果進行對比,結果表明,遺傳算法優化的BP神經網絡可以用于鐵路事故的中長期預測。
鐵路道口;事故預測;遺傳算法;BP神經網絡
安全是鐵路行車的重中之重,鐵路事故一旦發生,輕則造成財物的損失,重則危及到旅客、乘務人員或其他人員的生命。據此,以預防事故為目的的事故預測逐漸成為研究人員關注的焦點,通過研究發現,事故的發生短期內看起來似乎沒有規律可談,可是隨著時間的延長、累積數據的增加,其客觀規律性變得比較明顯。把握事故發生的規律,有利于相關部門客觀地檢查和總結安全工作,有效地預防和控制事故發生,科學地制定未來安全工作的目標。
鐵路事故常用的預測方法包括時間序列法、灰色理論法以及神經網絡法[1]。其中時間序列法和灰色理論法的短期預測效果明顯,研究者也進行了不少灰色理論法預測事故的實踐[2~4]。神經網絡法在函數逼近以及預測方面具有很廣泛的應用[5],但在事故預測方面鮮有報道。本文分別應用神經網絡法和遺傳算法優化的BP神經網絡法對美國高速公路—鐵路道口事故進行研究,并對其2014年~2016年的事故件數進行了預測。研究證明,BP神經網絡法可用于鐵路事故的中長期預測,并且通過遺傳算法的優化,其預測結果更加穩定。
1.1 數據來源
美國地域廣闊,截止上世紀末,在美國28萬km鐵路線路上就有公共道口15萬余個[6],每年發生的鐵路事故中,公路—鐵路平交道口事故數量占絕對優勢。實例數據來源于美國聯邦鐵路管理局網站[7]1978年~2013年共36年的公路—鐵路平交道口事故。
1.2 BP神經網絡
BP神經網絡是一種多層前饋型神經網絡,1986年由Rumelhart和McCelland為首的科學家小組提出。它包含輸入層、隱含層和輸出層,隱含層可以一層或多層,具有很強的學習、聯想和容錯功能,以及高度非線性函數映射功能,預測精度較高,泛化能力好。
對于一個三層BP神經網絡,設其輸入信號為xi,隱含層節點輸出為yj,輸出節點輸出為zk,輸入層節點到隱含層節點的連接權值為wij,隱含層節點到輸出層節點的連接權值為wjk,隱含層節點的閾值為θj,輸出層節點的閾值為?k,則輸出層節點的輸出為:

其中,n1為輸入層的節點數,n2為隱含層的節點數, 為作用函數,其形式通常為線性函數、S型函數或雙曲正切S型函數。BP神經網絡算法的思想就是根據輸出與實際數據的誤差來修改連接權值和節點閾值,當輸出和實際數據的接近程度達到既定要求時,即固定連接權值和節點閾值,完成模型的建立。
20世紀80年代,RobertHecht-Nielson證明了一個三層的BP網絡(只有單隱層的BP網絡叫做三層BP網絡),可以完成任意的n維到m維的映射,即對于任何一個在閉區間的連續函數都可以用三層BP網絡逼近。
1.3 遺傳算法
遺傳算法是20世紀60年代由美國密歇根大學的John Holland教授提出,是一種自然適應優化方法。該算法將要解決的問題模擬成一個生物進化的過程,通過復制、交叉和突變等操作產生下一代的解,并逐步淘汰到適應度低的解,增加適應度高的解,以達到進化N代后找到適應度滿足要求的解。在本文中應用遺傳算法,通過優化預測函數中的參數(層間權值和節點閾值)達到優化神經網絡預測結果的效果。該算法是常用的一種優化普通BP神經網絡的方法,得到的預測效果一般優于未優化的BP網絡。
2.1 模型參數及作用函數
建立的模型為有一個單隱層的三層BP神經網絡模型,在模型中,參見公式(1),輸入層的節點數n1取為30。隱含層節點數的選取在程序中采用試算法,步驟為:(1)輸入不同的隱含層節點數;(2)訓練網絡進行預測;(3)計算預測數據和訓練數據的均方誤差,選取預測數據和訓練數據的均方誤差最小時的隱層單元數為網絡模型的隱層單元數。作用函數f根據輸出與實際數據的吻合程度選取雙曲正切S型函數,其表達式為:

2.2 權值和閾值更新滾動算法
在實際應用中,通過研究表明,已經訓練好的BP神經網絡的預測誤差會隨著時間的推移而增大。這是因為訓練好的BP神經網絡的權值和閾值不再隨時間改變,從而造成權值和閾值不適應若干時間點后的事故件數預測。為此,本文采用滾動方式訓練BP神經網絡,使訓練數據實時更新。其方法是:利用事故件數數據Nj,Nj+1,…,Nj+e-1為輸入,Nj+e,Nj+e+1,…,Nj+e+m-1為輸出訓練BP神經網絡,再以Nj+t,Nj+t+1,…,Nj+e+t-1為輸入,用以預測Nj+e+t,Nj+e+t+1,…,Nj+e+m+t-1;然后以Nj+t,Nj+t+1,…,Nj+e+t-1為輸入,Nj+e+t,Nj+e+t+1,…,Nj+e+m+t-1為輸出訓練新的BF網絡,再以Nj+2t,Nj+2t+1,…,Nj+e+2t-1為輸入,用以預測Nj+e+2t,Nj+e+2t+1,…,Nj+e+m+2t-1。其中,N為事故件數,e為輸入的數據數,m為輸出的數據數;t為下一次計算的步長。
具體步驟如圖1所示:(1)利用1978年到2007年每月的數據為輸入,2008年到2010年每月的數據為輸出,建立BP神經網絡模型1并進行訓練,再以1978年到2007年的事故數據為輸入模擬2008年到2010年的事故數據,用以與2008年到2010年實際發生的數據進行對比,驗證數據的吻合程度,如圖2所示。(2)以1981年到2010年事故數據為輸入進行模擬,預測2011年到2013年的事故數據,并與2011年到2013年實際發生的數據對比,驗證預測的合理性,如圖3所示。(3)由于訓練好的BP神經網絡的預測誤差會隨著時間的推移而增大,訓練數據隨著時間的推移進行改變,所以,利用1981年到2010年每月的數據為輸入,2011年到2013年每月的數據為輸出,建立BP神經網絡模型2并進行訓練,模擬2011年到2013年的數據,如圖4所示。(4)預測2014年到2016年的數據,如圖5所示。
2.3 參數優化
在本研究中,為了優化預測結果,還引入了遺傳算法優化BP神經網絡中的層間權值和節點閾值,進行了圖1過程的模擬預測計算,并與未引入遺傳算法的結果進行了對比。該算法過程通過MatLab的遺傳算法工具箱GAOT實現,在遺傳算法中,種群規模為50,遺傳代數為100。

圖1 事故預測技術路線圖

圖2 2008年~2010年事故數據吻合程度曲線圖

圖3 2011年~2013年事故數據預測
3.1 2011年~2013年事故數據預測
圖2為用神經網絡模型預測的2008年~2010年事故數據與原始訓練數據的對比,圖3為神經網絡模型預測的2011年~2013年事故數據與實際發生的數據的對比,其中圖2(a)和圖3(a)使用的網絡未經優化,而圖2(b)和圖3(b)使用的網絡經過遺傳算法優化??梢钥闯?,盡管遺傳算法優化的神經網絡預測的2008年~2010年事故數據與原始訓練數據的吻合程度稍差,但是其預測的2011年~2013年事故數據與實際發生的數據差別明顯小于未經優化的BP神經網絡的預測結果,據此認為,遺傳算法優化BP神經網絡得到的預測結果更為可信。
3.2 2014年~2016年事故數據預測
圖4為用神經網絡模型預測的2011年~2013年事故數據與原始訓練數據的對比,圖5為神經網絡模型預測的2014年~2016年事故數據。由圖5(b)可以看出,2014年1月~4月、10月~12月以及2015年全年為高速公路—鐵路事故高發時間區段。

圖4 2011年~2013年事故數據吻合程度曲線圖

圖5 2014年~2016年事故數據預測

表1 BP網絡預測年事故件數與實際發生事故件數對比表
3.3 事故總數分析
表1為BP網絡預測年事故件數與實際發生事故件數對比,表中,BP網絡1是由1978年~2007年數據為輸入、2008年~2010年數據為輸出建立的BP網絡;BP網絡2是由1981年~2010年數據為輸入、2011年~2013年數據為輸出建立的BP網絡??梢钥闯?,遺傳算法優化后的BP網絡預測的事故數據件數和實際發生的件數更加接近,用BP網絡1預測的2011~2013年(共36個月)事故件數與實際僅相差85件,平均每月誤差小于3件;而未經優化的BP網絡1預測的2011~2013年事故件數與實際相差712件,平均每月誤差接近20件,所以遺傳算法優化BP網絡比單純的BP網絡更可靠。根據優化BP網絡預測, 2014年1月~4月、10月~12月以及2015年全年為美國高速公路—鐵路事故高發時間區段,根據預測,2014年到2016年的事故發生的總件數為5 733件,具體到每年預計分別為1 975件、2 223件和1 535件。相對來說,2015年是事故多發年。
通過以上研究,可以得到如下結論:
(1)相對于其它預測方法,BP神經網絡對于長期預測效果顯著;(2)遺傳算法優化可提高BP神經網絡的準確性。
[1] 王 卓,賈利民,秦 勇,等.鐵路行車事故預測方法分析與比較[J].中國安全科學學報,2009,19(8):34-39.
[2] 羅金保.基于GM(1,1)模型的鐵路行車事故預測[J].中國安全科學學報,2004,14(6).
[3] 錢武生.鐵路中間站事故的灰色系統理論預測模型研究[J].中國科技信息,2006(9):144-145,136.
[4] 歐春霞,田蘅暉.鐵路行車安全預測初探[J].中國安全科學學報,1995,5(2):40-43.
[5] 陳 鶯,徐 晨,張維強.基于Huang變換和BP神經網絡的時間序列預測方法[J].計算機工程與應用,2007,43(30):242-244.
[6] 賈明濤.鐵路道口事故分析與預測研究[D].北京:北京交通大學,2007,4.
責任編輯 楊琍明
Prediction on crossing accident based on BP neural network of optimized Genetic Algorithm
XU Hongmin, GUO Zhan, LI Xiaoyu, XI Niansheng
( Railway Science and Technology Research and Development Center, China Academy of Railway Sciences, Beijing 100081, China )
According to the unpredictability and the complexity of the railway accidents happening, the suggestions using the BP neural network to predict the railway accidents during a long period were presented.And taking the USA highway-railway crossing accidents as examples, the American highway-railway crossing accident in the next three years were forecasted using the BP neural network method and the BP neural network method optimized by the Genetic Algorithm.The forcasted results obtained using the two methods were compared.It was shown that, the BP neural network method optimized by the Genetic Algorithm could be used for the railway accident long-term prediction.In 2014, from January to April and from October to December, and in the whole 2015, was the periods that the USA highway-railway crossing accidents happening frequently.
railway crossing; accident prediction; Genetic Algorithm; BP neural network
U298.55∶TP39
A
2015-06-03
中國鐵道科學研究院院基金項目(2013YJ095)。
胥紅敏 ,副研究員;郭 湛,副研究員。
1005-8451(2016)03-0008-05