李益民
(中國鐵道科學研究院 運輸及經濟研究所,北京 100081)
基于GRNN的主要編組站辦理車輛數的預測
李益民
(中國鐵道科學研究院 運輸及經濟研究所,北京 100081)
運用廣義回歸神經網絡對鐵路編組站辦理車輛數進行預測。在對編組站辦理車輛數的經濟因素和結構因素進行分析的基礎上,給出GRNN預測的全過程,并將GRNN與BP網絡預測進行比較,建立網絡、訓練和檢測,最終模擬得到全路主要編組站辦理車輛數。實例分析證明GRNN能提高預測精度,為編組站規劃和設計提供理論支持。
鐵路;編組站;辦理車輛數;有調中轉車;無調中轉車;廣義回歸神經網絡
編組站在鐵路路網運輸中承擔大量的列車改編作業,編組站辦理車輛數的效率直接關系到路網運輸效率和運輸質量。編組站辦理車輛數是衡量和評價編組站運營效果的重要指標,編組站的發展規劃需要對未來年辦理車輛數進行預測。另外,該類指標對于評估車站作業的負荷和車站作業能力的適應性,以及確定編組站改編設備配置,都具有十分重要的作用。
編組站辦理車輛數不僅受到鐵路內部因素的影響,也會隨著國民經濟的發展發生變化,而選擇相關的重要影響因子將有助于提高預測結果的可靠性。另外,短期預測會減小預測的相對誤差,使得預測結果更具有實際意義。
以鐵路40個主要編組站總辦理車輛數、有調中轉車和無調中轉車為研究對象,選擇若干宏觀經濟指標作為重要的影響因子,運用廣義回歸神經網絡(Generalized Regression Neural Network,GRNN)進行5年的短期預測。
目前,常用的預測方法有時間序列法(移動平滑法、指數平滑法和季節調整法)、相關(回歸)分析法、灰色預測法和多種方法綜合的組合預測方法等。這些方法大都集中在對其因果關系回歸模型和時間序列模型的分析上,因而所建立的模型適用范圍有限。
人工神經網絡作為一種并行的計算模型,具有傳統建模方法所不具備的很多優點,有很好的非線性映射能力,一般不必事先知道有關建模對象的結構、參數和動態特性等方面的知識,只需給出對象的輸入、輸出數據,通過網絡本身的學習功能就可以得到輸入輸出的映射關系。
辦理車輛數的預測可以利用BP(Back Propagation)網絡模型和徑向基函數(Radial Basis Function,RBF)網絡模型,但是這兩種模型在用于預測時,存在收斂速度慢和局部極小的缺點,在解決樣本量少并且噪音較多的問題時,效果并不理想。
廣義回歸神經網絡在逼近能力、分類能力和學習速率上較BP網絡和RBF網絡有較強的優勢,模型最后收斂于樣本集聚較多的優化回歸面,并且在樣本數據較少時預測效果也比較好。此外,網絡模型還可以處理不穩定的數據。因此,采用GRNN建立網絡預測模型,對辦理車輛數進行預測。
GRNN網絡的基本思想是,用徑向基函數作為隱單元的“基”,構成隱含層空間。隱含層對輸入向量進行變換,將低維空間的模式變換到高維空間內,使得低維空間內的線性不可分問題在高維空間內線性可分,廣義回歸神經網絡結構圖如圖1所示。圖1中,X=x1,x2,…,xn,為網絡輸入向量;?j(X)(j=1,2,…,m)為任一隱節點的激活函數,W為輸出權矩陣,T為輸出層閥值向量;Y=y1,y2,…,yl,為網絡輸出向量[1]。
通過調查分析,影響主要編組站辦理車輛數、有調中轉貨車數和無調中轉貨車數的因素包括經濟因素和結構因素兩部分,如表1所示。

圖1 廣義回歸神經網絡結構圖

表1 編組站辦理車輛數影響因素分析表
經濟因素和結構因素涵蓋了宏觀與微觀的相關因素,宏觀上,GDP、工業總產值、CPI、進出口總額、社會消費品零售總額和人口作為大的指標,對于國家貨物的流動有重要影響;微觀上,橫向市場競爭的公路貨運量,縱向的鐵路內部指標包括全國鐵路營業里程、貨車日均裝車數、機車(貨車)的擁有量和鐵路貨運量,將直接影響辦理車輛數。煤炭、鋼鐵和糧食屬于最主要大宗貨物,主要采用無改編運輸形式,直接影響無調中轉車數。
選擇以上15個因素作為影響因子,主要編組站辦理車數、有調中轉車數、無調中轉車數作為輸出因子,構建GRNN。
以2001—2009年數據作為網絡的訓練樣本,以2010年樣本作為外推預測檢驗,如表2和表3所示,預測目標樣本如表4所示。

表2 樣本數據表1

表3 樣本數據表2
3.3.1 訓練和預測1
為了得到短期內2011—2015年全路主要編組站辦理車輛數、有調和無調中轉貨車數,必須得到并補全2011—2015年15個影響因子的基礎數據,下面將針對不同的預測因子采用不同的預測方法以期達到最佳效果。
(1)GDP的預測。對于GDP基礎數據的預測,不論是單線預測還是非線性的神經網絡預測,都可以從原始數據和相隔時間序列差值進行預測,下面將從原始數據和其差值作為歷史數據分別做預測,結果如表5所示。
從表5可以看出,以相隔時間序列差值為基礎數據作出的預測效果要優于原始數據作出的預測,并且BP神經網絡的預測相對誤差值達到了0.44%,是比較理想的外推測試效果,下面將通過BP神經網絡得到外推數據,如表6所示。GDP的平均增長率為5.3%,這與《十二五規劃綱要(草案)》中提出的未來5年目標GDP增長率控制在7%以內相一致。
(2)其他影響因子的預測工業總產值、CPI、進出口總額等其余14個影響因子測試樣本預測表如表7所示。測試樣本年份為2010年。在對影響因子的預測中,除CPI采用指數平滑預測方法,社會消費品零售總額和國家鐵路營業里程采用回歸分析預測方法外,其余因子均采用BP神經網絡預測方法。
由表5和表7可得到影響因子預測誤差平均值為2.18%。
對于影響因子的預測結果如表8和表9所示。
3.3.2 訓練和預測2
對樣本數據進行歸一化處理,以歸一化后的樣本數據創建一個GRNN網絡和BP網絡,以計算第t年的主要編組站辦理車輛數。
將光滑因子分別設置為0.01,按照0.01步長遞增至2尋找最優光滑因子值,通過訓練,檢查網絡對樣本的逼近性能。
當光滑因子(步長)spread = 0.67時,均方誤差mse取得最小值為0.052 342。即此時網絡逼近性能和預測性能的誤差都為最小。因此,將光滑因子設定為0.67。

表5 GDP測試樣本預測

表6 GDP預測數據

表7 其他影響因子測試樣本預測

表8 影響因子預測值1

表9 影響因子預測值2
將2010年作為測試預測年,用GRNN網絡和BP網絡預測總辦理車數、有調中轉車數、無調中轉車數,結果如表10所示。
由表10可以看出,GRNN網絡相對于BP在預測精度上更接近實際值,尤其是無調中轉車的辦理車輛數。考慮2009、2010年數據波幅較大,訓練樣本容量較小,精度雖然不是十分精確,但是預測結果還是可以接受的。
運用訓練完畢的網絡,將表8和表9中的影響因素值作為輸入向量,對2011—2015年的編組站辦理車輛數、有調和無調中轉貨車數進行預測,其結果如表11所示。

表10 網絡 1 預測結果

表11 網絡 2 預測結果
根據調研得知,無調中轉車數在地方性、區域性和路網性編組站上升趨勢相對明顯,有調中轉車數比較平穩,總辦理車輛數依然穩中有升,這和預測數據的趨勢較一致。
基于分析全路編組站辦理車輛數的影響因素及特點,經過預測效果的檢驗和分析,證明了利用GRNN神經網絡進行預測的有效性。
實例分析表明,GRNN在設定的條件下,輸入和輸出結果關系明顯,模擬結果穩定,預測結果與接近年份的數據相關度更大;在直接影響因素缺失的情況下,能夠反映出數據時序的變化規律;GRNN神經網絡雖然在趨勢修正上優于其他時間序列法,但有突發的干擾波動影響時,此時若沒有與干擾存在關聯的參數作為影響因子進行廣義回歸神經網絡預測的輸入向量,外推預測數據也會存在較大誤差。
:
[1] 張德豐. MATLAB神經網絡應用設計[M]. 北京:機械工業出版社,2009.
1003-1421(2012)02-0051-06
TP183;U291.4
B
2011-11-17
2011-12-26
金 穎