張亭 薛偉蓮
[摘 要] 本文針對日益增長的機動車保有量,利用BP神經網絡建立了一個機動車保有量預測模型,模型結構分為3層,輸入層有10個節點,輸出層為機動車保有量,主要涉及人口、經濟、道路等影響因素。利用此模型可以對未來機動車的保有量進行預測,為政府制定相應的政策及城市道路交通規劃提供理論依據。
[關鍵詞] BP神經網絡; 機動車保有量; 預測模型
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 03. 051
[中圖分類號] F50; U491 [文獻標識碼] A [文章編號] 1673 - 0194(2014)03- 0110- 03
0 引 言
近10年來,中國經濟穩健前行,GDP年均增長率達10.7%,這極大地推進了我國城市化的進程,從而促進了機動車工業的發展。截至2012年底,全國機動車保有量已達2.4億輛,同時,機動車保有量的急劇增加必然會帶來環境污染、交通堵塞等諸多問題。
機動車保有量及其增長速度,受到自然資源和社會環境的約束,以及城市道路和停車場等基礎設施的限制。機動車保有量的增速,應該在整個社會可以承受的限度內,無論從經濟學還是社會學角度考慮都該如此。我國人口眾多,人均土地少,預測和衡量機動車保有量的增長不能完全套用世界千人擁有量模式,只能走自己的路,因此本文建立了一個適用于我國大中城市的基于BP神經網絡的機動車保有量預測模型,為政府制定相應的政策及城市道路交通規劃提供理論依據。
1 相關研究
目前國內外對機動車保有量規模預測的研究取得了相當多的成果,提出了時間序列預測、定性預測、回歸分析預測、灰色系統預測、趨勢外推預測、神經網絡預測等計算方法。
牟振華、李美玲、趙慶雙[1]利用SPSS軟件中的主成分分析法篩選出了少量的影響因素,建立了基于影響因素的BP神經網絡預測模型;何明、過秀成[2]利用SPSS中的主成分分析法提取了少量影響因素,通過這些因素建立了基于BP神經網絡的汽車保有量預測模型;鄧恒進、胡樹華[3]分析了大量汽車保有量的歷史數據,提出了最大可容納汽車保有量這一概念,利用Logistic模型較為理想化地預測了汽車保有量增長期,并在此基礎上提出了各利益相關者應采取的策略。
Warren McCulloch, Walter Pitts[4]等人以二維選擇模型為基礎,綜合分析了家庭、工作選址與汽車保有量之間的關系,結合微觀經濟學和隨機效用選擇理論建立了以家庭為單位的動態汽車保有量模型。
當前很多學者建立了基于時間序列預測和回歸分析預測等預測方法,這些方法可以對機動車保有量進行預測,而且在指標的選取上要求不高,用這些方法建立的模型相對來說比較簡潔,但是很多時候會出現較大的誤差。本文選取了大連市2001-2010年間的相關指標數據建立了基于BP神經網絡的機動車保有量預測模型。
2 基于BP神經網絡的機動車保有量預測模型
2.1 預測指標的選取
城市機動車保有量受到諸多因素的影響,如社會經濟發展水平、道路水平和人口數量等。綜合考慮各方面因素,本文選取了社會經濟、人口、道路交通等幾個主要的影響因素作為評價指標[5]。本文用X1,X2,…,X10分別代表地區生產總值(億元)、人均地區生產總值(元)、地方財政預算內收入(萬元)、地方財政預算內支出(萬元)、年末總人口數(萬人)、人口密度(人/平方千米)、客運總量(萬人)、貨運總量(萬噸)、人均鋪裝道路面積(平方米)、年末實有鋪裝道路面積 (萬平方米)。
2.2 輸入、輸出層設計
本文設計的神經網絡結構分為3層:輸入層、隱層和輸出層。其中輸入層的節點數由輸入矢量的維數來決定,即數據中有多少個影響因素,輸入層就有多少個節點,本文中影響機動車保有量的主要因素有10個,因此輸入層的節點數為10。模型輸出的是機動車的保有量,因此輸出層只有1個節點。
2.3 隱層節點的選擇
在BP神經網絡中,單隱層的BP網絡可以實現任意非線性映射。我們可以結合經驗公式n1 = ■ + a通過試湊的方法來確定隱層節點的個數。
2.4 激活函數的選擇
BP網絡的激活函數必須是處處可微的。S型激活函數所劃分的區域是一個非線性的超平面組成的區域,它是比較柔和、光滑的任意界面,因而它的分類比線性劃分更加精確、合理,這種網絡的容錯性較好。它的另一個重要特點是:激活函數是連續可微的,它可以嚴格利用梯度法進行推算,因此本文BP網絡結構在隱含層采用S型激活函數。
基于BP神經網絡的機動車保有量預測模型如圖1所示。
3 機動車保有量預測實例分析
3.1 數據歸一化處理
下面我們以大連市為例說明模型的預測過程,我們可以在MATLAB[5-6]的命令窗口通過下面的線性函數轉換方法對大連市機動車保有量影響因素的相關數據進行歸一化處理:
P = (P0 - P■)/(P■ - P■) (公式1)
公式中的P為歸一化處理后的數據,P0為原始數據,P■為原始數據中的最小值,P■為原始數據中的最大值。歸一化處理后得到的輸入值如表1所示。另外,大連市2001-2010年的機動車保有量歸一化處理后得到的數據為: 0.000 0,0.186 8,0.256 3,0.298 0,0.383 0,0.511 1,0.594 5,0.681 0,0.745 2,1.000 0。
3.2 BP神經網絡模型的訓練及結果分析
我們選取經過歸一化處理的大連市2001-2010年間的數據對模型進行訓練和測試。我們把2001-2008年的指標數據作為輸入樣本,把2002-2009年的機動車保有量作為期望輸出值,然后對網絡進行訓練。然后以2002-2009年的數據作為測試的輸入樣本,以2003-2010年的機動車保有量作為測試的期望輸出值。首先通過試湊法來設定隱層的節點數,根據誤差的大小,我們最終將隱層的節點數設置為7。通過神經網絡的訓練得到訓練值,得到的結果如表2所示,可以看到,經過訓練得到的機動車保有量預測值和實際值已經十分接近,誤差非常小。
3.3 選擇樣本測試神經網絡模型
通過前面對訓練樣本的訓練,當訓練的誤差值小于設定的誤差值時訓練結束,得到一個最優權值和閾值。根據最優權值的和閾值,我們可以輸入2002-2009年的指標數據對2010年的機動車保有量數據進行測試驗證,由表3中的數據可以看出2010年的機動車保有量,雖然誤差要比之前訓練時的誤差大,但是得到的數據也是很接近,由于數據樣本較少的原因,訓練和測試的精度會有所差別。因此本文的神經網絡預測模型是可行的。
3.4 BP神經網絡與其他算法的比較
我們利用不同的方法來對大連市的機動車保有量進行預測,對不同方法的預測值與實際值的比較如表4所示,最后發現BP神經網絡與時間序列預測法和回歸分析預測方法相比具有較小的誤差。
4 結 論
由于機動車保有量增加會帶來諸多問題,為準確預測機動車保有量,本文提出了基于BP神經網絡的機動車保有量預測模型,選取了10項影響機動車保有量的指標因素,通過訓練和測試發現此模型具有較高的擬合度,與采用回歸分析和時間序列模型進行預測得到的結果相比,神經網絡具有誤差小的優點,該模型可以較好地對機動車保有量進行預測,從而為政府制定相應的政策提供了理論依據。雖然BP神經網絡已是非常成熟的技術,但是在使用的過程中仍然存在許多問題,如何將先進的優化算法加入到本文所建立的模型中以提高其收斂速度,是后續學習過程中研究的重點。
主要參考文獻
[1] 牟振華,李美玲,趙慶雙. 基于神經網絡的山東省機動車保有量預測[J]. 山東建筑大學學報,2009,24(3):229-232.
[2] 何明,過秀成. BP神經網絡主成分分析法在汽車保有量預測中的應用[J]. 交通與計算機,2007,25(4):96-99.
[3] 鄧恒進,胡樹華. 基于Logistic模型的我國汽車保有量增長期分析[J]. 企業經濟,2008(8):111-113.
[4] Warren McCulloch, Walter Pitts. A Logical Calculus of the Ideas Immanent in Nervous Activity [J]. The Bulletin of Mathematical Biophysics,1943,5(4):115-133.
[5] 田振中,彭晗,薛海培. 基于主成分和BP神經網絡的汽車保有量預測[J]. 交通標準化,2008(19):173-175.
[6] 雷英杰. MATLAB遺傳算法工具箱及應用[M]. 西安:西安電子科技大學出版社,2005.