朱智雄,鐘一兵
(肇慶學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣東 肇慶 526061)
深圳市交通事故預(yù)測的灰色神經(jīng)網(wǎng)絡(luò)模型
朱智雄,鐘一兵
(肇慶學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣東 肇慶526061)
道路交通系統(tǒng)的運(yùn)行具有較強(qiáng)的非線性和隨機(jī)性,現(xiàn)采用灰色關(guān)聯(lián)分析方法找出交通事故的主要影響因子;運(yùn)用灰色系統(tǒng)與BP神經(jīng)網(wǎng)絡(luò)模型,結(jié)合交通事故主要影響因子進(jìn)行組合建模,對深圳市的交通事故進(jìn)行預(yù)測.結(jié)果表明,組合預(yù)測模型的預(yù)測精度優(yōu)于單一灰色GM(1,1)模型.
深圳交通;灰色神經(jīng)網(wǎng)絡(luò);事故預(yù)測
我國已成為世界上最大的汽車生產(chǎn)和消費(fèi)國,安全高效的交通系統(tǒng)對我國國民經(jīng)濟(jì)的穩(wěn)定發(fā)展具有深遠(yuǎn)的影響.深圳市是我國改革開放的先鋒,同時也是我國擁有汽車最多的城市之一,其交通系統(tǒng)安全高效地運(yùn)行對社會的穩(wěn)定發(fā)展具有十分重要的意義.通過比較圖1和圖2可知,在有關(guān)部門對交通環(huán)境的科學(xué)治理下,近年來深圳市在地少車多的情況下仍能保持較低的交通事故發(fā)生率.各地交通管理部門應(yīng)加強(qiáng)對深圳市交通安全管理現(xiàn)狀的分析研究,借鑒其科學(xué)有效的管理經(jīng)驗(yàn),不斷提高所在地的交通治理水平.

圖1 北京、上海、深圳歷年交通事故年發(fā)生次數(shù)

圖2 北京、上海、深圳交通事故造成的直接經(jīng)濟(jì)損失
當(dāng)前預(yù)測交通事故模型常用的方法有統(tǒng)計(jì)回歸分析方法,其中倫敦大學(xué)史密德R.J教授的Smeed模型較為典型.當(dāng)前較為前沿的方法有神經(jīng)網(wǎng)絡(luò)模型、灰色系統(tǒng)模型以及組合預(yù)測模型等[1].
GM(1,1)灰色新陳代謝模型是一種少數(shù)據(jù)、信息不確定性問題的研究方法.該方法通過挖掘、提取研究對象內(nèi)“部分”有價值的已知信息,有效實(shí)現(xiàn)對研究對象的運(yùn)行與演化機(jī)制的描述和控制.人工神經(jīng)網(wǎng)絡(luò)是人工智能的重要分支,其具有強(qiáng)并行處理、容錯性、魯棒性、自適應(yīng)及自組織能力,并且在復(fù)雜的非線性系統(tǒng)中具有較高的建模能力,對數(shù)據(jù)也具有比較優(yōu)秀的擬合能力[2].
綜上可知,人工神經(jīng)網(wǎng)絡(luò)在非線性數(shù)據(jù)處理方面具有明顯的優(yōu)勢,而GM(1,1)灰色新陳代謝模型在貧數(shù)據(jù)、短時間序列的預(yù)測方面擁有獨(dú)特的優(yōu)勢,故本文試圖運(yùn)用BP人工神經(jīng)網(wǎng)絡(luò)與灰色系統(tǒng)模型進(jìn)行組合建模,以期能有效提高交通事故預(yù)測模型的穩(wěn)定性和準(zhǔn)確性.
1.1灰色新陳代謝模型的建立
第1步:對于原始數(shù)列中同類數(shù)據(jù)進(jìn)行累加生成,形成新的序列.
設(shè)序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n)為某一類原始數(shù)據(jù)序列,其中x(0)(k)≥0,k=1,2,…,n;x(1)為x(0)的1次累加生成序列,x(1)=(x(1)(1),x(1)(2),…,x(1)(n),其中即

依此類推可得新序列.

第3步:確定預(yù)測值:由GM(1,1)模型時間響應(yīng)式,可解出


1.2模型檢驗(yàn)
1.2.1事前檢驗(yàn)
要確保模型具有較高的精度,在建立模型前可先對原始數(shù)據(jù)序列進(jìn)行可行性分析.設(shè)原始序列x(0)=(x(0)(1),x(0)(2),x(0)(3),…,x(0)(n),檢驗(yàn)原始數(shù)據(jù)數(shù)列所有點(diǎn)的級比是否都落在區(qū)間內(nèi).只有當(dāng)級比ζ(t)落在該區(qū)間內(nèi),灰色模型才有意義.
1.2.2模型精度檢驗(yàn)
檢驗(yàn)?zāi)P途鹊某S?種方法為相對誤差檢驗(yàn)法、關(guān)聯(lián)度檢驗(yàn)法和后驗(yàn)差檢驗(yàn)法.
1)相對誤差檢驗(yàn)法.
2)關(guān)聯(lián)度檢驗(yàn)法.
設(shè)原始序列為X(0)=(x(0)(1),x(0)(2),x(0)(3),…,x(0)(n),預(yù)測值序列為Y(0)=(y(0)(1),y(0)(2),y(0)(3),…,y(0)(n);則關(guān)聯(lián)系數(shù)定義為
3)后驗(yàn)差檢驗(yàn)法.
設(shè)x(0)為原始序列,x~(0)為相應(yīng)的預(yù)測模擬序列,ε(0)為殘差序列,則分別為x(0)的均值和方差;分別為殘差的均值、方差,并稱c=s2/s1為后驗(yàn)差比值.對于給定的c0>0,當(dāng)c<c0,稱該模型為均方差比合格模型.顯然均方差c越小越好,s2小而s1大,即殘差方差小,原始數(shù)據(jù)方差大,說明殘差集中,原始數(shù)據(jù)分散.P=P(||ε(k)-ε-<0.674 5s1)稱為小誤差概率,對于給定的P0>0,當(dāng)P<P0時,稱模型為小誤差概率合格模型,其中小概率P越大越好.
常用的精度等級見表1[3],可供檢驗(yàn)?zāi)P蛥⒖迹?級精度效果最好).

表1 預(yù)測精度等級檢驗(yàn)表
1.3灰色新陳代謝模型構(gòu)建
隨著時間的推移,新產(chǎn)生的影響因素對整個灰色系統(tǒng)的影響程度,要大于初始時間相關(guān)影響因子的影響程度,因此,有必要在預(yù)測過程中不斷用新數(shù)據(jù)代替原序列中的歷史信息.具體操作方法是將通過GM(1,1)灰色預(yù)測模型得到的最新預(yù)測值,代入原預(yù)測序列x(0)=(x(0)(1),x(0)(2),x(0)(3),…,x(0)(n)中,并去掉該序列中第1個數(shù)據(jù)x(0)(1),從而得到新的預(yù)測序列將其代入GM(1,1)灰色新陳代謝預(yù)測模型,得到最新的預(yù)測值,依此規(guī)則依次替換至完成目標(biāo)預(yù)測.
1.4灰色新陳代謝模型的實(shí)證分析
本文中,筆者首先以深圳市交通事故次數(shù)作為預(yù)測目標(biāo),表2是深圳市2001—2012年的交通事故次數(shù)[4].

表2 2001—2012年深圳市交通事故次數(shù)
實(shí)踐表明,當(dāng)觀測值大于4時模型預(yù)測精度較好.運(yùn)用表2數(shù)據(jù),將2010—2012年的數(shù)據(jù)作為預(yù)測目標(biāo)值,選取5~9個觀測值,運(yùn)用灰色新陳代謝的方法進(jìn)行預(yù)測.下面以5個觀測值為例:
1)以2005—2009年的事故次數(shù)建立原始序列,X(0)=(7 068,4 836,3 384,2 471,1 927);
2)將X(0)序列代入GM(1,1)模型,并計(jì)算出序列中第6個值y(X(0),即2010年的交通事故數(shù)值;
3)在原序列末尾加入最新的預(yù)測值y(X(0),并去掉原序列中第1個數(shù)值,得到新的預(yù)測序列X(1),則X(1)=(4 836,3 384,2 471,1 927,y(X(0));
4)將X(1)作為新的預(yù)測序列代入GM(1,1)中,得到新的預(yù)測值y(X(1),將其作為2011年的交通事故預(yù)測值;
5)重復(fù)3)中的替換步驟,得到新的預(yù)測序列X(2),并求解2012年預(yù)測值y(X(2);
6)對照原數(shù)據(jù)中的真實(shí)值,并計(jì)算預(yù)測值的相對誤差;
7)6個觀測值的預(yù)測值之初始序列選擇2004—2009年的數(shù)據(jù),7~9個觀測值的預(yù)測序列依次類推,并重復(fù)1)~6)步驟.依據(jù)上述步驟,得到實(shí)驗(yàn)結(jié)果,詳見表3.

表3 5~7個觀測值交通事故次數(shù)預(yù)測精度表格
通過簡單比較上述實(shí)驗(yàn)結(jié)果易得,當(dāng)觀測值達(dá)到7個時數(shù)據(jù)的預(yù)測誤差已較小,故可取7個觀測值作為灰色新陳代謝模型預(yù)測序列.同時從表3可得,隨著時間推移,其預(yù)測誤差明顯增大.
1.5BP人工神經(jīng)網(wǎng)絡(luò)構(gòu)建
通過查詢深圳市統(tǒng)計(jì)局的相關(guān)數(shù)據(jù),我們選取了2001—2012年深圳市交通系統(tǒng)的相關(guān)統(tǒng)計(jì)指標(biāo):生產(chǎn)總值指數(shù)、道路照明燈盞數(shù)、深圳戶籍機(jī)動車數(shù)輛、大型汽車數(shù)輛、小型汽車數(shù)輛、摩托車數(shù)輛、機(jī)動車總量數(shù)輛、交通違法總數(shù)量、機(jī)動車交通違法數(shù)量等共19個統(tǒng)計(jì)量.由于樣本過多,我們用樣本指標(biāo)對交通事故次數(shù)進(jìn)行灰色關(guān)聯(lián)測試,取得了關(guān)聯(lián)度比較高的樣本:生產(chǎn)總值指數(shù)(x1)、行人交通違法(x2)、交通違法總和(x3)、道路照明燈盞數(shù)(x4)、粵港駕駛員違法(x5)、貨車超載(x6)、公共交通客流量(x7)、暫扣機(jī)動車(x8)、本地駕駛員違法(x9)、機(jī)動車交通違法(x10),詳情如表4所示.

表4 統(tǒng)計(jì)指標(biāo)的灰色關(guān)聯(lián)度
上述指標(biāo)與深圳市交通事故發(fā)生次數(shù)的關(guān)聯(lián)度均大于0.670,這說明以上統(tǒng)計(jì)量與交通事故的發(fā)生具有較明顯的關(guān)聯(lián)性.
利用GM(1,1)灰色新陳代謝模型預(yù)測方法分別對上述10個指標(biāo)進(jìn)行5~9個觀測值的灰色預(yù)測,并得到2010—2012年的對應(yīng)預(yù)測值,結(jié)果如表5所示.由于“暫扣機(jī)動車(x8)”這一指標(biāo)5~9個觀測值的預(yù)測值都無法保證灰色預(yù)測檢驗(yàn)的精準(zhǔn)度,為了保證預(yù)測結(jié)果的準(zhǔn)確性,該指標(biāo)在后續(xù)實(shí)驗(yàn)中予以剔除,只保留9個統(tǒng)計(jì)指標(biāo).

表5 最優(yōu)預(yù)測值
調(diào)用MATLAB R2014a中的“nntool”工具箱作為BP神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)平臺[5],選取2001—2009年上述9個指標(biāo)的相應(yīng)數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的輸入樣本,以對應(yīng)時段的交通事故次數(shù)作為輸出樣本,對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練.通過多次測試選擇,得到要獲得較好的預(yù)測精度,需滿足如下條件:網(wǎng)絡(luò)的隱含層神經(jīng)元個數(shù)為9個;訓(xùn)練函數(shù)Training function選取“TRAINSCG”,Adaption learning function函數(shù)選取“LEARNGDM”,隱層轉(zhuǎn)換函數(shù)選擇“TANSIG”,輸出層轉(zhuǎn)換函數(shù)選擇“TANSIG”.此時其總體輸入與輸出擬合效果較好,總體可決系數(shù)R=0.968 82.
將表5的9組GM(1,1)預(yù)測值作為已經(jīng)訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)的輸入值,預(yù)測2010—2012年深圳市交通事故次數(shù)的預(yù)測結(jié)果,并與單純用GM(1,1)灰色新陳代謝模型預(yù)測得到的相應(yīng)數(shù)值預(yù)測值進(jìn)行對比,詳情如表6所示.

表6 預(yù)測值與組合模型預(yù)測值比較
上述實(shí)證實(shí)驗(yàn)表明,運(yùn)用灰色關(guān)聯(lián)分析方法可以準(zhǔn)確找出深圳市交通事故的影響因素,在預(yù)測短期交通事故次數(shù)的數(shù)值時,單純采用GM(1,1)灰色新陳代謝模型的誤差程度并不明顯,但是隨著時間跨度的增大,其預(yù)測精度大大減低.而通過GM(1,1)灰色新陳代謝模型與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行組合預(yù)測,則可以明顯提高預(yù)測精度,且能避免上述灰色系統(tǒng)的缺陷,達(dá)到較為穩(wěn)定的預(yù)測精度.
[1]劉海申.基于和神經(jīng)網(wǎng)絡(luò)的組合模型對甘肅省交通事故的分析與預(yù)測[D].蘭州:蘭州商學(xué)院,2011.
[2]韓敏.人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)[M].大連:大連理工大學(xué)出版社,2014:1-63.
[3]劉思峰,楊英杰,吳利豐.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,2014.
[4]深圳市統(tǒng)計(jì)局.深圳統(tǒng)計(jì)年鑒2013[M].北京:中國統(tǒng)計(jì)出版社,2012.
[5]MATLAB技術(shù)聯(lián)盟,劉冰.MATLAB神經(jīng)網(wǎng)路超級學(xué)習(xí)手冊[M].北京:人民郵電出版社,2013:79-193.
The Grey Neural Network in Predicting for the TrafficAccident of Shenzhen
ZHU Zhixiong,ZHONG Yibing
(School of Mathematics and Statistics,Zhaoqing University,Zhaoqing,Guangdong 526061,China)
ractSince the road traffic system runs with strong nonlinearity and randomness,the paper uses the grey correlation analysis to find out its main effect.A combination forecast model has been established to predict the traffic accidents in Shenzhen,combining the grey system and BP neural networks with the main effects.The result shows that the forecast precision of this combination forecasting model is superior to the single gray metabolism grey metabolism model.
ordsTrafficAccident of Shenzhen;grey neural network model;the prediction of accident
TK514
A
1009-8445(2016)02-0004-05
(責(zé)任編輯:陳靜)
2015-12-18
廣東省大學(xué)生科技創(chuàng)新培育專項(xiàng)基金資助項(xiàng)目(pdjh2015b0575)
朱智雄(1992-),男,廣東韶關(guān)人,肇慶學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院2012級學(xué)生.
鐘一兵(1972-),男,湖南邵陽人,肇慶學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院副教授,博士.