徐永利 李景軍 王以龍




摘 要:高速公路網的日益完善,通車數量的急劇增加,目前交通事故的發生已成為高速公路通行中的一大難題。為了確定各因素對事故的影響程度,提高事故規律分析及預測的準確性,提出通過建立廣義線性回歸模型對高速公路進行事故預測。首先通過挖掘高速公路的歷史事故數據,對影響事故的多個因素進行定量分析,建立負二項回歸方程,其次驗證各因素的擬合優度,最后進行事故預測,結果表明模型提升了事故預測的準確性。
關鍵詞:廣義線性回歸模型;高速公路;事故預測
中圖分類號:U491.3 文獻標識碼:A
0 引言
根據山東省統計局官方網站統計,2018年山東省道路交通事故共發生13 226起,死亡人數為3 600人。而山東省截止到2018年,在汽車擁有量、道路面積、通車里程都持續增加的情況下,道路交通安全呈整體穩定的趨勢。
1 事故預測模型選擇
1.1 Poison分布模型
Poison分布作為回歸模型最基礎、最常用的模型,事故量選用Poison分布模型預測時,數據的均值和方差是相等的,采用該分布模型描述事故發生的規律,表達式如下:
式中:表示路段發生次事故的概率;表示路段發生的事故次數的數學期望;表示路段的解釋變量;表示解釋變量的系數。
由于道路交通事故數據難以滿足Poison分布對數據的要求,模型的應用具有局限性。
1.2 負二項分布模型
結合事故數據的特點,將Poison分布模型消除均值等于方差帶來的影響,即成為負二項分布模型。如式*:
式中:表示路段上發生的交通事故率;表示路段上發生的交通事故率的期望值;表示離散度指數;表示模型的解釋變量;表示解釋變量的參數。
1.3 零堆積Poison分布和零堆積負二項分布模型
如果劃分路段內無事故發生時,會導致數據過度離散,將無法使用Poison分布模型和負二項分布模型。
事故次數分布服從Poison分布和負二項分布,由于均值遠小于方差,因此選用負二項模型進行事故預測較為合適。
2 事故數據準備
2.1 路段劃分
使用微觀模型預測事故時首先需要將路段進行單元劃分,為研究交通流與事故之間的關系,選取濟樂高速南延段作為研究對象,該路段的道路設計為雙向四車道,最高速度不超過100 km/h,將道路每1 km視為一個路段,共50個樣本路段。
2.2 自變量選取
選擇交通流數據作為模型的自變量,研究各路段中固定檢測器所采集的數據,統計為表1。
3 負二項事故預測模型建立
由于交通流參數的不同,路段的事故期望值可看作交通流參數的函數,表達式為:
4 模型結果分析
通過對濟樂高速南延段事故數據和交通流數據的分析,選用SPSS17.0對多個數據進行回歸擬合,顯著性水平設為0.05,采用逐步回歸的方法,參數估計結果見表2和表3。
從表中彈性系數一列看各個因素的值,3個參數的彈性值均大于0,說明與交通事故發生次數是呈正相關的,其中路段平均占有率彈性系數值最大,說明對事故發生次數影響最大。
濟樂高速南延段交通事故期望值為:
其中:為年平均日交通量;為路段平均占有率;為大中型車占比。
將2019年該路段的交通流數據,代入上述所標定的模型,所得相對誤差為7.6%,證明所建立的事故預測模型具有較高的精度。
5 結語
論文根據歷史事故數據的分布規律,對多個影響因素進行量化,建立負二項回歸模型,研究各因素對交通事故的影響程度,使得預測結果更為準確。
參考文獻:
[1]陳長坤,武艷,辛夢陽,等.基于廣義線性模型的干線公路交通事故預測[J].公路與汽運,2015(06):56-59.
[2]童偉,楊凡.基于SVR的成都市交通事故態勢分析[J].農家參謀,2018(12):287.
[3]王小凡,朱永強.基于灰色BP神經網絡模型的道路交通事故預測[J].白城師范學院學報,2019,33(06):36-40+51.