馬 柱,陳雨人,張蘭芳
(同濟大學 道路與交通工程教育部重點實驗室,上海 200092)
隨著交通量的迅速增長導致交通事故率明顯上升,這給交通安全帶來了不可估量的影響。研究如何降低交通事故的嚴重程度是交通安全研究的重要內容。影響交通事故嚴重程度的因素很多且比較復雜,如何從中篩選出相關性比較大的因素,不僅對降低交通事故的危害程度有重要的意義,而且對道路交通基礎設施規劃設計,運營管理和駕駛行為研究等方面都有很好的指導作用。
近年來,有很多學者分析了交通事故嚴重程度與人的特性、道路條件和交通環境的關系,特別是運用Logistic 回歸模型分析交通事故嚴重程度。比如,Kim,等[1]分別用對數線性模型和Logistic模型分析事故類型與交通事故嚴重程度之間的關系;Ghamdi[2]使用Logistic模型分析了利雅得市事故嚴重程度影響因素,得到了事故嚴重程度與事故位置及事故原因間的關系;Yau,等[3-4]利用Logistic模型分別對單車碰撞和多車碰撞事故的影響因素進行了分析。馬壯林,等[5-6]用Logistic回歸模型分別進行了公路隧道交通事故嚴重程度影響因素分析和公路交通事故嚴重程度時空分析;H.Kirolos,等[7]分別使用了Probit模型、二項Logistic模型和多項Logistic模型對三路無信號交叉口和四路無信號交叉口事故嚴重程度的影響因素進行了分析;S.Kaplan,等[8]采用Logistic模型研究分析了性別、年齡、限速以及駕駛員注意力對公共汽車事故嚴重程度的影響。
綜合以上分析,這些學者對城市道路事故嚴重程度的影響因素分析比較少。在現有研究中,對城市道路事故影響程度研究中考慮的影響因素也比較少。由于城市道路的情況較為復雜,需要考慮更多因素,需要涉及到更多更復雜的自變量,并且需要把它們有效地篩選出來并組織在一起。因此,筆者將城市道路交通事故分為嚴重事故和非嚴重事故后。因變量交通事故嚴重程度就是一個二元分類變量,根據烏魯木齊市2006—2010年的3 505條事故資料,初步選擇13個候選自變量,通過相關性分析,篩選出合適的自變量,建立與城市交通事故嚴重程度之間關系,分析各影響因素對交通事故嚴重程度的影響程度,為降低交通事故嚴重程度提供支持。
Logistic回歸模型, 是國外于20世紀上半葉逐漸發展起來的一類離散選擇模型,其在生物學、經濟學、心理學、政治學和交通運輸等學科中都得到了廣泛的應用[8]。
當對數線性模型中的一個二分類變量被當作因變量并定義為一系列自變量的函數時。對數線性模型就變成了Logistic回歸模型, 如式(1)。

(1)

事件發生概率P與事件不發生概率(1-P)之比稱為事件的發生比(Odds)。將Odds取自然對數就能夠得到線性函數,如式(2):
(2)
Logistic回歸模型檢驗主要包括: 回歸系數的顯著性檢驗、Logistic回歸模型的擬合優度檢驗和Logistic回歸模型的預測準確度檢驗。
1.2.1 回歸系數的顯著性檢驗
由于并不是所有的候選自變量都對因變量有顯著的影響。因此,需要挑選出對因變量有顯著影響的自變量。目前,常用的自變量篩選方法有正向逐步選擇法、反向逐步選擇法和混合逐步選擇法。
1.2.2 擬合優度檢驗
Logistic模型擬合優度檢驗主要有皮爾遜χ2檢驗、偏差(Deviance) 統計量和信息測量指標。
1.2.3 預測準確度檢驗
常用評價指標有Gramma,Somers’D,Tau-a,c。
2.1.1 因變量
城市道路事故數據庫中的事故類型分為死亡事故、受傷事故和財產損失事故3 類。考慮到事故救援在事故類型中的作用。在文中,將事故嚴重程度分為嚴重事故和非嚴重事故。對死亡事故和有重傷的傷亡事故認為是嚴重事故,而輕傷事故和財產損失事故認為是非嚴重事故,編碼如表1。

表1 因變量編碼 Table 1 Description of dependent variable
2.1.2 自變量
道路交通系統是一個由人、車、路、環境構成的動態系統。任何一個環節出現問題都可能產生交通安全問題。在交通事故分析中,因責任認定問題,常將事故原因歸為人的主觀因素,而忽視了客觀因素在交通事故中的作用[6]。因此,筆者從客觀因素中初步選取13個候選自變量參與分析與交通事故的嚴重程度之間的關系,分別為:是否為節假日、天氣、道路橫斷面、能見度、交通信號方式、照明條件、道路類型、道路線形、路口路段類型、道路物理隔離、路側防護設施類型、道路橫斷面和道路橫斷面位置等。其中天氣、能見度、照明條件、道路類型采用啞變量方式。對分類變量進行編碼如表2、表3。表2、表3中“*”表示通過通過混合逐步選擇法得出的對事故嚴重程度具有顯著影響的自變量。

表2 自變量編碼 Table 2 Description of independent variable
表3 分類啞變量編碼
Table 3 Description of dummy variable

2.2.1 變量選擇
混合逐步選擇法是將正向選擇和反向選擇結合起來,根據所設的顯著性標準分別將變量加入到模型中去或刪除掉。筆者采用混合逐步選擇法對自變量進行篩選得出在0.05的顯著性水平下的自變量有:天氣、道路線形、能見度、路側防護、道路橫斷面、地形、橫斷面位置、道路類型。
2.2.2 參數估計
對烏魯木齊市2006—2010年的3 505條事故數據進行分析,得出擬合結果如表4。

表4 方程中的變量 Table 4 Variables in the equation
從表4 可知:
1)在不同的天氣下,陰天發生嚴重事故的概率最大,為惡劣天氣的1.049倍,相差不大,而晴天發生嚴重事故的概率只有惡劣天氣的0.676。說明良好天氣下發生嚴重事故的概率比較低。
2)丘陵和山區發生嚴重事故的概率非常低,只有平原地帶的0.262。
3)分車、分向的道路橫斷面發生嚴重事故的概率反而比混合式橫斷面高,是其的1.564倍。因為的道路橫斷面下,路況比較復雜,駕駛員的安全意識比較高。
4)其他道路上發生嚴重事故是平直道路的2.378倍。說明道路線形對事故的嚴重程度影響非常大。
5)快速路、主干路和次干路上發生嚴重事故的概率相對于其他道路要小很多,分別只有其他道路的0.483,0.377和0.443。這主要是因為這些道路整體車速比較低。
6)機動車道發生嚴重事故的概率是其他位置的1.385倍。在分車道的情況下,機動車間的事故要明顯嚴重很多,這和其他位置的車速較低有很大關系。
7)能見度在50~100 m范圍類時,發生嚴重事故的概率最高,是見度在200 m以上情況下的2.204倍。這和駕駛員的安全意識有很大關系。
8)有路側防護的情況下發生嚴重事故的概率高,是沒有路側防護的1.497倍。
由Logistic回歸系數的顯著性檢驗結果可知:當天氣情況不佳,且能見度在50~100 m時,發生嚴重事故的概率最高。在這種情況下,應該及時通過電視廣播等媒體發布惡劣天氣注意行車安全的警示信息,以提高駕駛員的注意力。而在平原地帶、分車分向式道路橫斷面、城市公路、機動車道位置時發生嚴重事故的概率比較高的原因是這些地方行駛條件較好,平均車速相對較高甚至出現超速違法駕駛行為;對于這些路段有條件應安裝電子警察、雷達測速等設備。平直道路的發生嚴重事故的概率最低,因而在規劃設計階段應該盡量使用平直道路線形,在線形不好的地方設置警示標志。路側防護與事故嚴重程度也有很大的相關性,因而在必須設置路側防護的地方應該考慮到路側防護對事故發生后的影響,在材料和路側防護的類型方面都需要考慮。
2.2.3 模型檢驗
模型整體擬合程度見表5。由LR、Score、Wald統計量值及P值可以看出在0.05的顯著性水平下模型的整體擬合效果比較好,自變量的解釋作用顯著。Deviance統計量和χ2統計量見表6。

表5 模型整體擬合程度參數 Table 5 Model fitness coefficients

表6 擬合優度檢驗 Table 6 Test of goodness-of-fit
從表6可以看出,Deviance 統計量、皮爾遜χ2統計量的P值均大于0.05,所以在顯著性水平A= 0.05 的條件下,χ2檢驗不顯著, 認為模型擬合數據比較好。
表7 是信息測量指標的擬合優度檢驗的結果。從表7可以看出,加上變量的模型較優。

表7 信息測量指標 Table 7 Information measures index
表8是序次相關指標的準確度檢驗結果。從表8 可以看出,本研究有71.3%的數據對為和諧的, 有21.9% 為不和諧的。除了Tau-a指標外, 其余3個指標值都不小于0.5。說明建立的Logistic模型的預測能力較好。
表8 預測準確度檢驗
Table 8 Test of forecasting accuracy

1)交通事故的發生是人-車-路-環境相互作用的結果,但主觀因素很大程度上受到了客觀因素的影響。將事故嚴重程度分成嚴重事故和非嚴重事故,在客觀因素方面選取了是否為節假日、天氣、道路橫斷面、能見度、交通信號方式、照明條件、道路類型、道路線形、路口路段類型、道路物理隔離、路側防護設施類型、道路橫斷面和道路橫斷面位置13個自變量,分析自變量與因變量之間的關系。Logistic模型在處理二分類變量與其他變量之間的關系上具有很大的優勢。
2)采用混合逐步選擇法分析候選自變量與因變量是否顯著相關。研究發現,天氣、道路線形、能見度、路側防護、道路橫斷面、地形、橫斷面位置、道路類型與事故嚴重程度顯著相關,而是否為節假日,交通信號方式、路口路段類型、道路物理隔離與事故嚴重程度的相關性不大。
3)采用Logistic回歸模型,分析各自變量與事故嚴重程度的影響程度并對模型進行了檢驗。結果表明,Logistic 回歸模型的擬合效果和預測能力還是比較好的。
4) Logistic回歸模型結果表明,在不同的天氣下,晴天發生嚴重事故的概率明顯小很多,同樣,能見度在200 m以上發生嚴重事故的概率最低,說明事故的嚴重程度與視線有很大的關系,視線越好,發生嚴重事故的概率越低。丘陵和山區發生嚴重事故的概率非常低,分車、分向的道路橫斷面發生嚴重事故的概率反而比混合式橫斷面高,表明在駕駛條件差的地方,發生嚴重事故的可能性反而比較低,說明這些地方駕駛員的安全意識起了主導作用。平直道路發生嚴重事故的概率比較低。而其他道路發生嚴重事故的概率明顯比城市快速路、主次干路高。同樣,機動車道發生嚴重事故的概率最高,有路側防護的情況下發生嚴重事故的概率最高。研究分析結果可以為道路交通基礎設施規劃設計,運營管理和駕駛行為研究以及事故救援等提供很好的指導作用,并為提高城市道路交通系統安全性能提供決策依據。
5)筆者假設自變量對因變量是線性的、可加的,但是,很有可能存在非線性和非加性作用。鑒于調研條件所限,沒有將車速、交通流量等引入自變量,這是今后需要研究的重要方向之一。
[1] Kim K,Nitz L,Richardson J,et al.Analyzing the relationship between crash types and injury severity in motor vehicle collisions in Hawaii [J].Transportation Research Record, 1994,1467:9-13.
[2] Al-Ghamdi A S.Using logistic regression to estimate the influence of accident factors on accident severity [J].Accident Analysis & Prevention,2002,34(6):729-741.
[3] Kelvin K W Y.Risk factors affecting the severity of single vehicle traffic accidents in Hong Kong [J].Accident Analysis and Prevention.2004,36 (3):333-340.
[4] Kelvin K W Y,Lo H P,Sherrice H H F.Multiple-vehicle traffic accidents in Hong Kong [J].Accident Analysis and Prevention,2006,38(6):1157-1161.
[5] 馬壯林,邵春福,李霞.基于Logistic模型的公路隧道交通事故嚴重程度的影響因素[J].吉林大學學報:工學版,2010,40(2):423-426.Ma Zhuanglin,Shao Chunfu,Li Xia.Analysis of factors affecting accident severity in highway tunnels based on logistic model [J].Journal of Jilin University: Engineering and Technology,2010, 40(2):423-426.
[6] 馬壯林,邵春福.基于累積Logistic模型的交通事故嚴重程度時空分析[J].中國安全科學學報,2011,21(9):94-99.Ma Zhuanglin,Shao Chunfu.Temporal-spatial analysis model of traffic accident severity based on cumulative Logistic model [J].China Safety Science Journal,2011,21(9):94-99. [7] Kirolos H,Abdel-Aty M.Examining traffic crash injury severity at un-signalized intersections [J].Journal of Safety Research,2010,41(4):347-357.
[8] Kaplan S,Prato C G.Risk factors associated with bus accident severity in the United States:A generalized ordered logit model [J].Journal of Safety Research,2012,43:171-180.
[9] 王濟川,郭志剛.Logistic 回歸模型—方法與應用[M].北京:高等教育出版社,2001.Wang Jichuan,Guo Zhigang.Logistic Regression Model-Methods and Applications [M].Beijing:Higher Education Press,2001.