馬庚華, 鄭長江, 鄧評心, 李 銳
(1.河海大學(xué)港口海岸與近海工程學(xué)院, 江蘇 南京 210098; 2.河海大學(xué)土木與交通學(xué)院, 江蘇 南京 210098)
交通事故是全球所有國家面臨的共同難題[1]。在我國,隨著社會經(jīng)濟的不斷發(fā)展,居民機動車保有量連年上升,城市交通面臨前所未有的巨大壓力。2016年,我國共接報道路交通事故864.3萬起,同比增加65.9萬起,上升16.5%。其中涉及人員傷亡的道路交通事故212 846起,造成63 093人死亡、226 430人受傷,直接財產(chǎn)損失12.1億元[2]。利用交通大數(shù)據(jù)分析事故成因,采取針對措施減少交通事故是保障道路安全的有效手段。
關(guān)聯(lián)規(guī)則挖掘是一種有效的數(shù)據(jù)挖掘方法,它可以從海量的數(shù)據(jù)中發(fā)現(xiàn)不同類型數(shù)據(jù)之間的關(guān)聯(lián)[3]。針對數(shù)量巨大的交通事故數(shù)據(jù),關(guān)聯(lián)規(guī)則挖掘可以得出事故原因(如駕駛員、車輛、道路、環(huán)境)與事故結(jié)果(如事故類型、嚴(yán)重程度)之間的關(guān)系,從而給交通決策者提供參考。國內(nèi)外學(xué)者對交通事故成因分析的方法有很多,如貝葉斯網(wǎng)絡(luò)[4]、決策樹[5]、FP-Growth[6]、Apriori算法[7-10]等。他們對關(guān)聯(lián)規(guī)則的篩選都是使用“支持度-置信度”框架,規(guī)則評選標(biāo)準(zhǔn)單一,模式評估度量數(shù)量不足,難以找出更加合理且易于應(yīng)用的關(guān)聯(lián)規(guī)則。
本文在以上研究的基礎(chǔ)上,采用改進的Apriori算法對交通事故數(shù)據(jù)進行關(guān)聯(lián)規(guī)則挖掘,并結(jié)合支持度、Kulc、平衡比3個模式評估度量[11],引入相關(guān)值,進一步篩選出有價值的關(guān)聯(lián)規(guī)則,得出相應(yīng)結(jié)論,為交通管理部門提供參考。
本文研究所使用的數(shù)據(jù)為某市2015年全年的交通事故數(shù)據(jù)與天氣數(shù)據(jù)?!?br>