檀亞寧 劉宏玉 金澤明


摘 要 隨著車聯網技術的發展,車輛行駛的許多指標監測更為精確,因此產生的行車數據也日益增多,交通運輸大數據時代也已經來臨。如何利用數據挖掘技術判別行車安全狀況成為當前運輸行業研究的熱點問題。本文對所給數據進行數據預處理操作,結合數據得出行車里程、平均行車速度、急加速和急減速情況,其次進一步挖掘每輛運輸車輛的不良駕駛行為得到的不良駕駛行為數據,利用邏輯回歸模型求解出每類不良駕駛行為影響因素對應的權值并且利用灰色關聯分析評價每輛車對應的安全狀況,建立了基于邏輯回歸模型和灰色關聯分析的行車安全評價模型。
關鍵詞 數據挖掘;行車安全;KNN:邏輯回歸模型;灰色關聯;評價模型
引言
隨著我國經濟高速增長,道路運輸行業持續發展,車聯網技術的大規模應用,對應產生的行車狀況數據呈大幅增長趨勢。利用邏輯回歸模型計算出各個影響因素的權值并將計算得到的權值結合灰色關聯分析法構建行車安全評價模型。行車安全評價模型可以有效的評價車輛在行駛過程中的安全狀況
1 數據預處理
①去除異常值,在給出的數據出現了部分的異常值,主要包括速度突變過大、經緯度數據異常和轉向不合理,本文將類似異常值都進行了刪除,保證行車數據的合理性。
②填補缺失值,對于數據中部分車輛出現數據缺失的情況,本文根據數據集中記錄的取值分布情況采用KNN預測缺失值方法對缺失值進行填補。
2 行車數據分析與提取
通過所給數據,本文挖掘每輛運輸車輛的不良駕駛行為,主要包括疲勞駕駛、急加速、急減速、怠速預熱、超長怠速、熄火滑行、超速、急變道等。
3 安全評價模型
3.1 邏輯回歸模型
本文采用客觀權重邏輯回歸模型[1]來確定影響因素的權重系數。不良駕駛行為對于安全評價模型的影響有怠速情況、疲勞駕駛、加速度突變、超速、急變道這五種指標。
經過選取測評指標、指標正向化處理、指標歸一化處理,利用梯度上升法[2],對處理過后的指標變量的計算,可以得到在導致不良駕駛行為的因素中,疲勞駕駛占比最大,達到0.27,駕駛者的怠速情況占比相對較小,只有0.13,其他影響因素的權重情況如下表1所示。
3.2 邏輯回歸模型和灰色關聯分析的行車安全評價模型
經過選取最優值[3]、確定特征矩陣、數據無量綱化、求差值序列、計算關聯系數[4]、求解關聯度等步驟。我們對導致不良駕駛行為的影響因素進行等權關聯計算和加權關聯計算[5]得到部分車輛的相關結果如下表2所示。
根據上表,我們劃分安全等級,為安全性高,不易發生交通事故,為安全性中等,可能會發生交通事故,為安全性低,極易發生交通事故。得到測評對象4車在安全行駛,可以繼續安全行駛,測評對象2車極易發生交通事故,需要立即靠邊停車調整行駛狀態,疲勞駕駛應進行休息,超速行駛應按照規定速度行駛等等。1、3、5車安全性中等,但是其駕駛者同樣也要提高警惕,以防交通事故的發生。
4 總結
從評價結果來看,大部分的車輛駕駛者的交通安全意識處于一般或低水平,因此在平常駕駛中有一定的發生交通事故的風險。大部分駕駛員在駕車過程中總存在不同程度的駕駛失當及危險行為。針對這一現象,本文建議在駕駛證的考取上應該嚴格把關,交通管理部門應加強對車輛駕駛者安全意識的培養以提高其駕駛安全程度,加強對交通運輸的管理,積極宣傳安全駕駛規范,嚴格執行交通法規,降低交通事故的發生率。
參考文獻
[1] 王進,郭靖,王衛東,方理剛.權重線性組合與邏輯回歸模型在滑坡易發性區劃中的應用與比較[J].中南大學學報(自然科學版),2012,43(5):1932-1939.
[2] 熊笑.基于梯度上升決策回歸樹的網約出租車需求動態預測[D].華中科技大學,2017.-09-23.
[3] Sy Han Chiou,Rebecca A.Betensky,Raji Balasubramanian. The missing indicator approach for censored covariates subject to limit of detection in logistic regression models[J]. Annals of Epidemiology,2019.
[4] 馬萍.灰色系統GM(1,1)模型的改進及灰色統計模型研究[D].吉林大學,2007.
[5] 史青春,王平心.基于合作博弈的供應鏈伙伴績效灰色綜合評價方法[J].軟科學,2010,24(1):56-59.