李婷婷
(河北省石家莊鐵道大學,河北 石家莊 050043)
結合K-means聚類和決策樹模型,對車輛行駛數據進行分析,建立一個駕駛員駕駛狀態模型。根據司機駕駛過程中產生的各種數據,結合不同的環境情況進行分析,可以判別當前車輛的駕駛狀態。
近年來交通事故越來越多,給人生安全造成極大威脅,很大程度上制約了經濟發展和社會進步。導致事故發生的因素來自方方面面,司機不正確的駕駛操作、異常監測設備的落后等。對于司機的駕駛狀態分析,目前還有所不足。例如車載監測設備可以發現司機疑似疲勞駕駛的行為,但還不能夠分析司機是否存在超長怠速、急變道等不當操作。
建立模型對司機的駕駛狀態進行分析,有利于對其不良行為監測并及時提醒,從而在源頭上減小交通事故的風險。
結合采集的行車軌跡,包括車牌號、設備號、方向角度、經緯度、點火狀態、轉向燈狀態、手剎腳剎以及采集時間等信息進行分析。
根據車輛在一段運輸路線上的數據進行聚類分析,區別安全行為和不良駕駛行為。對于找出的不良駕駛行為,利用隨機森林對其進行類別分析,其中所有不良駕駛行為分為狀態類和閾值類,閾值類包括急加、急減速、超速、急變道等,其特點在于當速度、加速度或者方向變化等達到一定閾值,便認為駕駛員存在不良駕駛行為;其余為狀態類,對于怠速預熱、超長怠速、熄火滑行等根據各項指標達到指定要求則判斷為不良駕駛行為。
選取某輛車的某條線路作為研究數據輸入,分析其速度-加速度散點圖可知,除了有少量突變性較高的數據外,速度-加速度點主要集中在低加速區域,而且隨著速度增加,高加速點在逐漸地減少;速度-加速度點聚集性較強,采取K-means聚類進行安全駕駛行為和異常駕駛行為的區分。
決策樹模型可以根據多組判斷條件的設置,形成一系列的分支,從而將輸入數據分成不同輸出結果。對于判斷條件的順序需要結合不同類別的差異性設置,將具有明顯差異的區分條件放在前面的順序;對于差別不大的判斷條件可以進行微調。
選擇C4.5算法作為屬性選擇度量算法,使其能夠完成對連續屬性的離散化處理并對不完整數據進行處理。
根據預處理后所選取的4種主要屬性集:{速度,加速度,點火狀態,方向改變值,駕駛時間}和最終分類結果集{急加,急減,怠速預熱,超長怠速,熄火滑行,超速}。
構造樹型時,需結合信息增益比,選取比值大的因素作為根節點,逐層遞進,對于比值差異不大的因素可以進行微調。
將這些異常駕駛行為分為閾值類和狀態類2大類。
狀態類如下:
①怠速預熱:分類依據為車輛是否處于點火狀態為開啟且速度為0的駕駛情況。
②超長怠速:分類依據為車輛點火狀態開啟且速度為0的狀態是否持續20分鐘以上。
③熄火滑行:分類依據為車輛是 否處于點火狀態為0且速度不為0的駕駛情況。
閾值類如下:
④急加速和急減速:分類依據為車輛加速度的絕對值是否超過問題一所述閾值。
⑤超速:分類依據為車輛瞬時速度是否超過所行使路況的規定車速。
⑥急變道:分類依據為車輛方向角變化幅度是否大于某一閾值且小于90度,即是否出現短時間方向突變情況。
數據預處理中,對于一輛車的不同路段采用時間間隔進行分段,閾值設置5min,10min,30min,60min分別分析,最后選擇60min作為路段閾值,避免了等紅燈、司機休息等其他情況對路段分割造成影響。
對于不同類別的不良駕駛行為,按照特點分為狀態類和閾值類,其中急加速和急減速、超速、急變道屬于閾值類,表現在于當某一指標或者其變化超過特定閾值時,便是某種類別的不良駕駛行為;對于其他的狀態類,則通過狀態轉移方程描述狀態變化情況,當狀態趨于平穩,則考慮是否出現某些不良駕駛行為,效果較為靈敏。
隨著數據分析與智能化的發展,對于駕駛行為發面的分析、評價和預測還有待進一步的完善。在真實場景下,算法的應用除了要求其準確率之外,還需要考慮適用性與易用性,這樣才能更加有助于算法與工業界的結合。