李月明,鄭貴省,車亞輝,王 鵬
(1.軍事交通學院 研究生管理大隊,天津300161; 2.軍事交通學院 基礎部,天津300161)
?
● 基礎科學與技術Basic Science & Technology
基于譜系聚類的公路運輸駕駛行為研究
李月明1,鄭貴省2,車亞輝1,王鵬1
(1.軍事交通學院 研究生管理大隊,天津300161; 2.軍事交通學院 基礎部,天津300161)
為規范駕駛行為、提高公路運輸安全水平,對公路運輸事故中車輛的駕駛行為及其誘因之間的關系進行研究。基于譜系聚類法并結合相關數學軟件對駕駛行為進行聚類分析,并以2010—2012年道路交通事故統計數據為例進行實例驗證,對引起交通事故的駕駛行為給出聚類圖譜。研究結果表明:各種不規范的駕駛行為是引起交通事故的重要原因,通過聚類分析能夠對引發交通事故的不規范駕駛行為進行識別,為規范駕駛行為提供重要依據。
譜系聚類;公路運輸;駕駛行為
隨著經濟的發展,公路運輸作為重要的運輸方式不可避免地承擔著越來越多的運輸任務,與此同時,公路運輸中交通事故也在不斷發生。據有關數據顯示,全球每年因公路交通事故都會使超過120萬的人失去生命,經濟損失數目巨大[1]。
國外關于公路運輸事故的數據分析中,由人為因素引發的公路運輸事故占了全部交通事故的80%~90%,國內有關數據分析中,在公路運輸事故中92.9%的事故都是人為因素引發的[2]。很明顯,在公路運輸“人—車—貨物及環境”系統中,車輛駕駛員的駕駛行為是導致公路運輸交通事故的重要因素。本文利用譜系聚類法對公路運輸中的駕駛行為進行研究,對引發交通事故的駕駛行為進行分析,為駕駛行為識別和駕駛員行車習慣分析提供支持,從而為公路運輸安全提供重要保證。
聚類分析是一種基于統計學對未知類屬樣品進行區分和歸類的一種手段方法。對所獲得樣品對象的程度大小進行評估,最終將某種特征相同或者比較接近的樣品對象看作一類,反之看作不同類。聚類分析的結果具有很多研究價值,比如提供實驗猜測的依據,判別獲得新數據的類屬等應用[3]。
聚類分析根據分類對象的不同,即對樣品的分類還是對變量的分類,可以分為Q型分析(前者)和R型分析(后者)。Q型聚類常常把樣品的相似度以距離的形式來度量,這種聚類分析方法的特點:對樣品的特征進行不同維數的數據采集處理和分析;清晰地呈現出分類結果,分類結果能夠通過聚類譜系圖把初始數據用圖樣表示出來;通過比較可知該聚類分析方式的分類結果具有合理性和全面性。
譜系聚類法在眾多的聚類方法中是一種非常有效的分類方法。譜系聚類法通過對各個樣品間相似程度的度量用距離進行統計學數字化,把距離相同或者距離最小的樣品聚成一個小類;通過類間距離的計算進行類間相似度的評估,把小類聚合成較大的類,最后將所有樣品聚合成一個大類,形成一個各類相似度不斷減小,類間距離不斷增大的譜系圖[4]。
公路運輸中的大部分交通事故都與不規范的駕駛行為有關,比如加塞、變道超車、超速、遇障礙急剎車等駕駛行為[5]。不規范的駕駛行為是造成公路運輸中交通事故的重要原因,通過不規范駕駛行為對以往交通事故引發因素的數據進行聚類分析,找出與外部影響因素的關系,對改善交通安全狀況,提高公路運輸效率有著極其重要的研究價值和經濟效益[6]。
2.1駕駛行為類間距離定義
本文對引發公路運輸交通事故的不規范駕駛行為進行聚類分析,聚類的各駕駛行為作為不同樣品,所以此處關于樣品的譜系聚類法依據Q型聚類方式討論。Q型聚類方式是通過對類間距離的大小評估類間相似程度大小進行劃分類別。

類間距離的大小會根據不同的類間距離定義而產生不同的計算結果,類間距離的定義有下面幾種。

圖1 最長、最短距離示意
(3)類平均距離:通過計算類間所有樣品之間距離的平均值作為兩類之間的距離。
類平均距離還可以描述為:通過類間所有樣品之間的平方距離的平均記為兩類之間的距離。
(4)重心距離:用兩類重心之間的距離作為兩類距離。
(5)離差平方和距離:由Ward依據方差分析的思想提出來的。
在聚類樣品時依據需要選擇不同距離定義進行聚類或者選擇不同距離定義比較聚類結果。
2.2駕駛行為譜系聚類法步驟
(1)確定要用的距離定義,包括樣品距離和類間距離。此處以d(xi,xj)表示樣品i與j間的距離,記為dij。類間距離按照上述幾種距離定義選擇,此處選擇最小距離定義來計算類間距離。
(2)聚類樣品開始時有n個樣品就當作n個類,然后對n個類相互之間的距離進行計算,得出一個行向量,通過三角化得到一個對稱矩陣。
此時,Dpq=dpq。
(3)選擇找出D(0)非對角線上的數據最小的元素Dpq。這時Gp={xp},Gq={xq}。將Gp、Gq合在一起組成一個類Gr={Gp,Gq}。這時類個數就減少了一個變成了n-1個,所以得到新的矩陣距離D(1),這個新的矩陣是n-1階方陣。
(4)從D(1)新矩陣經歷步驟(3)的過程,得到下一個新矩陣D(2)。再由D(2)重復上述步驟,最后n個樣品聚為一個大類的時候停止。
(5)在上述類別聚合的過程中,對被聚合的樣品號碼和聚合時候的相似程度要給以記錄,并把聚合過程的聚類譜系圖繪制出來。
根據《中華人民共和國道路交通事故統計年報(2010—2012)》,引發事故發生的因素主要有視野、行車道路環境、車身性能和其他的原因,不規范駕駛行為誘發事故的因素統計見表1[7]。

表1 不規范駕駛行為誘發事故因素統計表 次
下面進行譜系聚類的Matlab實現,利用最短距離法將其分為3類。
(1)在Matlab中依據樣品類型輸入數據矩陣,每一種駕駛行為看作一個樣品,作為數據矩陣的行向量,事故的各種誘因作為樣品的樣本特征看作數據矩陣的列向量輸入。
(2)利用軟件函數(d=pdist(A),A為數據矩陣)進行計算各樣品之間的距離d。此處d為每兩行之間距離的一個行向量。
(3)利用軟件函數(z=linkage(d),求得z為類間最小距離)進行不同類間距離計算并進行聚類,行表示類。最后將得到的距離矩陣利用命令tril(squareform(z))進行處理,最終得到一個三角矩陣D。
(4)將上述矩陣利用SAS進行譜系聚類處理,按最短距離法聚為3類,得到譜系聚類如圖2所示。

圖2 將各類駕駛行為聚為3類的譜系聚類

通過譜系聚類圖可以看出:超速行為u1自成一類;操作失誤u2、超載行為u3分為一類;其他7項分為一類。結合初始數據表可以看出,在實際的車輛安全事故中,超速行駛是最容易引發事故的現象,因此超速行為被單獨聚類成一個大類是符合現實的。
此外,操作失誤和超載行為被聚成一個大類,結合聚類圖譜和初始數據容易看出,道路環境的復雜變化性是操作失誤和超載行為引發事故的非常突出的因素。實際公路運輸中,由于超載會使車輛的正常駕駛模式失效,在道路環境發生變化時不能及時避免事故發生,從而造成車禍;在復雜多變的道路環境中,駕駛員也很容易發生操作失誤行為,從而引發交通安全事故。道路環境因素是引發超載和操作失誤行為類事故的突出因素,因此數據聚類的結果是符合實際意義的。現實中經常發生車輛因超載、超員而產生的公路運輸交通事故,在高速公路以及城市交通中一個錯誤的操作就可能帶來嚴重的交通安全事故,因此超速行為和操作錯誤行為聚成的大類圖譜結果和現實情況也是非常符合的。
其他7類現象的樣品特征相似度比較高,所以其他7類駕駛行為就聚合成了一個大類。結合圖譜和初始數據很容易發現圖譜和初始數據是一致的,這幾類不規范駕駛行為造成公路運輸安全事故的因素是多種因素綜合影響的結果,單一因素雖然相比較于前面兩個大類的駕駛行為的危險程度相對小一點,但是每一個引發事故的因素都不可忽視。
本文依據影響駕駛行為的因素,將引發交通事故的不規范駕駛行為進行譜系聚類法分析,相似度接近的行為聚合為一類,聚類結果的圖譜和現實背景具有一致性。通過成功應用譜系聚類法分析引發事故的不規范行為,說明聚類法在公路運輸安全領域是可以用來分析事故原因以及公路運輸安全影響潛在因素的威脅程度,由此可以對駕駛行為進行規范,對駕駛行為進行預判以及實時駕駛機動模式的判別等。
[1]張興儉.基于駕駛行為個體特征的酒后駕駛狀態識別方法研究[D].北京:北京工業大學,2014.
[2]肖獻強.基于信息融合的駕駛行為識別關鍵技術研究[D].合肥:合肥工業大學,2011.
[3]楊淑瑩,張樺.模式識別與智能計算—MATLAB技術實現[M].北京:電子工業出版社,2015:16.
[4]范金城,梅長林.數據分析[M].2版.北京:科學出版社,2010:198-202.
[5]成波,徐少兵,王文軍,等.激進駕駛狀態識別算法研究[J].汽車工程,2014,36(7):784-789.
[6]牛增良,李海斌,王文峰,等.基于聚類分析的營運駕駛人危險駕駛行為研究[J].山東交通學院學報,2014,22(1):19-23.
[7]公安部交通管理局.中華人民共和國道路交通事故統計年報(2010—2012)[R].北京:公安部交通管理局,2012.
(編輯:史海英)
Road Transportation Driving Behavior Based on Pedigree Cluster
LI Yueming1, ZHENG Guixing2, CHE Yahui1, WANG Peng1
(1.Postgarduate Training Brigade, Military Transportation University, Tianjin 300161, China;2.General Courses Department, Military Transportation University, Tianjin 300161, China)
To regularize driving behavior and improve road transportation safety, the paper studies the relation between driving behavior in road transportation accidents and its causes. It analyzes driving behavior with related mathematical software based on pedigree cluster and verifies it with 2010—2012 road traffic accident statistics as the example, and provides cluster map on driving behaviors caused traffic accidents. The result shows that irregular driving behaviors are the important causes for traffic accidents. Cluster analysis can identify irregular driving behaviors causing traffic accidents, which can provide important basis for regulating driving behaviors.
pedigree cluster; road transportation; driving behavior
2016-03-20;
2016-04-24.
李月明(1990—),男,碩士研究生;
鄭貴省(1975—),男,教授,碩士研究生導師.
10.16807/j.cnki.12-1372/e.2016.10.022
U471.1
A
1674-2192(2016)10- 0092- 04