酈紅藝
(揚州大學,江蘇 揚州 225000)
隨著我國城市化速度的加快及城市基礎設施的完備,一線大城市人口密度進一步加大,城市公交車作為低價、便捷的出行方式之一,成為大多數市民首選的出行工具。但是鑒于城市公交車承載量大、運行時間長等特點,也存在較多的安全問題。從2010—2023 年間,人們對于道路交通事故的重視程度提升,交通安全意識也增強了,使得由于道路交通事故所導致的人員傷亡也在逐漸下降,但是在人類因事故死亡的類型中,交通事故仍然排在前十。頻發的城市公共交通運行事故不僅直接威脅著人民的生命安全,更嚴重制約著我國社會經濟的發展。國家發布的《交通強國建設綱要》中也明確指出交通安全保障實現完善可靠、反應迅速的發展目標,加強交通安全綜合治理,切實提高交通安全水平。
城市交通事故空間分析方法的研究主要是從宏觀區域層面建立交通事故及其影響因素之間的聯系。有學者從宏觀角度分析不同規劃水平的區域影響因素與交通安全水平之間的關系,其劃分的空間分析單元主要包括 州(State)[1]、郡/ 縣(County)[2]、行 政 區 劃[3]、人口普查區(Census ward)[4]、郵政編碼區(Zip Code Tabulation Area, ZCTA)[5]、地理柵格[6]、交通分析小區(Traffic Analysis Zone, TAZ)[7]等。王雪松等[8-9]利用美國佛羅里達州Orange 縣的交通安全數據庫分析交通小區的路網形態結構,通過分析交通小區事故與影響因素之間的特征,基于事故與因素的關系建立貝葉斯自回歸模型,并據此挖掘了交通小區層面的影響因素及其對交通事故的影響作用。黃合來等[10-11]利用美國佛羅里達州某縣的數據建立交通小區,分析城市路網交通事故的特征,基于交通小區的路網特征數據、人流出行數據等,建立了基于空間自相關的貝葉斯模型,以此評價不同分區尺度對城市道路交通安全的影響。
該文基于公交運行報警數據分析其在空間上的特征,首先利用斯皮爾曼相關系數法計算公交運行報警數據的線性關系;然后采用核密度估計與全局莫蘭指數探究公交運行報警數據的空間相關性,為之后辨識公交風險位置提供了堅實的基礎。
該文數據來自鎮江市公交集團,通過汽車行駛記錄儀、智能駕駛輔助終端、駕駛員狀態監測(DSM)攝像機、高級駕駛輔助系統(ADAS)攝像機、主動安全報警系統、汽車行駛記錄儀攝像頭等公交車載報警檢測設備,采集鎮江市2022 年11 月的公交運行報警數據。
對于報警發生的類型主要可分為兩大類:第一類為公交駕駛員的異常駕駛行為包括打呵欠報警、打手機報警、抽煙報警、左顧右盼報警、疲勞駕駛報警等。第二類為公交車輛的異常駕駛狀態包括車道偏離報警、前向碰撞報警、急加速報警、急減速報警、遮擋報警等。公交運行報警數據發生的類型見表1。

表1 公交運行報警數據類型
打呵欠報警、打手機報警、抽煙報警、左顧右盼報警、疲勞駕駛報警數據代表駕駛員有規定駕駛行為之外的影響公交運行安全的行為,可能引發公交運行風險;車道偏離報警、前向碰撞報警、遮擋報警、急加速報警、急減速報警數據代表車輛沒有平穩運行或出現遮擋攝像頭現象,可能會與其他車輛發生碰撞,引發危險。由于打呵欠和抽煙報警次數在樣本中很少,因此下文分析將不再提及。
“空間”一詞,源自地理科學、區域科學,通常可以理解為地理現象在空間上呈現的區域分布狀態,空間自相關與相關性分析是數據重要的兩個性質。空間自相關與相關性分析主要研究數據之間是否存在高度線性關系,為了探究公交運營報警數據在空間上的特征分布,應對公交運營報警數據進行空間自相關與相關性檢驗。
公交運行報警數據的相關性檢驗主要是分析不同類型報警數據之間的相關性,常見的方法包括:Pearson(皮爾遜),Kendall(肯德爾)和Spearman(斯伯曼/斯皮爾曼)。三種相關分析方法中Pearson 相關系數最為常用,如式(1)所示:
但利用Pearson 相關系數進行計算時,首先需要驗證數據是否滿足正態分布,而Spearman 相關系數就不用滿足此前提條件。因此該文利用適用范圍更廣的Spearman相關系數來分析公交運行報警數據之間的相關性。
該文利用核密度估計、莫蘭指數分析了公交運行報警數據的空間自相關性。
核密度估計方法(KDE)屬于非參數檢驗方法中最常用的技術方法之一,普遍用于估計一個未知的概率密度函數,是對直方圖的一個自然拓展,改善了直方圖存在的不連續問題,核密度估計的分析精度更高。該方法在日常運用中具有以下特點:適用性強,靈活性好。核密度估計方法不受數據的限制,不需要事先假設數據的概率分布模式。取而代之的是通過獲取數據本身的特征來處理任意概率分布,從而具有很強的適用性和靈活性。
核密度估計方法最初是為了估計平滑的經驗概率函數而設計的。目前在GIS 領域,該方法是一種常用的空間分析技術之一,主要實現將地理上分布的點狀數據轉換為平滑的密度表面的功能。其基本思想是把每一個發生的事件看作一個核心要素點,根據一定范圍內點與其之間的距離計算該點的密度值,然后生成一個平滑曲面。根據地理學第一定律,距離中心點越近,密度值越大,反之則越小。正好落在以中心點為原點、以帶寬為半徑的圓的邊界上的點,其密度值為零,其基本原理如圖1所示。

圖1 核密度估計原理圖
由于莫蘭指數的計算是以劃分的位置分析區為前提,因此首先利用KNN 最鄰近算法以每個位置分析區的質點為依據計算分析區與分析區之間的空間矩陣,其中距離的選取采用歐式距離,如式(2)所示。
最終計算的空間矩陣如圖2 所示。
利用計算的空間矩陣采用公式(3)計算莫蘭指數,分析公交運行報警數據的空間相關性。
該文利用Spearman 相關系數來分析公交運行報警數據之間的相關性,結果如圖3 所示。

圖3 Spearman 相關系數圖
一般認為,相關系數大于0.7 即代表這兩類數據的相關性較高,通過圖3 發現,打手機報警與打瞌睡、遮擋、左顧右盼報警;左顧右盼報警與打瞌睡、遮擋、打手機報警;車道偏離報警與疲勞駕駛、前向碰撞報警的相關性較高。這在一定程度上說明當發生前一種報警數據之后,后一種報警發生的可能性也很高,比如發生車道偏離與疲勞駕駛的相關性高達0.8,說明司機的狀態對于安全駕駛行為的影響較大。
將公交運行報警數據中不同類型的報警數據進行核密度估計,參數采取自適應帶寬進行處理。由分析結果可知,車輛發生車道偏離報警的熱力區域主要集中在鎮江市中山西路與中山東路附近一帶;駕駛員抽煙報警熱力區域主要分布在以下兩塊:一塊位于長江路、中山西路與九華山路的交界處,另一塊位于左下角的金潤大道上。
總體上,報警分布的熱力區域以市中心范圍的中山東路、中山西路為主,同時還在夢溪路、丁卯橋路、喬家門路等區域分布。
利用公式(4)計算莫蘭指數,分析公交運行報警數據的空間相關性,選取急加速和急減速報警,如圖4~5所示。

圖4 急加速莫蘭指數示意圖

圖5 急減速莫蘭指數示意圖
對莫蘭指數的結果進行整理,如表2 所示。

表2 不同變量的莫蘭指數表
表2 顯示了莫蘭指數檢驗的空間自相關結果,所有報警類型的變量在0.01 以下水平顯著,這意味著駕駛員疲勞駕駛報警、駕駛員抽煙報警、車輛急減速報警、車輛急加速報警、車輛車道偏離報警并不呈現空間自相關。然而駕駛員急減速報警的Z 分值是負的,這表明駕駛員急減速報警的空間分布更集中在某一特定區域。
該文基于對公交運行報警數據的空間特征研究,從公交運行報警相關性分析、空間特征分析兩個角度進行挖掘,分別采用Spearman 相關系數、核密度估計、莫蘭指數進行分析。結果發現,公交運行報警數據之間存在較強的相關性,但是在空間上大部分數據并不呈現空間自相關性,但急減速報警在空間上更呈現空間集聚效應,結合核密度熱力圖可知急減速報警在景區附近居多。
近年來,隨著公共交通的快速發展,公共交通已經成為居民出行的重要交通方式之一,公交汽電車擁有量更是連年上升。但是在公交快速發展的同時,公交運營安全逐漸成為重點。該文以公交運行報警數據為依據,對公交報警數據空間特征進行探究,以期為城市公共交通運行管理提供科學決策,對公交運行風險做到事前精準預防,提高公交日常運行安全。
現有研究對于公交運行安全提出的建議大多從公交運行的角度,以定性分析為主,缺乏以大數據為基礎的定量分析,同時受限于所分析的數據源(大多局限于模擬駕駛實驗數據)一般通過抽樣測試的手段,抽樣駕駛的數據可能與實際駕駛數據存在較大出入,無法準確反映公交實際運行情況,很難有效針對公交車輛與公交駕駛員的實際情況進行合理安全分析。因此,基于公交運行報警數據的公交空間特征研究可以為公交的日常安全運行提供指導,在宏觀上對公交經過的位置風險進行量化辨識,為公交管理者提供決策依據;在微觀上,對公交駕駛員的日常行車安全提供保障。