趙 丹,王景升*,周 妍,劉 東,邢立利
(1.中國人民公安大學治安與交通管理學院,北京102163;2.浙江警察學院交通管理系,杭州310053;3.浙江省寧波市交通警察局,浙江寧波315100)
2020年初爆發的新冠疫情對我國城市交通運行產生較大影響.疫情影響下,出行者個體交通方式選擇和通勤交通結構發生變化[1],私人交通與公共交通分擔率呈現“一升一降”的趨勢[2-3].探討城市出行結構變化后的交通安全特征,研究疫情對交通安全特征影響的量化分析方法,有助于掌握疫情下交通安全隨政策推進而產生的時間變化規律,評估新冠疫情對城市交通的影響.
目前,很多文獻對疫情期間的公共交通組織[2]、交通管制[4],以及病毒通過交通系統傳播擴散機理和傳染病防疫策略[5-6]等進行研究,針對疫情對城市交通安全影響的研究較少.城市核心區是城市交通需求的“集散地”,大量的通勤交通使其成為反映疫情停工停產、復工復產政策對交通影響的“晴雨表”,探討疫情影響下非正常交通需求引發的交通安全特性變化有重要意義.本文提出運用機器學習算法和干預模型量化新冠疫情政策對交通事故量影響程度的方法,以浙江省寧波市核心區(東部新城)的交通事故接處警數據,評估新冠疫情對交通安全產生的直接影響.
東部新城是寧波市行政與商貿中心所在地,面積12 km2,道路總里程68.4 km.2018年該區域發生路內交通事故8 828起,2019年發生8 776起,平均每日發生事故約24起.本文收集該區域2019年1月1日~2020年5月24日的交通事故接處警數據,得到511 d 交通事故數量,形成時間序列數據.統計2019年的交通事故數量,一是為樣本量擴容,二是為濾除節假日、休息日等因素影響,區分由于疫情引起的事故量突變.交通事故量時間序列描述性統計如表1所示.

表1 交通事故量時間序列描述性統計Table 1 Descriptive statistics of traffic accidents sequence
據寧波市衛健委統計,2020年1月21日發現首起新冠肺炎病例,2020年2月20日達到最大感染人數157 例,后續無新增病例.根據文獻[7]對疫情階段的區分方法,結合寧波市各項重要政策出臺的時間節點,劃分疫情階段如表2所示.疫情爆發初期,對出行密集度高的地區盡早預警;疫情快速傳播時期,執行嚴格社區管控、停工停學、封閉進出城通道和交通禁行等措施,進行交通阻斷;疫情持續傳播期,疫情增速放緩,城市運行開始啟動,交通秩序逐漸恢復階段,仍需限制不必要的交通需求,進行交通管控;疫情恢復期,居民出行和社會活動大幅增加,公共交通正常運營,仍需警惕疫情反復的風險,視為交通需求疏解期.

表2 2020年寧波市新冠疫情防控重要政策Table 2 Main events during COVID-19 epidemic period in Ningbo,2020
以周為單位統計疫情期間交通事故數量.統計期內,除疫情因素外,節假日也是影響交通事故數量的顯著因素,日期與節假日對應關系如表3所示,統計期內2年的交通事故分布情況如圖1所示.

表3 日期與節假日對應關系Table 3 Relationship between date and calendar day

圖1 2019 與2020年1~5月交通事故量同期對比Fig.1 Comparison of number of traffic accidents from January to May in 2019 and 2020
由圖1可知:
(1)受疫情影響,2020年周交通事故量在交通阻斷期和管控期出現低谷,1月27日起連續3周低于20起,最低值為7起;2019年周事故量最低值出現在春節休假期間,發生事故27起,隨后事故數量快速上升至與春節前同一水平,每周約100 起.對比可知,剔除春節假期因素,交通阻斷和管控措施使交通事故發生率下降約3/4.
(2)隨著復工復產政策出臺,交通事故數在2020年2月中旬管控期開始后,以每周翻1倍的速度增長,最終在3月上旬達到穩定,3月以前的事故數量約為2019年同期的30%~40%,隨后差異逐漸減小.
(3)2020年3月8日以后,疫情持續期的事故數量比較平穩,未隨節假日發生變化,周平均事故量130 起;2019年事故數量則波動較大,周平均事故數量160 起,清明節事故量達到峰值,比平時多1/2,五一勞動節期間事故數量大致相等.
時間序列受到外部事件影響后,數據突然與主體呈現變化較大的偏差,且通常會在一段時間內改變時間序列的路徑,稱為結構突變,其發生的時間稱為突變點[8].小波分解能夠通過時間和頻率的局部變換,區分高頻和低頻信息,保留序列在各個不同頻率段的成分,并且能有效地從觀測時間序列中提取真實的變動信息,識別結構突變特征[9].
交通事故量受節假日、疫情因素影響發生變化.本文利用小波分析方法確定事故數的時間序列{yt}(t=1,2,3,…,511)的主要趨勢及結構突變點.小波分析參數選擇db2(多貝西二階小波),分解為3層,得到3組細節分量和3組近似分量.細節分量呈現序列的隨機噪聲和擾動,近似分量反映信號的主要趨勢,故用近似分量識別結構突變點.交通事故原始序列及3 層近似分量a1~a3 小波分解結果如圖2所示.
由圖2可知:
(1)原始序列有2 個明顯的低谷區,對應的分別是2019年、2020年春節和疫情期間;a1,a2 中保留較多的原始序列噪聲,從a3 開始,突變趨勢變得明顯.
(2)近似序列的幅值最低點可視為突變點,a3序列突變點序號為394,對應的時間為2020年1月29日,結合表2和圖1可知,當日該區域進、出城交通開始封閉,此突變點處于交通阻斷期.
(3)突變點處于春節(2020年1月23日)以后,按照春節休假7 d的規律,2019年交通事故量于春節(2月4日)后一周(2月10日)迅速恢復到節前水平,如圖1所示.然而,突變點卻呈現出最低谷,據此推斷,a3 的突變點394 是剔除春節假日帶來的事故量下降影響后的序列突變.

圖2 交通事故量序列的小波分解結果Fig.2 Wavelet decomposition of traffic accidents sequence
時間序列受到外部政策和事件影響的過程稱為干預.干預分析是從定量的角度評估政策或突發事件對時間序列的具體影響[10].干預模型為

式中:yt為t時刻受事件影響的事故時間序列值;Nt為t時刻不受事件影響的時間序列值;f(λ,ξ,t)為干預變量ξ對t時刻時間序列的干預效應;λ為未知參數.
干預變量ξ產生的干預效應Zt為

式中:K為干預變量個數;B為滯后算子;ξtj表示t時刻第j個干預變量;ωj(B),δj(B)為第j個變量干預程度的未知參數.K=1 表示只有一個干預變量,此時干預效應ωj(B)和δj(B)簡化為

式中:B(s)和B(r)分別為s步和r步滯后算子.
按照影響時間的長短,干預變量ξ分為持續性變量和暫時性變量.持續性變量表示事件在T時刻發生后對時間序列產生長期影響,暫時性變量表示事件在T時刻發生后對時間序列的影響是暫時的,分別表示為

文獻[10]給出持續性干預效應的2 種影響形式為

式(7)為干預變量產生的影響Zt突然發生(未滯后),影響強度為ω,長期持續且不變;式(8)表示影響逐漸開始且長期持續.
運用干預分析方法進行新冠疫情影響程度評估的步驟為:首先,利用干預事件發生前的數據構建合適的模型,外推T時刻以后的序列值,視其為不受干預事件影響的序列;其次,計算T時刻后的外推序列值與實際值的殘差,得到的殘差序列,即為受干預事件影響的具體結果;最后,選擇干預函數形式,運用殘差序列估計干預模型中的未知參數,得到干預影響.
(1)擬合模型構建.
以a3 為分析序列,將其劃分為[1,393](干預前)和[394,511](干預后)2 個階段,時間段[1,393]作為構建理想趨勢外推模型的數據集,包含393組輸入變量{yt-1,yt-2,yt-3,yt-4}(5≤t<393)及其對應的輸出變量{yt}(5≤t≤393),訓練集和檢驗集從樣本中隨機選擇,比例為60%和40%.為增加預測準確性,構建廣義線性模型和支持向量機模型對數據進行擬合.
廣義線性模型設事故量{yt} 為服從指數分布的因變量,{yt-1,yt-2,yt-3,yt-4} 為自變量,由于該模型不要求因變量必須符合某種分布(例如:正態分布、二項分布、泊松分布等),故靈活性和精度更高.支持向量機回歸模型的原理是給定一組由輸入變量{yt-1,yt-2,yt-3,yt-4} 和輸出變量{yt} 構成的數據集,并找到一個模型g(yt-1,yt-2,yt-3,yt-4),使g(yt-1,yt-2,yt-3,yt-4)的模型輸出值{Nt} 與實際值{yt} 盡可能接近.
對2 個模型進行訓練和參數標定.其中,支持向量機回歸(SVR)模型采用高斯核函數(RBF),核函數參數取0.005,懲罰系數取1 000,將數據集分成10 份,每次9 份數據用于訓練,1 份數據用于測試,最終選擇10 次計算結果中誤差平均值最小的一組參數作為最優參數.2種模型檢驗集數據的誤差分析結果如表4所示.

表4 2 種模型擬合精度評價Table 4 Fitting precision evaluation of two models
由表4可知,SVR 模型預測誤差更低,平均絕對誤差為0.290.
將2個模型得到的預測值與真實值進行對比,通過查看散點在多大程度上靠近對角線來衡量擬合優度,如圖3和圖4所示.

圖3 廣義線性模型擬合優度Fig.3 Goodness of fit of generalized linear model

圖4 支持向量機回歸模型擬合優度Fig.4 Goodness of fit of support vector machine regression model
圖3和圖4中擬合優度R2值說明,SVR 模型預測值與實際值的差異更小.SVR 模型對{yt} (1≤t≤393)的擬合結果如圖5所示,可以看出,擬合結果很理想.

圖5 a3 序列[1,393]擬合圖Fig.5 Fittig diagram of series a3 from 1 to 393
(2)干預后事故量預測.
利用已訓練好的支持向量機模型,對突變點后的時間序列值進行趨勢外推.例如,對于突變點394,輸入{y393,y392,y391,y390},模型輸出值記為N394;對于點位395,輸入{N394,y393,y392,y391},輸出N395.依次外推,得到一組預測值{Nt}(394≤t≤511),視為不受疫情政策影響的序列.{yt} 與{Nt} 之差,即為疫情影響結果,記為{Zt}.圖6給出SVR 模型預測值和實際值的對比及干預值曲線.

圖6 a3 序列[394,511]預測結果Fig.6 Prediction of series a3 from 394 to 511
由圖6可知:
①突變點所處的交通阻斷期事故量遠低于不受疫情影響時的事故量,變化趨勢與實際值有極大偏離,在[394,423]階段甚至呈現相反趨勢,干預效應先增強后減弱.
②在424點位(對應2020年2月28日,省際客運恢復通車)以后,事故量的差異顯著減小并穩定在15 起以內,預測結果與圖1所呈現的2020年3月以后周事故量受疫情影響比2019年同期低的趨勢相吻合,且干預效應基本穩定.
(3)干預模型估計.
如前所述,a3 擬合模型預測值與實際值的殘差為疫情政策的干預效應.由圖6可知,殘差序列{Zt} (3 94≤t≤511)代表干預變量的影響程度和作用區間.考慮干預影響先增強后減弱,最后趨于穩定的特性,干預函數應為分段形式,即

估計式(9)中參數,根據干預值曲線確定,當394≤t≤423 時,r=2;利用回歸模型的參數估計方法,得到ω1=-12.230,δ1=0.687,δ2=-0.309,R2值為0.883.各系數的含義為:新冠疫情初期管控政策產生影響使交通事故量平均每日下降12.23起,前期以68.7%的速度衰減,后期又以30.9%的速度回升.Zt=表示疫情產生影響強度為定值,取{Zt}序列在[424,511]區間的平均值,得到ω2=-11.707,表示疫情常態化防控下,相對寬松的管控政策對交通安全的影響長期持續,且穩定地使事故量平均每日下降11.707起.
本文提出運用小波分析技術、支持向量機模型和干預模型量化新冠疫情政策對交通事故量影響程度的方法,并以寧波市核心區為例進行驗證計算.
(1)基于統計方法分析疫情期間交通事故量的變化特征,發現疫情管控措施使交通事故發生率下降約3/4;隨著復工復產政策的實施,事故量回升,且不受節假日因素影響.
(2)運用小波分解技術識別出交通事故量序列突變點,該突變點位于2020年春節后一周,說明算法主動剔除了春節假日因素對事故量的影響,證實疫情導致事故量下降在春節后體現的更為明顯.
(3)針對存在突變點的小波分解近似分量,在支持向量機預測基礎上,構建分析疫情影響程度的干預模型,發現干預效應具有階段性,先增強后減弱,最終穩定,與不同疫情階段采取不同交通管理對策是符合的.
(4)疫情政策的影響使事故量平均每日下降12.23 起,初期以68.7%的速度衰減,再以30.9%的速率回升;隨著復工復產政策的實施,進入交通需求疏解期,疫情常態化防控政策穩定地使交通事故量平均每日下降11.71起.