肖 梅,王仲豪,顏建強,邊浩毅
(1.長安大學汽車學院汽車運輸安全保障技術交通行業重點試驗室,西安 710064;2.西安市交通信息中心,西安 710065;3.浙江鯤鵬建設集團設計總院,杭州 311112)
近年來,隨著我國機動車的快速增長,道路交通基礎設施無法滿足日益增長的交通需求,各種交通問題日益凸現,如交通擁擠、道路運行效率低、交通事故頻發和交通污染嚴重等。大力發展城市公共交通是解決我國大中城市交通問題的最佳的解決途徑之一。筆者通過近500個電話抽樣訪談發現:公交運行的準時性和舒適性是乘客公交出行關注的焦點。通常,公交運行時間主要耗費在站間運行、站臺停靠和信號路口等候,要提高公交車輛的準時性,需要保障公交在各運行階段的準時性。分析乘客上車耗時的影響因素,建立乘客上車耗時模型,對公交運營調度、公交準時運營、公交線網和站點的優化等有著積極的作用。
據課題組的調研數據,西安市的公交出行中90%左右的乘客通過IC卡或手機支付等方式來進行付費,已經逐漸代替了人工收費和投幣式付費。
國內外學者就車輛在站臺的停靠時間預測[1-6]和乘客上車時間[7-10]開展了大量研究。辛建霞等[1]基于歷史數據均值即 KNN(K-Nearest Neighbor)方法對公交停站時間進行預測,預測精度較高。王旭等[2]分析了上下車人數、車內擁擠度、車門數及公交車臺階數等因素對公交停靠時間的影響,發現上下車人數是影響公交車在站點停靠時間的主要因素,為此,建立了考慮車門數、車內擁擠等因素的公交站點停靠時間預測模型。Jaiswal等[3-4]研究發現公交車在大型停靠站的停靠時間與等待的乘客數呈正相關。Rajbhandari等[5]就公交車在站點的延誤開展研究,發現公交車乘客的平均上、下車時間是影響公交車運營效率的主要因素。王鑫等[6]基于GPS數據分析了公交車停靠時間隨時間、空間和線路的分布特性,建立了基于時間序列的公交停靠站時間預測模型。以上對公交停靠時間預測的研究中側重于單一因素對公交停靠時間的預測分析。
曹守華等[7]結合乘客上車時間的分段特性,建立分段的乘客上車時間模型,考慮乘客分隊列上車模式和車門寬度,建立了車門寬度的乘客上車時間模型。吳鼎新等[8]檢驗了乘客的性別、年齡和職業對上車時間的顯著性影響,結果表明:公交乘客的性別對上車時間影響不顯著,年齡和職業對乘客的上下車時間均有一定影響。王劍梅等[9]以跟車調查的方式對成都市抽樣公交線路的乘客上下車效率進行統計,運用方差分析得出乘客上車效率受到客觀因素如車門數量和車門寬度、踏步級數和踏步高度、座位構造等影響顯著的結論。Kraft等[10]對乘客的上下車時間的影響因素進行分析,發現上下車時間受車門數量和車門寬度、公交踏步的級數和踏步高度、公交售票方式、公交車內擁擠狀況、乘客攜帶行李情況、公交車的通道寬度、公交車座位構造等諸多因素的影響。
這些研究雖然已經在乘客上車影響因素的分析中取得了一定的成果,但由于獲取的數據采用實地調查的方法[2,8-10],結果受調查數據量的影響較大。其次,綜合考慮站點類型、刷卡類型、出行時段等客觀因素的研究還比較少,目前筆者只發現文獻[8]考慮了用戶類型的影響。最后,在互聯網+的信息時代下,各地域乘客上下車耗時的影響因素不盡相同。
鑒于公交IC卡數據具有信息量大、數據全面的優點[11],不少專家開展了乘客上下車站點判斷[12]、公交站點客流預測[13]等方面的研究,本文基于西安市公交IC卡出行大數據,開展了乘客上車耗時影響分析研究,探究包括用戶類型、站點類型、節假日、出行時段、天氣類型等對公交乘客上車耗時的影響。
采集到西安市8月的公交IC卡數據,其數據格式如表1所示。據統計,西安市公交一天上車總人數約為300萬人次,刷卡數據量約為260萬條/天,刷卡支付的比例占86.7%左右。
考慮到近90%的公交乘客通過刷卡上車,則計算連續2次乘客刷卡的時間差即可認為是一位乘客的上車耗時。當然,實際中常常存在投幣上車乘客、乘客先上車后刷卡或是一卡多刷等情況會造成連續2次乘客刷卡的時間差過大或過小,稱之為異常時間差,需要對其進行剔除或修正處理。異常時間差包括零時間差和大時間差。
1)零時間差。實際情況中,有時會出現1卡多刷的情形,約占總出行的1.2%,使得2次連續刷卡的時間差等于0,因此對該類數據進行修正處理。
2)大時間差。實際情況中,常常會出現乘客滯后刷卡,或2位刷卡乘客之間出現投幣乘客,公交同站臺多次停靠等,以上種種因素均會造成連續的刷卡時間差過大,需要對其進行剔除處理。
異常時間差的預處理過程如下:
1)乘客的上車耗時。用n表示采集的刷卡數據總數,Ti和 Ti+1分別表示第 i和 i+1個刷卡數據的記錄時刻。

2)乘客上車耗時的統計特性。統計乘客上車耗時的均值tm和標準差σ。

3)剔除大時間差的乘客耗時數據。若乘客的上車耗時大于2倍標準差,即滿足:ti>tm+2σ,則剔除之。
4)修正零時間差的乘客耗時數據。在剔除大時間差數據的基礎上,用同站點的乘客上車耗時的均值替換零時間差的乘客耗時數據。
正如已有的研究所表述的,乘客上下車的時間會受到車門數量和車門寬度、公交踏步的級數和踏步高度、公交售票方式、公交車內擁擠狀況、乘客攜帶行李情況、公交車的通道寬度、公交車座位構造等諸多因素的影響。由于研究地域采用了統一公交車型,車型對乘客上車耗時差別很小,本文從用戶類型、站點類型、出行時段、節假日和天氣類型等5個方面進行影響因素分析。
1)用戶類型
公交IC卡用戶類型包括學生卡、普通卡和老年卡,年滿65歲的老年人可以辦理老年卡,乘車享受優惠。與普通用戶及學生相比,老年人行動能力和靈敏度上有著顯著的差距,這種差距可能給乘客上車時間帶來影響。
2)站點類型
公交站點類型和功能因所處的地理位置不同而異,有的公交站點可能有十幾條公交線路同時經過,而有的站點只有一兩條線路經過。停靠線路較多的大型換乘站點較為擁擠,且乘客會由于攜帶行李或重物導致上車時間較長。本文也考慮大型換乘站點對乘客上車耗時的影響。
3)出行時段
與出行低峰相比,在出行高峰時段出行乘客較多,造成車內和站點等區域的乘客較多,此時車門處和車內均比較擁擠、移動困難,這些因素可能會帶來乘客上車耗時上的變化。
4)節假日
從出行目的來看,周內,乘客公交出行的主要目的是為了工作通勤,而節假日乘客出行目的則大多轉變為休閑或游玩,不同的出行目的對于乘客的上車耗時應該存在影響。
5)天氣類型
與晴朗天氣出行不同,惡劣的天氣出行常常會造成乘客的上車耗時更長,比如,雨天乘客需要攜帶雨傘出行,上車時需要收攏雨傘,通常會延長乘客的上車時間,進而會影響到公交在站臺的停靠時長。
綜合考慮用戶類型、站點類型、出行時段、節假日及天氣類型這5個因素對乘客上車的影響分析。對影響因素進行分類如下:①天氣類型分為晴天和雨天兩類,0為晴天,1為雨天;②節假日分為周內和節假日兩類,0為周內,1為節假日;③出行時段分為高峰時段和低峰時段,0為非高峰期,1為高峰期;④ 站點類型分為大型換乘樞紐站和普通站點兩類,0為普通站點,1為大型換乘站點;⑤用戶類型分為老年用戶和普通用戶,0為普通用戶,1為老年用戶。分類數據如表2所示。
在本文的研究中,采取3.0T MRI檢查的25例矮小兒童中,有15例垂體前葉發育不良,2例垂體柄阻斷綜合征,2例顱咽管瘤術后垂體前葉薄小,6例垂體增生。而且,和正常兒童相比較,矮小癥兒童的矢狀高徑數據明顯更低,P值小于0.05。
在統計中,直方圖和統計描述可以直觀地顯示數據的分布情況,用于數據初始階段的定性分析。本文對總體樣本進行統計分析,同時選取各影響因素(即雨天、節假日、高峰、大型換乘站點及老年用戶)對其進行統計分析,繪制各影響因素的直方圖。各因素影響下的乘客上車耗時直方圖如圖1所示,對應的統計描述如表3所示。

表2 分析數據

表3 各因素影響下乘客上車耗時統計描述

圖1 多因素影響下的乘客上車耗時直方圖
從直方圖和統計描述值(偏度和峰度)可以看出:①乘客上車耗時近似呈正態分布。②雨天狀況的乘客上車耗時直方圖分布與總體直方圖分布類似。究其原因如下:西安市屬于平原地區,全年降雨量少,采集時間段內的公交數據只有間斷性的小雨天氣出現,對交通出行影響不大。③其他因素影響下的乘客上車耗時均與總體分布有差異,其中用戶類型的差異分布最大。基于直方圖的直觀分析結果,進一步地對各影響因素分別進行單因素方差分析和Logistic回歸,以定量檢驗不同的因素對乘客上車耗時是否有顯著的影響。
方差分析(ANOVA)是一種常見的影響因素分析方法,在使用SPSS對各個因素進行單因素方差分析時,將5個因素作為影響因子,以對應的乘客上車耗時作為因變量,逐一進行單因素方差分析,方差分析結果見表4。
表4的分析結果表明:① 天氣類型的顯著性為0.728>0.05,說明天氣因素不會對乘客上車產生影響,這與數據采集的城市本身降雨量很少有關,故在后續的分析中不考慮天氣因素對乘客上車耗時的影響;②除天氣類型以外,其他4類因素的顯著性均小于0.05,說明節假日、出行時段、站點類型和用戶類型會對乘客上車耗時產生一定的影響;③ 根據F值的大小,諸因素對乘客上下車耗時影響由大到小的順序為:用戶類型>站點類型>節假日>出行時段。
Logistic回歸是一種廣義線性回歸(generalized linear model),本節運用Logistic回歸分析各因素對乘客上車耗時的影響,并給出預測方程。采用二分類的Logistic回歸的因變量需要是一個二分類的分類變量,故對乘客上車耗時進行二分類,以乘客上車耗時的平均值2.193 3 s(見表3)作為Logistic回歸因變量的二分類閾值,將小于平均值的耗時作為正常耗時記為0,將大于平均值的耗時作為較長耗時記為1,并且根據單因素方差分析的結果排除天氣類型對乘客上車耗時的影響,得到如表5所示的Logistic回歸數據。

表4 各影響因素的單因素方差分析

表5 Logistic回歸數據
將表5數據導入SPSS軟件,利用SPSS對乘客上車時間間隔的數據進行Logistic回歸分析,得到的結果如表6、7所示。表6為對Logistic回歸模型進行Hosmer-Lemeshow檢驗結果。P=0.158>0.05,認為當前數據中的信息已經被充分提取,表明模型擬合優度較高。表7為Logistic回歸的擬合結果,用于模型的建立和影響因素的分析。
在Logistic回歸擬合結果中,4種影響因素的顯著性P值均<0.05,表明4種不同的影響因素對乘客上車耗時均有影響。根據Wald值,各因素對乘客上車耗時影響的顯著性大小排序為:用戶類型>站點類型>節假日>出行時段。該結論與通過單因素方差分析得出的結論是一致的。

表6 Hosmer-Lemeshow檢驗表

當P>0.5時表明乘客上車耗時較長,P<0.5表明乘客上車耗時為正常耗時。從Logistic回歸模型中,得出用戶類型、站點類型對乘客上車耗時呈正相關,即老年人或者在大型換乘站點會加大乘客上車的耗時。出行時段、節假日對乘客上車耗時呈負相關,即高峰出行或節假日出行會減少乘客上車耗時。

表7 Logistic回歸擬合結果
以西安公交IC卡大數據為研究對象,探索了天氣類型(雨天)、用戶類型、站點類型、節假日和出行時段等因素對乘客上車耗時的影響分析,并建立了多因素影響下的乘客上車正常耗時的概率預測模型。
1)從直方圖定性可知:乘客上車耗時近似呈正態分布,除了雨天情況下的乘客上車耗時直方圖分布與總體直方圖分布類似之外,其他因素對乘客上車耗時直方圖均有所影響。
2)基于方差分析法發現:天氣類型的顯著性為0.728>0.05,說明該因素對乘客上車耗時沒有顯著影響。除天氣類型以外,用戶類型、站點類型、節假日和出行時段對乘客上車耗時顯著性均小于0.05,這些因素對乘客上車耗時均有一定的影響。進一步根據F值的大小,得到諸因素對乘客上下車耗時影響由大到小的順序為用戶類型>站點類型>節假日>出行時段。
3)Logistic回歸擬合結果發現:根據顯著性P值和Wald值顯示,用戶類型、站點類型、節假日和出行時段對乘客上車耗時均有影響,且影響顯著性排序一致。