楊 靜, 代盛旭, 張紅亮, 汪 波
(1.北京建筑大學(xué)土木與交通工程學(xué)院, 北京 100044; 2.北京交通大學(xué)交通運(yùn)輸學(xué)院, 北京 100044; 3.北京市交通信息中心, 北京 100073)
大型活動散場時(shí),地鐵車站產(chǎn)生的大規(guī)模客流在短時(shí)間內(nèi)聚集和消散過程,是對車站集散能力的重要考驗(yàn),也是車站管理人員的關(guān)注重點(diǎn)。車站進(jìn)站客流的變化情況與大型活動特性緊密相關(guān),但又受到很多隨機(jī)因素影響,整體呈現(xiàn)較強(qiáng)的集中性和隨機(jī)性,以5~15 min為時(shí)間跨度進(jìn)行短時(shí)進(jìn)站客流量預(yù)測更能夠適應(yīng)車站車流的時(shí)變性特點(diǎn)。
在常規(guī)情況下,地鐵車站主要承擔(dān)的是通勤客流,這部分客流的規(guī)律性較強(qiáng),可采用時(shí)間序列方法進(jìn)行短時(shí)預(yù)測,楊靜等[1]提出一種基于小波變換與自回歸滑動平均(auto-regressive moving average, ARMA)的組合預(yù)測模型,對于常態(tài)客流的短時(shí)預(yù)測效果較好,差分整合移動平均自回歸模型(auto-regressive integrated moving average, ARIMA對于常規(guī)情況的車站短時(shí)客流需求也具有較好的預(yù)測效果[2]。對于非常規(guī)的大客流,如自然災(zāi)害、突發(fā)事故等情況,當(dāng)前研究更多地關(guān)注大客流的傳播和消散機(jī)理[3]。事實(shí)上,部分非常規(guī)大客流是可預(yù)知的,例如:大型活動的散場客流,車站工作人員在大型活動舉辦前會收到大客流預(yù)警,可以根據(jù)已知信息制訂預(yù)案[4]。有關(guān)大型活動的客流研究較多的集中于客流特性分析。Simon[5]基于GPS數(shù)據(jù)和活動數(shù)據(jù)預(yù)測了活動散場時(shí)段的交通流量。崔洪軍等[6]基于宏觀交通流理論,利用觀眾步行速度的概率分布,確定了觀眾達(dá)到停車場的流量分布規(guī)律。王興川等[7]將活動期間的客流劃分為背景客流與活動客流,并分別采用改進(jìn)ARIMA模型對其進(jìn)行預(yù)測。
隨著計(jì)算機(jī)運(yùn)算能力的飛速增長,神經(jīng)網(wǎng)絡(luò)在客流預(yù)測中展現(xiàn)出了更強(qiáng)的適用性,任崇嶺等[8]基于小波神經(jīng)網(wǎng)絡(luò)模型預(yù)測了地鐵車站常態(tài)客流,論文模型的預(yù)測精度顯著高于時(shí)間序列模型。Li等[9]基于徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測了計(jì)劃大型活動(planned special events, PSEs)的客流需求,徑向基神經(jīng)網(wǎng)絡(luò)在BP(back propagration)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上對激活函數(shù)進(jìn)行了改進(jìn),然而該網(wǎng)絡(luò)的各計(jì)算層均為線性計(jì)算層,難以直接分析輸入變量的相互關(guān)聯(lián)。近年來的深度學(xué)習(xí)結(jié)構(gòu)基于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)加入更多的線性計(jì)算層,輸入變量通過多層傳遞間接實(shí)現(xiàn)組合分析。Nicholas等[10]建立了包含21層線性計(jì)算層的深度神經(jīng)網(wǎng)絡(luò)預(yù)測了某籃球比賽的短時(shí)交通流量。然而,網(wǎng)絡(luò)深度直接影響著模型計(jì)算量,網(wǎng)絡(luò)深度過高時(shí)會出現(xiàn)梯度衰減與噪聲放大等計(jì)算問題。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)作為一種新的深度學(xué)習(xí)結(jié)構(gòu),通過引入卷積層、池化層等非線性計(jì)算層,能夠?qū)斎脒M(jìn)行組合分析,并且保持較低的網(wǎng)絡(luò)深度,對于預(yù)測短時(shí)公交客流[11]、地鐵換乘客流[12]、路網(wǎng)短時(shí)交通流[13-14]以及車頭時(shí)距[15]均具有較高的精確度。大型活動散場期間的地鐵車站客流影響因素較多且相互關(guān)聯(lián),擬采用卷積神經(jīng)網(wǎng)絡(luò)對這部分客流進(jìn)行預(yù)測。
綜上,擬利用卷積神經(jīng)網(wǎng)絡(luò)提取客流序列與活動特征,經(jīng)過卷積層、池化層與線性計(jì)算層的逐層計(jì)算,擬合活動特征與客流時(shí)空分布的映射關(guān)系,并針對問題特性對模型進(jìn)行適應(yīng)性優(yōu)化,建立一個(gè)適用于大型活動散場期間地鐵車站的短時(shí)進(jìn)站客流預(yù)測模型。
在大型活動散場期間,進(jìn)站客流T(t)根據(jù)發(fā)生原理的不同可以分為兩個(gè)部分:不受大型活動影響的背景客流B(t)和由大型活動引起的活動客流A(t)。背景客流屬于常規(guī)客流,具有一定的規(guī)律性,可利用同期歷史數(shù)據(jù)采用一般時(shí)間序列方法預(yù)測;活動客流的分布時(shí)段集中、隨機(jī)性強(qiáng),與大型活動特性緊密相關(guān),需要進(jìn)行單獨(dú)分析,因此將活動客流從進(jìn)站客流中拆分。利用時(shí)間序列方法預(yù)測得到某一時(shí)段t內(nèi)的背景客流B(t),初步拆分的活動客流A(t)即為進(jìn)站客流T(t)與B(t)的差值。為保證活動客流在分布時(shí)段上的連續(xù)性,需要對A(t)進(jìn)行降噪處理,摒除背景客流短時(shí)波動的干擾,以得到最終的活動客流數(shù)據(jù)。
設(shè)活動客流A(t)僅在n個(gè)活動影響時(shí)間TAi∈[ai,bi](i=1,2,…,n)內(nèi)出現(xiàn),為避免客流波動變化的噪聲,記活動影響時(shí)間上下界ai、bi滿足
bi-ai≥δtint
(1)
式(1)中:tint為自動售檢票(automatic fare collection, AFC)數(shù)據(jù)的統(tǒng)計(jì)時(shí)間間隔;δ為降噪因子,δ∈N。降噪因子δ的取值越大,對活動客流的降噪效果越好,取值越小,活動客流的時(shí)空特征提取越完整。當(dāng)δ取0時(shí),拆分的活動客流與實(shí)際流量變化基本一致,但客流曲線存在較多的噪聲,不利于計(jì)算分析,如圖1(a)所示。當(dāng)δ取較大值6時(shí),拆分時(shí)的降噪過程消除了活動客流較為稀疏的部分,保留了活動客流的峰值特征,如圖1(b)所示。δ的取值應(yīng)根據(jù)大型活動的性質(zhì)確定。如演唱會、體育賽事等活動結(jié)束時(shí)客流到達(dá)車站較為集中,則δ可以取較大值,使活動影響時(shí)間的最小區(qū)間δtint較大,消除由于客流的隨機(jī)性帶來的噪聲。對于持續(xù)時(shí)間較長,且客流到達(dá)分散的活動,例如商品交易、展覽類活動,δ則應(yīng)取較小值。
基于客流拆分結(jié)果,針對活動客流特征進(jìn)行分析。區(qū)別于常態(tài)客流,活動客流分布不僅與前向時(shí)段的進(jìn)站客流量相關(guān),還需要考慮大型活動的類型,大型活動的舉辦地點(diǎn),大型活動的規(guī)模以及活動舉辦時(shí)間等因素。
由于活動性質(zhì)的不同,活動客流的分布存在明顯差異。商品交易、展覽類活動在一天內(nèi)不具有明顯的活動起止時(shí)間,活動客流分布特征表現(xiàn)為低峰值,持續(xù)時(shí)間長。體育賽事、演唱會類活動的人員到達(dá)及離開則具有明顯的峰值,活動客流分布特征表現(xiàn)為高峰值,持續(xù)時(shí)間短。將拆分后的活動客流進(jìn)行K-means聚類,根據(jù)活動客流的分布特征,聚類指標(biāo)選取為客流峰值與活動客流總量的比值,以及活動客流的持續(xù)時(shí)長,將活動客流分為兩類,聚類中心點(diǎn)的活動客流分布如圖2所示,Ⅰ類對應(yīng)展覽類活動客流,Ⅱ類對應(yīng)演唱會類活動,并按照聚類結(jié)果將客流樣本批量添加標(biāo)簽,完成活動類型的特征標(biāo)記。

圖1 降噪前后的拆分活動客流Fig.1 Split activity passenger flow before and after noise reduction

圖2 活動客流的時(shí)間分布特征Fig.2 Time distribution characteristics of active passenger flow
大型活動場館鄰近軌道交通站點(diǎn)的進(jìn)站客流高峰開始時(shí)刻等于活動散場時(shí)刻加上前往車站所花費(fèi)的時(shí)間。由于地鐵客流數(shù)據(jù)為自動售檢票AFC刷卡數(shù)據(jù),該時(shí)間距離除靜態(tài)的步行時(shí)間,還包含了站外的限流排隊(duì)時(shí)間。對于具體的場館及其鄰近車站,步行時(shí)間為常數(shù);限流排隊(duì)時(shí)間由該時(shí)段的活動客流量決定,活動客流量越大,限流排隊(duì)時(shí)間越長,進(jìn)站客流在AFC數(shù)據(jù)上呈現(xiàn)的峰值出現(xiàn)越晚。
根據(jù)大型活動籌辦方的預(yù)計(jì)活動人數(shù),以及選取軌道交通出行方式的分擔(dān)比例,可以得到活動客流總量的期望值。考慮到大型活動籌辦方的預(yù)計(jì)活動人數(shù)通常以不同置信水平的區(qū)間給定,可將活動的預(yù)計(jì)活動客流量視為隨機(jī)變量且對稱分布。
對于散場時(shí)間集中的大型活動,活動的起止時(shí)間顯著影響了活動客流在時(shí)間軸上的分布,在活動特征標(biāo)記時(shí),將活動開始時(shí)間和活動結(jié)束時(shí)間轉(zhuǎn)換為時(shí)間戳標(biāo)記。
本文模型包含兩個(gè)非線性計(jì)算層,利用卷積核移動組合提取活動特征與客流序列,線性計(jì)算層計(jì)算效率較高,但只能逐一提取活動特征,無法捕捉特征之間的相互關(guān)聯(lián)。因此選用了非線性計(jì)算層與線性計(jì)算層組合的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),利用非線性計(jì)算層提取活動特征傳遞至線性計(jì)算層輸出活動客流的時(shí)空分布,以獲得更好的預(yù)測效果。
區(qū)別于常態(tài)客流的輸入層,針對大型活動散場客流的卷積神經(jīng)網(wǎng)絡(luò)輸入層除了包括進(jìn)站客流的時(shí)間序列,額外加入活動特征相關(guān)的4個(gè)輸入變量:活動類型、活動地點(diǎn)、活動規(guī)模和活動時(shí)間。其中活動類型為boolean變量,分別代表展覽類活動與演唱會類活動;活動地點(diǎn)與活動規(guī)模為數(shù)值變量;活動時(shí)間為boolean變量序列,結(jié)合時(shí)間戳序列反映該時(shí)段是否正在舉辦活動。
卷積神經(jīng)網(wǎng)絡(luò)的主要計(jì)算層包括卷積層、池化層與全連接層。卷積層通過提取卷積核覆蓋區(qū)域的變量進(jìn)行組合并提取特征,隨著卷積核的逐步移動,提取所有的組合形式以特征圖的形式輸出至池化層。卷積操作可表示為

(2)
式(2)中:l∈N,為網(wǎng)絡(luò)層數(shù);x(l)為各計(jì)算層張量;x(0)為輸入層張量;wi,j為卷積核記錄的權(quán)重;H和W為卷積核尺寸。(il+1,jl+1)為卷積核中心的位置坐標(biāo),并滿足
0≤il+1 (3) 0≤jl+1 (4) 針對活動客流數(shù)據(jù)的突變性與波動性,取最大池化對提取的客流特征進(jìn)行池化,保留了活動客流峰值的時(shí)空特征,加強(qiáng)了特征的稀疏表達(dá),最大池化為 (5) 全連接層的功能是將提取的特征表示映射到樣本標(biāo)記空間,將一系列卷積池化層的特征圖以張量的形式輸出,該層是一個(gè)普通的前饋網(wǎng)絡(luò),可記為 x(l+1)=f(wx(l)+b) (6) 式(6)中:w為權(quán)重矩陣;b為偏置矩陣;f為激活函數(shù),選取Relu函數(shù)。 構(gòu)建完畢的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括兩個(gè)非線性計(jì)算層x(1)、x(2),以及三個(gè)線性計(jì)算層x(3)、x(4)、x(5),輸入層x(0)通過5個(gè)計(jì)算層輸出客流量預(yù)測值y,實(shí)現(xiàn)活動特征與活動散場期間進(jìn)站客流量的映射關(guān)系構(gòu)建,如圖3所示。可將該映射關(guān)系以隱函數(shù)表示為 y=x(5)=F(x(0)) (7) 圖3 針對大型活動散場客流的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Convolution neural network structure for large-scale event scattered passenger flow 大型活動散場時(shí)的地鐵進(jìn)站客流具有明顯的集中到達(dá)特性,在客流時(shí)間曲線上表現(xiàn)為突變點(diǎn),流量自該點(diǎn)起出現(xiàn)陡增。在此突變點(diǎn),客流量急劇變化,參數(shù)更新的誤差將被放大,為消除這部分誤差,計(jì)算機(jī)會重復(fù)進(jìn)行的迭代,容易造成過擬合現(xiàn)象。因此在目標(biāo)函數(shù)中引入模型復(fù)雜度懲戒項(xiàng),將神經(jīng)網(wǎng)絡(luò)的權(quán)重變量w以2-范數(shù)形式加入目標(biāo)函數(shù),進(jìn)而弱化參數(shù)更新的誤差。優(yōu)化后的目標(biāo)函數(shù)為 (8) 式(8)中:L為損失函數(shù);y為預(yù)測流量向量;y*為實(shí)際流量向量;wl為第l層神經(jīng)元與下層神經(jīng)元連接的權(quán)重向量。 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程通過誤差的反向傳播實(shí)現(xiàn),CNN網(wǎng)絡(luò)通常使用隨機(jī)梯度算法及其變體。將使用Adam算法作為CNN的訓(xùn)練算法。作為一種矩估計(jì)算法,Adam算法[16]采用梯度的矩估計(jì)代替了傳統(tǒng)最優(yōu)化算法的Jacobi陣或Hessian陣,單次迭代的計(jì)算效率較高。針對活動客流集中到達(dá)時(shí)Adam算法學(xué)習(xí)率的更新問題,在Adam算法的學(xué)習(xí)率衰減項(xiàng)Δθt的更新規(guī)則中補(bǔ)充一階梯度差懲戒項(xiàng),當(dāng)兩個(gè)迭代點(diǎn)的一階梯度差值較大時(shí),降低學(xué)習(xí)率的變化速度,以較小的迭代步長進(jìn)行尋優(yōu),表達(dá)式為 (9) 式(9)中:θ為學(xué)習(xí)率;η為超參數(shù)。 地鐵短時(shí)客流預(yù)測流程中,主程序部分為CNN的前向傳播結(jié)構(gòu),如圖4所示,將輸入數(shù)據(jù)預(yù)處理為訓(xùn)練集和測試集,模型初始化后將訓(xùn)練集分次喂入神經(jīng)網(wǎng)絡(luò),通過正則化的損失函數(shù)計(jì)算預(yù)測值與真實(shí)值的誤差,調(diào)用Adam算法并接受其返回值完成CNN的訓(xùn)練,將測試集輸入訓(xùn)練完畢的CNN模型,進(jìn)行預(yù)測并計(jì)算評價(jià)指標(biāo),實(shí)現(xiàn)地鐵活動客流的預(yù)測,并采用ARMA模型對背景客流進(jìn)行預(yù)測,最終實(shí)現(xiàn)大型活動期間的地鐵短時(shí)進(jìn)站客流預(yù)測。 圖4 基于Adam-CNN的地鐵短時(shí)客流預(yù)測流程Fig.4 Short-term passenger flow prediction process of subway based on Adam-CNN 研究采用北京地鐵8號線奧林匹克公園站從2018年8月—9月的AFC數(shù)據(jù),訓(xùn)練集選取8月11日、8月24日、9月8日、9月9日共4 d的進(jìn)站AFC數(shù)據(jù),測試集選取8月25日的AFC數(shù)據(jù),預(yù)測時(shí)間間隔為5 min。經(jīng)車站工作人員確認(rèn),以上5 d大型活動均是鳥巢體育館舉辦演唱會,活動時(shí)段為當(dāng)日19:00—22:00,平峰時(shí)段場館至車站步行時(shí)間12 min,預(yù)計(jì)活動規(guī)模為(1.2~1.4)萬人。 實(shí)驗(yàn)環(huán)境采用Ubuntu16.04版本的Linux操作系統(tǒng),學(xué)習(xí)框架為Tensorflow,軟件編程環(huán)境為Python2.7。對9種不同CNN網(wǎng)絡(luò)結(jié)構(gòu)的性能進(jìn)行了測試,結(jié)果如表1所示。可知,測試集準(zhǔn)確率最高的兩種網(wǎng)絡(luò)結(jié)構(gòu)分別為1層卷積層、卷積核尺寸3×3,以及2層卷積層、卷積核尺寸4×4。在性能相差不大的前提下,考慮選取規(guī)模較小的網(wǎng)絡(luò)結(jié)構(gòu),即1層卷積層、卷積核尺寸3×3。卷積核個(gè)數(shù)均為64,卷積步長取3,保留卷積前變量個(gè)數(shù),池化層取最大池化。全連接層神經(jīng)元個(gè)數(shù)為512,激活函數(shù)選擇Relu函數(shù),Adam算法的超參數(shù)u和v分別取0.9和0.999,ε取10-8,權(quán)值與偏置按正態(tài)分布隨機(jī)賦值。 表1 不同CNN結(jié)構(gòu)的性能對比Table 1 Performance comparison of different CNN structures 首先使用上文所建Adam-CNN預(yù)測模型對活動客流進(jìn)行預(yù)測,并與較為傳統(tǒng)的基于隨機(jī)梯度下降法(stochastic gradient descent, SGD)的SGD-CNN模型,以及時(shí)間序列方法ARMA作對比,結(jié)果如表2所示。采用如下3個(gè)評價(jià)指標(biāo)比較兩個(gè)模型的預(yù)測效果:平均絕對誤差MAE、平均絕對百分誤差MAPE以及擬合度R2。 從圖5所示的預(yù)測曲線來看,ARMA預(yù)測的進(jìn)站客流峰值存在一定的滯后性,約為2個(gè)統(tǒng)計(jì)時(shí)間間隔(10 min)。從總體統(tǒng)計(jì)指標(biāo)來看,ARMA預(yù)測的活動客流曲線擬合度R2=0.783,誤差較大,難以直接應(yīng)用于大型活動期間的活動客流預(yù)測。預(yù)測結(jié)果對比顯示,SGD-CNN與Adam-CNN預(yù)測精度顯著高于ARMA模型,對于活動散場期間的客流預(yù)測均具有較好的適用性,其中Adam-CNN預(yù)測5 min內(nèi)活動客流進(jìn)站人數(shù)絕對誤差MAE為16.60人次,與實(shí)際活動客流曲線的擬合度R2達(dá)到0.992,絕對百分誤差MAPE為5.96%,具有更高的預(yù)測精度。 表2 活動客流預(yù)測結(jié)果對比Table 2 Comparison of forecast results of activity passenger flow 圖5 Adam-CNN模型活動客流預(yù)測結(jié)果Fig.5 Forecast results of activity passenger flow of Adam-CNN model 之后,采用ARMA對背景客流B(t)進(jìn)行預(yù)測,訓(xùn)練數(shù)據(jù)選取大型活動舉辦前6 d的數(shù)據(jù),預(yù)測結(jié)果與活動客流A(t)按統(tǒng)計(jì)時(shí)段累加,得到大型活動散場期間的總進(jìn)站客流T(t),對應(yīng)圖6所示的進(jìn)站客流預(yù)測值。從統(tǒng)計(jì)指標(biāo)看(表3),總進(jìn)站客流的平均絕對誤差MAE為14.13人,由于平峰時(shí)段客流量較低,總進(jìn)站客流的MAPE上升至7.35%,擬合度R2=0.990。從圖7中可以看出,北京地鐵奧林匹克公園站各時(shí)段的客流預(yù)測值與實(shí)際值均分布在45°線附近。分析結(jié)果表明,基于Adam-CNN網(wǎng)絡(luò)的地鐵短時(shí)客流預(yù)測模型精度較高,對客流峰值預(yù)測準(zhǔn)確,是一種適用于大型活動散場期間的地鐵短時(shí)進(jìn)站客流的預(yù)測方法。 表3 大型活動散場期間地鐵短時(shí)進(jìn)站客流預(yù)測結(jié)果對比Table 3 Prediction result comparison of short-term passenger flow of metro station in the period of planned special events 圖6 大型活動散場期間進(jìn)站客流預(yù)測結(jié)果Fig.6 Forecast results of inbound passenger flow during large-scale activities 圖7 大型活動散場期間進(jìn)站客流預(yù)測擬合精度Fig.7 Fitting accuracy of inbound passenger flow forecast during large-scale activities 基于深度學(xué)習(xí)框架,將客流序列與活動客流特征作為模型輸入,利用卷積層對活動客流特征進(jìn)行提取,并經(jīng)過池化層與全連接層逐層計(jì)算,建立了活動特征與客流時(shí)空分布的映射關(guān)系,并基于Adam算法對CNN模型進(jìn)行適應(yīng)性優(yōu)化,提出了一種適用于大型活動散場期間地鐵車站的客流預(yù)測模型。 非常態(tài)客流的預(yù)測問題是當(dāng)前交通規(guī)劃和運(yùn)營中的一個(gè)重大挑戰(zhàn),當(dāng)前研究大多集中在短期或長期預(yù)測范圍內(nèi)的常規(guī)客運(yùn)需求預(yù)測,對大型活動散場期間的短時(shí)客流預(yù)測研究較少。針對非定期舉辦的大型活動短時(shí)進(jìn)站客流需求進(jìn)行研究,對于城市軌道交通運(yùn)營單位,尤其是大型活動場館臨近的地鐵車站及所在線路,向乘客實(shí)時(shí)傳達(dá)服務(wù)信息,根據(jù)客流需求合理地分配運(yùn)輸資源,有序開展站內(nèi)工作組織等工作提供有力支撐。
3.2 基于Adam算法的模型適應(yīng)性優(yōu)化
3.3 基于Adam-CNN的地鐵短時(shí)客流預(yù)測流程

4 案例分析
4.1 數(shù)據(jù)描述
4.2 模型參數(shù)設(shè)置

4.3 預(yù)測結(jié)果分析





5 結(jié)論