高御堯,石明全,秦 渝,陳建平,周 喜,張 鵬
(1.中國科學院重慶綠色智能技術研究院,重慶 400700;2.中國科學院大學 重慶學院,重慶 400700;3.重慶市公共交通控股集團 鳳筑科技有限公司,重慶 401120)
科學合理的線網規劃(Transit Network Planning,TNP)是公共交通管理中的一個相當寬泛且復雜的問題。為了便于研究,文獻[1]將該問題劃分為線路設計、頻率設計、車輛調度、司機調度等若干子問題。子問題之間又相互關聯,往往某一項子問題的解又可以作為另一項子問題的輸入,形成網狀關系,并相互依賴。在大多數子問題研究中,客流量起終點(Origin-Destination,OD)數據是必需的基礎數據,由此出現了大量關于OD 預測的研究[2-3]。宏觀上,所有站點的客流量都可以用OD 數據來反映,因此,研究站點客流量變化對OD 數據分析具有重要參考價值。
人類出行具有一定規律性,主要由個體需求決定[4],而OD 是乘客需求的直接反映。乘客選擇上下車站點的背后邏輯是站點所處地的性質、站點周邊是否有一定數量的興趣點(Point of Interest,POI)聚集地,如若干寫字樓、醫院、學校等,其中包含乘客的目標POI。某地區的POI性質是各個時間段內乘客需求不同的根本原因,通過乘客在該地站點的OD數據體現。
在目前關于地面公交站點客流量與POI 的關系研究中:文獻[5]分析了客流數據和POI 數據,實現了對軌道站點的聚類分析;文獻[6]研究與之類似;文獻[7]根據AFC 數據和POI 數據,分析影響軌道車站客流量的因素;文獻[8]將軌道站點周邊土地性質劃分為5 類,根據每類土地所占比例,利用長短時記憶網絡預測客流,但是所提方案需要針對具體線路才能實現;文獻[9]通過分析站點周邊POI 的類型和數量,實現了對車輛客流OD 矩陣的估計。上述研究多數是針對軌道交通站點展開的,并且需要以特定線路為研究對象,具有一定的局限性。地面公交相較地鐵而言,寬泛性和靈活性均有所提升。當前,運營商普遍對POI 與客流量的關系有一定的經驗積累,主要用于調度安排以及線路規劃等[10-11],而客流量模型多數停留在一種定性的狀態。因此,構建一種普適通用的公交站點客流量預測模型具有較高的實用價值。
POI 類型和數量越多的地方影響乘客選擇公交站點的可能性越大,POI 點與公交站點的距離越近,影響效應越強[12],因此,針對性地構建一個模型用于訓練公交站點周邊POI 點的分布與站點客流量的關系,模擬并定量預測站點每天的客流量變化,對于線路規劃、車輛調度以及新城區的站點線路規劃具有重要意義。傳統全連接神經網絡在高維輸入數據下存在擬合效果差、訓練速度慢、易陷入局部最優解、可解釋性差等一系列問題,需要從結構上對網絡進行改進。本文以研究POI 與公交站點客流的關系為主進行以下工作:通過非全連接的方式簡化網絡結構并通過構造連接矩陣實現,使神經網絡的訓練可以快速收斂至全局最優解;賦予部分隱藏層節點實際意義,以改善神經網絡的可解釋性;通過增加約束條件調整誤差傳遞方式,使網絡的輸出結果更接近實際狀況。
以公交站點為研究對象,根據站點所處位置周邊一定半徑內的POI 類型等要素的分布特征,研究POI 與站點各個時間段客流量的關系,以此準確預測站點每天各個時段上車或下車的客流量。表1 定義了此問題中的主要參數。

表1 主要參數定義 Table 1 Definition of main parameters
為把握問題的主要因素,提出如下基本假設:
1)站點客流量僅與時間段Ti、POI 的屬性及其與站點距離相關;
2)與站點距離大于rmax的POI 無法影響客流量;
3)POI 類型的影響值xn越高,對客流的吸引效果越強;
4)各個POI 對客流量的影響作用相互獨立,因為人們傾向于在同一個POI 內度過大部分時間,POI對人們的吸引力相對獨立,各POI 之間的依賴性較為輕微[13]。
選取重慶市公交站點為例,根據已有的通用行業分類標準(如百度地圖分類標準)及歷史經驗,選擇可能對站點客流量影響較大的若干POI 類型作為研究對象:P={P1,P2,…,Pn}。如圖1 所示,對于任意一個POI 類型Pn,研究半徑rmax內可能包含若干個同類的POI 點Pn,k。對每類POI 的各個點進行加權,表示該類POI 對站點的影響力。加權方式可能有多種[14-15],為了把握主要因素,選擇POI 到公交站點的物理距離rn,k、POI 的綜合影響因子(規模、口碑等因素)An,k作為研究參數,共同決定Pn對站點客流量的影響力。由于同一站點在不同時間段的客流量有很大的差異性,因此設置時間參數Ti,表示不同類型的POI 在不同時間段內對客流量的影響力不同。

圖1 站點及POI 空間分布Fig.1 Spatial distribution of stations and POIs
本文研究的問題可以定義為一個多分類問題或回歸問題。在多分類問題中,預先將客流量按人數劃分為若干區間,通過預測輸出客流量屬于各個區間的概率以確定客流量屬于哪一類,解決方案可以考慮SVM、決策樹、RBF 神經網絡等[16-18];而在回歸問題中,直接預測輸出客流量,解決方案可以考慮多項式回歸、回歸樹、BP 神經網絡等[19-21]。在多數情況下,兩類問題的解決方案可以互相通用。由于客流量屬于不確定因素,存在波動性,原始數據可能存在一定偏差,因此采用回歸方案更佳。而神經網絡由于具有較強的自學習能力和非線性映射能力,因此被廣泛應用于回歸問題的求解。
本文采用BP 神經網絡的基本架構。根據圖1所示的各項要素,設時間段m內某站點的上(下)車人數為ym,滿足下式:
其中:時間參數Ti設為超參數,i=1,2,…,18;rmid為中間距離,表示POI 對客流量影響力的變化率由高到低的臨界距離,rn,i
式(2)反映了POI 的距離與對客流量的影響呈負相關關系,指數的主要意義為:越近的POI 對于客流量越具有決定性的影響作用,當距離超過某一臨界值時,影響作用就會趨于平緩。該式計算xn的目的在于量化站點周邊的POI 指標和確定每類POI 對該站點的重要性。xn的值越大,代表站點周邊Pn的分布越廣、對該站點的重要性越高。關于xn對客流的影響效果,則通過神經網絡的自適應學習過程不斷更新。
根據實際情況,選取10 類POI 類型:P={P1,P2,…,P10},類型說明如表2 所示。

表2 POI 類型說明 Table 2 Description of POIs’ type
根據站點的GPS 定位,確定每個站點在研究半徑區間內所有屬于Pi的POI,并通過式(2)計算出該站點的各類型POI 的加權影響值xn。
通過對重慶市全市區的站點GPS 定位信息、每條公交線路的客流信息(主要為每個乘客的上下車站點及時間信息)的相關數據分析得出,在不考慮節日的前提下,客流趨勢在工作日(周一至周五)和雙休日(周六、周天)呈現出不同狀態,如表3 所示,并且在每種狀態下基本保持穩定。

表3 研究類別 Table 3 Study category
對任意一個站點Si,統計每個時間段Ti內所有工作日(或雙休日)在Si上車(或下車)人數的平均值。所有站點客流量經歸一化處理后即為期望輸出q的各項參數。
采用全連接策略的傳統BP 神經網絡由于輸入參數的維度過高,會使結構十分臃腫[22],如圖2(a)所示,在數據量不足的情況下很難訓練出各個參數之間的關系,并且很容易陷入局部最優解,需要采用降維等方式對數據預處理[23],這增加了工作量。因此,本文對網絡結構進行優化,以非全連接的方式提升網絡運行效率及準確度,如圖2(b)所示。

圖2 全連接及非全連接BP 神經網絡結構Fig.2 Structures of fully and non-fully connected BP neural networks
根據第1.1 節中的假設4)可知,xn對結果的影響相互獨立,那么隱藏層的任一節點僅能受到其中一個xn的輸入影響,即任意2 個xn的值無法傳遞到相同的神經節點中,由此可以保證xn對隱藏層節點的影響相互獨立。因此,刪除圖2(a)中大部分影響xn相互獨立性的連接,構造新的非全連接神經網絡,如圖2(b)所示。非全連接神經網絡可以重新定義為在時間段Ti內,將各類型POI 分別對客流量的影響值求和,即為站點的總客流量,如下所示:
在非全連接神經網絡中,pn為單個類型的POI對客流量的影響值,僅與xn、Ti有關,定義為輸出1,意義為:在Ti時刻,有pn個乘客在該站點上車(或下車)的目標為第n類POI,即僅受xn的影響。綜合所有的輸出1,即為站點的實際客流量,定義為輸出2。從xn和Ti到pn可看作雙輸入、單輸出的子神經網絡,n個子神經網絡的組合構成完整結構。因此,子神經網絡之間除了相同的Ti外,并無任何關聯,是一種非全連接形式。特別注意,由于子神經網絡的輸出pn具有實際意義,POI 對客流量的影響值不可能為負數,因此需要在神經網絡的訓練中對該限制條件加以考慮。
子神經網絡的隱藏層節點數量依據需求而定。每類POI 在不同時間段內對客流量的影響效果可能并不相同,為了擬合出復雜的時域變化曲線,理論上隱藏層節點數量越多越好,但訓練效率也會越來越低。綜合考慮,本文將隱藏層節點數量設置為8。
非全連接神經網絡簡化了輸入層和隱藏層之間的關系,理論上更容易收斂到全局最小值。
值得注意的是,圖2(b)所示的子神經網絡相結合的結構與特征子空間的集成學習模型(集成法)比較類似,即任意一類POI 特征與時間特征可視為原始特征集的子集之一,生成n個相互獨立的特征子空間分別構建不同的學習器,并在最后一步集成輸出結果。針對這兩類模型的區別說明如下:
1)集成法通常需要學習每一類特征子空間到理想輸出結果的映射關系(如x1、Ti與y的關系),并將各學習器的輸出結果加權(權重需要學習),得到最終輸出;本文方法中子神經網絡的輸出可視為分別受各類POI 影響客流量的真實數值,因此,只需要將所有真實數值簡單相加即為實際客流量。
2)集成法的加權過程需要確定各學習器的權重。但在實際中,針對不同的輸入,各學習器的權重應是不同的。當然,這種需要動態調整的權重可以通過另建一個學習器解決,該學習器用于訓練輸入和權重的關系,或者采用堆疊、混合的方式融合各學習器,這些方法均無疑增加了工作量。
3)本文模型是一個結構緊湊的整體,各子神經網絡的訓練是同步且統一的,單個子神經網絡的訓練完成意味著模型整體的訓練完成,同時,集成法的學習器訓練是相對獨立的,各學習器的訓練時間及效果難以統一。
根據圖2(b)可知,神經網絡的輸入為x=(Ti,x1,x2,…,xn)T,期望輸出為q,實際輸出為y,參數均經歸一化處理,其中輸出向量的每個參數表示固定的時間段內站點的上(下)車人數。神經網絡僅在第1 個隱藏層采用Sigmoid 激活函數。
2.3.1 正向傳遞
在圖2(b)所示的神經網絡中,第1 個隱藏層的輸入用矩陣表示如式(5)所示。為了方便神經網絡的隨機權重生成以及權重迭代,將權重矩陣ω1表示成Hadamard 乘積模式(用符號“?”表示,下同),如式(6)所示。
定義L1為輸入層到第1 個隱藏層的連接矩陣,表示神經網絡的連接方式(全連接方式的連接矩陣元素全部為1)。
第1 個隱藏層的輸出經過Sigmoid 變換,增加了非線性因素:
第2 個隱藏層的輸出并未采用激活函數,輸入即輸出:p=O2=I2。利用式(4)對隱藏層的輸出相加后便得到實際輸出。
2.3.2 誤差反饋
在神經網絡訓練過程中,誤差修正的方式與傳統BP 神經網絡類似。根據網絡的期望輸出和實際輸出,輸出層誤差函數為:
由于子神經網絡的輸出被限定為非負數,因此需要設定第2 個隱藏層的誤差函數。做以下假設:第2 個隱藏層輸出pn若為正數,則不存在誤差;若為負數,則該層虛擬輸出為0,那么誤差值為-pn。因此,第2 個隱藏層輸出的誤差函數為:
根據鏈式法則,由最終輸出誤差導致的誤差向量分別為:
其中:δo,3~δo,1分別表示由Eo導致的輸出層、第2 個隱藏層和第1 個隱藏層的誤差向量。同理,由第2 個隱藏層的輸出誤差導致的誤差向量分別為:
其中:δho,2~δho,1分別表示由Eho導致的第2 個隱藏層和第1 個隱藏層的誤差向量,輸出層不受該誤差影響。在此基礎上,可以求得各個參數梯度變化:
其中:A1和A2分別表示滿足等式的單位列向量。
通過上述過程,將每個參數梯度乘以適當的學習率η即可獲得每一步需要更新的參數大小。為了加速網絡學習過程,η可采用動態學習率[24]。在訓練過程中,第1 個隱藏層的節點數較多,是計算資源消耗的主要因素。縮減該層節點數量可以明顯加快訓練速度,但同時會損失一定的擬合精度。
實驗主要針對模型做擬合(或預測)準確度測試,檢測任意站點每個時間段的期望值與實際值的差距。對重慶市近3 300 個公交站點的數據隨機劃分為訓練集和測試集2 個部分,其中,訓練集為2 500 個站點,其余的為測試集。各站點周邊的POI數據經過式(2)及第2.1 節的方法量化處理后作為該站點POI 輸入數據。由于單個站點的日客流量被劃分為18 個時間段分別統計,訓練集輸出數據有2 500×18=45 000 組,測試集類同。對神經網絡的各項參數隨機在[-1,1]的范圍內賦值初始化,經過100 萬次迭代訓練(或均方差小于設定閾值)后停止迭代。
根據表3 的研究類別,用4 個相同結構的神經網絡分別訓練每一類樣本,因此,共包含4 組結果,各組之間的訓練集、測試集分別獨立。
現實中,客流量始終處于一個浮動狀態,期望輸出q也僅代表平均客流水平,并非準確值。就車輛調度和線路優化工作而言,站點單向客流量浮動數為10 人/h,不會對公交的調度工作產生較大影響,實際意義基本相同。因此,采用實際輸出與期望輸出間的殘差人數作為模型檢驗標準:
其中:為 第i個樣本 的殘差 值;qi為期望輸出;yi為實際輸出。
以工作日的上車客流量為例,將所有的樣本殘差降序排列,如圖3 所示,可以看出,僅有極小部分殘差值偏離較大。總體概率分布如圖4 所示,可以看出,訓練集和測試集的δ*近似高斯分布,均值處于零值附近,略小于零值,測試集的預測方差略大于訓練集。

圖4 總體概率分布Fig.4 Overall probability distribution
將樣本按照時間段劃分,統計各時間段樣本殘差的概率密度,如圖5 所示。結果顯示:在一天時間段內,早班車與末班車的客流預測偏差較為集中,多集中在零值附近,說明該時間段內的乘客預測基本不存在誤差;早晚高峰期的預測偏差較為分散,這2 個時間段也是預測可能出現較大誤差的時間段。誤差的主要來源為乘客數量的波動性提升,原始數據表明,部分客流量較大的站點每一天同時間段內的客流量有較大區別,單位時間段內的客流量波動范圍可達到100 人次以上,這種不確定性也為模型預測帶來了較大難度。其余時間段內預測偏差分布較為均衡,均小于高峰期預測偏差。

圖5 殘差時域概率密度分布Fig.5 Residual time domain probability density distribution
同時采用其他典型常用的回歸模型,分別做相關實驗進行對比測試,包括該模型對應的全連接神經網絡模型[見 圖2(a)]、決策樹、SVM回歸、AdaBoost 以及多項式回歸模型。輸入及輸出參數均與該模型相同,取工作日的上車客流量做分析,經多次測試后,取每種模型的最優解,對比實驗結果如表5 所示。

表5 各類模型測試結果對比 Table 5 Comparison of each model testing results
取其中部分典型模型,對日均客流量的變化趨勢進行擬合測試。隨機抽取若干測試集的站點,將一天內每小時的實際客流量與不同模型的預測客流量進行對比。這里以工作日數據為例,隨機抽取3 組站點的對比結果如圖6 所示,樣本包含了客流量從稀疏到密集的情況。

圖6 站點日客流量變化預測值對比Fig.6 Comparison of predicted values of daily station’s ridership
從實際客流量與預測客流量的變化趨勢對比中可以看出各預測模型的擬合效果。結果表明:
1)全連接神經網絡的訓練集和測試集預測誤差均比較大,在長時間訓練后依舊無法擬合實際結果,尤其是無法擬合客流隨時間的變化趨勢。主要原因在于引入了大量的非必須的連接,并且輸入的高維變量中,僅有一維是時間變量,其余為POI 變量,因此在誤差反饋中,各個節點的誤差傳遞相互交錯,在數據集不夠充分的情況下,難以準確訓練出其中關于時間的有效信息。
2)決策樹回歸可以快速收斂至(局部)最優解,但是由于過擬合現象嚴重,導致測試集的預測誤差較大,并且同樣難以擬合客流隨時間的變化趨勢。
3)SVM 回歸的訓練集擬合精度略高于非全連接神經網絡,但是過擬合現象在所有模型中最嚴重,因此測試集擬合精度大幅下降。
4)AdaBoost 回歸的預測精度與非全連接神經網絡較為接近,其日客流量變化的預測趨勢也與實際客流量較為符合。但是該模型獲得最優解需要經過多次嘗試,主要原因在于弱分類器的選擇以及數量會較大影響預測精確度。因此,該模型訓練時間過長是主要弊端,其中弱分類器的訓練是時間消耗的主要因素。
5)多項式回歸方案經測試并不適用于該研究,因為各類POI 變量與時間變量之間具有高度相關性,并且數據較為復雜、維度較高、非線性特征明顯,因此難以構建合適的多項式并獲得有效解。
由上述實驗結果,進行以下分析與討論:
1)綜合比較下,非全連接神經網絡具有結構簡潔、訓練方便的優點,隨機設定初始值后,多數情況下均可以快速收斂至相同的最優解,并且模型基本擬合出了站點每天客流量的變化趨勢,同時體現了每天客流量平、高峰期的狀態。
2)根據表4、圖3 與圖4 的結果可以看出,有個別站點的預測誤差過大。經過對原始數據的分析,這類站點多為中心城區的樞紐站點。在這些站點中,除了POI 分布,其他人為或歷史等因素[25]對客流量影響較其他站點更為突出。
3)圖6 的趨勢變化曲線反映了站點每日的上下車規律基本是對稱的,即早高峰上車客流量的趨勢與晚高峰下車客流量趨勢基本相同,且峰值一定。由于城市規劃中人口活動較大的區域主要為住宅用地以及商業用地,上車客流量的高峰值出現在早高峰的站點附近的POI 類型以住宅區為主,并且該類站點在晚高峰期間會出現下車高峰值,寫字樓附近的站點則與之相反。
4)對比實驗說明非全連接神經網絡針對類似的問題是非常有效的,它是基于所研究問題的特殊性,對全連接神經網絡的一種精簡,使訓練時間及準確性均可以獲得一個較優解。但是這種神經網絡的構建模式具有一定的局限性,即主要針對高維的數據輸入,并且輸入數據之間存在相互獨立或近似相互獨立的情況(在本文研究中,POI 對客流量的影響相互獨立)。若輸入數據的關聯性較高,則這種非全連接神經網絡可能無法訓練出最優解,甚至得到錯誤解。因此,針對不同的回歸問題,需要具體分析該模型的適用性。
5)關于圖2 中子神經網絡的隱藏層節點數量選擇:在本文研究中,若采用m個隱藏層節點,其本質為用m個不同參數的Sigmoid 曲線疊加構成新的函數曲線,數量越多,可以構成的曲線種類越多,復雜度越高。由于子神經網絡需要擬合xn、Ti和pn的函數關系,pn關于xn和Ti的關系越復雜,所需要的隱藏層節點數量將越多。實際情況表明:當Ti一定時,pn關于xn的關系基本呈現單調上升(或下降)的,只需較少的節點即可大致擬合;當xn一定時,pn關于Ti有明顯的“M”曲線關系(即早晚高峰人數多、平峰人數少),若需要擬合該函數關系,則需要較多的隱藏層節點。因此,決定隱藏層節點數量的參數主要在于pn與Ti的關系。本文選擇的隱藏層節點數量8 為綜合性能、擬合效果等各因素經多次測試后確定。
本文改進傳統的BP 神經網絡全連接思想,根據各項研究參數的相關性,設計一種非全連接的神經網絡進行模型訓練,該神經網絡可降低訓練難度,減少訓練過程的計算量,提升訓練速度,并易收斂至全局最優解,降低獲得局部最優解的概率。同時,提出一種連接矩陣,輔助實現神經網絡的非全連接形式,便于誤差傳遞過程的優化設計。在此基礎上,通過賦予神經網絡部分隱藏層實際意義,并根據實際狀況對其進行約束限制,豐富誤差傳遞模式,增加神經網絡的可解釋性,使得結果更加符合現實規律,從而實現在任意POI 分布下預測站點各時間段的上車(或下車)客流量,以利于對于新公交站點的位置選擇。本文模型對高維非關聯性數據有優良的效果,但對關聯性強的數據效果可能不佳。由于影響客流量的不只有POI 因素,因此將在逐步添加其他次要因素(如天氣因素等),增強模型仿真效果,并且將通過與其他模型的結合(如作為弱分類器融合進AdaBoost 中),獲得更好的預測效果。