周青 張青松
1.昆明醫(yī)科大學海源學院;2.云南師范大學實驗中學
本文明確了客流量預測在整個公交運力配置流程中的關(guān)鍵作用。客流量的準確預測是公交資源優(yōu)化配置的依據(jù)和前提。本文給出了基于Elman神經(jīng)網(wǎng)絡(luò)的公交客流量預測流程。最后,通過數(shù)據(jù)搜集,利用某城市近8年的客流量數(shù)據(jù)進行了實例預測。最后通過與當前較流行的BP靜態(tài)神經(jīng)網(wǎng)絡(luò)比較,發(fā)現(xiàn)Elman神經(jīng)網(wǎng)絡(luò)整體上比BP神經(jīng)網(wǎng)絡(luò)具有較高的預測精度。
客流量的預測是進行公交運力配置的基礎(chǔ)和依據(jù)。但是,由于客流量的時間和空間復雜性,數(shù)據(jù)量之大,準確度量很難真正實現(xiàn)。客流量在不斷地發(fā)生變化,在不同的時間和不同的空間上均有變化,但是這種變化還是有一定的規(guī)律可循的。掌握了公交客流的變化規(guī)律,對于組織公交運輸、優(yōu)化公交運力資源具有極其重要的意義。
城市公交客流指公眾為實現(xiàn)某項出行活動,借助特定的交通工具,在城市道路上有目的地流動而形成的人流。依據(jù)乘客乘車的目的地指向區(qū)別,公交的客流可分為上班工作流和其他客流。位于市區(qū)的乘客,客流量整體上較郊區(qū)大,時間規(guī)律性較強,高峰時間明顯,平均乘車間距較短,換成交替頻繁;公交客流量是動態(tài)變化的,難以準確計算。但是客流量的準確預測,對公交站點、線路的設(shè)定和發(fā)車頻率等有著決定性的影響。
公交客流量的分布主要呈現(xiàn)出時間特征和空間特征,時間上分為高峰期和平峰期,高峰期的客流量主要為上下班客流,人員多,時間比較集中,規(guī)律性比較強;通常存在幾個高峰時段:早上班高峰,晚下班高峰,節(jié)假日高峰,學校附近上下學高峰等。平峰期,主要呈現(xiàn)出客流分散,時間不集中,規(guī)律性不明顯。空間分布特征也主要體現(xiàn)在客流密集地帶和分散地帶。密集地帶主要分布在學校、客運站和居民區(qū)附近等,分散地帶客流量比較少無規(guī)律性,密集地帶,人員量大,時間規(guī)律性強。對于規(guī)律性以外的客流量具體來分,客流量還具有以下空間特點:
1.2.1 線路網(wǎng)上的客流動態(tài)
線路網(wǎng)上的客流動態(tài),是指對整個城市而言,是個宏觀的概念,是指某一時刻,城市公交線路的某一截面上的客流量的動態(tài)變化,沒有公交線路、停靠站點和流動方向的區(qū)別,總體體現(xiàn)了整個城市公交線路網(wǎng)上客流量的特征。
1.2.2 方向上的客流動態(tài)
某條線路乘客在流動方向上的變化狀態(tài)即方向上的客流動態(tài)。公共交通每條線路都有上、下之分,在同一時間間隔內(nèi)上下行客流經(jīng)常是不平衡的,有的線路差異甚至巨大,根據(jù)客流方向可以分為單行和雙行兩種類型。
分析客流動態(tài),利于確定公交調(diào)度形式,組織車輛運行,編制行車時刻表都有至關(guān)重要的意義。
針對客流量的預測,我們國家已有很多研究,最常見的預測方法主要有兩種:四階段預測法和直接預測模型法。但是,這些模型牽涉的相關(guān)因素多、結(jié)構(gòu)復雜,求解難度大,因而在實際的應用過程中有很大的局限性。因此,有很多學者開始轉(zhuǎn)向神經(jīng)網(wǎng)絡(luò)方面的研究和實驗。
神經(jīng)網(wǎng)絡(luò)是一門交叉學科,是機器學習研究的重要分支。它通過模范學習動物神經(jīng)網(wǎng)絡(luò)的行為特征,對信息進行類似仿生處理的數(shù)學方法。神經(jīng)網(wǎng)絡(luò)通過調(diào)整系統(tǒng)內(nèi)部節(jié)點之間相互關(guān)系,實現(xiàn)信息處理的目的。由于公交客流量的特殊性,隨著時間不斷變化的特點,很難用確定的函數(shù)或方程來描述。因此,在對客流量進行預測的過程中,本文引入了神經(jīng)網(wǎng)絡(luò)的相關(guān)原理。
Elman神經(jīng)網(wǎng)絡(luò)的概念最早是由J. L. Elman于1990年首次提出來的,它是一種典型的局部回歸型網(wǎng)絡(luò)(Global Feed Forward Local Recurrent)。因此,我們可以將Elman神經(jīng)網(wǎng)絡(luò)看作是一個具有局部記憶單元和反饋連接的遞歸神經(jīng)網(wǎng)絡(luò)。在神經(jīng)網(wǎng)絡(luò)的預測模型中,有兩種常用理論:BP網(wǎng)絡(luò)和Elman網(wǎng)絡(luò)。而BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓練的多層前饋神經(jīng)網(wǎng)絡(luò)。其原理本質(zhì)上是將動態(tài)的時間建模轉(zhuǎn)化為靜態(tài)的空間建模。而本文中關(guān)于公交客流量的預測,公交客流量具有動態(tài)性時空變化的特點,使用BP網(wǎng)絡(luò)建模必然會出現(xiàn)許多問題。因此本文引入了帶有反饋的動態(tài)神經(jīng)網(wǎng)絡(luò),Elman型神經(jīng)網(wǎng)絡(luò)由于其自身的特殊性,在解決預測問題上也有更高的準確性和科學性。
公交客流預測是一個復雜的過程。在對客流量進行預測時,首先要對公交線路客流現(xiàn)狀的調(diào)查,通過各種形式的數(shù)據(jù)調(diào)查,可以得到公交線上的乘客分布規(guī)律以及各站點一天客流分布規(guī)律、公交車的滿載率等指標,為公交線路運力的合理配置提供依據(jù)。我國城市公交基礎(chǔ)設(shè)施普遍落后,而公交出行乘客眾多,客流調(diào)查難度大,調(diào)查數(shù)據(jù)容易出現(xiàn)偏差。因此,數(shù)據(jù)修正的步驟必不可少。通過數(shù)據(jù)修正,對客流量進行初步的預測。根據(jù)預測結(jié)果,進行試運營,具體數(shù)據(jù)根據(jù)實際的運營狀況再次進行調(diào)整。因此整個運營線路的客流預測是線路運力配置優(yōu)化的關(guān)鍵。具體的流程如圖1所示。

圖1 基于時空變化的公交線路客流分布預測流程Fig.1 Passenger flow distribution prediction process of bus lines based on temporal and spatial changes
(1)首先,根據(jù)線路的現(xiàn)有運營情況,確定是否要優(yōu)化公交站點?
如果需要,就要從站點的具體客流情況做分析調(diào)研。這里主要是對線路站點的服務(wù)面積分析,在此基礎(chǔ)上結(jié)合以往歷史數(shù)據(jù)(已有站點)或者類似站點的經(jīng)驗數(shù)據(jù)(新增站點),生成該站點的客流量預估數(shù)值。同時,做本站點的客流量OD調(diào)查,調(diào)查內(nèi)容主要涉及乘客起止點分布、出行目的、出行方式、出行時間、出行距離、出行次數(shù)等,以此對站點預測數(shù)據(jù)做出修正。對于最終得到的預測數(shù)據(jù),作為新線路客流量預測的初值,在實際運營過程中,根據(jù)后期的實際統(tǒng)計數(shù)據(jù),再做最終的修正。
(2)如果不需要開辟新線路,就直接對該條線路做全日客流量的預測。根據(jù)線路上站點的地理位置、人群結(jié)構(gòu)等分布,針對站點的兩種不同的類似度有以下兩種處理方式。
1)如果線路上的若干個站點類似度較高,則采用首末站分層不等概率抽樣,根據(jù)調(diào)查數(shù)據(jù),做出客流時段分布預測,并以此對其他站點的客流量做出分布推算。
2)如果線路上的站點類似度較低,則采用聚類分析的方法對站點進行處理。首先,聚類分析代表站點的客流量情況,并做出預測。然后,再針對層內(nèi)站點客流量做出時段分布推算。
(3)這些通過模型預測得到的數(shù)據(jù),必須在實際的公交運用過程中,根據(jù)用戶的乘車體驗和公交公司的綜合效益等指標再做出數(shù)據(jù)修正。
這里采用Matlab軟件完成數(shù)據(jù)處理,通過網(wǎng)絡(luò)訓練和預測數(shù)據(jù)的時間序列轉(zhuǎn)換,需要對原始數(shù)據(jù)進行歸一化處理。函數(shù)如下:

為了提高精度,通常設(shè)置輸入輸出數(shù)據(jù)的范圍在0.2~0.8之間。經(jīng)過這樣的處理,利于樣本數(shù)據(jù)的快速訓練,生成預測數(shù)據(jù)。下文中的實驗數(shù)據(jù)處理過程也是采用這種數(shù)據(jù)精度的。
為了更好地比較Elman神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)的差異,我們通過數(shù)據(jù)搜集,取某城市某一個固定站點近8年的公交線路客流量數(shù)據(jù)如表1所示,進行實例化模型分析。

表1 2013—2020年某城市公交客流量Tab.1 Bus passenger flow of a city from 2013 to 2020
該城市2013—2020某一固定站點8年的客流量數(shù)據(jù),每個數(shù)據(jù)分別對應一個時間函數(shù)x
(i
)。通過MATLAB仿真模擬,得到的模擬值和模擬誤差率如表2所示。
表2 Elman和BP模擬值及誤差率Tab.2 Elman and BP simulation values and error rate
從表2中數(shù)據(jù)可以看到,Elman模擬比起B(yǎng)P模擬,平均誤差為-0.66%,而BP模擬的誤差率達到2.15%,從8年的實例數(shù)據(jù)仿真可以看出,Elman神經(jīng)網(wǎng)絡(luò)比BP神經(jīng)網(wǎng)絡(luò)具有更高的模擬精度。因此,現(xiàn)實的客流預測中采用Elman神經(jīng)網(wǎng)絡(luò)來進行,會有更高的現(xiàn)實擬合度,更加精確和科學。
但是,神經(jīng)網(wǎng)絡(luò)預測體系只是保證了預測過程的相對準確度,要想真正得到精確的數(shù)據(jù),需要與其他先進技術(shù)相結(jié)合,如視頻圖像處理、模式識別、傳感器等,保證采集到第一手準確的現(xiàn)實數(shù)據(jù)。只有做到了這些,才能保證得到較準確的客流量數(shù)據(jù)。
本文首先分析公交客流量的時空分布的復雜性和規(guī)律性,然后結(jié)合現(xiàn)有的優(yōu)秀的算法對客流量的預測流程進行了建模。最后,利用某城市近8年的某一固定站點的客流量數(shù)據(jù)進行了實例預測,通過比較,發(fā)現(xiàn)Elman神經(jīng)網(wǎng)絡(luò)比BP神經(jīng)網(wǎng)絡(luò)具有較高的預測精度。在實際的使用過程中,數(shù)據(jù)的采集和數(shù)據(jù)的修正也直接關(guān)系著后續(xù)優(yōu)化工作的開展效率。因此,有待于先進科技的不斷融入,只有準確采集了當前的客流量數(shù)據(jù),對整個公交運力配置的過程推進才會產(chǎn)生真正的意義。