文/葉佳樂
基于阻滯增長模型的軌交客流預測模型
文/葉佳樂
由于軌道交通客流部分線路在實際開通后,客流的增長速度與預期并不匹配,而通過線路已經有的客流數據進行長期的跟蹤預測將極大的改善新線路客流預測的準確度,而對于已經開通一段時間的線路,通過客流增長的規律獲得高精度的客流預測也將更好的為線路運營節省運能成本。本文介紹了采用LOGISTIC(阻滯增長)模型來分析預測上海軌道交通的客流的一種方法。
客流預測 阻滯增長 客流增長
上海軌道交通現已有12條線路(1~11、13號線)、接近300座車站、日均客流1000萬人次以上。
預計到2020年,上海軌道交通將建成18條線路、總運營里程1051公里、587座車站,每天預測客流仍會持續增長。
軌交的客流研究,不僅僅要對已有的客流數據進行分析,更要對將會出現的客流增長的情況進行預測。由于軌道交通客流部分線路在實際開通后,客流的增長速度與預期并不匹配,而通過線路已經有的客流數據進行長期的跟蹤預測將極大的改善新線路客流預測的準確度,而對于已經開通一段時間的線路,通過客流增長的規律獲得高精度的客流預測也將更好的為線路運營節省運能成本。
LOGISTIC(阻滯增長)模型是一種約束隨著對象本身數量的增加而增加的規律,有著廣泛的應用。常用在天然環境下生物種群數量的變化,傳染病在封閉地區的傳播,耐用消費器在有限市場上的銷售等等,阻滯增長模型最典型的應用就是對一個限定區域內的人口數量的變化預測,比如上海市人口數量預測等。
軌道交通客流的增長與城市人口增長情況相似,運能和自然條件等情況也會影響客流增長,并且隨著客流總量的增加,客流增長的阻滯作用也越大。
因此,初步選擇采用LOGISTIC(阻滯增長)模型來分析預測上海軌道交通的客流。
假設客流為 x,時間為 t。
在實際環境中,線路的客流會有一個最大值M(比如一號線的極限運能為每日500萬客流,每日客流無法超過這個數值);當x遠離M時,增長近似指數增長,x增長的越來越快;當x越接近M時,增長會越來越慢。
由上述假設,建立公式,當x遠離M時,增長近似指數增長。
表述公式:dx/dt=rx(r為指數)
由于當x越接近M時,增長會越來越慢,修正上述公式。
表述公式如下:dx/dt=r(x)x, x(0)=x0
設定r(x)是x的線性函數:

當x遠小于M時,sx≈ 0, r(x)≈r

圖1
當x接近M時,sx≈r, r(x)≈0
經過上述修正: r(x)=r(1-x/M)
將上述模型公式整理后得到如下公式:

以上公式中有2個參數需要確定:r和M
這2個參數的確定,可以通過線路的既有數據,使用數學軟件工具進行曲線擬合。該方法在既有數據性質良好的情況下,擬合的參數具有很好的延續性和可信度。
接著對計算出的模型參數,針對每條線路的實際運能等情況進行驗證,如果發現參數不合理,就對數據進行檢測,查看是否有部分數據失真,并剔除這一部分數據,再次進行曲線擬合。
在確定了以上2個參數后,通過測算客流函數在接下來幾個時間步長中的值,就可以得到相應的客流預測值。在得到預測值的過程中,有如下幾個要素:
函數是光滑的曲線,根據歷史數據統計和LOGISTIC模型的特性,只要客流未達到阻滯點,客流不會出現下降趨勢;
較短的時間跨度內,客流的實際變化情況是會出現波動的。并不完全依賴于阻滯增長的三個條件;
經驗判斷只是剔除失真數據的手段,所有得到的客流預測數據來源還是曲線擬合;
因此根據以上要素,得到的客流預測,只是某個時間段的平均客流情況。反應的是線路在不考慮天氣因素、節日因素、人工因素等條件下的自然增長情況。
模擬采用MATLAB軟件來進行以上2個參數的確定和曲線擬合。
在通過MATLAB確定了模型參數以后,就能夠得到每條線路相對的客流增長率函數。當需要進行客流預測時,將時間參數,帶入客流增長率函數中,就可以很容易的算出接下來的客流預測值。
以下為對8號線的模型預測情況:


以上為MATLAB代碼,圖1藍色框內為已有數據擬合情況,紅色框內為預測部分。
軌道交通的實際客流情況是:每月的日均客流穩步增長,但是每周的客流呈現完整的周期性,變化周期為7天,因此可以通過logistic模型確定一個每周客流的變化情況,即以一周為一個步點單位進行曲線擬合,得到每周的客流X。
接著可以為這個客流添加一個周期性參數
則周一到周日的客流可表述為:

這樣,就能較為準確的預測出指定日的客流。
阻滯增長模型能夠較好的擬合客流增長的數據,并且將不同數據組所依賴的初始參數設定為線路開通初始的客流增長速率和線路的最大客流值。
該模型也有一定的缺陷。由于它主要表現的是數據的一個增長趨勢,因此選用的是基于指數函數的增長率公式。這就導致了它不能準確敏感的反映短期客流的周期性的特征,比如使用該模型做每日的客流預測,則函數本身在曲線擬合的時候,客流在工作日和雙休日的一些通勤客流出行特點反而成為曲線擬合的干擾函數。
由于背景數據的局限性和對于客流理解深度的局限性,目前客流預測模型還不能完全的做到非常精細的對于所有影響客流的情況都進行估算。
很多情況下,客流情況會比模型更為復雜,這是由于多種因素的疊加效應并不能簡單的用系數相乘來計算。
因此,可通過對于模型的修正,把每日客流細化分解,將各種不同類型的乘客按比例分解并分別設定相應的影響因素的系數,通過將一個客流自變量分解成為多種客流組合而成的多個自變量來細化整個預測模型,并且利用多元線性回歸分析對指定日客流進行預測,這將會提高預測的準確性。
作者單位 上海地鐵第二運營有限公司 上海市 200120
葉佳樂(1984-),男,上海市人。大學本科學歷?,F為上海地鐵第二運營有限公司設施設備部職員。研究方向位信息化運營管理。