徐皓
(合肥職業(yè)技術(shù)學(xué)院,安徽 合肥 230000)
城市軌道交通客流對地鐵實際運(yùn)營過程中的策略決策有重大影響。現(xiàn)階段,國內(nèi)各地鐵公司雖有各種大客流的應(yīng)急預(yù)案,但都有明顯的滯后性。所以,近年來,國內(nèi)各大城市都對地鐵客流的預(yù)測展開了研究。其中,杭州地鐵借助阿里云平臺,由達(dá)摩院牽頭,開展了一次“天池全球城市計算AI挑戰(zhàn)賽-地鐵客流量預(yù)測 大賽,用于甄選出適合杭州地鐵的客流預(yù)測模型,為后來的運(yùn)營管理提供數(shù)據(jù)支撐,可見客流預(yù)測越來越被人們所重視。
常見的時間序列有平穩(wěn)非平穩(wěn)之分。其中,前者是序列的統(tǒng)計特征[均值E(Xt)、協(xié)方差Cov(Xt,Xs)、相關(guān)性不隨時間變化而變化。非平穩(wěn)時間序列,統(tǒng)計特征隨著時間的變化而變化。
判斷其是平穩(wěn)還是非平穩(wěn)序列,常用如下:(1)利用散點圖進(jìn)行平穩(wěn)性檢驗;(2)利用樣本自相關(guān)函數(shù)進(jìn)行平穩(wěn)性判斷;(3)單位根檢驗等檢驗方法,此處選用最簡單的曲線圖來直觀判定,實際效果見圖1。

圖1
對于平穩(wěn)非白噪聲序列,它的均值和方差是常數(shù)。ARMA模型適用于此種序列。
對于非平穩(wěn)序列,由于統(tǒng)計特征不穩(wěn)定,首先轉(zhuǎn)化成平穩(wěn)序列,然后分析,常用ARIMA 模型。
(1)AR(自回歸模型):用變量歷史數(shù)據(jù)對未來預(yù)測,該模型必須滿足平穩(wěn)性的要求。
如 果{εt} 為 白 噪 聲, 服 從N(0,σ2),a0,a1,...,ap(ap≠0) 為實數(shù),就稱p 階差分方程:

是一個p 階自回歸模型,簡稱AR(p)模型。自回歸方法的優(yōu)點是所需資料不多,可用自身變數(shù)數(shù)列來進(jìn)行預(yù)測。但是這種方法受到一定的限制:如果自相關(guān)系數(shù)(R)小于0.5,預(yù)測結(jié)果偏離較大,不適用此類模型。
(2)MA(移動平均模型):如果一個單變量時序數(shù)據(jù){yt;t=1,2,...},滿足如下關(guān)系,則定義為MA 函數(shù)

(3)ARIMA(p,d,q)差分自回歸移動平均模型。AR 的含義為 自回歸 ,p 參數(shù)表示自回歸項數(shù);I 表示差分的含義,d 為差分次數(shù)(階數(shù));MA 為 滑動平均 ,q 為滑動平均項數(shù)。

其中,L 是滯后算子(Lag operator)。
本次使用ARIMA 模型對客流量進(jìn)行預(yù)測。一般情況下,城市軌道交通的客流量數(shù)據(jù){at}是非平穩(wěn)的,需要進(jìn)行差分轉(zhuǎn)化。
將記為差分算子,那么,有:

statsmodels 庫提供適合ARIMA 模型的功能。可以使用statsmodels 庫創(chuàng)建ARIMA 模型,如下所示:
通過調(diào)用ARIMA()并傳入p,d 和q 參數(shù)來定義模型。通過調(diào)用fit()函數(shù)在訓(xùn)練數(shù)據(jù)上準(zhǔn)備模型。可以通過調(diào)用predict()函數(shù)并指定要預(yù)測的時間或索引的時間索引來進(jìn)行預(yù)測。我們將ARIMA 模型與整個Shampoo Sales 數(shù)據(jù)集相匹配,并檢查殘差。
我們可以使用ARIMAResults 對象上的predict()函數(shù)進(jìn)行預(yù)測。如果我們在訓(xùn)練數(shù)據(jù)集中使用前150 個觀測值來擬合模型,那么,用于進(jìn)行預(yù)測的下一個時間步驟的索引將被指定給預(yù)測函數(shù),如start=1,end=150。這將返回一個包含預(yù)測的一個元素的數(shù)組。如果我們執(zhí)行任何差分(在配置模型時d>0),我們也希望預(yù)測值在原始比例中。這可以通過將typ 參數(shù)設(shè)置為’levels’值來指定:typ=’levels’。我們可以將訓(xùn)練數(shù)據(jù)集拆分為訓(xùn)練集和測試集,使用訓(xùn)練集來擬合模型,并為測試集上的每個元素生成預(yù)測。考慮到差異的先前時間步長和AR 模型的觀察依賴性,需要滾動預(yù)測。執(zhí)行此滾動預(yù)測的一種粗略方法是在收到每個新觀察后重新創(chuàng)建ARIMA 模型。
最終的預(yù)測結(jié)果如圖2。

圖2