999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ARIMA的公交行程時間預測研究

2024-05-29 18:48:25閻瑜婷
交通科技與管理 2024年9期

收稿日期:2024-03-11

作者簡介:閻瑜婷(1999—),女,碩士研究生,研究方向:公交優先。

摘要 文章在小汽車產業迅速發展、私家車保有量逐年增加、交通問題突出的背景下,通過研究預測公交車在站點間的運行時間,為出行者決策以及公交的運營管理提供數據基礎,進而提高公共交通的分擔率,緩解存在的交通問題。首先,對數據做預處理和可視化操作,利用單位根檢驗和白噪聲檢驗數據的可用性;其次,確定模型階數并建立模型,用自相關和偏自相關函數,通過殘差檢驗模型證明了模型的可用性;最后,將建好的模型用以預測西海岸東1路公交車從卓亭廣場站到崇明島路小學站的行程時間。

關鍵詞 時間序列;ARIMA模型;公交GPS數據;行程時間

中圖分類號 U491.17文獻標識碼 A文章編號 2096-8949(2024)09-0011-04

0 引言

隨著經濟的發展,私人小汽車的數量快速增長,造成了許多問題。不僅是交通擁擠,隨之而來的還有交通污染、交通事故頻繁、公路秩序混亂等一些嚴重的問題。公共交通能夠很大程度地解決上述存在的問題,大幅節約能耗,是解決擁堵、污染、秩序混亂等問題的有力支撐。但公交車沿確定路線行駛,路上實時的車輛行駛狀態影響公交車到站時間,進而影響出行者乘車體驗。如果能夠進一步提高公交服務質量和水平,此舉對發展公共交通有重要作用。

2002年,周雪梅等[1]對公交車的行駛特點進行了分析,建立了公交車輛行程時間的預測模型,并且獲得了相關模型的預測結果。2007年,陳巳康等[2]通過車載GPS設備獲取了公交車運行的實時數據,并且建立了公交道路網模型,預測了公交車的到站時間。2014年,胡繼華等[3]通過分析大量公交GPS數據,構造了馬爾科夫狀態轉移矩陣。2015年,Kumar B A等[4]采用基于模型的卡爾曼濾波算法對公交出行時間進行了預測。2016年,Amita J等[5]建立了一種基于人工神經網絡(ANN)的GPS數據預測公交出行時間的模型。2017年,黃明芳、鄭娜英[6]對影響公交車行程時間的動靜態影響因素進行了綜合性分析,構建了RBF-BP協作神經網絡的預測公交車行程時間的模型。

1 ARIMA模型

ARIMA模型是自回歸移動平均模型,用于對時間序列進行建模和預測。模型包含三個部分:自回歸(AR)、差分(I)和移動平均(MA)。AR表示自回歸,即當前觀測值與之前若干個觀測值之間的線性關系。I表示差分,用于將非平穩時間序列轉化為平穩時間序列,使得序列的均值和方差在不同時間點上保持不變。MA表示移動平均,即當前觀測值與之前若干個隨機誤差項之間的線性關系。ARIMA模型記作ARIMA(p, d, q),其中p是自回歸項數,q是滑動平均項數,d是差分次數。差分是ARIMA模型中的關鍵步驟,通過對非平穩時間序列進行差分,可以將其轉化為平穩的時間序列,使得可以應用ARIMA模型進行建模和預測。

2 實例分析

選取青島市開發區東1路公交線路,始發站為啤酒城公交站、終點站為黃島輪渡公交站,總里程為22.6 km,途經站點41站。東1路途經青島理工大學、青島職業技術學院、青島濱海學院等大學以及卓亭廣場住宅區和中心醫院、崇明島路小學等流量聚集處,這些區域在出行高峰期給周圍交通帶來極大壓力。該文研究從卓亭廣場住宅區到崇明島路小學在不同時間段公交車的運行時間,并做出預測,為周圍出行者的出行決策以及換乘提供宏觀的信息支撐。

2.1 數據說明

對青島市西海岸新區公交車GPS數據進行初步處理,去掉經緯度以及GPS速度列,數據內容包括線路號、站點、車站號、運營類型、GPS產生時間、瞬時速度、車牌號等,原數據共有452 461條,線路包含65條線路,從中篩選出東1路數據27 495條,再將站點、運營類型、到站和離站進行篩選后,得到東1路經過卓亭廣場站點,且為下行離站的數據共186條,同理得到東1路經過崇明島路小學站點,且為下行到站的數據有190條。

上述得出的數據存在一定問題:由于數據受到車載設備以及傳輸情況的影響,導致行駛線路一致,到達站點的車輛數不一致的現象,對應車牌號出現缺失;并且還存在重復數據,可能由于在短時間內公交車重復進站,GPS重復采集了數據;當不同車牌號公交車同時刻在相同站點發車,但運行時間不一致時,同一時刻就會對應多個運行時間。為避免對預測造成影響,不對缺失的車輛牌信息進行補充,對缺失行進行整行刪除,同樣刪除重復信息,實現一個發車時刻對應一個運行時間,采取求平均值的方法將數據實現一一對應。最后根據車牌號對應原則,將卓亭廣場下行離站時間和崇明島路小學車站下行到站時間進行相減,得出站間運行時間,將提取的到站時間和運行時間兩列數據作為預測研究的對象,具體見表1所示。

2.2 模型建立

模型建立過程中用到的Python庫有:NumPy、Pandas、Matplotlib、Seaborn、Statsmodels等。其中,NumPy提供了大量的數學函數庫可以進行復雜的數組運算;Pandas是基于NumPy工作,對于處理大數據有很好的效果,并且包含很多的數據結構,如DataFrame、Series等;Seaborn是Python的可視化庫,通過可視化庫理解并展示數據,其與Matplotlib主要不同是Seaborn的色彩搭配更鮮明、繪圖風格更優美;Statsmodels可以擬合多種統計模型,可以進行數據探索、統計測試以及可視化,Statsmodels中的模型可用于時間序列分析,以及對模型進行評估。

2.2.1 數據處理

將上述經過篩選的數據導入,用Matplotlib將處理的數據進行成圖展示,如圖1所示,可以直觀地看出不同時段公交車行程時間的變化。由圖1可見,在7:00和17:00左右,公交車的行程時間比平峰時期長2~3 min,這是受到早晚高峰車流的影響。

圖1 站間運行時間圖

2.2.2 ADF檢驗和白噪聲檢驗

進行平穩性檢驗,再根據檢驗結果確定是否需要進行差分。平穩性檢驗采取單位根檢驗(ADF)的方法,看序列是否存在單位根。如果不存在單位根那么序列平穩就不需要進行差分;如果存在單位根序列,那么序列不平穩則需要進一步確定差分階數。經過檢驗得到ADF的結果為0.112 47,由于大于0.05所以序列不平穩需要進行差分。為了使時間序列平穩,需要對序列在一階差分的基礎上進行二階差分(如圖2所示)。由圖2可以看出,時序圖圍繞常數進行波動,一階差分基本滿足平穩性,可使序列平穩。

圖2 差分結果圖

ADF檢驗后需要進行白噪聲檢驗,也叫純隨機性檢驗。白噪聲序列相互之間沒有關聯,是無法預測的歷史數據且無法影響未來的數值,所以要進行預測就需要保證序列具有規律性,通過程序計算出統計量為3.03754254e-7,由于小于0.05所以序列不是白噪聲,可以繼續預測。

2.2.3 時間序列定階

ACF和PACF定階,用Matplotlib中的subplot函數畫出ACF圖和PACF圖。如圖3所示為ACF圖,橫坐標為滯后階數,縱坐標為ACF值,可以看出圖3中的1階后震蕩衰減趨于零。如圖4所示為PACF圖,橫軸為滯后階數,縱軸為PACF值,圖4中的1階后震蕩衰減趨于零。根據表2所示的定階原則,確定出p=1、q=1。

圖3 ACF圖

圖4 PACF圖

表2 定階原則表

模型 ACF PACF

AR(p) 衰減趨于零

(幾何型或震蕩型) p階后截尾

MA(q) q階后截尾 衰減趨于零

(幾何型或震蕩型)

ARMA(p,q) q階后衰減趨于零

(幾何型或震蕩型) p階后衰減趨于零

(幾何型或震蕩型)

3 模型評估

通過殘差檢驗對建立的模型進行評估,殘差是模型擬合值和觀測值之間的差值。好的模型殘差為正態分布,方差固定,均值為0,沒有自相關性。通過將殘差的數據表現成圖,檢驗其相關性,如圖5所示,縱坐標為殘差,橫坐標為樣本數,隨著樣本數的增加,殘差不會顯示任何明顯的季節性,均值接近0。圖6所示為殘差QQ圖,QQ圖的計算原理是將數據由小到大排列,并按1到n進行標號,計算分位數。計算公式為:

(i?0.5)/n (1)

式中,i——第i個數據的標號。

橫軸為正態分布的理論分位數,縱軸為殘差的分位數,做y=x的直線,QQ圖趨近落在y=x直線上,說明兩分布相似。上述檢驗都說明建立的模型近似正態分布,滿足要求。

圖5 標準化殘差圖

圖6 殘差QQ圖

4 模型預測

建立的模型確定了階數,并且對其進行了評估,充分證明了模型的可用性,最后就可以用確定的模型進行預測。對處理后的公交車輛站間運行時間的歷史數據進行劃分,并利用所建立的模型進行預測,如圖7所示為預測結果。橫坐標為樣本數,縱坐標為運行時間,藍色實線為歷史數據、紅色虛線為預測的行程時間。從圖7中可以看出,預測部分的誤差在2 min以內,表明該模型在預測公交運行時間上的可行性,通過增加數據量,可以預測出任意兩站點之間在不同時段的運行時間。

5 結語

該文闡述了公交站間行程時間的研究方法,分析了相關模型原理。并且基于ARIMA模型,對西海岸新區公交車GPS數據進行了處理,選出所用線路、站點的數據,對數進行預處理。以東1路卓亭廣場站至崇明島路小學站的下行路線為例,建立模型并進行預測,其間使用了Python語言進行處理數據、展示數據、可視化、模型建立,以及檢驗過程用到了很多的Python庫,如Numpy、Pandas、Matplotlib、Statsmodels等。構建ARIMA模型時,首先可視化展示數據并對數據初步觀察,對數據進行平穩性和白噪聲檢驗,使用ACF、PACF定階,再通過殘差檢驗模型,用Matplotlib展示殘差的QQ圖,最后通過檢驗后,劃分訓練集和測試集,得出模型的預測值。

參考文獻

[1]周雪梅, 楊曉光, 王磊, 等. 公交車輛行程時間預測方法研究[J]. 交通與計算機, 2002(6): 12-14.

[2]陳巳康, 詹成初, 陳良貴. 基于路段行程時間的公交到站預測方法[J]. 計算機工程, 2007(21): 281-282.

[3]胡繼華, 李國源, 程智鋒. 基于馬爾科夫鏈的公交站間行程時間預測算法[J]. 交通信息與安全, 2014(2): 17-22.

[4]Kumar B A, Mothukuri S, Vanajakshi L, et al. Analytical approach to identify the optimum inputs for a bus travel time prediction method[J]. Transportation Research Record, 2015(1): 25-34.

[5]Amita J, Jain S S, Garg P K. Prediction of bus travel time using ANN: a case study in Delhi[J]. Transportation Research Procedia, 2016(17): 263-272.

[6]黃明芳, 鄭娜英. 基于RBF-BP協作神經網絡的公交行程時間預測[J]. 閩江學院學報, 2017(5): 100-107.

主站蜘蛛池模板: 国产日本欧美在线观看| 久热中文字幕在线| 亚洲av片在线免费观看| 国产成人精彩在线视频50| 美女一级毛片无遮挡内谢| 区国产精品搜索视频| 亚洲天堂首页| 99青青青精品视频在线| 亚洲A∨无码精品午夜在线观看| 国产真实乱人视频| 五月激情婷婷综合| 四虎成人在线视频| 97青草最新免费精品视频| 精品撒尿视频一区二区三区| 婷婷色一二三区波多野衣| 亚洲人成在线精品| 亚洲第一极品精品无码| 婷婷色中文| 国产欧美日韩在线在线不卡视频| 制服丝袜一区二区三区在线| 少妇极品熟妇人妻专区视频| 久久天天躁夜夜躁狠狠| 国产永久无码观看在线| 欧美啪啪网| 国产无码精品在线| 国产乱人伦精品一区二区| 亚洲乱码在线视频| 在线观看av永久| 99在线视频网站| 国产91无码福利在线| 国产精品大白天新婚身材| 永久免费精品视频| 久久99热66这里只有精品一| 伦伦影院精品一区| 成年人福利视频| 2018日日摸夜夜添狠狠躁| 成人一区在线| 91精品人妻一区二区| 欧美亚洲一区二区三区导航| 日韩无码精品人妻| 亚洲va在线∨a天堂va欧美va| 欧美一级特黄aaaaaa在线看片| 国模视频一区二区| 在线一级毛片| 露脸一二三区国语对白| 日韩毛片在线视频| 久久这里只有精品免费| 午夜福利视频一区| 亚洲综合一区国产精品| 欧美日韩午夜| 国产波多野结衣中文在线播放| 中国一级特黄大片在线观看| 亚洲欧洲日韩国产综合在线二区| 国产高清又黄又嫩的免费视频网站| 国内毛片视频| 亚洲区第一页| 98超碰在线观看| 国产福利一区二区在线观看| 午夜a级毛片| 日本国产在线| 亚洲av日韩综合一区尤物| 日韩视频精品在线| 97国产成人无码精品久久久| 国产成人91精品| 99久久国产综合精品2020| 精品国产一区91在线| 四虎永久免费在线| 国产成人一区二区| 日本一区高清| 成人无码区免费视频网站蜜臀| 四虎影视8848永久精品| 国产精品流白浆在线观看| 久久免费观看视频| 欧美成人a∨视频免费观看 | 97亚洲色综久久精品| 欧美97欧美综合色伦图 | 91精品国产91久久久久久三级| 91娇喘视频| 成年人国产网站| 国产91精品调教在线播放| 亚洲精品成人福利在线电影| 婷五月综合|