999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習長短期記憶網絡結構的地鐵站短時客流量預測*

2018-11-17 05:34:38魏子健王思達陳賴謹
城市軌道交通研究 2018年11期
關鍵詞:影響模型

李 梅 李 靜 魏子健 王思達 陳賴謹

(北京交通大學經濟管理學院,100044,北京//第一作者,碩士研究生)

隨著城市信息化水平的日漸提高,公共交通IC卡的頻繁使用產生了海量數據。如何充分利用大數據資產對交通客流規律進行精細化研究成為新的熱點。客流量預測是地鐵營運規劃和安全防護應用過程中需要解決的一個關鍵技術問題。應用大數據技術,準確預測地鐵站短時客流量,可為地鐵管理部門在擁擠環境下的人流疏導與安全防范工作提供科學支持,進一步提升城市應急準備和管理水平。

客流預測是指在t時刻對下一決策時刻t+Δt乃至以后若干時刻的客流作出實時預測。一般認為,t到t+Δt之間的預測時間跨度不超過15 min(甚至小于5 min)的預測為短時客流預測。目前,國內外涉及客流量預測的算法主要分為兩類,一類是線性估計模型,主要有自回歸移動平均模型(ARlMA)[1]、多元線性回歸模型[2]、卡爾曼濾波模型[3]等;另一類是機器學習的方法,如支持向量機、神經網絡[4]、深度學習[5]等。線性估計模型有一些不可避免的缺陷:一是不能很好地解決非線性問題以及行人流存在的隨機和不確定性等問題;二是不能準確地進行短時客流量的預測。而機器學習算法中所考慮因素仍然較少,預測精度有待進一步提升。

在現實環境中,客流量與天氣條件密切關聯,天氣條件會直接影響人們的出行選擇。文獻[6]基于歷史數據和天氣數據對天安門廣場每日的客流量進行了預測。文獻[7]利用傳遞函數模型研究了短期天氣條件對英國出境流的影響,指出平均氣溫、熱浪、氣霜和日照天數對出境流的影響最大。文獻[8]探討了天氣對公交客流的影響。

深度學習中,LSTM(長短期記憶)網絡算法對具有長期依賴性的大規模時序數據有著良好的學習效果。本文基于2016年3月上海軌道交通刷卡數據,結合外部天氣數據,綜合考慮影響地鐵站客流的內外部因素,提取了包括天氣數據在內的12個顯著影響因子。在此基礎上,以上海軌道交通莘莊站為例,提出了一種基于深度學習LSTM模型的地鐵站短時客流量預測方法。

1 數據集與預處理

1.1 數據預處理

試驗數據采用2016年SODA上海開放數據創新應用大賽所提供的上海軌道交通刷卡數據以及從國家氣象科學數據共享服務平臺獲取的天氣數據。該數據集包含2016年3月1日至3月31日上海軌道交通刷卡數據以及2016年3月天氣數據,總量約為2.4億條。

上海軌道交通莘莊站是5號線、1號線的起始站交匯處,人流相對密集,便于研究。因此,本文選擇莘莊站進行客流量數據分析。通過對上海軌道交通刷卡原始數據分析可得,2016年3月莘莊站有進出站客流的時間段為05:00到23:40。為充分利用歷史客流量數據,并進一步擴大數據量,按照15 min的時間間隔對2016年3月莘莊站的進出站客流量進行統計,一天共有75個時間段,所以31天共有2 325段數據。然后將天氣數據同樣按照15 min時間間隔進行整理,并與客流量數據匹配。

1.2 顯著影響因子提取

1.2.1 Pearson相關分析法

很多因素都會對地鐵站客流量產生影響,如天氣等外部因素以及歷史客流量等內部因素。為了提取客流量的顯著影響因子,本文采用Pearson相關分析法來檢驗客流量與各因素之間的關系。Pearson相關系數法是檢驗變量間相關程度的一種有效方法,其計算式為:

(1)

式中:

Xi——客流量;

sX——客流量的方差;

Yi——客流量的影響因素;

sY——影響因素的方差;

r的取值范圍在-1到1之間,如果r<0,表示兩個變量負相關;如果r>0,表示兩個變量正相關。|r|的取值越大,變量之間的相關性越強。

1.2.2 外部影響因子

天氣、溫度、濕度等外部因素會對人們的出行產生一定的影響,一般來說,對外出購物、旅游等人群產生的影響較大,對通勤人員的影響較小。客流量與其外部影響因子的相關系數表如表1所示。每個影響因子與客流量的Pearson相關系數值都在95%的置信區間內。

表1 客流量與其顯著影響因子的Pearson相關系數表

1.2.3 內部影響因子

(1) 歷史客流量數據:當前時刻的客流量不僅受到外部因素的影響,還受到歷史客流量數據等內部因素的影響。為了充分利用歷史數據,將預測點前3個時間段(15 min為一個時間段)的數據也作為客流量的影響因子,預測點客流量數據與3個歷史客流量數據的相關系數見表1。其中,Pearson相關系數的值都在99%的置信區間內。

(2) 工作日與非工作日:工作日與非工作日相比,人群出行規律、出行人群特征均不同,人流高峰時段與人流密集程度也不同,從而使得客流量數據在工作日與非工作日呈現不同的特征。圖1為2016年3月莘莊站每天進出站客流量,可以看出,工作日與非工作日對客流量的影響非常顯著。因此,本文選取“是否工作日”作為影響地鐵站客流量的一個內部影響因子。其中,1代表工作日,0代表非工作日。

圖1 2016年3月莘莊站每天進出站客流量

(3) 高峰時段與非高峰時段: 地鐵站客流量在早晚高峰時段會顯著增多,圖2為2016年3月7日至13日(從星期一到星期日)莘莊站每天分時段的客流量趨勢圖(隨機選取2016年3月任一周,客流波動趨勢是相同的)。可以看出,星期六、星期日客流量波動較為平緩,與星期一到星期五相比,無顯著高峰時段。因此,將高峰時段作為影響客流量的一個顯著影響因子。其中,1代表高峰時段,0代表非高峰時段。

圖2 2016年3月7日至3月13日客流量

1.2.4 小結

綜上所述,提取了12個變量作為客流量的顯著影響因子。表2列出了本案例研究中使用的所有顯著影響因子。

2 基于LSTM網絡的地鐵站短時客流量預測模型的建立

2.1 LSTM網絡

與傳統的預測方法相比,深度學習的方法能夠更好地對大規模數據進行處理,且具有良好的學習能力和模型泛化能力。遞歸神經網絡(RNN)在現有神經網絡的基礎上引入了時序的概念,使得上一刻的輸出能夠對這一刻的輸入產生直接影響,特別適合學習具有長期依賴性的時序數據[9]。圖3為一個基本的RNN結構。由于RNN增加了跨越時間點的自連接隱含層,所以能夠實現對時間的顯式建模。從圖3中可以看出,當前時刻的隱藏層會有一條連向下一時刻隱藏層的邊。

表2 影響上海軌道交通莘莊站客流量的顯著影響因子

圖3 RNN模型結構

傳統的RNN模型有很多缺陷,容易產生梯度爆炸或梯度消失的情況[10]。所以,引入了一種特殊的RNN——LSTM網絡。LSTM網絡是一種經過改進的RNN,具有很多優良特性,可以在很大程度上避免梯度消失的問題。同時,LSTM網絡可以學習時間序列長短期依賴信息,由于LSTM網絡中包含時間記憶單元,因此,其在處理和預測具有較長間隔和延遲事件的時間序列方面,應用效果顯著[11]。LSTM網絡在RNN的隱含層神經元節點中增加了一個存儲記憶門(Memory gate),可以保存重要記憶,使得神經網絡“不只記住前一刻”。從RNN結構轉變到LSTM網絡結構的過程如圖4所示。具體就是,LSTM網絡在RNN的每一個神經元內部增加了三種門,即忘記門(Forget Gate)ft、輸入門(Input Gate)it、輸出門(Output Gate)Ot。

圖4 從RNN到LSTM網絡的結構轉變

忘記門確定應該被神經元遺忘的信息。忘記門會讀取上一時刻隱含層的狀態ht-1,以及當前時刻的輸入xt,最后將輸出的值賦值給Ct-1。該輸出值在[0,1]之間,0的含義是“完全丟棄”,1的含義是“完全保留”。其計算式為:

ft=σ(Wf·[ht-1,xt]+bf)

(2)

輸入門確定保存哪些新信息到Cell狀態中。輸入門包括兩個模塊,一是利用sigmoid層確定要輸入的值,二是利用tanh層確定一個新的候選值向量,然后將該向量添加到新的Cell狀態Ct中。計算式為:

it=σ(Wi·[ht-1,xt]+bi)

(3)

對神經元狀態的新貢獻為:

(4)

(5)

輸出門確定要輸出的值。該輸出以當前時刻的Cell狀態為基礎,還需通過濾波器對其進行過濾。①通過sigmoid函數來確定Cell狀態中需要被輸出的部分;②利用tanh層對Cell狀態進行處理(其目的是使輸出值在[-1,1]之間);③乘以sigmoid門的輸出,以此來確定最終的輸出。具體計算式為:

ot=σ(Wo·[ht-1,xt]+bo)

(6)

ht=ot·tanh(Ct)

(7)

式(2)~(7)中,W表示對應的權重,b表示對應的偏執項,σ表示sigmoid函數,tanh表示雙曲正切激活函數。

2.2 基于LSTM的地鐵站短時客流量預測模型

本文構建了一個三層的LSTM模型來預測地鐵站短時客流量,模型整體框架如圖5所示。其包括輸入層、隱含層、輸出層、模型訓練以及模型預測5個功能模塊。輸入層是一個全連接層,通過對樣本數據進行初步處理,以滿足LSTM的輸入要求;隱含層是由多個LSTM神經元構成的遞歸神經網絡;輸出層是將隱含層的多個實際結果重新通過一個全連接網絡映射成模型期望的結果;模擬訓練是在訓練過程中采用優化器對模型進行優化,其是一個實現了Adam算法的優化器;模擬預測是將得到的預測結果可視化。

圖5 基于LSTM的地鐵站客流量預測模型整體框架

3 應用分析

3.1 基于LSTM的地鐵站短時客流量預測

首先,分別定義獲取訓練集與獲取測試集的函數,訓練集與測試集個數比為4∶1,并將訓練集與測試集的數據標準化。其次,定義神經網絡變量,即輸入層和輸出層的權重、偏執。最后,根據建立的LSTM地鐵站客流量預測模型,確定輸入與輸出數據維度。模型采用AdamOptimizer優化器進行優化,經過反復試驗,模型的參數learning rate=0.01、batch_size=2 325、timesteps=32、訓練次數為10 000時,模型的預測效果最好。預測結果如圖6所示。

圖6 LSTM模型預測結果

3.2 對比模型分析

3.2.1 基于多元線性回歸的地鐵站客流量預測

多元線性回歸(MLR)是一種廣泛應用于預測任務的多因素分析方法。MLR用于多因素預測分析的模型可表示為y=a0+a1x1+a2x2+…+an-1·xn-1+anxn+ε。其中,y為預測值;x1,x2,…,xn代表不同的影響因素;a1,a2,…,an代表與每個xi(i=0,…,n)對應的回歸系數;a0和ε分別代表偏置項和誤差項。本文利用MLR模型對地鐵站客流量進行預測,結果如圖7所示。

圖7 MLR模型預測結果

3.2.2 基于BP神經網絡的地鐵站客流量預測

BP神經網絡是一種前反饋性質的網絡,又被稱為反向傳播神經網絡。BP神經網絡的應用很廣泛,且對非線性系統具備很強的模擬能力。其主要原理是:通過對訓練數據的不斷學習,對網絡的權值和閾值進行不斷更新,使得網絡誤差逐漸減小,從而逐漸接近期望輸出。本文利用BP神經網絡模型對地鐵站客流量進行預測,結果如圖8所示。

圖8 BP神經網絡模型預測結果

3.3 模型誤差分析及比較

為了更好地分析比較不同參數設置下LSTM網絡、MLR及BP神經網絡三種模型在地鐵站客流量預測中的預測效果,本文計算了兩種常見的誤差評價指標:均方根誤差(RMSE)與平均絕對百分比誤差(MAPE)。計算式分別為:

(8)

(9)

不同參數設置下的LSTM網絡模型的預測結果分析如表3所示。由表3可知,LSTM模型參數learning rate=0.01、batch_size=2 325、timesteps=32、訓練次數為10 000時,模型精度最好。由于batch是對下降的方向進行確定,且本文的樣本數據量有限,故利用全數據集進行學習,即batch_size的值為2 325(樣本總數),模型效果較好。這是因為樣本總體可以由全數據集所確定的方向更好地表示出來,使得確定的極值所在方向更加地準確。

表3 不同參數設置下的LSTM網絡模型預測結果分析

timesteps的大小表示RNN可利用的時間序列的長度。從表3可知,LSTM模型的精度在timesteps=128時,反而比timesteps=32時更低,且耗費時間更長。說明過高的timesteps不僅會增加模型收斂時間、提高模型訓練難度,而且有可能降低模型精度。同樣,過高或過低的learning rate也會導致模型過擬合或欠擬合的問題,從而影響模型精度。

最優參數設置下LSTM網絡、MLR及BP神經網絡三種模型的預測結果分析如表4所示。

表4 LSTM網絡、MLR及BP神經網絡預測結果分析

4 結語

本文提出了一種基于深度學習LSTM模型的地鐵站短時客流量預測方法,解決了MLR等傳統線性模型和BP神經網絡等機器學習的方法不能有效從原始數據中提取有效特征而造成的模型有效性低的問題,驗證了LSTM模型在地鐵站客流量預測中的準確性,以及在該領域中的適用性,同時,拓展了深度學習方法的應用領域。在目前研究工作的基礎上,后續研究可進一步擴展隱藏層層數來建立更有效的地鐵站客流量預測模型,并運用到不同地區、不同地鐵站的客流量預測中。

猜你喜歡
影響模型
一半模型
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
沒錯,痛經有時也會影響懷孕
媽媽寶寶(2017年3期)2017-02-21 01:22:28
3D打印中的模型分割與打包
擴鏈劑聯用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
基于Simulink的跟蹤干擾對跳頻通信的影響
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产18在线| 2021最新国产精品网站| 亚洲高清无在码在线无弹窗| 依依成人精品无v国产| 不卡色老大久久综合网| 免费无码网站| 亚欧成人无码AV在线播放| 美女一级免费毛片| 99视频在线精品免费观看6| 凹凸精品免费精品视频| 视频在线观看一区二区| 美女免费精品高清毛片在线视| 亚洲欧美色中文字幕| 免费观看欧美性一级| 欧美日韩91| 日本一区二区三区精品视频| 亚洲人成网站观看在线观看| 欧美成人综合在线| 国产 日韩 欧美 第二页| 久久夜夜视频| 久久一级电影| 四虎国产精品永久一区| 亚洲中文字幕日产无码2021| 中文字幕色在线| 人妻夜夜爽天天爽| 亚洲国产理论片在线播放| 欧美黑人欧美精品刺激| 97在线观看视频免费| 成人免费黄色小视频| 波多野结衣的av一区二区三区| 国产美女丝袜高潮| 噜噜噜综合亚洲| 999精品视频在线| 亚洲精品无码人妻无码| 日韩在线中文| 日韩av在线直播| 99视频全部免费| 欧美一区二区福利视频| 久久久久免费看成人影片 | 国产一级精品毛片基地| 97色婷婷成人综合在线观看| 久久这里只有精品国产99| 性色一区| 国产又黄又硬又粗| 久久无码免费束人妻| 欧美一区福利| 国产无码制服丝袜| 91精品啪在线观看国产91九色| 午夜爽爽视频| 亚洲第一视频免费在线| 国产爽妇精品| 亚洲日韩国产精品综合在线观看 | 国产天天射| 一级福利视频| 一区二区三区四区在线| 特级做a爰片毛片免费69| 国产精品视频久| 国模粉嫩小泬视频在线观看| 亚洲一区毛片| 亚洲人成网站色7777| 日韩性网站| 全午夜免费一级毛片| 日本精品αv中文字幕| 国产高清毛片| 国产区在线看| 国产精品天干天干在线观看 | 亚洲综合狠狠| 国产成人凹凸视频在线| 中文国产成人久久精品小说| 成人看片欧美一区二区| 九色视频一区| 一本大道无码日韩精品影视| 亚洲欧美国产五月天综合| 毛片免费高清免费| 国产无码高清视频不卡| 欧美翘臀一区二区三区| 亚洲成人手机在线| 丝袜无码一区二区三区| 55夜色66夜色国产精品视频| 国产欧美日韩va| 热久久国产| 免费观看无遮挡www的小视频|