999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于K-LSTM-ecm模型的城市軌道交通短時客流預測

2022-05-26 13:00:44王金鋒孫連英
制造業自動化 2022年5期
關鍵詞:模型

王金鋒,孫連英,張 天,涂 帥

(1.北京聯合大學 城市軌道交通與物流學院,北京 100101;2.北京聯合大學 智慧城市學院,北京 100101)

0 引言

我國正在經歷世界歷史上規模最大、速度最快的城鎮化進程,隨之也帶來了新的問題,日益加劇的交通擁堵和環境污染困擾著人們。軌道交通作為準時、大運量的出行方式是解決城市交通問題的重要手段[1]。因城市軌道交通系統客流具有明顯的時效性,成為人們出行主要手段,也造成高峰時刻客流量過飽和的問題,影響城軌交通運營安全可靠性。如何采取有效的方式對客流量過大造成的隱患進行有預見性的運營規劃和安全防護,關鍵技術在客流預測[2],通過挖掘客流特征實現城市軌道交通客流短時預測,可以為制定更加準確科學的運營方案以及提高運營服務水平提供有效的解決途徑。

應用于城市軌道交通客流預測的模型主要包括計量模型以及人工智能模型。常見的計量模型如:卡爾曼濾波(Kalman)模型[3]、自回歸滑動平均模型(Autoregressive Moving Average Model,ARMA)[4]。回歸模型對于刻畫中長期客流的變化趨勢有良好的效果,然而對數據中出現的隨機變化敏感度不足,難以精準進行隨機性較高的短時客流預測。而應用支持向量回歸模型(Support Vector Regression,SVR)[5]、神經網絡(Back Propagation,BP)[6]等人工智能模型對客流數據擬合程度更高,通過自身學習能力以及自適應能力可以更好捕捉非線性規律從而提升預測精度,但對描述輸入與輸出之間聯系的能力有限,參數的訓練過程也相對較慢。其中,中長短期記憶網絡(Long Short-Term Memory,LSTM)[7]在處理時序性數據的時間特征時有很好的效果,能夠處理長間隔跨度數據有效信息消失的問題。但單一使用LSTM進行短時客流預測仍存在一定的局限性。因此,本文構建了K-means聚類、LSTM以及誤差修正模型(ErrorCorrection Model,ecm)結合的K-LSTM-ecm的城市軌道交通短時客流預測模型。

1 K-LSTM-ecm模型構造

1.1 K-LSTM-ecm模型

本文以LSTM模型作為主模型,在此基礎上增加K-means聚類以及誤差模型構建城市軌道交通短時客流預測模型。LSTM模型首次發表于1997年,其獨特的設計結構適用于處理時間序列性數據,對預測時間序列中的長間隔和延遲有很好的處理效果,LSTM模型在預測問題上的表現優于時間遞歸神經網絡(RNN)以及馬爾科夫模型(HMM)。作為非線性模型,LSTM模型適用于預測客流數據這種非線性數據[8]。本文提出的K-LSTM-ecm模型通過以下流程實現城市軌道交通短時客流預測。

1)基于客流數據的短時間隨機性、長期周期性以及同類型臨近站點的空間客流分布,構建前d天q個歷史客流數據的數據集合,利用LSTM模型對時序性數據的敏感性,對預測目標站點及其同類型相鄰站點的時間、空間關系進行提取。

2)探究預測目標站點及其同區域相鄰站點工作日、非工作日(節假日、周末)客流特點,以單個時段客流數據作為樣本點,采用K-means算法進行聚類分析生成聚類標簽,將最終聚類后的數據作為主模型的輸入數據。

3)將第一次LSTM模型輸出的y-pre作為ecm模型輸入,對y-pre進行協整分析,以發掘第一次預測值與真實值之間的協整關系,并構成誤差修正項建立ecm模型。將誤差反饋到LSTM模型,最終實現城市軌道交通短時客流預測。K-LSTM-ecm模型框架如圖1所示。

圖1 K-LSTM-ecm模型框架

1.2 輸入數據構造

城市軌道交通在網絡化運營條件下,不同區域站點有不同的客流特點,可分為居住密集型、崗位密集型、混合型和樞紐型4類[9],同類型臨近站點之間的客流分布相互影響。城市軌道交通網絡化運營導致了客流不僅受本站歷史時段客流量的影響,還會受相鄰站點客流分布的影響,因此構建輸入數據時不僅要考慮預測目標站點的歷史客流數據時間特征,還要考慮同類型區域相鄰站點客流的空間分布特征,以達到更好描述目標站點客流特點的效果,從而提升預測精度。

將目標站點定位為N(1<N,n=1,2,3,…,N),用XNT,t表示目標站點T天第t時刻的客流量,由于同類型臨近站點客流特點具有相似性,輸入數據按空間位置關系將相關站點表示為XN-nT,t。對于N站點的T天第t時段的客流預測來講,由于客流具有連續性,輸入的客流數據應考慮其前q個時段的客流量以及前d天的連續性客流量,故模型輸入數據集如式(1)表示:

1.3 工作日與非工作日聚類分析

城市軌道交通作為市民的出行首選交通方式,其客流分布與市民的出行模式相關,不同車站所處位置在一定程度上能反映其客流規律,如:在居住密集型區域地鐵站,受乘客們的出行目的影響,工作日與非工作日(節假日、周末)的客流時段分布差異較大。工作日期間,絕大多數乘客都是通勤乘客。客流潮汐式分布十分明顯,表現在高峰時期客流量巨大,早高峰時段進站乘客數量遠多于出站乘客數量,晚高峰與之相反。客流在工作日期間分布具有顯著的突峰特征,早高峰客流出現峰值。

非工作日期間,乘客出行目的區別于工作日,會出現一定商務客流、出行客流等,因而客流分布與工作日有所區別。節假日和周末客流無工作日的潮汐式分布,全天各時段進站乘客數量較為均衡,無明顯低谷,一般呈全峰型分布。同時,節假日和周末的客流分布具有相似性。

為進一步量化工作日和非工作日單日客流量之間的相似性,本文選取Pearson相關系數對于客流數據進行相關性分析,其能夠精準地表達數據之間的數量關系,從而達到定量分析和比較。結果如表1所示。

表1 工作日和周末客流相關性分析

圖2 工作日進站客流分布

圖3 節假日與周末進站客流分布對比

表2 周末和節假日客流相關性分析

由上表,周一至周五單日客流之間均呈強相關性,周六和周日客流數據之間同樣呈強相關性,而工作日數據和周末數據呈中相關性,究其原因,周末的客流組成區別于工作日的客流,客流隨機性更強,故導致該結果;周末和節假日數據之間呈強相關性,但其系數表現上與其他強相關數據比略低。

通過上述相關性分析結論,工作日期間單日客流量相似性極強,非工作日同工作日一樣,為進一步提升短時客流預測精度,本文采用K-means聚類算法對客流數據進行聚類并生成聚類標簽。K-means聚類的無監督分類方法可以無監督地探索客流數據的內部結構特征,將具有較強相似性的數據劃分為相似的數據集。因此,本文采用K-means聚類算法將采集到的客流數據劃分為工作日和節假日聚類集,不同類別間數據相似度越小越好。相似的通過樣本之間的距離表示,兩個樣本之間距離越小,說明樣本之間相似度越高,反之,說明相似度越小。對于樣本之間距離的計算通常通過歐式距離計算二維空間,高維度空間多采用馬氏距離和曼哈頓距離等。歐式距離計算公式如下:

K-means聚類算法基本計算思想:

首先對有n個數據點的數據集從n個數據點中隨機選取k個點作為初始聚類中心,再通過歐氏距離計算對靠近各聚類中心的數據進行分類,采用迭代的方式,在上述過程中不斷更新聚類中心點,直至整體達到穩定的狀態,獲得聚類中心C。

K-means聚類算法計算基本步驟:

1)輸入一個數據集,確定聚類中心數目k;

2)在數據集中隨意生成k個初始聚類中心;

3)計算聚類中心點與其他數據點的距離,取距離最小值;

4)計算同一聚類中所有對象的均值并加以統計,將計算結果更新替換為新的聚類中心;

5)重復上述步驟,直至結果穩定,聚類中心不再變化,輸出。

1.4 LSTM模型

LSTM模型在RNN結構基礎上,添加了各層的閥門節點。LSTM結構如圖4所示,其結構由遺忘閥門(forget gate),輸入閥門(input gate)、輸出閥門(output gate)以及細胞狀態組成。

圖4 LSTM神經元結構

這些閥門可以打開或關閉,用于判斷模型網絡的記憶態(之前網絡的狀態)在該層輸出的結果是否達到閾值,從而加入到當前該層的計算中,閥門節點利用Sigmoid函數將網絡的記憶態作為輸入計算;如果輸出結果達到閾值則將該閥門輸出與當前層的的計算結果相乘作為下一層的輸入;如果沒有達到閾值則將該輸出結果遺忘掉。每一層包括閥門節點的權重都會在每一次模型反向傳播訓練過程中更新。具體計算過程如式(3)~式(8)所示:

其中,W表示輸入向量與輸入閥門、輸出閥門等之間相對性的權向量,b為偏置變量。

1.5 ecm模型

誤差修正模型(ecm)是1978年由Davidson等提出的表示變量之間的一種長期均衡關系的模型,這種均衡關系可能會在短期內出現波動或者偏離這種均衡關系[10]。該模型通過對誤差的修正,可以使變量重返均衡狀態。不僅考慮到了短期波動,還兼顧長期趨勢影響,對于城市軌道交通客流預測模型有良好的修正效果,其表達式如式(9)所示。

其中,λ1、λ2為各變量差分項的系數,反映了模型短期的動態變化;φ為修正系數,也稱調整速度,通常為負值;ecmt-1為誤差修正項;c為模型的常數項。

2 案例分析或實證分析

2.1 實證數據

本文以北京地鐵回龍觀站為預測目標站點,該站位于北京市大型社區回龍觀地區的核心位置,是典型的居住密集型區域地鐵站,日常客流潮汐現象明顯且客流量巨大,并呈現非線性特征。本文選取北京地鐵AFC客流數據作為K-LSTM-ecm模型的輸入數據集。選取4:00到第二日00:30作為預測時段,進行數據預處理,除去重復值與異常值。選取15min為一個間隔,每日84個統計時段,以便于指導站點實際運營管理以及緊急情況預警。

3.5 金屬蛋白酶結構域10(ADAM10) 去整合素和ADAM10是APP剪切的主要α分泌酶,能阻止Aβ產生[27]。ADAM10過表達能預防淀粉樣病變和提高長時程增強作用及學習記憶功能[28]。ADAM10中罕見的編碼變體與晚發家族AD相關。沒有關于ADAM10與自噬和AD相關的報道,但最近一則報道指出在內皮細胞中ADAM10可以被自噬調節,反過來調節小鼠對內皮ADAM10相關疾病狀態的敏感性[29]。因此,有可能ADAM10在神經元和神經膠質細胞也可以被自噬調節。神經元和膠質細胞ADAM10的自噬調節及AD相關的ADAM10變體對自噬的影響需要在將來的研究中得到闡明。

依據地鐵站所處區域屬性相同,客流分布相似的特點,選取同區域鄰近地鐵站霍營站和龍澤站。為直觀地分析所選三個站點的客流分布規律,隨機選取一天三個站點的進站客流進行對比,如圖5所示。

圖5 同類型區域站點全天客流對邊圖(節假日、工作日)

可以看出,所選三個同區域相鄰站點工作日出站客流分布曲線整體相似性強,由于回龍觀站所處于居住密集型區域,主要客流為通勤客流,進站客流量分布呈現早高峰時段(8∶00-10∶00)客流激增的情況,而晚高峰時段(5∶00-21∶00)并未出現客流激增的特點,客流峰值出現在8∶30-8∶45時段;節假日客流相比工作日客流分布較為均衡,在19∶00-19∶15時段三站出站客流均呈平緩上升趨勢。故選取地鐵龍澤站、回龍觀站以及霍營站的客流數據為模型輸入數據集。

2.2 時段選擇選擇

預測規定站點的客流量受前q個相鄰時段客流數據影響,不同q值會影響預測精度,為確認合理q值,本文根據地鐵站客流分布規律、客流的周期性以及每日運營時段數設計實驗,分別選擇q=5、10、15、20,以回龍觀站歷史客流數據為訓練數據集,最大訓練迭代次數為10進行試驗,以標準差(RMSE)作為判斷依據。q值取5、10、15、20時模型標準差如表3所示。

表3 q取不同值的標準差

由實驗得出結論,當q值取10時,標準差最小,因此工作日預測結果較為精準。也就說明對預測當前時段客流量,前5個時段客流量與預測時段客流量聯系緊密;而非工作日的客流分布波動相對平緩,標準差值相差不大,其中q值取20時標準差最小。在后續實驗中設定工作日q值取10,非工作日q值取20進行模型性能實驗。

2.3 實驗模型訓練流程

本節以地鐵回龍觀站進站客流為例進行預測,構建K-LSTM-ecm城市軌道交通短時客流預測模型進行實驗,其實驗參數設置為包含一個輸出層、兩個隱含層和一個輸出層,輸入層神經元個數為5,隱含層的節點數為(100,100)輸出層神經元個數為1。工作日q值取10,非工作日q值取20。

K-LSTM-ecm模型訓練流程如下:

1)將三個站點客流數據進行K-means聚類并生成標簽;

2)將聚類后的客流數據劃分為訓練集和測試集;

3)將LSTM神經網絡模型網絡權重及其參數進行初始化處理;

4)選取ReLU函數為激活函數,并向前傳播輸出單個神經元輸出值;

5)選取平方損失函數為損失函數,并向后傳播誤差值;

6)計算梯度;

7)采用Adam函數為優化函數,更新參數;

8)輸出預測結果到ecm誤差補償模型,計算誤差,輸出誤差到LSTM神經網絡;

9)輸出預測結果。模型訓練流程如圖6所示。

圖6 K-LSTM-ecm模型訓練流程

為了后續實驗的公平性及準確性,對照模型K-LSTM模型與LSTM模型的參數取值與K-LSTM-ecm模型一致。

2.4 模型性能分析

本文選取北京地鐵龍澤站、回龍觀站以及霍營站歷史客流數據集驗證K-LSTM-ecm模型效果,數據集為2020年9月1日至10月8日全天出站客流數據,數據總量為9577條,其中每條數據包含4個輸入數據,主模型輸入數據為同一天預測時段前q個時段客流數據、同類型站點同時段客流數據、日期數據以及工作日、節假日聚類標簽數據,輸出數據為當前時段的預測客流數據。為保證模型穩定性,提升預測精度以及模型訓練速度,將輸入數據歸一化處理。劃分2020年9月23日至10月8日為測試集,其余為訓練集。使用python語言進行建模。為驗證模型選取LSTM模型、K-LSTM模型進行對比。預測結果如圖7、圖8所示。

圖7 工作日預測結果

圖8 節假日預測結果

由預測結果顯示以及進站客流的結果圖可知,客流受時間因素較大,進站客流同真實客流一樣呈現集中現象,主要集中在早高峰數段7:00-9:30。對于非工作日真實客流所展現的客流波動性,LSTM模型波動時段與真實客流不符,K-LSTM模型客流波動范圍相較K-LSTMecm模型與真實客流有所差異。故客流除LSTM短時客流預測模型效果不理想,K-LSTM模型與K-LSTM-ecm模型都對未來客流進行有效預測。但對客流隨機性波動K-LSTM-ecm模型直觀上看效果更優,與真實客流量曲線趨勢更加貼近。為更精準對比預測結果,本文選取RMSE、MAE、MAPE作為模型評價指標,以驗證模型有效性,結果如表4所示。

表4 模型評價指標

由上表數據可知,本文構建的K-LSTM-ecm模型在三個評價指標表現上均優于單一的LSTM模型與未采取誤差補償模型的K-LSTM模型。

3 結語

對于城市軌道交通的客流預測,現有研究對于歷史客流數據的時間特征有很多理論成就,而對于空間特征多是考慮整體地鐵路網的空間關系,為更加細化空間特征,本文根據地鐵站同類型相鄰原則構建考慮時空特征的K-LSTM-ecm模型,進一步提升預測精準度。為更精準預測客流,本文設計實驗,選取q個臨近歷史客流量,結果表明:預測當前時段的客流時,工作日前10個時段客流數據影響最大,而節假日則受20個時段客流影響。為進一步證明K-LSTM-ecm模型效果,設計對比實驗,將模型與LSTM模型與K-LSTM模型進行直觀的折線圖結果比較與評價指標比較,研究表明,在進行K-means聚類生成聚類標簽,實現了對歷史客流數據集客流特征的細化,更加有效的描述了客流特征且提高了預測精度。實驗結果顯示K-LSTM-ecm模型優于LSTM模型與K-LSTM模型,進而驗證了模型的有效性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 久久永久免费人妻精品| 手机成人午夜在线视频| 亚洲永久色| 欧美日韩中文国产| 波多野结衣无码中文字幕在线观看一区二区| 欧美一级在线看| 在线播放真实国产乱子伦| 亚洲成人精品| 小13箩利洗澡无码视频免费网站| 国产白浆一区二区三区视频在线| 亚洲国产成人精品无码区性色 | 色婷婷成人网| 色亚洲成人| 日韩资源站| 九九久久99精品| 国产在线视频自拍| 久久精品国产电影| 极品国产在线| 四虎永久在线| 九九九精品成人免费视频7| 亚洲国产精品无码久久一线| 亚洲Aⅴ无码专区在线观看q| 四虎AV麻豆| 国产精品夜夜嗨视频免费视频 | 99成人在线观看| 亚洲第一成年网| 99ri精品视频在线观看播放| 日韩在线2020专区| 国产91小视频| 国产一级小视频| 亚洲AV无码一二区三区在线播放| 亚洲天堂在线免费| 秋霞国产在线| 色香蕉影院| 夜夜爽免费视频| 国内精品视频在线| 伦精品一区二区三区视频| 亚洲性日韩精品一区二区| 在线播放91| 亚洲成网站| 自拍偷拍欧美日韩| 超碰aⅴ人人做人人爽欧美 | 国产精品内射视频| 毛片a级毛片免费观看免下载| 国产永久在线观看| 一区二区三区毛片无码| 久久久久亚洲av成人网人人软件| 欧美日韩一区二区三区四区在线观看 | 91精品日韩人妻无码久久| 中文字幕精品一区二区三区视频| 青青草欧美| 欧美a在线看| 国产免费怡红院视频| 91无码视频在线观看| 久久天天躁狠狠躁夜夜躁| 怡红院美国分院一区二区| 久久久噜噜噜| 老汉色老汉首页a亚洲| 小说区 亚洲 自拍 另类| 九九热视频精品在线| 又粗又硬又大又爽免费视频播放| 99re在线免费视频| 中日无码在线观看| 97se亚洲综合在线天天| 青青草原国产一区二区| 久久久久国产精品免费免费不卡| 麻豆国产精品| 天天综合天天综合| 国产麻豆va精品视频| 色综合天天综合中文网| 九色视频线上播放| 国产精品福利尤物youwu | 在线中文字幕网| 熟妇丰满人妻| 亚洲成网777777国产精品| 成人国产精品2021| 超碰免费91| 欧美劲爆第一页| 亚洲男人的天堂在线观看| 熟妇丰满人妻| 亚洲成人精品在线| 中文字幕有乳无码|