999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于集成學習的公交車輛到站時間預測模型研究

2019-11-15 02:17:24荊靈玲王安琪
重慶理工大學學報(自然科學) 2019年10期
關鍵詞:特征方法模型

荊靈玲,解 超,王安琪

(1.中航勘察設計研究院有限公司,北京 100098;2.中國交通通信信息中心,北京 100011;3.中交信有限責任公司,北京 100007;4.北方工業大學,北京 100144)

城市公共交通是交通運輸業的重要組成部分,落實“公交優先”政策,大力發展公共交通系統是緩解城市交通擁堵和交通安全問題行之有效的手段[1],而準確、實時地預測公交到站時間是城市智能交通系統(ITS)的重要組成部分。隨著定位和通信技術的發展和完善,準確預測公交車輛到站時間有利于市民合理規劃出行時間、滿足市民多元化出行需求、減少等車時間、緩解乘客焦慮情緒及提供精細化服務,將居民出行方式吸引到公共交通上來,使居民的出行融入可持續發展的交通系統中[2],進而緩解城市交通擁堵等問題,有利于構建以公共交通為主體的暢通、安全、高效、舒適、環保、經濟、公平的城市交通系統[3]。

國內外學者在公交到站時間預測方面提出了多種不同的方法。根據數據源可以分為基于歷史數據的方法、基于實時數據的方法和兩者相結合的方法。從預測方法上可以分為統計模型、回歸模型、時間序列模型、神經網絡模型、SVM、 Kacman濾波和路況相似性方法等。李天雷等[4]基于大量的歷史公交軌跡數據,用多元回歸計算各路段分時段的平均速度,基于平均速度進行預測。該統計模型對于路況比較穩定的線路預測性能好,但不能適應路況變化較多的線路。孫棣華[5]在歷史平均速度的基礎上考慮車輛實時速度、到站距離、車站、信號燈等因素,建立了到站時間預測的線性方程。這種方式考慮了車輛的速度及其他影響因素,但由于公交車的密度不足以覆蓋所有時段和路段,所以在實時速度方面難以達到較高的覆蓋率和準確率。Li等[6]和Tetreault等[7]基于時間、歷史速度、實時速度、天氣、路段長度和交叉口數量等影響因子構建多元回歸方程進行預測,由于路況的多變和影響因子較多,線性回歸模型的擬合能力有限。孫玉硯等[8]對歷史路況進行聚類,找到與當前路況相似的歷史路況來預測站點到站點的行程時間,這種方法在復雜路況下的聚類和相似性判斷方面難以達到較高準確性。

另外,不少學者使用人工神經網絡模型(ANN)來預測到達時間。 Chien[9]提出了基于link和stop的ANN預測模型。與線性模型相比,該模型學習能力更強,預測更準確,但是需要大量的訓練數據且在線性能較差。

卡爾曼濾波模型由于對歷史數據依賴小、抗干擾能力強被許多學者采用。Shalaby[10]提出用卡爾曼濾波來預測公交到站時間和離站時間??柭鼮V波利用通過某路段的前車數據對后面通過該路段的公交車時間進行預測。這種方法較好地考慮了實時路況,對歷史數據要求不高,但是由于公交車運行在各路段和各時段的不均衡,會導致數據稀疏。此外,由于長距離預測時路況變化較大,所以在實際應用中存在較多限制。

SVM 作為主流機器學習方法,因非線性擬合能力強、適合小樣本的特點常被用來預測到達時間。Yu[11]提出了基于SVM的預測模型,把時間、天氣、路段、當前路段的行程時間和下游路段的行程時間作為特征。實驗結果表明,該模型的預測精度優于歷史平均模型和ANN模型。陳旭梅等[12]在卡爾曼濾波基礎上結合SVM對BRT進行了行程時間預測,效果較好。由于公交線路及路況的復雜性遠大于BRT系統,所以該模型在公交系統上的適用性還需要進一步驗證。

智能公交系統在長時間運營過程中積累了海量的公交軌跡數據。 作為一項數據驅動的技術,機器學習在眾多領域取得了成功。集成學習作為機器學習的一個重要研究領域,通過聯合若干弱模型來提高效果,與單一模型相比可以得到更好的預測效果。張威威等[13]利用實測的車輛旅行時間數據,提出了多步預測的主成分分析-梯度提升決策樹 (PCA-GBDT) 方法,實驗結果表明該方法具有更高的預測精度與算法穩定性。

本文提出了一種基于集成學習的公交車到站時間預測方法。利用集成學習方法,確定優化目標,把公交車到站時間相關的影響因素進行特征化,基于海量歷史數據訓練出機器學習模型,預測公交到站時間。

1 數據與方法

1.1 數據源

數據源包括靜態數據和動態數據。靜態數據主要指公交線路及站點,動態數據主要指車輛上報GPS坐標流。公交線路及站點見圖1,公交車輛GPS坐標流見表1。

圖1 北京市公交站點線路

線路編號車輛編號GPS上報時間緯度經度10016b8c4f149860901339.873 863116.458 18110016b8c4f149860902039.873 849116.458 85310016b8c4f149860902739.873 914116.459 15210016b8c4f149860903439.874 104116.459 43110016b8c4f149860904139.874 065116.459 80210016b8c4f149860904839.873 881116.460 54910016b8c4f149860905539.873 678116.460 77010016b8c4f149860906239.873 124116.460 82610016b8c4f149860906939.872 554116.460 84610016b8c4f149860907639.872 268116.460 92810016b8c4f149860909039.871 643116.460 82710016b8c4f149860909739.871 442116.460 88810016b8c4f149860910439.871 539116.461 16110016b8c4f149860911139.871 977116.461 21310016b8c4f149860911839.872 714116.461 21110016b8c4f149860912539.873 374116.461 215

1.2 預測方法

本文采用集成學習GBDT的方法進行公交車輛到達站點的時間預測。

集成學習通過構建并結合多個學習器來完成學習任務[14]。GBDT是集成學習的一種算法。GBDT算法(gradient boosting decision tree)由Friedman最早提出,它利用最速下降的近似方法,即利用損失函數的負梯度在當前模型的值,作為回歸問題中提升樹算法的殘差的近似值擬合一個回歸樹[15]。GBDT通過迭代地訓練一系列的分類器,使每個分類器采用的樣本分布都與上一輪的學習結果有關。GBDT算法輸入是訓練集樣本T={(x1,y1),(x2,y2),…,(xm,ym)},最大迭代次數T,損失函數L。GBDT算法描述如下[16]:

步驟1初始化f0(x);

步驟2迭代輪數t=1~T,有:

1) 對樣本i=1,2,…,N,計算負梯度rit:

2) 利用(xi,rit)(i=1,2,…,N),擬合1顆CART回歸樹,得到第t顆回歸樹,其對應的葉子節點區域為Rjt,j=1,2,…,Jt。其中J為回歸樹t的葉子節點的個數;

3) 對j=1,2,…,Jt,計算最佳擬合值cjt:

4) 更新ft(x):

步驟3輸出f(x)

GBDT預測方法框架(如圖2)包括:① 目標函數定義;② 特征工程:確定特征因子和分析其重要性。公交車輛到站時間預測涉及影響因素主要有歷史路況、實時路況、站點分布、路段距離、紅路燈數量和路口數量等;③ 離線訓練與驗證;④ 在線預測。

圖2 GBDT預測方法框架

1.3 評價指標

常用的回歸預測評價指標有MAE、RMSE和MAPE等,具體含義詳見表2。本文采用預測誤差MAPE作為集成學習目標函數。

表2 評價指標MAE、RMSE和MAPE的含義

2 基于集成學習的ETA預測模型實現

2.1 目標函數定義

定義目標函數L為

訓練目標為求解最優化:

2.2 特征工程

將特征因子分為初階和高階特征。初階特征包括請求時間、到站點距離、經過站點數等;高階特征分為路網(路口數量、紅綠燈數量)和統計特征(歷史路況和實時路況),特征列表見表3。

表3 特征列表

2.2.1特征因子計算

請求時間:按15 min作為時間片段,用[0,96)來表示全天各個時間片段。

路網特征:利用公交線路對應的道路數據提取路口數量及紅路燈數量。

統計特征:歷史路況和實時路況。

1) 歷史路況計算

基于公交線路歷史軌跡計算歷史平均路況。計算某一路段在某一時間窗口的平均速度,該過程主要考慮時間塊劃分(t)和路段劃分(s)問題。

時間塊劃分(t):路況隨時間變化呈現出明顯的高峰期和平峰期、工作日和休息日的差異規律。公交車排班也呈現明顯的高峰期、平峰期、工作日和休息日的差異。

基于公交車排班差異將工作日和節假日采用不同的時間片劃分方式,主要差異在早晚高峰的劃分上?;诠卉嚺虐嗖町惪杀WC時間片內有足夠的樣本數量?;谶@兩點采用如表4的時間塊劃分,時間塊是將每天的各個時間區間映射成一個數值。

表4 時間塊劃分

續表(表4)

路段劃分(s):① 不同路段路況不同,兩站點間距離從幾百米到幾公里不等,會導致嚴重的路況異質性;② 某一路線存在多條公交線路的車輛數據,這些不同公交線路的歷史軌跡都可以用來計算該路段的歷史路況?;谝陨蟽牲c提出網格劃分的線路離散化方法。該方法將公交線路抽象成一系列連續的網格,網格大小為100 m,如圖3所示。

圖3 線路離散化網格

歷史路況計算采用cost單條軌跡計算方法,方法如下:

步驟1將軌跡數據映射到線路網格;

步驟2計算網格耗時。如圖4所示,2個軌跡點落在2號網格和5號網格;每個網格的耗時為 avg = (T1-T0)/ (5-2);

圖4 軌跡數據映射到線路網格

步驟3計算網格耗時異常值過濾和均值。當有若干條軌跡數據需進行異常值檢驗之后進行平均計算,最終得到每一個網格的平均耗時。

2) 實時路況計算

計算方式與歷史路況類似,統計了過去15min內通過該路段的公交車輛平均耗時。

2.2.2特征因子重要性評價

特征的選取和處理決定了預測效果的上限。對于特征j,全局特征重要性通過在每棵樹中的重要度的平均值來計算:

其中M是樹的數量。

特征j在1棵樹中的特征重要性為

2.3 訓練與驗證

采用過去N天公交車輛到站時間請求數據,按2.2方法計算出所有特征,并計算出實際到達時間。從訓練集隨機抽取10%作為驗證集。本文測試了不同訓練參數下的不同效果,如表5所示。

表5 不同訓練參數下的不同測試效果

2.4 線上預測

線上預測部分主要包括特征生成模塊、預測模塊和驗證模塊。線上生成特征向量傳入預測模型,最終得到結果。驗證模塊會記錄公交車實際到達每個站點的時間,進而計算出預測的精度。

3 實例研究

本文選取北京市2017-06-01—2017-06-30公交車輛的軌跡數據作為訓練集,以07-01—07-07日的數據作為測試集,利用XGBoost進行訓練,驗證公交到站時間預測模型的有效性。不同方法的測試效果見圖5。

圖5 不同方法測試效果

4 結束語

本文利用數條重合線路的坐標流數據,提出將集成學習GBDT方法用于預測公交車輛到站時間,提高了公交到站預測的準確性。通過實例分析和驗證發現,基于GBDT方法的預測性能明顯優于其他方法,可靈活處理混合類型特征,包括連續值和離散值,無需特征歸一化處理,且預測準確率更高;有特征組合的作用,可自然地處理缺失值,對異常點魯棒,具有易于實現、抗干擾能力強及泛化能力強等優點。但該方法也有一定的局限性,在ETA預測中,不同的線路、不同的司機都會影響到達時間,這些特征在GBDT模型中較難表達。另外,對突發的路況變化預測精度不夠, 例如,在北京等大城市,由于道路突發事件較多,類似體育比賽、臨時封路等也會影響周邊路況,實時路況特征無法表達這種特殊路況持續的時間和波及的區域,會影響長距離的到達時間預測精度。這些存在的問題有待進一步的研究。

猜你喜歡
特征方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 国产精品吹潮在线观看中文| 日本www色视频| 久久91精品牛牛| 国产视频 第一页| 久久国产精品麻豆系列| 婷婷开心中文字幕| 国产日韩欧美中文| 欧美伦理一区| 中国一级特黄大片在线观看| 婷婷成人综合| 欧美、日韩、国产综合一区| 国产男人的天堂| 中文字幕久久亚洲一区| 婷婷综合在线观看丁香| 91视频精品| 日韩大片免费观看视频播放| 日本在线免费网站| 久久久久九九精品影院 | 国产手机在线观看| 国产精品美女免费视频大全| 亚洲伊人久久精品影院| 亚洲无码熟妇人妻AV在线| 日本一区二区三区精品AⅤ| 国产免费久久精品99re丫丫一| 亚洲娇小与黑人巨大交| 亚洲第一区精品日韩在线播放| 亚洲一区二区精品无码久久久| 国产精品太粉嫩高中在线观看| 欧美在线伊人| 国产成人精品视频一区二区电影 | 精品超清无码视频在线观看| 红杏AV在线无码| 无码福利日韩神码福利片| 91欧美亚洲国产五月天| 五月激激激综合网色播免费| 91精品国产福利| 熟妇人妻无乱码中文字幕真矢织江| 天天综合天天综合| 456亚洲人成高清在线| 亚洲欧美自拍一区| 精品人妻一区无码视频| 久久精品无码专区免费| 亚洲日韩欧美在线观看| 19国产精品麻豆免费观看| 一级香蕉人体视频| 99久久精品免费视频| 在线国产你懂的| 国产三区二区| 国产精品毛片一区视频播 | www.精品视频| 中文字幕天无码久久精品视频免费 | 亚洲欧美另类日本| 日本日韩欧美| 国产呦视频免费视频在线观看| 国产精品视屏| 日韩毛片免费视频| 亚洲成人在线免费观看| 欧类av怡春院| 亚洲一区无码在线| 免费人成视网站在线不卡| 国产成人综合久久精品尤物| 538精品在线观看| 日韩午夜片| 国产成人综合亚洲网址| 在线欧美a| 日韩a级毛片| 亚洲欧美激情小说另类| 国产不卡一级毛片视频| 亚洲综合香蕉| 99爱在线| 国产视频a| 久久 午夜福利 张柏芝| 亚洲香蕉在线| 亚洲精品大秀视频| 欧美精品1区2区| 视频二区国产精品职场同事| 国产福利一区视频| 激情综合五月网| 国产经典在线观看一区| 中文字幕丝袜一区二区| 天天躁夜夜躁狠狠躁躁88| 国产不卡在线看|