999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

杭州地鐵客流特征分析與客流預測

2019-08-27 03:46:06張素潔
價值工程 2019年19期
關鍵詞:機器學習

張素潔

摘要:通過對杭州地鐵2019年1月1日到2019年1月25日的地鐵刷卡數據進行分析,根據進出站高峰小時系數和站點位置將80個站點分為居住、工作、交通場站和混合類型四類。不同類型的車站早高峰晚高峰進出站高峰小時系數均不相同。對不同地鐵線路的換乘量進行分析發現3號線換乘量比例最高,占其出站人數的77.7%。使用機器學習方法(隨機森林和lightgbm)對不同站點每小時的進出站人數進行預測,平均相對誤差均值為9.0%。表現出較強的可預測性。

Abstract: Based on subway card data of Hangzhou metro on January 1, 2019 to January 25, 2019, according to the inbound and outbound of the station peak hour coefficient and site location, 80 stations can be divided into living, working, traffic hub and the mixed type four categories. Different types of station morning peak and evening peak inbound and outbound of the station peak hour coefficient are not the same. By analyzing the transfer volume of different subway lines, it is found that the transfer volume of line 3 is the highest, accounting for 77.7% of the number of people leaving the station. The machine learning method (Randomforest and Lightgbm) is used to predict the number of people entering and leaving the station at different stations per hour. The average mean absolute percentage error(MAPE) is 9.0%, showing strong predictability.

關鍵詞:客流預測;機器學習;隨機森林;lightgbm

Key words: passenger flow prediction;machine learning;randomforest;lightgbm

0? 引言

地鐵因在綠色、環保和運量等方面領先于其他城市公共交通方式,成為各大城市優先發展的交通方式。隨著新建成線路的投入運營.線網規模的日益擴大和運輸組織形式的日益復雜,地鐵客流的安全形勢日益嚴峻、根據客流量的變化并及時采取相應措施對地鐵的客流進行有效疏通,這對運營組織提出了更高的要求[1]。

分析地鐵客流的特征,尋找主要特征,建立模型預測客流量變化,并啟動相應的預案,提高地鐵運營組織的靈活性和多樣性,充分發揮設施設備能力,確保運營安全。國內外的研究人員已經提出了諸多理論和方法,以實現連續交通流狀態的實時預測,主要包括基于歷史平均、基于序列方法(例如SARIMA模型)[2]、基于機器學習的神經網絡方法[3]、K-近鄰方法[1]、支持向量機方法[4]等,其中每一類預測方法又包含若干種預測模型。

由于地鐵客流具有很大的隨機性,基于機器學習的方法擅長處理此類數據,因此本文采用天池提供的杭州市地鐵2019年1月1日到2019年1月26日的地鐵刷卡數據,進行以小時為單位對總進出站客流量的統計、分析與研究,利用Python語言和隨機森林模型、Lightgbm模型對進出站客流量進行預測。

1? 方法與數據

1.1 模型介紹

隨機森林是一種集成算法(Ensemble Learning),它屬于Bagging類型,通過組合多個弱分類器,最終結果通過投票或取均值,使得整體模型的結果具有較高的精確度和泛化性能。

Bagging也叫自舉匯聚法(bootstrap aggregating),是一種在原始數據集上通過有放回抽樣重新選出k個新數據集來訓練分類器的集成技術。隨機森林的弱分類器使用的是CART樹,CART決策樹又稱分類回歸樹。當數據集的因變量為連續性數值時,該樹算法就是一個回歸樹,可以用葉節點觀察的均值作為預測值;當數據集的因變量為離散型數值時,該樹算法就是一個分類樹,可以很好的解決分類問題。CART樹選擇使子節點的GINI值或者回歸方差最小的屬性作為分裂的方案。

Lightgbm是基于GBDT的樹回歸,通過迭代多棵樹來共同決策其核心就在于,每一棵樹學的是之前所有樹結論和的殘差,這個殘差就是一個加預測值后能得真實值的累加量。Lightgbm模型在運行速度、內存使用、準確率和并行學習等多方面進行了優化。其計算速度快,結果優異。模型采用絕對平均誤差(MAE)和絕對相對誤差(MAPE)進行評價。

1.2 數據介紹

數據來源于天池大賽,包含20190101至20190125共25天地鐵刷卡數據記錄,共涉及3條線路80個地鐵站約7000萬條數據。數據字段包括刷卡時間、線路ID、站點ID、刷卡設備號ID、用戶ID、進出站狀態和刷卡類型。

2? 結果

2.1 客流特征分析

全網進站早高峰高峰小時系數出現在上午8:00-9:00,占全天進站量的11.1%,晚高峰高峰小時系數出現在17:00-18:00占全天進站量的9.3%。全網出站早高峰高峰小時系數出現在上午8:00-9:00,占全天進站量的11.4%,晚高峰高峰小時系數出現在18:00-19:00占全天進站量的9.4%(圖1)。早高峰的出行量比晚高峰的出行量大。上午7:00-9:00,下午17:00-19:00的出行量占全天出行量的52.4%左右,需要重點關注。分析換乘客流發現發現3號線出站流量換乘比例最高,占其出站人數的77.7%(圖2)。

所有線路進站量的時間分布呈現駝峰型,全網客流高峰較為集中。所有線路的早高峰出站人數均大于晚高峰,但晚高峰的持續時間長于早高峰(圖3)。分析每個車站的進站人數,發現不同車站間的變化很大。依據高峰小時系數和站點周圍信息將站點分為4類。將工作日晚高峰入站人數小時系數形成當日峰值的站點定義為工作類站點,將工作日早高峰入站人數小時系數形成當日峰值的站點定義為居住類站點,將站點位于火車站或醫院附近的站點定義為交通場站類。不同類別間進站量的時間分布如(圖4)。圖中編號15和9的為杭州火車站和杭州火車東站。

綜合以上信息在建模預測中,主要考慮歷史客流特征,預測日的前一日和上周的同星期的時間段的數據,站點的類別特征和時間特征包括是否是工作日等。另外短時客流預測受前一日數據影響最大。所以采用將模型預測結果與前一日數據進行線性融合,進一步提高預測準確度。

2.2 模型預測結果

選取2019年1月24(周四)、2019年1月25(周五)和1月20(周日)數據作為測試集,其中2019年1月24(周四)作為線性融合的測試集,其余數據作為訓練集,對原始數據按小時進行匯整,特征包括前一日進出站人數和前一周同星期進出站人數,分工作日和周末,使用Lightgbm和隨機森林分別建模。預測站點的進出站人數,然后利用前一日數據和預測結果進行線性融合。結果如圖(圖5,表1)。測試結果顯示工作日和休息日客流預測值的平均絕對誤差均值為71.2人,平均相對誤差均值為9.0%。最大平均相對誤差均小于12.5%,保持在較小的水平。因此說明,擬合得到的模型能夠較好地預測客流的波動。Lightgbm模型結果優于隨機森林。同時線性融合能提高模型的準確度,說明前一日數據對預測日短時客流影響最大。

3? 結論

①經過對個站點客流量的分析發現不同的站點客流量差異較大,同一站點不同時段差異也很明顯,可根據這些數據靈活的制定應對措施,保證地鐵安全運營。

②Lightgbm模型和隨機森林模型可以很好的預測客流量的隨機變化,能較準確的預測客流量的短時變化,值得的在應用中推廣。

參考文獻:

[1]林培群,陳麗甜,雷永巍.基于K近鄰模式匹配的地鐵客流量短時預測[J].華南理工大學學報(自然科學版),2018,46(01):50-57.

[2]王瑩,韓寶明,張琦,李得偉.基于SARIMA模型的北京地鐵進站客流量預測[J].交通運輸系統工程與信息,2015,15(06):205-211.

[3]李梅,李靜,魏子健,王思達,陳賴謹.基于深度學習長短期記憶網絡結構的地鐵站短時客流量預測[J].城市軌道交通研究,2018,21(11):42-46,77.

[4]謝俏,葉紅霞.基于支持向量機的節假日進出站客流預測方法[J].城市軌道交通研究,2018,21(08):26-29,35.

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 黄色三级毛片网站| 午夜啪啪福利| 欧美成人看片一区二区三区 | 亚洲免费黄色网| 欧美国产精品不卡在线观看| 亚洲精品爱草草视频在线| 成人在线天堂| 中文毛片无遮挡播放免费| 美女毛片在线| 久久久噜噜噜| 激情六月丁香婷婷四房播| 午夜一区二区三区| 成人欧美在线观看| a网站在线观看| 98精品全国免费观看视频| 午夜福利在线观看成人| 国产亚洲精品91| 91黄视频在线观看| 国产在线第二页| 亚洲精品国偷自产在线91正片| 国产喷水视频| 亚洲视频a| 欧美高清视频一区二区三区| 国产超薄肉色丝袜网站| 色哟哟精品无码网站在线播放视频| 欧美成人午夜影院| 国产一级裸网站| 中文字幕免费在线视频| 在线毛片网站| 成人午夜在线播放| a级毛片免费播放| 国产成人区在线观看视频| a级毛片在线免费| 一本一本大道香蕉久在线播放| 在线观看的黄网| 制服丝袜一区| 99热这里只有精品免费| 国产成人亚洲无吗淙合青草| 欧美性精品不卡在线观看| 国产成人精品第一区二区| 亚洲精品视频免费| 欧美三级视频在线播放| 国产精品成人第一区| 色综合天天综合中文网| 国产成人高清在线精品| 日韩av电影一区二区三区四区| 国产成人久久综合777777麻豆 | 91亚洲视频下载| 亚洲日本韩在线观看| 亚洲综合专区| 欧洲一区二区三区无码| 亚洲精品免费网站| 福利小视频在线播放| 无码国内精品人妻少妇蜜桃视频| 欧美日韩国产高清一区二区三区| 免费无码又爽又黄又刺激网站 | 亚洲国产中文综合专区在| 久久国产亚洲欧美日韩精品| 亚洲乱码视频| 热伊人99re久久精品最新地| 九九热精品在线视频| 日韩中文精品亚洲第三区| 97视频在线精品国自产拍| 天堂av综合网| 亚洲国产精品无码AV| 欧美a级在线| 色综合激情网| 欧美色综合网站| 午夜日本永久乱码免费播放片| 亚洲AV无码久久天堂| 日韩av无码精品专区| 久久青草精品一区二区三区| 一级黄色片网| 99久久国产综合精品2023| 国产精品成| 亚洲日韩图片专区第1页| AV不卡在线永久免费观看| 亚洲精品黄| 国产一线在线| 伊人久久婷婷五月综合97色| 中文字幕欧美日韩高清| 国产原创自拍不卡第一页|