999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高速公路收費數據的車輛分類研究
——以重慶市為例

2021-03-06 06:19:16馬新露雷小詩馬筱櫟
交通運輸研究 2021年1期
關鍵詞:高速公路分類

馬新露,雷小詩,馬筱櫟,樊 博

(重慶交通大學交通運輸學院,重慶 400074)

0 引言

近年來,隨著我國汽車保有量的不斷攀升,高速公路交通擁堵時常發生、“非法營運”屢禁不止。高速公路出行效率下降使管理人員必須應用更有針對性的、精細化的交通管控方法[1],提升交通管控效率及服務水平,以滿足車輛正常出行需求。出行群體分類是基于出行者出行相似性和規律性,提取特征將出行者劃分為不同類別的方法,分類結果能為交通精細化管理及服務水平提升提供依據。

隨著交通大數據獲取設施不斷完備以及大數據技術的快速發展,研究人員可基于交通大數據進行出行群體分類辨識模型研究,以解決傳統群體分類方法樣本量少、結論不準確等問題[2]。國內外部分研究人員基于自動售檢票(Automatic Fare Collection,AFC)數據對出行個體進行分類研究。如劉家瑋[3]利用AFC 數據,從出行強度、時間維度、空間維度及卡類型4 方面構建指標,運用兩步聚類法將乘客分為4 類,基于分類結果測算優惠票價對每類乘客的轉移效果;席洋[4]利用AFC 數據提取出行時間及空間特征,引入基于語義分析的主題模型,識別出10個出行主題,并在此基礎上利用K均值(K-means)聚類算法將乘客分為6類;Kieu 等[5]利用AFC 數據,以出行起訖點和出發時間為指標,應用具有噪聲的基于密度的聚類(Density-Based Spatial Clustering of Ap?plications with Noise,DBSCAN)算法將乘客分為通勤乘客、出行起訖點穩定型等4 類;Briand 等[6]通過分析法國城市雷恩2014年4月的公共交通刷卡數據,提出了一種主題模型結合高斯混合模型的方法,將乘客按照出行時間及出行模式聚類,并從智能卡的類型分析聚類成分,證明了聚類結果與出行者社會經濟屬性的關聯性。另外,有研究者基于高鐵客票數據進行鐵路旅客分類研究,如呂紅霞等[7]采集旅客出行數據,用凝聚法合并相關性較強的特征變量,并用近鄰傳播算法對旅客進行樣本聚類,將旅客分為6 類。同時,也有研究者以出行車輛為研究對象進行出行群體分類研究,如暢玉皎等[8]基于上海快速路牌照識別系統采集的數據,通過K-means 聚類進行數據挖掘,提取路網中具有通勤特征的車輛,并分析了通勤車輛在路網中的出行時空分布。

已有出行群體分類研究多以城市內部出行大數據為基礎,以在城市內部出行的人群為研究對象。而高速公路聯網收費數據作為典型的交通大數據,記錄了車輛經過高速公路收費站的詳細信息,如進出口收費站點編號、車輛進出收費站時間、車型、車牌等數據,是研究高速公路出行的良好數據源。部分學者基于高速公路聯網收費數據進行了研究,但集中于旅行時間預測、交通流特征分析、短時流量預測等[9-11],僅有少量學者基于收費數據進行高速公路出行群體的識別,如錢超等[12]利用ETC 收費數據提取客戶細分指標,基于大型應用中的聚類(Clustering Large Applica?tions,CLARA)算法實現ETC 客戶的聚類分析,并采用分類與回歸樹(Classification and Regres?sion Tree,CART)算法提取ETC 客戶細分規則,最終將ETC 客戶細分為5 類;魏廣奇等[13]基于高速公路收費數據,利用聚類方法只進行通勤車輛識別,并分析通勤車輛的出行時空分布特征。

因此本文針對高速公路車輛群體分類研究較少且多只進行部分類別辨識的情況,基于高速公路收費數據,分析車輛出行特征并建立車輛出行指標,利用K-means++無監督學習算法,對高速公路出行車輛進行群體分類辨識,將具有相似出行特征的車輛劃分到同一類別,并分析各類別的差異,以期為交管人員進行精細化的、更有針對性的高速公路交通管控提供依據。

1 數據準備及車輛分類流程

1.1 數據準備

本文數據來源于重慶市某高速公路特定通道2018年7月2日—2018年7月29日小型客車(7座及以下)收費數據,數據表設計見表1。2018年7月2 日—2018 年7 月29 日包含4 個完整周,其中工作日20d、周末8d。特定通道共包含5 個互通和8 個收費站,左起南環互通,屬主城巴南區管轄,右至雙河口互通,屬南川區管轄,全長約92.4km。為方便研究,將南環互通至雙河口互通方向定義為“出城方向”,反之為“進城方向”。

表1 高速公路收費數據主要字段

由于設備問題或人工操作失誤等原因,收費數據可能包含個別錯誤數據。為提高研究精度,降低錯誤干擾,將存在缺失字段、車牌號錯誤、進站時間晚于出站時間、進出站時間差大于24h等情況的錯誤數據刪除,最終保留有效數據134.6萬條,對應小型客車43.6萬輛。

1.2 車輛分類流程

基于收費數據,統計每周“進出城方向”各小時交通量變化情況,結果顯示:周五下午、周六及周日上午出城方向車流量大,而周六及周日下午進城方向車流量較大。經分析認為,周末出城走親訪友的車輛增多,且受該地存在景區的影響,7 月后兩周的周末有大量游客前往通道附近景區游玩避暑。另外,統計車輛出行次數后發現:出行1 次的車輛占車輛總數的30.95%,無法對該部分車輛進行個體出行規律分析。

若直接進行聚類,出行總次數較少而占比較大的車輛會降低分類精確度。為提高車輛分類準確性,本文采取“先定義后聚類”的方式,具體分類流程(見圖1)為:

(1)清洗原始數據;

(2)將出行1 次的車輛定義為“單次出行車輛群體”;

(3)出游或走親訪友車輛群體主要在周末出行而工作日基本無出行,因此篩選出周末有出行但工作日出行為零的車輛,定義為“出游或走親訪友車輛群體”;

(4)對剩余車輛構建時空出行指標,并將指標作為聚類算法的輸入,將剩余車輛分類。

2 出行車輛群體辨識準備

2.1 K-means++算法簡介

圖1 車輛分類流程

K-means 作為經典的劃分聚類算法,通過計算各數據點與質心間的歐式距離,將其劃分到最近的質心所在的簇,從而將數據點分為具有相似特征的k個簇。K-means 具有計算簡單、處理大數據效率較高和伸縮性較強等特點,因此廣泛應用于各個領域。但因其k個初始質心是隨機抓取的,算法對初始質心的選擇異常敏感。2007 年,Arthur 等[14]在K-means 的基礎上提出了Kmeans++聚類算法,該算法對初始質心的選擇進行了優化,使得各初始質心分布盡可能遠,以消除K-means 因生成較近的初始質心而產生的局部最優解。本文將應用K-means++聚類算法對車輛時空出行指標進行聚類,將車輛劃分到不同類別。K-means++算法步驟如下:

(1)選取數據集X中任一點作為第1 個聚類中心點c1。

(2)首先計算數據點x與已有聚類中心之間的最短距離dx,然后計算其他數據點被選為下一個聚類中心點的概率px[14],最后按照輪盤法選擇下一個聚類中心,即:

式(1)~式(2)中:x為數據集X中的數據點;c為聚類中心點集C中的中心點。

(3)重復步驟(2),直至選出所需的k個聚類中心點。

(4)選出k個所需的聚類中心點后,逐一計算數據集中每一個x與k個中心點的距離d(x),并將其劃分至距離最小的聚類中心。

(5)針對每個聚類中心,重新計算質心作為新的聚類中心。

(6)重復步驟(4)和步驟(5),直至聚類中心不再變化或迭代次數達到預設值為止。

K-means++聚類算法需先確定最優的聚類數k,使聚類產生高的簇內相似度及低的簇間相似度。本文將分別在不同k值下計算兩個內部質量評價指標:Calinski-Harabasz(CH)指標及Da?vies-Bouldin(DB)指標,以保證選擇最優的k值。

2.2 車輛出行指標構建

將出行特征較明顯的車輛劃分到相應群體后,對剩余車輛的出行時空分布進行量化,作為K-means++聚類算法輸入。由于高速公路出行車輛中,通勤車輛及營運車輛具有明顯的時空穩定性,出行強度、時間維度及空間維度特征能較好地描述車輛出行分布規律[15]。但因生產生活需要,高速公路出行車輛在工作日的出行較穩定,而周末較分散。因此本文在“工作日”下,結合車輛出行數據,改進RFM(最近一次交易(Recency),交易頻率(Frequency),交易金額(Monetary))指標體系,分別從出行強度、時間維度及空間維度3 方面構建出行指標(見表2),以滿足表征不同類型車輛出行特征的基本原則,而“周末”的出行特征僅用于群體分類結果的進一步驗證。

表2 車輛分類指標匯總

(1)出行強度

出行強度表征車輛出行的整體情況,包括工作日出行強度、工作日平均出行天數及其方差3個指標。工作日出行強度是工作日出行總次數與工作日出行總天數的比值,代表著車輛日均出行的頻繁程度,如營運車輛工作日出行強度明顯高于通勤群體車輛。工作日平均出行天數及其方差則表征車輛在工作日出行天數的分布情況及穩定性。

(2)時間維度

高速公路通勤車輛受限于工作時間要求,在時間維度上與城市通勤人群存在相似的早晚高峰出行特征,但高速公路通勤車輛晚高峰時段出行更為分散[13]。因此,本文統計車輛在工作日首次出行時間屬于早高峰時段(07:00—10:00)的周均天數和車輛在工作日午平峰(10:00—15:00)出行的周均天數兩個指標,作為車輛的時間維度出行指標。

(3)空間維度

出行OD 表征車輛在高速公路出行的空間分布,不同車輛群體的出行OD 穩定性存在差異,如通勤車輛的往返OD 對較其他車輛更為固定。本文分別統計車輛進城及出城方向OD 最大出行次數,并計算其與該車輛工作日出行總次數的比值,設定為工作日最大進出城OD 出行占比指標,描述車輛出行OD的穩定性。

3 聚類結果與分析

3.1 聚類結果

基于重慶某高速公路特定通道2018 年7 月收費數據,提取“單次出行”及“出游或走親訪友”的車輛,剩余24.1 萬輛車。計算剩余車輛的7 個出行指標并進行聚類。為提高聚類準確性,避免各指標數量級不同對聚類結果造成影響,首先利用Z 分數(Z-score)算法將指標標準化;然后根據CH 指標及DB 指標的計算結果,確定k為6 時獲得最優聚類效果;最后將7 個指標放入Kmeans++聚類算法模型中,并將聚類k值設為6,獲取最終聚類結果(見表3)。

表3 K-means++聚類結果

3.2 車輛群體定義

基于聚類結果,結合已定義的“單次出行”及“出游或走親訪友”兩類車輛群體,分析不同車輛類別的指標分布情況(見圖2~圖4),并結合實際對各類群體進行定義。

(1)類別1 出行特征明顯。周均出行天數多(3.34d),擁有穩定的出行OD 對,出行強度較小(1.69 次/d),小時交通量呈明顯的早晚高峰分布(見圖3)。結合實際將類別1定義為“通勤車輛群體”,其在所有出行車輛中占比為0.43%。

(2)類別4 與類別1 有相似的周均出行天數,日均出行次數更多(2.54 次/d),但出行OD 對較分散,小時交通量在7:00—17:00 間無峰值,所以定義類別4為“營運車輛群體”,其在所有出行車輛中占比為0.39%。

圖2 出行總次數對應車輛數占比

圖3 類別1、類別3、類別4的小時交通量對比

圖4 其余4類別的小時交通量對比

(3)類別3 的出行強度與類別1 相似,但周均出行天數較少,出行OD 較分散。車輛出行總次數較少,但每周工作日均有出行,該類別車輛出行規律與遠距離出行進行商務洽談的人群(如因工作需要頻繁出差的人群)出行規律相似,因此將其定義為“商務車輛群體”,在所有出行車輛中占比為5.53%。

(4)類別2 及類別6 的指標中心點差距較小,雖然出行天數及出行強度分布存在一定區別,但兩類別90%以上的車輛在統計周期(4 周)內出行總次數均小于6 次,小時交通量分布也基本重合(見圖4)。因此,將類別2 及類別6 合并為同一類別,并定義為“零星出行車輛群體”,其在所有出行車輛中占比為39.34%。

(5)類別5 的周均出行天數及出行強度是所有類別中最小的,其最大進出城OD 出行占比呈兩極分化,表明該類別車輛大多在工作日僅出行一次且為出城出行。類別5 小時交通量呈現出工作日交通量極小,但周五下午及周六、周日突增的變化趨勢(見圖4)。該類別車輛出行特征與“出游或走親訪友車輛”的特征類似,因此將兩類別合并,共同定義為“出游或走親訪友車輛群體”,其在所有出行車輛中占比為23.37%。

4 分類結果分析及應用

本文最終將車輛劃分為6 類,并分別定義為“單次出行”“通勤”“營運”“商務”“零星出行”及“出游或走親訪友”車輛群體。進一步分析各類別的出行特征,高速公路交管人員可基于此針對不同類別車輛進行精細化管理。

(1)高速公路存在具有出行強度高、特定線路出行占比大等特征的“非法營運車輛”[16],這會嚴重危害路網行車安全。因此交管人員可基于本文提出的方法對歷史出行車輛進行“營運車輛”識別,針對識別出的“營運車輛”,重點檢查其是否具備營運資格,可為打擊高速公路“非法營運”活動提供依據,提高管控效率。

(2)進一步分析“通勤車輛群體”的出行OD,發現車輛多集中在“南川收費站—大觀收費站”“南彭收費站—G65巴南收費站”及“南川收費站—水江收費站”等距離小于20km 的OD 對上出行。因此可考慮在“通勤車輛”出行較多的OD 對間增加早晚班車,而其余時段和路段適當縮減班車車次,這樣既能緩解早晚高峰道路擁堵又能減少資源浪費。

(3)88.12%的“出游或走親訪友”車輛為渝籍車輛,可知該特定通道內景區多吸引重慶主城區人群游玩,景區可加大宣傳,提高對外地出游人群的吸引力,還可為出游車輛制定更為詳細的自駕游出行計劃及產品推送,提升車輛“復出游”率。細化分析該類別車輛出行時空偏好發現,78.45%的車輛在以“G65 巴南收費站”為起點,景區附近收費站為終點的OD 對上出行,且多集中在周五的14:00—19:00 及周六、周日早晚高峰時段。基于此,交管部門可在景區到達車輛過飽和時段對該類車輛進行特定消息推送,引導車輛改變出游計劃,達到緩解周五下午及周六、周日交通擁堵的目的。

5 結語

本文應用“先定義,后聚類”的方法,建立了一套較完整的高速公路小客車分類模型。首先定義了“單次出行”及“出游或走親訪友”出行群體,然后從出行強度、時間維度及空間維度3方面構建指標,利用K-means++算法進行聚類,最后結合實際將出行車輛劃分為最佳的6類群體,分別為“單次出行”“通勤”“營運”“商務”“零星出行”及“出游或走親訪友”車輛群體。基于分類結果,交管部門可進行“非法營運”車輛識別、班車頻次優化、特定消息推送引導車輛錯峰出行等工作,以提升高速公路管控效率和精細化服務水平。

本文只基于出行車輛群體分類辨識結果對各類別出行特征進行描述,未來可進一步研究車輛群體出行與高速公路各站點間流量分布的關聯性,并探析多類型客流分配。

猜你喜歡
高速公路分類
高速公路養護與管理探討
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
分類討論求坐標
數據分析中的分類討論
為什么高速公路上不用路燈照明
教你一招:數的分類
高速公路與PPP
給塑料分分類吧
高速公路上的狗
小說月刊(2014年4期)2014-04-23 08:52:20
主站蜘蛛池模板: 日本影院一区| 亚洲精品国产日韩无码AV永久免费网| 在线观看av永久| 午夜人性色福利无码视频在线观看| 日本免费a视频| 国产一级做美女做受视频| 亚洲免费福利视频| 亚洲久悠悠色悠在线播放| 欧美成人区| 亚洲人成影视在线观看| 久久人人97超碰人人澡爱香蕉| 97精品国产高清久久久久蜜芽| 91青青视频| 国产日韩精品欧美一区喷| jijzzizz老师出水喷水喷出| 精品91视频| 亚洲国产成人麻豆精品| 最新精品国偷自产在线| 久久国产精品电影| 午夜毛片福利| 国产精品黑色丝袜的老师| 国产福利在线观看精品| 99re在线视频观看| 久久精品国产999大香线焦| 亚洲动漫h| 91精品啪在线观看国产| 国产幂在线无码精品| 香蕉国产精品视频| 国产精品人莉莉成在线播放| 高潮毛片无遮挡高清视频播放| 99精品国产电影| 久久精品无码国产一区二区三区 | 欧美午夜视频在线| 久久国产成人精品国产成人亚洲| 欧美一区日韩一区中文字幕页| 亚洲精品男人天堂| 精品人妻AV区| 小蝌蚪亚洲精品国产| 久久a级片| 午夜视频免费一区二区在线看| 91久久大香线蕉| 国产三级国产精品国产普男人| 亚洲欧美另类日本| 欧美19综合中文字幕| 自拍偷拍一区| 怡春院欧美一区二区三区免费| 亚洲国产91人成在线| 亚洲侵犯无码网址在线观看| 91亚洲免费| 蜜桃臀无码内射一区二区三区 | 日韩精品一区二区深田咏美| a级免费视频| 三上悠亚精品二区在线观看| 日韩一级二级三级| 亚洲乱码视频| 欧美性久久久久| 欧美日韩亚洲国产主播第一区| 91网站国产| 中美日韩在线网免费毛片视频| 色综合成人| 91精品专区| 国产H片无码不卡在线视频| 全午夜免费一级毛片| 中国成人在线视频| 91福利国产成人精品导航| 国产精品分类视频分类一区| 日韩欧美国产另类| 伊人网址在线| 97久久超碰极品视觉盛宴| 国产毛片基地| 久久一色本道亚洲| 日韩av电影一区二区三区四区 | 熟女成人国产精品视频| 91在线国内在线播放老师| 亚洲无码久久久久| 亚洲av日韩综合一区尤物| 亚洲全网成人资源在线观看| 香蕉在线视频网站| 亚洲免费成人网| 亚洲欧美成人在线视频| a免费毛片在线播放| 九色视频最新网址|