999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于樸素貝葉斯分類器的乘客出行屬性分析

2020-06-04 05:38:26崔洪軍朱敏清
科學技術與工程 2020年11期

崔洪軍, 趙 銳, 朱敏清, 李 霞

(河北工業大學土木與交通學院,天津 300401)

智能卡的廣泛應用在各大城市中產生了海量的乘客出行信息數據,充分利用這些數據中的出行屬性可有效地分析乘客的出行特征、規律等[1-2]。Atfred等[3]、Ma等[4]利用時空關聯理論分別分析了智能卡乘客在指定車站的乘降數量及關聯行程,針對北京智能卡出行者的出行時空特性規律進行了研究。Kusakabe等[5]對地鐵出行乘客的智能卡數據加以研究進而得到出行者的出行規律信息。Ordóez等[6]對出行活動進行聚類,并利用分層選擇模型對為期7 d的連續出行活動進行了分析。Sang等[7]、Gordon等[8]、Nassir等[9]。基于公交智能卡數據對出行目的、出行鏈等進行了分析。王月玥[10]、翁劍成等[11]對通勤者的出行特征屬性及出行鏈進行了提取。咼娟[12]基于時空關聯理論,結合個體出行特征對乘客的出行規律進行了一定分析。劉永鑫[13]、Weng等[14]、Liu等[15]基于智能卡數據,對乘客的出行模式進行了深入研究。

從以上成果可看出,學者多注重于從單一數據源來分析乘客的出行規律,但如將多源數據融合,研究結果將會更準確及多元化。同時,以上諸多研究側重于對地鐵乘客出行規律的推斷;在出行選擇繁多的今天,傳統的公交出行依舊擁有很大的研究價值。在多數城市,公交出行的計費方式等與地鐵存在差異,因此在智能卡數據庫中會缺失部分出行屬性信息。鑒于以往研究中的不足之處,基于樸素貝葉斯分類器,融合了出行調查數據及智能卡數據對公交乘客的出行目的進行推斷,并基于各出行目的對出行規律進行研究。

1 研究數據描述

1.1 智能卡數據預處理

研究數據來源為石家莊市公交智能卡及公交全球定位系統(global positioning system, GPS)數據,其中智能卡基礎數據為數據卡ID編號、刷卡時間、車輛號、車輛線路號等,GPS數據包括車輛終端號(車輛號)、GPS時間、經緯度數據、GPS接收時間等。由于篇幅限制,只選取研究所需數據,數據結構如表1所示。

表1 智能卡數據描述

圖1 數據融合算法流程Fig.1 The flow of data fusion algorithm

通過匹配智能卡刷卡時間與車載GPS進站時間可確定乘客的上車站點信息。由于石家莊公交系統采用一票制刷卡乘車原則,乘客的下車站點數據信息無法通過系統自動獲得,因此選取文獻[16]中的方法匹配下車站點數據,并且通過車輛時刻表確定乘客的下車時間節點。

1.2 出行調查數據

采用問卷調查的方式獲取公交乘客的出行信息,調查背景為限定的一個乘降站。調查內容包括乘客出行的上下車站點、上下車時間及出行目的。出行調查數據如表2所示。

表2 出行調查數據

2 數據融合算法

2.1 方法概述

提出一種同時結合出行調查與智能卡數據的數據融合方法,依照此方法可將公交智能卡數據中缺少的乘客相關屬性信息進行提取。圖1所示為該方法的流程,此法核心為推斷智能卡乘客的出行行為屬性。乘客的出行行為屬性c(如出行目的、起始地)為僅在問卷調查中得到的屬性;屬性F(如上車站點和上車時間)為兩個數據集中均包含的出行屬性,屬性g為僅從智能卡數據集中獲得的屬性(如出行頻率)。基于該方法,使計算智能卡數據集中具備屬性c的出行次數成為可能;同時,也得到了無法在單個數據集中得到的屬性c和g的關系。

假設從智能卡數據集中觀測到的乘客出行次數同問卷調查數據集中得到的乘客出行次數具有相同的條件概率分布函數P(c|F),此分布表示該乘客在屬性F條件下產生出行屬性c的概率。將概率函數P(c|F)應用到樸素貝葉斯分類器中,可將智能卡數據集中的出行屬性c提取出來,基于此可得到各出行屬性下的概率分布關系。同時,N(c)為具有出行屬性c的出行次數,屬性c和g的關系可用當c已知時g的條件概率分布P(g|c)來表示。

2.2 樸素貝葉斯概率模型

假設向量集F={f1,f2,…,fk}為一系列行為屬性,F中的每個元素均代表著兩個數據集中存在的一個共有屬性(如上車時間、上車站點)。c為可通過問卷調查獲得的智能卡數據集中缺失的屬性變量。將c及集合F中的每個元素視為離散變量,基于貝葉斯定理,概率P(c|F)可表示為

(1)

式(1)中:p(c)、p(F)、p(fk|c)均為從問卷調查中獲得的概率分布;p(c)、p(F)分別為出行中具備屬性c和F的概率,條件概率p(fk|c)為在屬性c下,具備屬性fk的出行所發生的概率。

當智能卡數據集中每次行程的屬性F被觀測確定后,由樸素貝葉斯分類器可得到該行程的出行屬性c,表達式如式(2)所示,其中,C為所有出行屬性c的集合。同時,可由式(3)得到此出行屬性下的行程次數,其中S為所有F取值集合。

(2)

(3)

當問卷調查數據集中的屬性變量g在智能卡數據集中被計算出后,屬性g與屬性c的聯合概率分布可由貝葉斯推理得出,即

(4)

式(4)中:ps(F,g)為從智能卡數據集中得到的具有出行屬性F和g的行程占比。通過出行調查數據及智能卡數據可得到在屬性c下屬性g的分布條件概率:

(5)

式(5)中:ps(F)為由智能卡數據集中得到的具有屬性F的出行占有率。

2.3 出行目的推測

為推測智能卡乘客的出行目的,將出行目的定義為2.2節中所述的屬性c,如式(6)所示。其在出行問卷調查中的意義如下:其中通勤出行包含成人上班、學生上學出行;因私出行包括出行人以休閑、購物、探親、訪友、商務會見等為目的的出行;歸家出行包括除通勤返程以外的歸程出行。同時定義特征屬性g為依據智能卡出行數據求得的乘客的出行頻率。

c∈{通勤出行,因私出行,歸家出行}

(6)

假設乘客的上車時間、出行持續時間、目的地、出行逗留時間等各出行特征參數均因出行目的而異。基于此假設,兩個數據集中共有的出行屬性F定義為F={faboard,fduration},其中faboard為乘客上車刷卡時間節點,fduration為乘客出行時下車后又在同一車站刷卡上車的時間間隔時長,在研究中稱此為活動持續時間。至此,由上述方法可得到智能卡數據庫中缺失的乘客出行目的屬性。

3 實證分析

3.1 數據準備

選取石家莊CBD中心區北國商城公交站為研究對象,周邊辦公寫字樓、賓館、酒店、醫院、購物中心齊全,有較大的客流量;同時存在多種目的的出行需求。公交智能卡數據為2018年1月1日至2018年3月25日期間的交易數據。經篩選處理后北國商城站的可用出行數據共計199 145條,其中包含卡號10 263個,所用數據中保證了出行者至少出行一次。出行調查采取問卷調查方式,針對本文研究站點,可用問卷共計1 000份,將其隨機分為兩部分,其一用于推算概率分布P(c|F),共計700份,余下300份用于檢驗其準確性。

3.2 概率估算結果

700份問卷樣本數據結果通過式(1)的概率模型計算。概率分布結果P(c|F)由出行屬性F={faboard,fduration}決定,因此,模型的準確程度取決于所選屬性集合F能否合理地體現乘客的出行目的。同時,樸素貝葉斯分類器假定各元素服從有條件的獨立分布,因此,P(faboard|c)與P(fduration|c)兩個分布情況被分別加以計算。

表3及表4分別展示了700組問卷數據在上述兩種分布情況下的計算結果。由此可看出,通勤出行多集中在早間高峰時期,同時逗留時間也遠長于因私出行的逗留時間,歸家出行集中在下午5時以后,符合日常規律。

3.3 算法驗證

為驗證本文聚類方法的準確性,筆者利用前文所述的300組包含出行屬性F和c的出行調查數據來檢驗,通過比較推測出行目的與實際出行目的來判斷由式(2)推斷出的結果的準確性。圖2所示為

表3 北國商城站出行調查概率p(faboard|c)的分布值

表4 北國商城站出行調查概率p(fduration|c)的分布值

圖2 北國商城站以出行目的聚類的出行次數統計Fig.2 Number of trips at Beiguoshangcheng station counted by trip purposes

由式(2)、式(3)得到的結果分布情況。其中,85.6%的出行被準確估計,通勤出行、因私出行、歸家出行的準確性分別為91.5%、72.1%和82.6%。

3.4 智能卡數據分析

為了分析乘客在不同時段的出行行為變化情況,基于上述數據融合方法對智能卡數據進行分析。由式(3)統計后可得到圖3所示的2018年1月1日至2018年3月25日北國商城站為期12周的乘客日出行頻次變化情況。

圖3 北國商城站出行量日變圖Fig.3 Daily variation of travel volume at Beiguo-shangcheng station

由圖3可看出:該車站工作日期間日出行量稍有波動,其中通勤出行占比最大,歸家出行稍高于因私出行;但在周末及假日期間,通勤出行占比明顯減少,歸家出行成為主要出行目的,且稍高于因私出行;工作日與周末銜接處可見顯著波動。同時,值得注意的是2月15日至2月21日春節假期期間本站的出行變化情況:此時段較前后時段相比,日出行數量顯著減少,主要以歸家出行為主,伴有少量因私出行及通勤出行。該站春節假期前后工作日時段通勤出行、因私出行、歸家出行的日出行量均值分別為1 598、407、509次;周末時段日出行量均值分別為706、777、959次;而在春節假期期間,以上出行目的下的日出行量均值則分別為60、146、451次。

圖4所示為由式(5)得到的研究時段內通勤、因私、歸家各出行目的下的出行頻率。圖中橫軸為研究時段,縱軸為該站點每周內每名乘客的出行次數,不同色塊代表不同時段中每名乘客在該站點的出行次數占比情況。由圖可知,乘客通勤出行平均每周4.7次,因私出行每周2.9次,歸家出行每周3.4次。由圖4(a)可知,在第7、8觀察周(春節假期)中,每名乘客的通勤周出行次數多為3次;參考圖4(b)、圖4(c)可知,該時期每名乘客的因私出行次數明顯上升,且多集中于5次,而歸家出行次數在前半段春節假期中較平時上升明顯,在后半段中則與平時相差不大。

圖4 北國商城站不同出行目的下乘客出行次數周變頻率Fig.4 Weekly frequency chart of passenger trips for different purposes in BeiGuo Shang Cheng STA

4 結論

提出了一種數據融合方法。此法基于樸素貝葉斯分類器,通過融合智能卡及出行調查數據,結合公交智能卡乘客出行屬性F(上下車時間及活動持續時間)對出行目的加以分類。基于不同的出行目的,將乘客的出行頻率加以描述,以此刻畫乘客的出行行為,驗證表明該法對出行目的估計的準確率為85.6%,其中通勤出行、因私出行、歸家出行的準確性分別為91.5%、72.1%和82.6%。

基于不同的出行目的對所研究時段的刷卡數據進行分類。結果表明,該方法能夠有效地篩選出不同出行目的下智能卡乘客的出行頻率,同時可階段性地刻畫乘客的出行偏好。基于本研究選取車站,得到了2018年春節假期前后各出行目的下的出行變化規律、日出行量均值及乘客出行次數周變規律。結果可為交通規劃部門提供較好的信息支撐。

主站蜘蛛池模板: aaa国产一级毛片| 欧美成人在线免费| 欧美午夜理伦三级在线观看| 丁香亚洲综合五月天婷婷| 欧美一级特黄aaaaaa在线看片| 国产一级α片| 亚洲第一福利视频导航| 一区二区三区成人| 青青操国产| 一级香蕉视频在线观看| 日韩小视频在线播放| 亚洲欧美综合精品久久成人网| 免费无码又爽又刺激高| 色爽网免费视频| 亚洲午夜片| 国产精品lululu在线观看| 亚洲黄色高清| 成人a免费α片在线视频网站| 欧美精品一二三区| 亚洲成人网在线观看| 久久77777| 99999久久久久久亚洲| 中文字幕首页系列人妻| 色噜噜综合网| 天堂在线www网亚洲| 欧美翘臀一区二区三区| 91成人精品视频| 日本在线国产| 日韩欧美国产成人| 毛片大全免费观看| 国产后式a一视频| 成人韩免费网站| 欧美一区二区三区欧美日韩亚洲 | 亚洲第一视频网站| 狠狠色成人综合首页| 亚洲专区一区二区在线观看| 日韩欧美中文字幕一本| 日本一本在线视频| 无码免费视频| 久久性妇女精品免费| 91无码人妻精品一区二区蜜桃| 亚洲永久视频| 成人在线综合| 人妻精品久久无码区| 在线精品自拍| 亚洲精品国产综合99| 国产成人精品无码一区二| 国产精品香蕉在线| 蜜桃视频一区二区| 亚洲欧洲日产国码无码av喷潮| 国产精品jizz在线观看软件| 国产靠逼视频| 日韩毛片在线播放| 亚洲男人的天堂在线观看| 中文字幕丝袜一区二区| 欧美国产日韩另类| 国产男女免费视频| 日本国产精品一区久久久| 成人精品午夜福利在线播放| 欧美中文字幕在线视频| 亚洲综合精品香蕉久久网| 成·人免费午夜无码视频在线观看| 男人天堂伊人网| 亚洲第一成年人网站| 国产成人亚洲综合A∨在线播放| 一本大道无码高清| 国产噜噜在线视频观看| 日韩精品一区二区三区视频免费看| 精品国产三级在线观看| 操国产美女| 无码日韩精品91超碰| 一级毛片在线免费看| 国产人成乱码视频免费观看| 国产精品hd在线播放| 69国产精品视频免费| 亚洲一区二区日韩欧美gif| 国产在线观看第二页| 国产三级视频网站| 亚洲第一成年网| 香蕉国产精品视频| 欧美午夜性视频| 欧美性猛交xxxx乱大交极品|