999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大規模GPS軌跡數據的出租車換道行為研究①

2019-01-07 02:41:30溫興超段宗濤
計算機系統應用 2018年12期

康 軍,溫興超,段宗濤,唐 蕾

1(長安大學 信息工程學院,西安 710064)

2(陜西省道路交通智能檢測與裝備工程技術研究中心,西安 710064)

近年來,基于軌跡數據挖掘人類移動規律和興趣愛好已成為研究人員的熱點研究領域之一.在軌跡數據處理方面,高強等人[1]對基于軌跡大數據的處理技術進行了綜述,介紹了多種軌跡處理分析方法;在出租車GPS軌跡分析方面,鄭運鵬等人[2]通過聚類方法識別乘客熱點區域并對出租車司機進行熱點推薦;在基于出租車GPS軌跡數據研究城市交通狀況方面,王晗等人[3]提出使用大規模出租車GPS軌跡數據對城市交通狀況進行建模和預測,構建基于大規模出租車GPS軌跡的宏觀交通密度動態模型,預測未來的交通密度,何雯等人[4]提出了基于GPS軌跡的規律路徑挖掘算法;在基于GPS軌跡數據研究人類活動方面,段宗濤等人[5]以西安市GPS軌跡為例基于Hadoop分布式系統設計了出租車服務策略分析模型.Moreira Matias L 等人[6]通過出租車GPS軌跡實時數據和出租車站牌的乘客需求預測在短時間內(幾分鐘)的出租車乘客空間分布從而進行智能派遣.

本文基于西安市大規模的出租車GPS數據,利用大數據分析平臺,首先對不同時段的司機收入進行量化;再根據各時段司機收入分布情況進行軌跡數據篩選,然后利用過濾數據對出租車的換道行為進行識別和次數統計,并計算出租車的平均速度;最后與司機收入結合分析出租車司機換道行為的習慣和心理對運營的影響.

1 換道行為軌跡分析

1.1 數據預處理

本文基于西安市出租車調度系統采集的GPS數據;數據格式依次為:‘序號’,‘車輛牌照’,‘時間’,‘經度’,‘緯度’,‘水平速度’,‘方向’,‘狀態位’(0 無狀態位 1 防劫2 簽到 3 簽退 4 空車 5 重車 6 點火 7 熄火).將 GPS 數據轉化為文本格式,上傳到HDFS分布式存儲平臺.原始的GPS軌跡數據可能存在數據缺失,漂移,時間錯亂,不完整等問題.因此本文通過數據預處理過程從12 000多輛出租車GPS數據中,選取了3189輛數據完備和準確的GPS數據進行分析,根據統計學原理,為了保障精度,假設在整個樣本區間95%的置信度下,0.05的誤差限,此時認為數據選取足夠可靠.

在數據預處理過程中,首先對GPS軌跡數據進行二次排序,獲得車輛的完整時空軌跡,然后對其進行以下幾個方面的處理:

(1)錯誤數據.一天出租車狀態位為‘4’即空車的數據,對于研究是無用數據,對于超出西安市范圍(東經108度~109 度,北緯 33.65 度~34.65 度)的數據均認為無用的錯誤數據,對錯誤數據直接刪除.

(2)重復數據.GPS 數據時間重復現象,如果重復時間數據沒有斷點現象,直接刪除一條重復數據,如果某時刻的重復數據造成斷點現象,刪除重復數據后,還需利用上下兩條數據進行插值處理.

(3)缺失數據.原始的GPS軌跡存在部分字段缺失(速度或航向角)現象,如果連續時間點中間某一字段缺失,利用上下兩條數據插值補足,如果存在大量連續時間點字段缺失,直接刪除.

(4)異常數據.在原始 GPS 數據中,存在 speed<0或者 speed >120(單位為 km/h)的異常速度值,還存在相鄰時刻的經緯度之差大于0.012閾值的GPS軌跡誤差,這些認為是異常數據,這樣的數據比較少直接剔除比較簡單并對后續研究沒有影響.

1.2 換道運動軌跡關系

汽車的行駛過程符合物理運動規律,如圖1所示建立汽車行駛運動的平面圖.圖1中i,j,k代表連續時間間隔車輛所在的經緯度點,Vi,Vj,Vk為車輛的瞬時速度,δi,δj,δk表示車輛行駛的航向角(即車輛瞬時速度與正北方向沿順時針形成的角度),θij,θjk表示軌跡方向(即相鄰上一時刻GPS點與當前GPS點的連線與正北方向的順時針角度).

圖1 汽車行駛運動軌跡

出租車在行駛過程中會發生航向角和軌跡方向的波動,而直線換道行為的軌跡波動會呈現規律變化,如圖2所示,Δδ1,Δδ2,Δδ3表示航向角偏差(相鄰兩個航向角之差),Δθ1,Δθ2表示軌跡偏差(相鄰兩個軌跡方向角之差),連續的四個GPS軌跡中,Δδ 先變大,再逐漸變小,之后又變大滿足關系 Δ δ1≈ Δδ3> Δδ2;對于軌跡方向,換道行為發生在同一道路方向,變化不大,即Δθ1≈ Δθ2.上述規律換道行為發生在同一道路方向,圖2中示例的是右拐彎,左拐彎也符合這一規律,如果是十字路口拐彎則滿足 Δ δ1≈ Δδ3< Δδ2且 Δ θ1< Δθ2,環島行為滿足 Δ δ3> Δδ1> Δδ2且 Δ θ1< Δθ2,因此根據航向角偏差和軌跡偏差的關系與變化規律可以區別不同的換道行為,本文研究的是在同一道路方向的換道行為即直道換道行為.

圖2 換道運動軌跡關系

2 換道行為識別模型

2.1 換道行為模型特征向量的選取

以換道行為的航向角偏差和軌跡方向偏差為特征,建立特征向量樣本集合T={(x1,y1),···,(xn,yn)},其中xi=(Δδi1,Δδi2,Δδi3,Δθi1,Δθi2),1 ≤i≤n,其中 Δ δi1,Δδi2,Δδi3表示連續四個GPS軌跡點之間的航向角偏差,同理Δθi1,Δθi2表示連續四個GPS軌跡點之間的連續兩個軌跡方向偏差;以D1表示1次出租車換道行為,D2表示其它情況;yi表示樣本xi屬于D1類或D2類的數學值,則:

2.2 換道行為識別支持向量機模型的實現

支持向量機 (Support Vector Machine,SVM)是機器學習領域可以用于分類的經典模型,它在解決有限樣本,數據非線性適應,模式識別中表現出許多優勢,本文利用Spark的SVMWithSGD進行換道行為識別.

SVMWithSGD通過求得最優分類面g(x)=wTx+b,將D1和D2分開.SVMWithSGD引入損失函數和正則化函數求解最優分類面[7],轉化為目標函數

最后采用隨機梯度下降求解.根據以上分析,換道行為識別算法如表1.

表1 換道行為識別算法

2.3 換道行為識別支持向量機模型的驗證

經過出租車(裝配GPS設備)在城市道路的實測,如表2所示得到200個由航向角和軌跡方向偏差與標簽組成的特征數據,標簽1表示換道行為,0表示其他,將200個特征數據隨機分為訓練樣本(120個樣本,大概有50多次換道行為)和測試樣本.利用spark的SVMWithSGD(stepSize,numIterations,gradient,updater,optimizer)進行模型訓練.其中,stepSize:迭代步長,默認為 1;numIterations:迭代次數,設置為 50;gradient:梯度下降的損失函數,設置為 hinge loss;updater:正則化,設置為L2范數;optimizer:隨機梯度下降優化計算.

表2 部分特征數據集

采用80個測試樣本(40次換道行為)進行測試,測試結果如表3所示,可以看出,Spark的SVM算法可以準確的識別換道行為.

表3 SVM 分類準確率

3 出租車司機換道行為的大數據分析方法實現

司機的換道行為的分析主要是研究不同時段司機換道行為發生的次數與出租車平均行駛速度的關系,首先將一天劃分成12個時段(即每兩個小時為一個時段),并按時段量化司機收入,大量的收入數據滿足大數中心定律,近似服從T分布,對平均收入進行區間估計并過濾置信范圍內的GPS軌跡數據,數據過濾后,利用SVM進行換道行為識別,并統計各時段換道行為發生次數和出租車平均行駛速度.換道行為的分析的關鍵是數據的定量統計和分析,由于數據量規模比較大,傳統的的數據庫和數據分析工具SPSS等分析方法比較耗時,而且本文分析的統計量計算步驟繁復,需進行大量的迭代操作.Spark是一個分布式系統架構的計算引擎,它是基于內存計算的框架,計算速度快,適合大規模數據迭代運算[8],并且spark包含數據統計庫函數,可以直接調用進行復雜的數學統計,為了分析計算方便,因此本文采用大數據平臺spark進行分析數據.

3.1 出租車司機收入量化

司機收入量化即計算司機每個時隙的收入,通過計算每個時隙出租車司機載客的距離,根據出租車運營價格大致得到司機的收入.利用司機載客狀態的GPS數據相鄰時間經緯度的變化,計算出間隔的距離,累積一個時隙得到司機的載客距離,從而得到司機的大致收入.利用spark對出租車司機收入量化,主要用到三個算子:map,groupByKey 和 mapValue.map 算子將原始數據切分成key_value型數據((車牌號,日期,時隙),原始數據),groupByKey 將 (車牌號,日期,時隙)這種key相同的數據聚合到一個組.mapValue對group成一組的數據進行操作,對司機收入進行量化.算法1中的V表示原始數據,原始數據:(車牌號,日期,時段,經度,緯度,航向角,狀態)=(carid,date,slot,lon,lat,A,state).

算法1.司機收入并行量化算法輸入:按時間排序的GPS軌跡數據.輸出:各個時隙司機的收入.1.map:2.切分數據為 key_value 形式:((carid,date,slot),V);3.groupByKey:4.將key相同的數據聚合成一組,即(carid,date,slot),iterable(V));5.mapValue:6.對每組數據的value進行操作7.for (line<- iterable(V)){8.if(state==5){9.累積計算載客狀態的每兩個相鄰時間間隔GPS點距離,olon,olat代表上一個經緯度;

10.distance=GetDistace(olon,olat,lon,lat);11.累積計算一個時隙載客總距離;12.Dis=Dis+distance;13.}14.累積計算一個時隙司機的收入;15.Salary=Dis*運營單價;16.}17.整合數據為 ((carid,date,slot),Salary).

3.2 按出租車收入的置信區間提取GPS軌跡數據

對于出租車司機的收入,由于存在很多非營運因素造成出租車司機收入過高或過低,影響出租車換道行為的分析結果.因此,首先假設出租車司機收入服從T分布,然后對出租車司機收入進行區間估計,在后續分析過程中,僅保留收入在置信水平為95%的置信區間內的出租車的軌跡數據,以消除收入極值的影響.出租車司機收入的置信區間如下式

其中,n為出租車數量,x為出租車收入均值的估計值,S為出租車收入方差的估計值,tα/2(n–1)為T分布水平α的分位數,其中顯著水平 α為0.05.在spark平臺上提取各時段平均收入置信區間內數據,算法2首先對量化收入用 map 數據轉化為 (時隙,(收入,原始數據)),然后進行groupByKey和mapValue計算,得到各個時段的置信區間,然后對收入數據進行filter操作,過濾出置信數據.

算法2.司機收入置信區間范圍內軌跡提取算法輸入:算法 1 數據 ((c a r i d,d a t e,s l o t),S a l a r y)輸出:置信區間的軌跡數據1.m a p:2.轉換數據為 (s l o t,( S a l a r y,V));3.g r o u p B y K e y:4.將 k e y 相同數據聚合為一組,即5.(s l o t,I t e r a t o r(S a l a r y,V));6.m a p V a l u e:ˉX 7.計算各時隙平均收入 和方差SˉX 8.=g e t A v e S a l a r y(I t e r a t o r(S a l a r y,V));ˉX 9.S=g e t V a r(I t e r a t o r(S a l a r y,));1 0.m a p:1 1.得出每個時隙收入的置信區c o n d i s;1 2.f i l t e r:1 3.從 (s l o t,(S a l a r y,V))過濾置信數 d a t a;1 4.d a t a=f i l t e r(c o n d i s.c o n t a i n s(S a l a r y)).

3.3 出租車司機換道次數提取

上述置信區間的軌跡數據,算法3在Spark上通過groupByKey和mapValue計算航向角和軌跡方向的偏差和平均行駛速度,并建立特征向量,通過map算子利用Spark已建立SVM模型進行換道行為判別,最后通過reduceByKey統計換道次數.

算法3.基于S V M的出租車換道次數提取算法輸入:置信區間的軌跡數據輸出:換道次數和平均速度1.g r o u p B y K e y:2.將(s l o t,V)按k e y聚合為一組;3.m a p V a l u e:4.計算每個時隙的平均速度m e a n v 5.m e a n v=g e t A v e r a g e S p e e d(I t e r a t o r(V));6.m a p V a l u e:7.計算連續四個G P S軌跡的航向角偏差和軌跡方向偏差;x i x i=(Δ δ i1,Δ δ i2,Δ δ i3,Δ θ i1,Δ θ i2)=g e t V e c t o r(I t e r a t o r(V));8.m a p:9.判別換道行為為 1,其他為 0;x i1 0.s t a t e=S V M M o d e l.p r e d i c t();1 1.r e d u c e B y K e y:1 2.統計換道次數S;1 3.整合數據為 (s l o t,(m e a n v,S)).

4 實例分析

通過司機收入量化,置信數據提取,和換道行為的分析,得到了各個時隙的換道行為次數,司機的收入,和出租車平均速度.最后,對換道行為的次數和出租車平均速度,司機收入進行相關性計算,評估三者的關聯關系.實驗環境:Spark 集群,13 臺 Workers,104 個Cores,64G Memory;GPS 數據集:西安市 2015年9月一個月的數據,約 70 GB數據,包含1萬多輛出租車.

本文相關性分析采用皮爾遜相關系數評估算法,通過相關系數臨界值表得知,當自由度為1000,顯著水平α=0.05時,顯著相關的相關系數臨界值為0.041,即對于1000組樣本數據,其相關系數絕對值大于等于0.041,則相關性顯著.以下各圖分析樣本的數量均大于等于1000.

在圖3中,可以看出0點到5點,出租車司機收入與置信范圍的邊界值低于其它時段,說明乘客量比較少,自 6 點后,收入開始增加,在 8 點到 9 點和 18 點到19點,出租車司機收入相比前一時段增幅比較大,說明這幾個時段是客流量高峰期.

圖3 各個時隙出租車司機的平均收入與其置信范圍的最低和最高值

在圖4中,0點到5點速度高于其它時段,速度與收入的相關系數低于臨界值0.041,不顯著相關,可以理解在這期間司機的駕駛速度快,與收入沒有直接的關聯關系,自 6 點后的其它時段,速度降低,相關系數大于臨界值,呈現正相關,表明在這期間,司機的駕駛速度變快,收入就會增加,并且在速度較低的時段相關系數明顯大于臨界值,說明在車流量多的時候速度與收入正相關性越顯著.

圖4 各個時隙出租車的平均速度及其與司機收入平均值的相關系數

圖5中0點到5點平均換道次數少于其他時段,速度與換道次數的相關系數為負值,小于臨界值-0.041,可以看出換道次數與平均速度沒有直接關系;6點以后換道次數增多,在車流量高峰時明顯高于其他時段,如 8 點到 9 點,18 點到 19 點,換道次數與速度的的相關系數呈現顯著的負相關,說明速度越慢,換道次數越多.結合圖4速度與收入的相關系數,可以得出結論,0 點到 5 點,在這期間,車流量少,出租車司機都以較快的駕駛速度運營,換道次數少,速度與換道次數和收入三者沒有相關關系;6點以后,隨著車流量增加,收入與速度呈現正相關,出租車司機通過提高速度來增加收入,為了提高速度多次換道,尤其在車流量高峰期,而頻繁的換道行為,造成了交通不暢,加劇了交通擁堵,反而降低車的行進速度,因此換道次數與速度呈現負相關.

圖5 各個時隙出租車的換道次數及其平均速度的相關系數

5 總結

出租車司機的直道換道行為是一種司空見慣的駕駛行為,一般的,我們認為出租車司機的的換道行為會提高出租車的駕駛速度,有利于出租車司機更好的服務乘客,但這種行為會對城市交通狀況產生什么影響,進一步這一行為受到什么因素驅動,本文通過大規模的GPS軌跡數據挖掘城市出租車司機的換道行為,發現出租車GPS軌跡數據中隱藏的規律與特征.

通過結果分析,出租車司機的直道換道行為受到收入的驅動,當車流量較少時,換道行為可以提高收入,但當車流量較大時司機頻繁換道行為致使車流整體速度降低,造成交通不暢,而出租車司機駕駛速度會影響它的收入,速度越慢收入越低,所以當車流量較大時,司機的頻繁直道換道行為會降低收入并且影響城市交通狀況,而且容易造成交通事故,建議出租車司機在車流量較大時盡量減少不必要的換道行為,養成良好的駕駛習慣,促進城市交通和諧.

主站蜘蛛池模板: 谁有在线观看日韩亚洲最新视频| 午夜a视频| 日韩无码黄色网站| 亚洲啪啪网| 99热国产在线精品99| 亚洲欧洲自拍拍偷午夜色无码| 在线中文字幕日韩| 欧美午夜理伦三级在线观看| 91无码视频在线观看| 日韩国产黄色网站| 成年人视频一区二区| 91无码国产视频| 免费在线国产一区二区三区精品| 欧美日在线观看| 一本久道热中字伊人| 久久人人爽人人爽人人片aV东京热 | 国产爽爽视频| 国产一区在线观看无码| 狠狠色丁香婷婷| 久久精品人人做人人综合试看| 国产成人精品一区二区不卡| 亚洲午夜福利在线| 亚洲床戏一区| 国产成年无码AⅤ片在线| a级毛片视频免费观看| 亚洲an第二区国产精品| 精品国产一二三区| 亚洲AⅤ综合在线欧美一区| 亚洲国产成人久久77| 欧美一区二区精品久久久| 在线观看国产精美视频| 久久www视频| 免费高清毛片| 欧美中文一区| 欧美在线视频a| 欧洲亚洲欧美国产日本高清| 五月激激激综合网色播免费| 久久久久人妻精品一区三寸蜜桃| 国产网友愉拍精品视频| 亚洲AⅤ波多系列中文字幕| 国产欧美网站| 久久久久无码精品| 国产剧情国内精品原创| aa级毛片毛片免费观看久| 高清国产在线| 亚洲第七页| 亚洲最猛黑人xxxx黑人猛交| 国产成人av大片在线播放| 沈阳少妇高潮在线| 亚洲码一区二区三区| 99热国产在线精品99| jizz亚洲高清在线观看| 亚洲一区二区日韩欧美gif| 国产欧美日韩va| 国产第一页免费浮力影院| 亚洲国产综合自在线另类| 精品无码国产一区二区三区AV| 大学生久久香蕉国产线观看| 久久免费精品琪琪| 一本大道视频精品人妻| 99re在线视频观看| 波多野吉衣一区二区三区av| 欧美日韩北条麻妃一区二区| 色妺妺在线视频喷水| 久久这里只有精品免费| 久久精品娱乐亚洲领先| 人妻精品久久久无码区色视| 日韩第九页| 99精品福利视频| 色婷婷亚洲综合五月| 直接黄91麻豆网站| 4虎影视国产在线观看精品| 亚洲无码高清一区二区| 在线观看亚洲成人| 亚洲国产一成久久精品国产成人综合| 综合成人国产| 国产精品女同一区三区五区| 国产经典三级在线| 看你懂的巨臀中文字幕一区二区 | 亚洲一区波多野结衣二区三区| 亚洲日本中文字幕天堂网| 久久国语对白|