劉康 陳智勇 黃慶鵬 張逸泓



摘要:本文利用GPS所采集到的數據,把租車群體的外出行為進行深入分析。通過對大數據進行預先處理,然后建立數據處理模型,分析租車人群的出行規律,推測租車人群的需求,從時問和空間上研究城市租車人群的分布,為城市交通運輸提供科學依據和理論支持。
關鍵詞:GPS;出行行為;租車人群;數據采集
中國分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2020)20-0048-03
如今,城市人口密集,道路交通擁擠,能源消耗,環境污染成為出行所面臨的一個巨大問題。人們的出行行為分析已經成為城市進行交通道路建設及城市規劃的一項重要參考。由于GPS技術具有實時、客觀以及數據量大等特點,GPS移動軌跡數據的挖掘和分析為解決城市擁堵和用戶出行提供新思路方法,可以很好地描述和分析用車人群出行行為特征,特征,蘊含著巨大的價值,挖掘移動軌跡數據背后隱藏的有用信息,可改善出行交通流,實行交通預測預警。隨著當代生活節拍和都市住民生活多元化的加快,住民外出的調查的難度也日益提高。出租車作為一種不同于公交車的交通器材,其營運具有隨機性、全天候行駛以及即停即走等特征,其運營規律能夠很好地反映搭客出行特征。此次調查主要面向的對象是針對人流量較大的租車人群,實施的范圍是我國人口密度較大的省份和城市。通過出行行為分析,也對租車行業車輛調度,提取租車人群用戶畫像標簽信息發現商業圈,熱點旅游區、采摘季山區路況及農戶出行行為等,具有一定的研究意義和價值。
1問題分析
擬解決問題一:如何對數據來源采集與提取。隨著人們生活質量越來越好,車輛逐漸變成每家每戶的必備工具之一。這為我們的對人們出行研究提供了基礎保障,傳統方式的數據采集必須通過對租車人群進行走訪調查,或者是通過租車戶登記等信息來進行數據收集與分析,其不規律性和采集信息的困難度很大。這樣處理起來的誤差會比較嚴重。而隨著科學技術地不斷發展,GPS的引入為采集用戶出行信息提供了強有力的保障。可能只需要些許設備,或者調用第三方已經處理好的工具。那么我們就可以實時地獲取到相對傳統方式更加可靠且精細的數據來源,便于我們能夠根據租車人群的移動軌跡,能夠更好地對風險駕駛、道路規劃、出行時間和空間上進行深維度的分析,從而對駕駛行為、租車人群時間和空間上的分布都可以對其指定策略。
擬解決問題二:租車人群軌跡數據分析,在已經通過GPS的方式收集到可靠數據的前提下,那么就可以根據定位實時位置,來獲取到經緯度信息。之后在地圖上進行詳細的標注,并且按照路段不同情況下車輛的加速度,減速,轉彎根據特定的算法對車輛的軌跡在地圖上進行描述與展現。這樣計算下來的一條軌跡即是一名租車人群出行軌跡圖。那么之后我們就可以通過對各種不同路段進行采集,加大采集數據量。以大數據的統計方式來減小誤差的產生。有了一定的數據基礎后,我們便可以對數據進行數據清洗并進一步地優化軌跡與總結。
擬解決問題三:數據人群時間和空間上分析。除了對軌跡處理之外,根據不同的城市,時間和空間上的分析也是必不可少的。時間上我們采用與法定工作日的時間,對數據進行日常的采集,然后我們會將一日時間劃分為四個階段,分別是第一階段凌晨零點至凌晨六點,第二階段為凌晨六點至午時十二點,第三階段為午時十點至下午十八點,第四階段為下午十八點至凌晨零點。然后分析人們在不同階段的出行情況。繪制成統計圖。這樣就能直觀地表述人們在一天中不同時候的外出情況。一周多次采集求取均值,以縮小誤差產生。再將一周作為一個梯度,重復采集3-4周,以減小因各種原因產生的周誤差。這樣提取的數據就會變得更加的精確。在空間上的分析就根據一線都市車輛與普通二三線都市進行比較。但因一線城市交通方式更多種多樣,各種不確定性較多。而且在一線城市不同的地段,在繪制圖形時可能會出現不同的峰值情況。這時候就采用去掉峰值與最低值,再對數據進行處理來減小空間上分布不均勻造成的誤差。
2實施方案
2.1建立數據處理模型
首先需要把出租車GPS大數據集放到Hadoop平臺上,將其存儲在Node2的HBase數據庫中,接下來對受天氣、環境及操作誤差影響較大的數據進行預處理,如果不對這些大數據進行預先處理,將會有很大的可能產生非常大的誤差,在使用這些數據之前進行預先處理,可以使得最終的結果更為準確,實行預處理后首先使用DBSCAN算法把預處理后的所得的數據進行處理得到合適的K值,然后把K值作為K-means算法的初始簇心對數據進行最終處理。
在收集數據之前,先根據經緯度對區域進行劃分,在區域內的數據進行收集和處理,區域外的則進行剔除。劃分區域后對產生的無效數據進行排除,當GPS終端收到車輛的經緯度數據長時間沒有發生改變時,表示車輛速度為0,處于靜止狀態,這樣的數據需要對其進行剔除。或者接收的經緯度數據在短時間內發生極大的改變,這樣所得到的數據不能真實地反映車輛情況,也屬于無效數據。
2.2數據分析
2.2.1租車人群時間和空間上分析
一般而言,租車人員的出行特征會有一定的地域性,不同的租車人員,有著完全不同的出行特征,根據租車人員的起始地和目標地,得出租車人員的外出時間,外出距離和外出高峰期,這里首先分析研究出租車輛工作日和非工作日的GPS數據然后把工作日和非工作日的研究數據分開研究,然后在DB-SCANS算法得出K值后,用K-means算法進行處理,聚類分析不時間段的狀態,從而分析出某一天的租車人員行為特征,對比7天的數據處理結果,得出某城市中一天大概的租車信息。
給定一個數據集X={X1,X2,…,Xn}假沒K個簇的簇類中心為P={P1,P2,……Pk},那么有概率聚類的目標函數形式如下:
F(n,p)=
其中Q(Xk)表示Pi和Xk的聯合概率分布Q(Pi|Xk)代表樣本數據點,Xk屬于第i個聚點的條件概率,由此可得出以下圖像。
2.2.2租車人群軌跡數據分析
由GPS巾包含的信息中可以根據經緯度和時間得出車輛的位置信息和運動軌跡,分析研究7天中出租車的GPS數據,得出租車人群的主要活動地點和運動軌跡,對活動路線實行聚類分析得到整體活動熱點,再根據經緯度坐標上的距離和車輛運行的時間分析m租車輛的平均速度,大致地預估某城市的交通路況,從而能夠更好地規劃行駛路線、出行時間以及降低駕駛風險。
出租車輛駕駛節點A,B的位置坐標的經緯度分別是(Lo-nA,LatA)及(LonB,LatB),在t時刻速度為Vt,下一時刻速度為Vt+1,時間變化量為At。平均速度為V,兩點間的距離為Dis-tance。
C=sin(LatA*II/180)*sin(LatB*II/180)+cos(LatA*'IT/180)*cos(LatB*'TT/180)*
cos((MLonA-MLonB)*'1T/180)
DistanCe=R*Arccos(C)*'IT/180[2]
V=DistanCe/At
2.2.3對數據進行利用
得到處理后的數據后,可以建立起租車人員的用戶畫像,根據用戶畫像,推測出租車人群的行為和需求,了解其出行規律。從而在活動范圍熱點在其附近設立商圈對出行人群精準營銷,并對城市通行路況進行解析,經過交通預警緩解城市的交通擁堵。
3結論
最終得出的結論有一定的參考價值但不能完全表現出所有的時間所有的地點乘客出行的時間特征和空間熱度區域。通過對乘客出行的時間特征和空間熱度的分析可以城市更有效地安排公共的交通具的設置地點,這樣即環保又能為乘客供應快捷的服務,促使和諧社會更好更快的發展。此外,通過客流量的空間熱點區域的分析,可以在熱點區域設置休閑娛樂場所為商人提供商機,不僅促進的經濟的發展,也使人們生活變得更加愜意。此外,大數據分析研究了租車人群出行行為數據,對租車人群出行行為在不同時間、空間、距離等方面數據進行了深入剖析,提取出了租車出行行為特征,可以建立起租車人員的用戶畫像,根據用戶畫像,推測出租車人群的行為和需求,了解其出行規律,可以對城市交通路況進行分析,通過交通預警緩解城市的交通擁堵,也可調度為出行人群提供精準服務等。
參考文獻:
[1]劉惠宇,劉鵬,張婷.基于出租車GPS數據的城市人群出行模式研究[J].江蘇科技信息,2019(17):49-50.
[2]郭艷君.基于GPS軌跡數據實現營運客車風險駕駛行為分析.[J】.教育教學論壇,2017(3):76-77.
[3]魏祥.基于大數據挖掘的出租車行為檢測方法研究[D].西南石油大學,2015.
[4]盛勇.基于GPS軌跡數據的居民出行行為特征分析[D].江西理工大學,2018.
[5]劉敬帥.基于出租車GPS數據的居民出行分析[D].蘭州理工大學,2017.
[6]何賢國,孫國道,高家全,等.出租車CPS大數據的道路行車可視分析[J].計算機輔助設計與圖形學學報,2014,26(12):2164-2170.
[7]張亞茹.基于車聯網大數據分析的實時路況信息系統關鍵技術研究[D].南京郵電大學,2017.
【通聯編輯:梁書】
收稿日期:2020-04-15
基金項目:教育部產學合作協同育人項目;項目名稱:面向大數據技術的創新創業教育改革;項目(基金)號:201802130075;廠東省大學生創新創業訓練項目(粵教高函[2019]40號)
作者簡介:劉康(1998-),男,廣東河源人,本科,研究方向:軟件工程;陳智勇(1996-),男,廣東普寧人,本科,研究方向:軟件工程;黃慶鵬(1997-),男,廣東梅州人,本科,研究方向:軟件工程;張逸泓(1999-),男,廣東汕頭人,本科,研究方向:物聯網工程。