999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于出租車軌跡數據的人口活動分析

2016-08-02 03:29:40韓吉德王祖順
測繪工程 2016年10期
關鍵詞:數據挖掘

韓吉德,王祖順,王 霞

(青海省第二測繪院,青海 西寧 810001)

?

基于出租車軌跡數據的人口活動分析

韓吉德,王祖順,王霞

(青海省第二測繪院,青海 西寧 810001)

摘要:根據軌跡數據識別出人們感興趣的區域,并且挖掘出人們的日常出行特性,作為數據挖掘的一個熱點逐漸受到人們的重視。目前,絕大多數大城市的出租車上都安裝有GPS,其記錄的軌跡數據在時間和空間上都包含豐富的信息,分析出租車的軌跡數據能在一定程度上反映城市人口的出行情況,挖掘有價值的信息。文中挖掘出租車軌跡數據中的乘客上下車的位置點數據,經過數據預處理、地圖匹配以及整合后,對位置點進行有權重的熱點區域分析,疊加到地圖上進行人口活動分析。

關鍵詞:出租車軌跡;數據挖掘;熱點區域;人口活動

隨著衛星技術、傳感器技術、無線技術、RFID技術的出現和快速發展,實時追蹤移動對象的運動軌跡已經變成現實,并且現在每天都產生著海量的移動對象的軌跡數據,這些看似雜亂無章的時空數據實際蘊含著豐富的信息,人們逐漸認識到,如何高效準確地挖掘出其中的價值變得尤為重要。數據挖掘是一個從不完整的、不明確的、大量的并且包含噪聲,具有很大隨機性的應用數據中,提取出隱含其中、事先未被人們獲知、卻潛在有用的知識或模式的過程。從海量的出租車軌跡數據中挖掘出人口活動的信息屬于移動軌跡數據挖掘的范疇。數據挖掘的整個過程分為數據預處理、數據挖掘、結果解釋和評價。

1地圖匹配

出租車軌跡數據具有范圍廣、成本低、數據提取方便等優點,但是由于受到GPS定位精度的影響,位置點數據很難精確定位,往往會偏離交通路網,因此,為了更準確的分析,需要進行地圖匹配,將位置偏差的點重新定位到交通路網上。

地圖匹配必須滿足兩個前提條件:

1)GPS點所表示的車輛行駛在已知的道路網上;

2)匹配的道路網絡數據精度比GPS點精度要高得多。

地圖匹配算法多種多樣,總體分為點到點的匹配、點到線的匹配、線到線的匹配,考慮到點到點的匹配算法的精度問題以及線到線的匹配算法的復雜性,本文選擇點到線的匹配算法,該算法不僅考慮兩點的距離,還將道路線信息加入考慮因素,設置一個匹配度的概念,如圖1所示,假設待匹配點P到道路CG的垂直距離為d,設距離所占權重為φ,P點的行駛方向與道路的夾角(0~90°)大小為Q,角度所占權重為μ,再對兩者加權相加,則P點到道路CG的匹配度為S。

圖1 地圖匹配

地圖匹配算法的詳細流程:讀取出租車軌跡點—以該點為圓心確定搜索范圍(100m)—匹配范圍內的道路—計算待匹配點與道路的匹配度—選取匹配度最高的道路—更新待匹配點坐標。由于匹配的道路網數據坐標系為WGS-84,而GPS點經緯度也為WGS-84,故不需進行坐標轉換。

2數據整合與熱點區域分析

軌跡點數據因為其數據量巨大,在地圖上的分布比較分散,從原始數據上很難挖掘出有價值的信息。因此需要對數據進行聚類,從而使數據能夠分門別類。本文采用數據整合處理,取代復雜的聚類算法。數據整合就是將坐標位置在誤差允許范圍內的點聚為一個點,容差的值非常關鍵:容差過大會導致要素折疊或導致面或線被刪除,還可能導致不應該移動的折點被移動。要使誤差降至最小,選擇的 x,y 容差值應盡量小。數據整合X,Y,需要將同一個坐標位置的重合點計數,以計數來表示權重。

有了每個點的權重信息以后就可以進行熱點區域分析。本文采用核密度分析方法,該方法用于計算每個輸出柵格像元周圍的點要素的密度。概念上,每個點上方均覆蓋著一個平滑曲面。在點所在位置處表面值最高,隨著與點的距離的增大表面值逐漸減小,在與點的距離等于搜索半徑的位置處表面值為零。搜索半徑參數值越大,生成的密度柵格越平滑且概化程度越高。值越小,生成的柵格所顯示的信息越詳細。計算密度時,僅考慮落入鄰域范圍內的點或線段。如果沒有點或線段落入特定像元的鄰域范圍內,則為該像元分配NoData。如果面積單位比例因子的單位相對于要素(點間距離或線段長度,取決于要素類型)很小,則輸出值可能會很小。

本文的研究路線主要為:

Step1:數據預處理。該階段主要對數據進行篩選、集成、選擇等操作;

Step2:數據挖掘。對經過數據預處理的軌跡點數據進行整合、密度分析;

Step3:結果解釋和評價。將分析結果與電子地圖疊加,結合POI位置,分析人口活動規律。

3實驗

本文使用的是北京市2012-11-01全天24h的2000輛出租車軌跡數據,數據說明如表1所示。

表1 數據項說明表

數據預處理主要分為以下幾點:

1)北京市經緯度范圍為39°28′~41°05′N、115°25′~117°35′E,凡是超過此范圍的數據都將被剔除;

2)數據項出現空的情況:當速度為空,因為不影響本文的研究,故可以忽略,其余項如經度、緯度、時間等如果為空,就將該條記錄刪除;

3)提取上下乘客點:根據“觸發事件”字段,提取出下客點(0=變空車)、上客點(1=變載客)數據;

4)將全天24h的數據分成5個時段,分別為0:00—8:00、8:00—12:00、12:00—16:00、16:00—20:00、20:00—24:00,以便于從時空兩個角度分析人口出行活動情況。

數據整合操作使用ArcMapDataManagementTools工具箱中的integrate工具。通過不斷調整容差值,確定容差為50m時,整合效果比較合適。經過整合以后,同一個位置會表示多個點,采用SpatialStatisticsTools工具箱中的CollectEvents工具可以完成點數的統計,該工具可將重合點合并:它會創建一個新的輸出要素類,其中包含在輸出要素類中找到的所有唯一位置。然后,它會添加一個名為ICOUNT的字段,以保存每個唯一位置所有事件點的總和。

經過CollectEvents,生成的Icloud字段作為核密度分析中Population的值,即權重。通過調整搜索半徑及輸出象元大小,得到詳細程度適當的結果。

整個過程通過ArcMap建模得到,模型如圖2所示。

圖2 熱點分析建模

為了結合北京市的地圖信息,將ArcGISonline上共享的北京市地圖(含POI)加載到本地,并調整透明度,與柵格圖疊加,因為含有POI信息,因此更有利于說明人口活動的規律。圖3~圖5為3個時段乘客上車點的數據分析得到的熱點區域分布圖(說明:因為不是最新數據,所以以下分析僅作學術研究說明,并不一定與實際相符)。

圖3 0:00-8:00

圖4 8:00-12:00

圖5 20:00-24:00

總體來說,從凌晨到8:00人口活動非常稀少,整個圖中只出現兩個相對比較密集的點,從地圖上得知分別是工人體育場、朝陽醫院附近以及北京大學、清華大學附近;而到8:00-12:00,這時候的上班人群比較多,乘車點分布較為分散,五環以內都比較密集,但相對的左側的海淀區、豐臺區相對于右側的朝陽區較為密集,因此分析,上午從海淀區、豐臺區出發上班的相對較多。晚上20:00—24:00,朝陽區與東城區區域乘車人口最為密集,而海淀區、豐臺區則相對較稀疏,與白天形成對比,相對比較合理。因此分析整體的大趨勢是白天從海淀區、豐臺區往朝陽區、東城區,而到夜晚則相反。

再對比乘客下車的位置點分布:

下車點(見圖6)位置說明這個時間點乘客想要到達的目的地,從圖上顯示分布較為密集主要是火車站、飛機場等,從左往右,自下而上依次為豐臺西站、北京西站、中國海關,機場路上的酒店賓館聚集

圖6 0:00-8:00(下車點)

點以及飛機場。因為在這個時間段去的目的地肯定是車站或機場較多。因此0:00-8:00人口的主要活動趨勢是從市區到各個火車站以及機場。

4結束語

由于數據的局限性,本文只采用了一天的數據進行分析,沒有對比工作日與休息日之間的不同,并且本文只對人們的出行活動做了簡略的、簡單的分析,但是基于位置與時間的軌跡數據對于時空GIS的研究有重要的意義,通過對人們出行規律的準確掌握,可以提供基于位置的各種各樣的服務,為商鋪、公園等選址提供決策依據,優化交通調度系統,有效地緩解交通堵塞等。

參考文獻:

[1]鄭宇,謝幸.基于用戶軌跡挖掘的智能位置服務[J].中國計算機學會通訊, 2010, 6(6): 23-30.

[2]馬云飛.基于出租車軌跡點的居民出行熱點區域與時空特征研究[D].南京:南京師范大學, 2014.

[3]張明月.基于出租車軌跡的載客點與熱點區域推薦[D].長沙:湖南科技大學, 2013.

[4]袁冠.移動對象軌跡數據挖掘方法研究[D].北京:中國礦業大學, 2012.

[5]陽憲惠.工業數據通訊與控制網絡[M].北京:清華大學出版社,2001.

[6]YUANNJ,ZHENGYu,ZHANGLiuhang,etal.T-Finder:ARecommenderSystemforFindingPassengersandVacantTaxis[C].IEEE,KnowledgeandDataEngineering, 2012.

[7]HUANGL,LIQ,YUEY.ActivityidentificationfromGPStrajectoriesusingspatialtemporalPOIs’attractiveness[C].ZhouXF.Proceedingsofthe2ndACMSIGSPATIALInternationalWorkshoponLocationBasedSocialNetworks.SanJose,California:ACMPress, 2010.

[8]YUEY,HUB.Identifyingshoppingcenterattractivenessusingtaxitrajectorydata[C].JiangB,HuangW.Proceedingsofthe2011internationalworkshoponTrajectorydataminingandanalysis.Beijing:ACMPress, 2011.

[責任編輯:張德福]

DOI:10.19349/j.cnki.issn1006-7949.2016.10.014

收稿日期:2015-10-11

作者簡介:韓吉德(1977-),男,工程師.

中圖分類號:P208

文獻標識碼:A

文章編號:1006-7949(2016)10-0069-03

Population activity analysis based on taxi trajectory data

HAN Jide,WANG Zushun,WANG Xia

(QinghaiProvinceNo.2SurveyingandMappingInstitute,Xi’ning810001,China)

Abstract:It is difficult in data mining to discover the region of interest and dig out the people's daily travel features according to the trajectory data,which gradually draws the attention of the people. At present, the taxi in most of the cities has been set with GPS,which records trajectory data with rich information in time and space. To a certain extent, it can reflect the travel of the urban population and dig out useful information by analyzing the trajectory data of the cab. This paper mainly presents the positions of getting on or off the taxi and then data preprocessing, map matching, and integration. After all it can be done to analyze the region of interest with the weight and the trajectory data of the cab with map.

Key words:taxi trajectory; data mining; region of interest; population activity

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 久久黄色毛片| 国产精品毛片一区视频播| 国产十八禁在线观看免费| 日本成人在线不卡视频| AV片亚洲国产男人的天堂| 尤物精品国产福利网站| 丰满人妻久久中文字幕| 精品成人一区二区三区电影 | 欧美成人看片一区二区三区 | 国产在线一区二区视频| 国产精品短篇二区| 男人天堂亚洲天堂| 久无码久无码av无码| 亚洲色大成网站www国产| 中字无码av在线电影| av午夜福利一片免费看| 亚洲一区网站| 操国产美女| 国产免费高清无需播放器| 在线欧美a| 97se亚洲综合在线天天| 国产亚洲欧美另类一区二区| 久久久久人妻一区精品色奶水 | 在线看免费无码av天堂的| 美女高潮全身流白浆福利区| 免费不卡视频| 亚洲精品国产综合99| 成人福利一区二区视频在线| 国产欧美又粗又猛又爽老| 一本大道香蕉中文日本不卡高清二区 | 亚洲黄网在线| 日本在线欧美在线| 久久a毛片| 久久毛片免费基地| 多人乱p欧美在线观看| 色婷婷亚洲十月十月色天| 国产人成在线观看| 国产黄网永久免费| 色香蕉网站| 2019国产在线| 日韩欧美在线观看| 国产黄视频网站| hezyo加勒比一区二区三区| 国产日本视频91| 57pao国产成视频免费播放| 久久精品丝袜| 内射人妻无码色AV天堂| 久久狠狠色噜噜狠狠狠狠97视色 | 丝袜无码一区二区三区| 国产综合精品一区二区| 在线观看的黄网| 91系列在线观看| 日韩成人免费网站| 亚洲中文精品人人永久免费| 久久久精品国产亚洲AV日韩| 国产成人AV男人的天堂| 国产精品va| 尤物国产在线| 日韩在线中文| 91精品国产91欠久久久久| 亚洲视频免费在线| 男女性色大片免费网站| 成人福利一区二区视频在线| 亚洲欧美日韩天堂| 国产成人精品亚洲77美色| 亚洲动漫h| 99精品国产电影| 在线国产毛片| 中国国产高清免费AV片| 亚洲欧美日韩动漫| 9久久伊人精品综合| 国产精品女人呻吟在线观看| 婷婷五月在线| 精品久久国产综合精麻豆| 色综合久久无码网| 婷婷亚洲视频| 国产手机在线观看| 日本人真淫视频一区二区三区| 黄色a一级视频| 国产精品无码AV中文| 亚洲码一区二区三区| 亚洲天堂首页|