楊沁樓,王飛翔












摘要:軌跡數據隱含著城市交通系統的豐富信息,出租車作為城市交通的重要組成部分,其軌跡具有數據源獲取容易、成本消耗小、更新快、反饋快等特點,其軌跡信息可以為城市道路網信息的提取和還原提供支持?;谶@個背景,開展基于出租車軌跡數據提取道路信息和構建道路模型的研究具備一定的實際意義,通過對道路中心線、道路交叉口等信息的提取,還原道路模型并對還原效果并進行評價,所獲得的成果能為基于軌跡路網信息提取的進一步研究提供參考,也能為大眾的出行和相關管理部門的工作提供決策支持。
關鍵詞:出租車軌跡數據;數學形態學;道路提?。籄rcGis
中圖分類號:G642? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)35-0060-04
1 緒論
1.1 研究背景及意義
隨著時代的進步,大數據研究成為一股熱潮,其目的在于實現數據的“增值”。大數據具有5V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。大數據可以分為三類:傳統企業數據、機器和傳感器數據、社交數據。
軌跡數據是機器和傳感器數據的一部分,蘊含著相當可觀的數據信息,對路網信息更新、智慧城市建設等方面起到相當積極的作用。城市路網是城市范圍內由不同功能、等級、區位的道路以一定的密度和適當的形式組成的網絡結構,是城市居民出行不可或缺的資源;隨著GPS儀器、衛星定位、道路監控、便攜式定位設備以及傳感器技術的迅速發展,對于移動對象的實時追蹤已經成了現實,這就使得我們可以在低時間成本和經濟成本條件下輕松獲得大量的、實時的軌跡數據,進而對城市交通系統進行完善,諸多學者開始著眼于研究軌跡數據,希望能從中提取出可靠有效的路網信息。
1.2 國內外研究現狀
從各類數據中提取路網信息是當下數據挖掘的熱點方向之一。
國外方面,針對道路信息數據,Kim、Kyoungok同時分析了地鐵和出租車的數據,以揭示首爾交通工具對人的流動性的影響因素,采用了聚類和分類等數據挖掘技術,確定影響乘客模式的因素[1]。Gong和Cartlidge基于軌跡數據,利用地理感興趣點(POI)數據和時空聚類相結合的方法,自動識別每個出租車行程的相關活動,并估計行程后的返回行程和后續活動[2]。
國內方面,也有許多針對出租車數據的挖掘案例。李清泉通過出租車軌跡回復路線,與已有路徑進行比對分析,以獲取經驗最優路徑[3]。何曉軍等學者提出基于 VGA 聚類的遙感影像道路中心線的提取,該方法解決了聚類數目難以確定的問題,但是數據源獲取昂貴,對于軌跡數據來說適用有待商榷[4]。劉笑等學者通過全卷積神經網絡提取道路信息,該方法數據源使用的是遙感影像,需要大量的數據集支撐,效率慢,費用昂貴[5]。
2 有效軌跡提取
2.1數據采集
本文需要收集出租車的軌跡數據和北京市交通圖。其中,收集到的出租車軌跡數據為北京市10357輛出租車在2008年2月2日至2008年2月8日期間的GPS位置,數據以txt的格式存儲。其格式如圖1所示。各字段含義如下:車序列號、年月日、具體時間點、經度值、緯度值。如圖1中的第一行出租車軌跡數據值表示:序列號為1的出租車在2008年2月2日15點36分08秒處于東經116.351172°,北緯39.92123°的位置。
除此之外,筆者從谷歌地圖上截取了2008年北京市交通圖,用于對比分析路網信息提取的效果。
2.2數據預處理
數據預處理即針對數據噪聲進行處理,旨在提高數據處理的速度,減少臟數據在模型構建過程中的影響。異常數據即偏離預期道路軌跡的數據,對已發表文獻總結,找到異常軌跡數據處理主要有四種方法[6]:歷史軌跡相似性檢測法、閾值檢驗法、網格檢驗法、分類檢測法。
閾值檢驗法較為簡單且精度較高,可以相對準確地將偏離主干線的點進行刪除,滿足數據預處理的要求,且適合本文的數據量,所以本文采用此方法對交通軌跡數據進行異常處理。
異常數據刪除示例如圖2所示。
2.3 道路中心線的提取
2.3.1 面狀道路要素構建
面狀要素的構建是道路中心線提取的關鍵一環,構建面狀要素即是構建出整體的道路輪廓,該輪廓與城市交通路網相對應。
面狀道路要素構建可以直接建立要素緩沖區來達到目的,從我們搜索的資料來看,北京市的道路寬度平均為14.64米,所以我們對出租車軌跡點的緩沖區半徑設置為10-20米,希望建的緩沖區能夠相對全面地覆蓋道路。
本文分別選取10米、15米、20米、25米為緩沖區半徑進行嘗試,具體實驗結果如圖3所示。
從中不難看出,20米的緩沖區半徑最為合適,而10米、15米緩沖區的道路面具有斷開、不連通的現象,且存在大量的噪聲干擾;當緩沖區半徑大于20米,道路面無法體現出道路的細節,相鄰的道路會融合在一起,從而無法精確地得出道路模型,所以本文采用20米作為緩沖半徑構建道路面。
2.3.2基于數學形態學的柵格清理
數學形態學(Mathematical morphology)是一門建立在格論和拓撲學基礎之上的圖像分析學科,是數學形態學圖像處理的基本理論。
進行柵格清理時需要用到基于數學形態學的膨脹和腐蝕運算。膨脹可以理解為是求局部最大值的操作,設有兩個集合A,B,對B移動x距離后,仍存在與A集合內的B要素點,即膨脹后的結果。也可以理解為A與B進行了卷積處理,B為核,計算集合B所在區域的最大像素值,并將該像素值賦予我們指定的像素,使得該區域內某些像素值得到突出顯示。
如公式(1)所示:
[A?B=B+x?A]? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
A為被處理集合,B為結構元素,或可以理解為卷積運算中的核,[?]為卷積運算符;
腐蝕運算則不同,將集合B移動x距離,若新集合B’與A集合相交,則將相交要素集合輸出,即是腐蝕運算的結果;
如公式2所示:
[A⊕B=B+x?A≠0]? ? ? ? ? ? ? ? ? ? ? ? ? (2)
A為被處理集合,B為結構元素,或可以理解為卷積運算中的核,[?]為卷積運算符;
細化前要將構建的矢量的道路面數據進行柵格化處理,盡可能地保留原來數據的信息,從而保持道路連通性。
采用大量的低精度的出租車移動軌跡數據,在經過緩沖區分析、柵格轉化之后難免存在一定的問題,數據中存在空洞,破壞了數據的連通性,數據邊緣存在毛刺,細化會產生零散的道路,對主干道產生干擾,如圖4所示。
如圖5所示,我們使用對柵格數據進行清理,運算像元為前景像元,對像元進行開運算和閉運算,
通過開運算可以看出:
圖像中孤立的點經過開運算之后被消除,且要素邊緣的毛刺也被平滑,開運算起到了平滑、消除噪聲的作用,而且保持了原圖像整體的幾何形狀和位置沒有發生改變。
對數據進行閉運算,結果如圖6:
通過閉運算結果,可以看出:
閉運算能夠填補空洞,閉合裂縫,而且與開運算一致,都保持了圖像要素整體的幾何形狀與位置不發生變化。
最后清理結果如圖7所示。
2.3.4 細化
細化算法的目的就是在保持圖像原有的拓撲結構和幾何結構不變的前提下,提取圖像的中心像元,以消除冗雜要素,突出圖像主要特征,同時可以減少內存消耗,加快計算機處理速度。
細化后的效果如圖8所示,道路提取結果如圖9所示,所得的線要素就是北京市交通道路網。
3 道路模型的構建
3.1 道路交叉口提取及模型構建
提取道路交叉口有助于完善道路的拓撲結構,道路交叉口的位置、拓撲連接以及路口的方向關系是構建路網不可或缺的,其定義如表1所示:
常用的道路交叉口提取方法有基于密度峰值聚類的道路交叉口提取方法和遍歷法以及拓撲法等等[7],常用的是遍歷法和拓撲法。
基于ArcGIS,使用拓撲法得到交叉點,進而提取交叉口;基于道路要素,建立網絡數據集,建立轉彎要素類,針對道路端點設置連通性,在添加屬性時,添加道路長度和道路交叉口,最終生成道路模型,如圖10所示:
3.2 道路模型評價
經過道路交叉口的提取,我們構建了路網模型,得到了交通圖,現將北京市交通圖作為底圖,對其進行綜合評價:
(1)道路精度評價。道路模型與底圖基本重合,主要線路不偏離底圖道路,精度符合要求,如圖11所示:
(2)道路完整性評價。北京市的主要道路已經完整地從出租車軌跡數據中得到提取,主要道路從模型中得到了體現,可以從道路模型中看到北京三環內的道路得到了體現,道路完整性良好。
(3)道路拓撲關系評價。具備一定的拓撲結構,具有連通性,標識出了道路拐角、丁字路口、十字路口等要素,符合實際情況,具備合理性。
4 總結
在前人研究基礎上,本文基于出租車軌跡數據對道路進行了還原,并對還原結果進行了評價,在這個過程中取得以下一些認識:
(1)基于異常數據檢測算法,對異常數據進行了刪除,提高了數據精度。
(2)對道路中心線的提取,總結了一套方法,分析了緩沖區分析的半徑參數,并利用數學形態學進行了去噪和空洞填補等操作。
(3)基于道路模型,得到道路交叉口等信息,進一步豐富了道路模型的數據內涵。
(4)使用出租車軌跡數據來還原道路是提取最新道路信息的一種方式,由于出租車軌跡數據獲取容易、成本消耗小、更新快、反饋快,可以考慮選為更新道路信息的一種方法進行使用?;谶@個背景,該設計開展了基于出租車軌跡數據提取道路信息和構建道路模型的研究,所獲得的成果能為路網信息提取和更新提供幫助,有一定的實用價值。
本文在研究過程中有以下不足之處:
(1)在進行道路面狀要素構建的時候只考慮到全局的連通性,用相同的緩沖半徑構建道路面,對局部細節處理不到位。
(2)細化算法的選擇較為單一,對目前主流的細化算法討論不到位。
參考文獻:
[1] Bertolotto M,Di Martino S,Ferrucci F,et al.Towards a framework for mining and analysing spatio-temporal datasets[J].International Journal of Geographical Information Science,2007,21(8):895-906.
[2] 何曉軍,徐愛功,李玉.基于VGA聚類的遙感影像道路提取[J].計算機仿真,2018,35(5):288-293.
[3] 劉笑,王光輝,楊化超,等.全卷積神經網絡遙感影像道路提取方法[J].遙感信息,2018,33(1):69-75.
[4] 王偉,譚松榮.基于軌跡大數據離線挖掘與在線實時監測的出租車異常軌跡檢測算法[J].數字技術與應用,2018,36(12):118-119.
[5] 李思宇,向隆剛,張彩麗,等.基于低頻出租車軌跡的城市路網交叉口提取研究[J].地球信息科學學報,2019,21(12):1845-1854.
[6] 王祖超,袁曉如.軌跡數據可視分析研究[J].計算機輔助設計與圖形學學報,2015,27(1):9-25.
[7] 鄔群勇,張良盼,吳祖飛.利用出租車軌跡數據識別城市功能區[J].測繪科學技術學報,2018,35(4):413-417,424.
[8] 呂海洋.基于車行GNSS軌跡數據的道路網絡構建與增強方法研究[J].測繪學報,2019,48(2):268-270.
【通聯編輯:王力】