999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

時空軌跡序列模式挖掘方法綜述

2021-09-09 08:09:26段宗濤李宜修
計算機應用 2021年8期
關鍵詞:語義

康 軍,黃 山,段宗濤,2,李宜修

(1.長安大學信息工程學院,西安 710064;2.陜西省道路交通智能檢測與裝備工程技術研究中心,西安 710064)

0 引言

在全球定位、位置感知、移動通信和遙感等技術高速發展的背景下,時空軌跡數據,如:車輛行駛軌跡、人群移動軌跡、動物遷徙軌跡等,開始大量涌現。時空軌跡數據含位置、時間、速度等基本信息,其具有時空序列性、異頻采樣性、數據質量差的特點[1],是對移動對象在時空環境下的個體移動和行為歷史的真實寫照。它不僅蘊含著群體對象泛在的移動行為模式與規律,例如人群的出行活動特征、車輛移動軌跡特征,還能反映城市交通流演化的內在規律。通過從海量的時空軌跡數據中發現這些模式規律,能夠為城市規劃、交通管理、交通指揮、服務推薦、位置預測等領域提供新的解決思路和建設性幫助,而這些過程通常需要通過對時空軌跡數據進行序列模式挖掘來得以實現。

時空軌跡序列模式挖掘作為序列模式挖掘的一個重要研究分支,可以定義為從海量的、異構的、含噪聲的移動全球定位系統(Global Positioning System,GPS)軌跡序列中提取潛在的、頻繁出現的、具有價值的軌跡序列的過程。隨著數據采集和存儲等技術的飛速發展,時空軌跡數據呈指數級增長,出現了“數據過剩,信息匱乏”的局面。在這樣的背景下,很多領域內的學者,都致力于研究和開發相關時空軌跡序列模式挖掘算法和應用程序,揭示移動軌跡數據中有價值的信息。然而在大數據的時代下,各種時空軌跡數據規模持續增長,應用需求日趨提升,現有的時空軌跡數據序列模式挖掘方法在對海量軌跡數據進行處理時存在著諸多局限性,如挖掘效率低、適用范圍有限等。該領域亟待突破分布式挖掘算法、針對實時數據流的處理算法等關鍵技術。

本文將從時空軌跡序列模式挖掘的需求入手,從時空軌跡序列的數據特征及其應用、時空軌跡序列模式的挖掘過程及研究現狀、時空軌跡序列模式挖掘的現有問題及未來發展趨勢3個方面來闡述該領域的現狀和發展。在第一方面介紹時空序列數據的基本特點及其典型的應用場景;在第二方面介紹時空軌跡序列模式的挖掘過程,并闡述近幾年該領域的研究情況;最后闡述現有時空軌跡序列模式挖掘方法存在的問題,指出其未來的發展趨勢。

1 時空軌跡序列的數據特征及其應用

1.1 數據特征

軌跡序列就是在時空環境下,通過對一個或多個移動對象運動過程的采樣所獲得的數據信息,包括采樣點位置、時間、方向、速度等,這些采樣點數據信息根據采樣先后順序排列構成的數據序列。時空軌跡數據可以通過帶定位功能的移動智能設備、車載GPS設備、通信基站、社交媒體、地圖APP等不同方式來獲取,其來源多樣復雜。時空軌跡數據用于分析研究移動對象隨著時間特性和空間特性的變化而產生的演化規律,是對移動對象在時空環境下的歷史行為活動的真實寫照。

表1匯總了不同方式下獲取到的幾種典型的時空軌跡序列數據。從表1可以看出,時空軌跡序列數據具有“3V”特性——量大(Volume)、實時(Velocity)、多樣(Variety)。此外,移動對象的時空軌跡數據還具備以下特點:

表1 代表性時空軌跡序列數據Tab.1 Representative spatio-temporal trajectory sequence data

1)時空序列性。軌跡序列是一系列具有位置、時間信息的采樣點序列,體現了移動對象的時空動態性。軌跡序列的最基本特性就是時空序列性。

2)異頻采樣性。不同的移動對象其運動軌跡的采樣間隔也呈現出顯著的差異。像車輛軌跡、用戶移動軌跡、動物遷徙軌跡,其更新頻率一般為秒/分鐘級;而諸如氣溫、氣流、降水的氣象數據其更新頻率為由分鐘、小時到天不等。不同軌跡序列的差異采樣極大影響了軌跡序列模式挖掘的過程。

3)數據質量差。移動對象的時空運動軌跡是連續的,軌跡序列則是時空運動軌跡的離散化表示形式,但是會受到GPS設備采樣精度的影響,當某對象運動到拐角或突然停止運動時,GPS設備采集到的軌跡點會出現位置不確定、位置偏離等問題,這就給時空軌跡序列模式挖掘的過程增加了困難。

綜上所述,時空軌跡序列數據廣泛存在于生活的諸多領域且蘊藏著大量的可用信息,但其數據特性給時空軌跡序列模式挖掘帶來極大的挑戰。

1.2 時空軌跡序列模式挖掘的應用

時空軌跡序列數據蘊含著豐富的運動信息,通過對其進行序列模式挖掘分析,可從中揭示出有價值的模式信息來服務于社會。城市規劃[2-4]、交通管理[5-7]、出行服務推薦[8-9]、旅游推薦[10-12]、位置預測[13-14]和異常軌跡行為檢測[15-16]等領域已經有諸多應用,如圖1所示,并深入影響了人們的生活方式。

圖1 時空軌跡序列模式挖掘應用Fig.1 Applicationsof spatio-temporal trajectory sequence pattern mining

1)城市規劃。群體移動對象的運動軌跡蘊含著其在城市時空環境下的行為活動模式與規律,通過挖掘這種行為模式規律,有利于揭示城市內部的交通流演變規律、城市不同區域的社會功能和熱度特征以及不同移動對象與城市空間的占用關系,這些信息的發現能夠為城市公共空間布局、土地利用、基礎設施建設等規劃提供輔助決策,使得城市規劃更符合城市的地理環境、人文條件和經濟發展狀況。

2)交通管理。人群和各種車輛是城市交通中最主要的活動對象,其移動軌跡數據中記錄了人們日常出行的頻繁歷史路線,這些頻繁軌跡模式的發現能夠深入了解城市交通流的變化特點,還有助于發現人群和交通車輛活動范圍的交集區域。這為緩解交通擁堵狀況提供了機會,使交通管理人員更加合理地設置交通標志、道路交通標線及十字路口的紅綠燈等候時間,為司機和行人提供更好的交通出行環境。

3)出行服務推薦。出租車是人們戶外出行的重要交通工具,而很多時候人們都面臨著打不到車或者候車時間較長的情況。通過對海量的出租車軌跡數據進行分析,挖掘出出租車司機的經驗行駛軌跡,發現出租車的頻繁活動區域,這些信息能夠用于幫助乘客推薦周圍有效的打車地點,從而有效減少乘客的打車等候時間,提高打車效率。

4)旅游服務推薦。隨著在線旅游業的快速發展,旅游推薦也成為其熱點服務。海量的用戶移動軌跡數據反映了他們的歷史活動路線。從大量用戶的歷史軌跡數據中發現他們的頻繁移動模式,可以揭示出用戶旅游出行的頻繁熱點區域,其代表了大多數用戶對旅游地標和路線的偏好,這些信息能夠為那些沒有明確出行目的的旅客提供參考意見,為其進行個性化的推薦服務。

5)位置預測。移動對象的歷史軌跡數據包含了豐富的運動信息,通過挖掘出移動對象的歷史頻繁軌跡模式可以找出其行為潛在的時空規律性及其行為偏好,再與移動對象當前的運動狀況相結合,來分析確定對象在未來某個時刻或時間段的運動趨勢,這樣做可以有助于趨利避害、合理分配道路資源等。

6)異常軌跡行為檢測。一個異常軌跡是在一個距離度量,例如形狀和旅行時間上與語料庫中其他的軌跡有明顯不同的一個軌跡,或者是軌跡的一部分。這種離群軌跡可能是駕駛司機的惡意繞道或意外的道路變化(由于交通事故或施工)。通過頻繁軌跡模式挖掘方法,能夠從軌跡數據集中檢測出軌跡的異常段:如果某一軌跡(或子軌跡)不頻繁,則它可能是一個異常軌跡。這種異常軌跡的發現有利于及時發現隱患并輔助決策以確保社會公共環境的人身和財產安全。時空軌跡序列模式挖掘的應用并不僅僅局限于上述幾個領域,隨著位置感知和定位技術的不斷發展,人們對于軌跡模式挖掘的需求越來越多,應用領域也在不斷擴大。

2 時空軌跡序列模式的挖掘過程及研究現狀

2.1 挖掘過程

時空軌跡序列模式挖掘旨在從時空軌跡數據集中找出頻繁出現的序列模式,如普遍性規律或公共性頻繁路徑等,而從軌跡數據中挖掘頻繁的序列模式是一個多步驟相互鏈接、反復交互過程,如圖2所示,指從收集原始軌跡點序列到提供可理解的軌跡模式的所有處理步驟,包括:

1)軌跡預處理:軌跡數據清洗,軌跡分割,軌跡壓縮。

2)軌跡模式挖掘:從軌跡數據中發現頻繁序列模式,挖掘時空數據中隱藏的信息,例如:位置模式(頻繁軌跡、熱點區域)、活動周期模式、語義行為模式。

最重要的預處理步驟是軌跡分割和軌跡壓縮,因為頻繁軌跡模式不僅可能出現在整個軌跡之間,還可能出現在子軌跡之間[17]。通常采集得到的軌跡數據都是以天為單位的、按周期性間隔采樣的連續點序列,其過于冗長無法直接用于挖掘分析,所以有必要基于特定標準(如時隙等)將原始軌跡分割為若干短的子軌跡。另一方面,由于移動軌跡在空間上的連續性分布,需要對其覆蓋的空間區域進行離散化處理,如網格劃分、聚類等,以實現軌跡壓縮。經過軌跡分割和空區間域離散化處理可以將原始的細粒度軌跡點序列轉換為諸如網格、區域或其他形式的粗粒度符號序列,從而基于序列模式挖掘算法來發現頻繁序列模式。

2.2 研究現狀

近年來,不少專家學者致力于時空軌跡序列模式挖掘方法的研究,主要包括三類,即基于時空軌跡序列的位置模式挖掘、基于時空軌跡序列的周期模式挖掘和基于時空軌跡序列的語義模式挖掘,如圖3所示。

圖3 時空軌跡序列模式挖掘的方法分類Fig.3 Method classification of spatio-temporal trajectory sequence pattern mining

2.2.1 基于時空軌跡序列的位置模式挖掘

基于時空軌跡序列的位置模式挖掘是從時空軌跡數據集中發現頻繁的含位置信息的序列模式,如網格序列、地理區域序列、路段序列,故基于時空軌跡序列的位置模式挖掘又可分為基于網格劃分的位置模式挖掘、基于聚類劃分的位置模式挖掘、基于路網匹配的位置模式挖掘。

1)基于網格劃分的位置模式挖掘是將軌跡數據覆蓋的區域劃分為若干個規則的網格,以軌跡點所處網格標識軌跡,將冗長的軌跡點序列轉化成簡潔的網格序列,再基于改進的頻繁模式挖掘算法來發現反復出現的網格序列。

Zhang等[18]提出了一種基于時間、經度、緯度三重因素的軌跡定界符將連續軌跡劃分為不同子軌跡,再對目標區域進行網格劃分,把子軌跡轉換為網格序列,通過Apriori算法來挖掘頻繁軌跡;Yu[19]首先基于網格劃分將原始軌跡點分配到不同網格中,在此基礎上將網格建模為節點,將相鄰網格間的交通流建模為具有權值的邊,構建一個加權有向圖。然后用一種擴展標簽傳播算法來識別相鄰時隙內有向圖中的移動路徑,將每條路徑當作一條transaction使用Apriori算法來挖掘一天內不同時段的頻繁移動路徑;Enami等[20]在對時空軌跡等時隙劃分的基礎上,將經緯度覆蓋的地理區域劃分成若干網格,將時空軌跡轉換成具有時間間隔約束的網格序列,最后分別基于改進的Prefixspan和BIDE(BI-Directional Extension paradigm)算法來挖掘頻繁時空軌跡,并將結果用于預測未來的移動性。

雖然文獻[18-20]以軌跡點所處的網格離散化軌跡達到了簡化軌跡的目的,但是對于網格大小的劃分沒有明確標準,并且網格劃分過程中還存在軌跡點位于網格邊界上而無法判斷具體歸屬于哪個網格的問題,這些最終都容易導致軌跡模式丟失的情況。為了規避此問題,Wang等[21]提出了一種模糊空間劃分(Vague Space Partition,VSP)方法將研究區域劃分一組模糊網格單元,并通過基于距離的隸屬函數把原始軌跡位置轉換為相鄰的模糊網格序列,再提出兩種挖掘算法,即VTPM-PrefixSpan(Vague space partition Trajectory Pattern Mining-PrefixSpan)算 法 和VTPM-GSP(Vague space partition Trajectory Pattern Mining-Generalized Sequential Patterns)算法,以發現具有嚴格時間約束的頻繁軌跡模式;Chen等[22]在此基礎上又提出了一種基于垂直投影距離的網格劃分方法——VGS(Vague Grid Sequence method based on vertical projection distance),根據垂直投影距離將每個網格劃分為顯式區域和模糊區域;然后將軌跡變換為模糊網格序列;最后提出VGS-PrefixSpan(Vague Grid Sequence method based on vertical projection distance-PrefixSpan)算法,在PrefixSpan算法的基礎上,通過記錄軌跡序列中項的位置來減少構造投影數據庫的時間。

2)基于聚類劃分的位置模式挖掘即把目標研究區域聚類為若干不相重疊的區域,如熱點區域[23]、停留點區域[24],以區域序列來表示軌跡,再通過序列模式挖掘從中挖掘頻繁軌跡模式。文獻[25]先將原始軌跡數據所處跨度區域劃分為若干子區域,通過K-means算法將所有子區域聚類為多個簇群,并根據各簇所含軌跡數以降序排列來提取熱點簇群,最后從這些熱點簇群中挖掘頻繁軌跡模式;文獻[26]中提出一種基于時空熱點區域的移動模式挖掘算法FMTPM(Frequent Moving Trajectory Pattern Mining),通過動態聚類方式提取移動軌跡密集時間區間,在不同時間區間對軌跡點進行聚類劃分以識別時空熱點區域,實現移動軌跡序列向時空熱點區域序列的轉換;文獻[27]中提出一種基于3D網格的時空頻繁軌跡挖掘方法,識別出軌跡數據覆蓋范圍內的停留區域,用密度聚類算法將軌跡數據轉化為停留區域序列并將其映射到水平坐標為經緯度空間信息、垂直坐標為單一粒度時間信息的3D網格中,以挖掘頻繁軌跡模式;文獻[28]中提出基于從社交網站提取的用戶軌跡數據利用Apriori-like算法發現頻繁軌跡模式的方法,主要是通過DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法識別出用戶日常活動區域中的頻繁訪問區域,將原始數據轉換為時序排列的頻繁區域序列來實現的。

雖然文獻[25-28]通過不同的聚類方式來簡化原始軌跡序列的表達形式,縮減軌跡序列的長度,以降低挖掘過程的復雜度;但是聚類算法也存在時間復雜度較高的問題,同時對于各聚類簇內部的序列模式并不能很好地挖掘。

3)基于路網匹配的位置模式挖掘是通過假設研究對象被限制在目標區域的相關道路網絡上移動,通過路網匹配算法將軌跡點映射到路網中,使其轉化為具有路網含義的路段序列,以便于進行頻繁軌跡模式挖掘。

文獻[29-31]通過提取道路網絡中的關鍵位置、特征點以表示原始軌跡。王亮等[29]在移動過程模式發現中,提出了基于移動軌跡的路網拓撲關系模型構建方法,通過路網關鍵位置點的探測抽取拓撲關系模型,最后基于空間劃分集合與路網拓撲模型對原始移動軌跡數據進行序列數據轉換與頻繁模式挖掘。Wang等[30]研究了道路網絡中的個人軌跡頻繁模式挖掘,利用拐角檢測技術來識別嵌入在個人GPS軌跡中的物理道路拓撲信息,從GPS軌跡中提取特征點,將軌跡變換為道路網絡中有序的拐角序列,來挖掘頻繁軌跡。Bermingham等[31]提 出 了 一 種DC-SPAN(Distinct Contiguous Sequential PAtterNs)算法從車輛軌跡中來挖掘軌跡模式,通過假設車輛被限制在研究區域的相關道路網絡上行駛,使用地圖匹配將軌跡映射到路網中,將原始軌跡轉換為道路節點訪問序列,以挖掘連續軌跡模式。

2.2.2 基于時空軌跡序列的周期模式挖掘

基于時空軌跡序列的位置模式挖掘更多側重于發現移動對象頻繁經過的軌跡路線,然而移動對象的行為在很多時候還呈現出一定的周期性規律,即移動對象總是會在特定時間間隔內或多或少遵循相同的運動軌跡,例如:鳥類定期的遷徙行為,人們每天按固定的路線上下班,商業客機按固定的時間表從一個地方到另一個地方等。對于這種周期性軌跡模式的發現同樣很有研究價值,可用于壓縮運動數據,預測對象未來的運動趨勢。

文獻[32]中提出了一種基于Traclus的融合軌跡點方向、速度、時間等時空語義信息的層次軌跡聚類方法用于時空周期性模式挖掘,克服了傳統周期模式挖掘方法其忽略了序列和固有層次結構的缺陷,但是未能考慮軌跡點的語義背景信息,同時也無法處理不規則軌跡;文獻[33]針對[32]算法的缺陷,在從不規則采樣的時空軌跡中檢測參考點時,綜合考慮所有空間性、時間性、語義和層次結構,提出一種分層語義周期性模式挖掘方法,以找到分層周期性模式。

Yang等[34]提出一種兩階段方法:階段一,使用運動參數對周期性行為建模;階段二,基于循環周期模式特點,提出了軌跡距離矩陣搜索算法TDMS(Trajectory Distance Matrix Search)用于識別周期性軌跡和提取周期軌跡。利用Delaunay三角剖分和逆向地理編碼方法,從收集的周期軌跡中提取運動位置信息。Shi等[35]提出了一種GPMine(Group Periodic moving pattern Mining)算法用于挖掘群體對象的周期性運動模式。文獻[36-37]則研究了周期模式挖掘中面臨不確定性時空數據采樣頻率及數據稀疏性的問題。

上述的周期模式挖掘方法大都只專注于發現特定時空范圍內具有不同周期長度的模式,與固定時空粒度的周期模式相比,不同時空粒度下的周期模式則具有更大的實用價值,這樣的模式可以更準確地描述個人行為。文獻[38]引入多粒度模型來描述對象活動的時空信息,并通過空間優先和時間優先的多粒度活動發現算法,來識別出不同的粒度下對象的活動行為,最后提出一種多粒度周期性活動發現算法MPAD(Multi-granularity Periodic Activity Discovery)來挖掘物體活動的周期性模式。文獻[39]中提出了一個發現具有不同時空粒度下周期模式的框架:首先通過軌跡抽象將軌跡點序列轉換為具有位置信息的時間序列;然后,根據時空信息定義了一個多粒度行為模型;最后,提出了SBPM(Single Behavior Period Mining)和MBPM(Muti-Behavior Period Mining)算法,SBPM可以在不知道周期長度的情況下發現單個行為周期模式,MBPM可以從單個行為模式中識別多個行為的周期模式。

2.2.3 基于時空軌跡序列的語義模式挖掘。

從時空軌跡序列中挖掘的位置模式和周期性模式往往只能反映移動對象頻繁經過的位置信息或在某些特定時間內反復遵循的路線,卻無法捕獲軌跡的語義信息。然而軌跡數據所蘊含的豐富語義信息,如其所在的場景地理知識、在某處的行為模式與狀態等,能更好地反映與體現真實環境,通過從時空軌跡數據集中挖掘出的語義軌跡模式更具有實際應用性。Chen等[40]中定義了一種語義軌跡模式,即具有空間、時間和語義屬性的移動模式。通過從原始軌跡數據中提取出這三種屬性,將其轉換為語義軌跡序列,再基于PrefixSpan算法來發現語義模式,以預測用戶的移動行為。Comito等[41]通過基于密度的聚類算法將GPS軌跡點聚類到具有實際語義的位置區域中,實現軌跡序列到語義位置區域序列的轉換,再運用改進的PrefixSpan算法來挖掘轉換后具有時間間隔約束的序列,使其只獲得最大頻繁模式,并將所得結論用于分析人們的移動行為。

文獻[42]中提出了一種基于停留時間的語義行為模式挖掘方法。先將原始軌跡轉化為停留點區域序列并賦予其實際的區域背景信息,構建停留語義行為集,再結合PrefixSpan算法挖掘頻繁語義行為模式,通過定義語義行為模式之間的相似性度量方法以找出具有相似行為模式的群體移動對象;文獻[43]中提出了SMOPAT(Semantic MObility PATterns)算法來從私家車軌跡數據中挖掘時空語義移動模式,以理解司機的行為目的;文獻[44]中提出了一種基于語義軌跡模式挖掘的路線推薦系統,該系統通過從帶有地理標簽的照片中提取軌跡,用所需的語義去擴展軌跡來構建語義軌跡集并挖掘語義軌跡模式,這些語義軌跡模式將連同用戶的各種需求來生成一組滿足用戶指定約束和目標的語義軌跡路線;文獻[45]中使用豐富的上下文語義注釋擴展了從社交媒體獲取的用戶時空軌跡數據,并提出一種語義軌跡模式挖掘算法來挖掘基本和多維語義軌跡模式以深入理解用戶的移動行為模式。

3 時空軌跡序列模式挖掘的現有問題及發展趨勢

關于移動對象的時空軌跡序列模式挖掘已經得到許多專家學者的廣泛研究,并且開發出許多時空軌跡序列模式挖掘的方法,然而大部分算法只是從理論上進行分析,沒有投入到實際應用中,適用性也差。現有的時空軌跡序列模式挖掘技術仍然存在諸多局限性,具體包括以下幾個方面:

1)對于移動時空軌跡序列模式挖掘的研究沒有形成一個完整的、適應性強的理論框架和模型,同時缺乏必要的相關模式定義、分類方法以及處理流程規范,沒有一個統一的開發平臺。

2)在實際的挖掘過程中,大多數算法仍然沿用著在單一時空粒度下挖掘頻繁軌跡模式的方式,這樣得到的結論往往不能夠充分體現與反映移動對象的活動規律及模式。因此,今后更多的研究工作應基于多維時空粒度來挖掘時空頻繁軌跡模式中蘊含的群體活動規律語義信息。

3)信息時代下時空軌跡數據無時無刻不在增加,而現有的研究方法僅僅只是基于移動對象的歷史軌跡數據來進行模式挖掘,一旦軌跡數據集發生改變,整個挖掘過程將要重新開始,這樣會造成巨大的計算開銷。

4)大數據時代下,時空軌跡數據日益激增,現有的軌跡模式挖掘算法大多都是基于單機環境的,在處理海量的時空軌跡數據時,效率低下且算法各方面性能遭遇瓶頸,難以滿足大量時空軌跡數據的挖掘需求。

5)由于GPS設備的采樣頻率基本都是秒級的,因此獲取的時空軌跡數據具有實時更新的特性,從而使其呈現出數據流式的結構。現有的對于實時更新的軌跡數據流進行序列模式挖掘的技術方法還不夠成熟,基于時空軌跡數據流的序列模式挖掘方法還有待深入研究。

綜上所述,時空軌跡序列模式挖掘的研究工作今后應更多地聚焦于以下幾個發面:

1)基于多維時空粒度的軌跡序列模式挖掘方法。由于時空信息是移動對象行為活動的兩個最基本屬性,該方法通過將移動對象的軌跡所對應的時空信息進行層次劃分,形成多維的時空粒度,再挖掘出移動對象在所有時空粒度下的頻繁位置模式,從而得到移動對象的活動規律,為位置感知和個性化位置等服務提供相應的技術支持。

2)基于增量式的時空軌跡序列模式挖掘方法。該類方法是專門用于規避一旦數據庫原始數據發生改變,對改變后的整個數據集重新挖掘而造成的時空消耗,其只需要通過對變化部分的數據挖掘,并在原有所得軌跡序列模式的基礎上進行更新就能夠挖掘得到每次數據集改變后的軌跡序列模式,從而節省大量計算開銷,更具靈活性和適應性。

3)基于分布式的時空軌跡序列模式挖掘方法。這類方法旨在通過將規模巨大的軌跡數據集分散在不同的服務器上存儲,然后每臺機器對分布在本機上的數據進行挖掘,最后將所有機器的挖掘結果匯總整合,具體可以借助于并行編程模型如Spark、MapReduce等來實現,以適應對于海量軌跡數據的挖掘需求。由于整體的工作量是不可預測的,因此如何在服務器之間均勻地分配任務是非常棘手的。同時,并行挖掘需要各個機器之間的信息交互,通信IO就無可避免。這些問題都將是分布式的軌跡序列模式挖掘方法即將面臨的難題。

4)基于實時軌跡數據流的模式挖掘方法。軌跡數據流是指那些數據量非常巨大的,無法全部存放在存儲介質上進行分析和計算的數據。其特點是數據持續到達,且速度快、多變化、規模宏大;基于實時軌跡數據流的模式挖掘方法其核心是設計高效的單遍數據集掃描算法,在一個遠小于數據規模的內存空間里不斷更新一個代表數據集的結構,使得在任何時候都能根據這個結構迅速挖掘出軌跡序列模式。目前已經有了一些流式處理框架如Spark Streaming、Flink、Storm等,所以可以以這些框架為基礎來設計基于軌跡數據流的挖掘方法。

4 結語

時空軌跡序列模式挖掘是在全球定位技術與位置感知技術快速進步的背景下催生出的熱門研究領域之一,已經成為分析移動對象行為模式規律的重要手段。為此,各領域業界人士開展廣泛的研究,相繼提出針對移動對象時空軌跡的序列模式挖掘方法,主要包括從時空軌跡數據中挖掘位置模式、周期模式和語義模式三類方法,并在城市規劃、交通管理、服務推薦等領域取得諸多應用。但是隨著GPS采集技術、位置感知技術等的不斷完善,時空軌跡數據規模呈現出爆炸式增長,現有的技術方法在算法效率、適應性等方面已經無法滿足實際的應用需求。未來,該領域的研究工作重點可能主要在以下方面:1)基于多維時空粒度的時空軌跡序列模式挖掘;2)基于增量式的時空軌跡序列模式挖掘;3)基于分布式的時空軌跡序列模式挖掘;4)基于時空軌跡數據流的序列模式挖掘。

猜你喜歡
語義
為什么字看久了就不認識了
語言與語義
“社會”一詞的語義流動與新陳代謝
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
“吃+NP”的語義生成機制研究
長江學術(2016年4期)2016-03-11 15:11:31
“V+了+NP1+NP2”中V的語義指向簡談
認知范疇模糊與語義模糊
“V+X+算+X”構式的語義功能及語義網絡——兼及與“V+X+是+X”構式的轉換
語言與翻譯(2014年2期)2014-07-12 15:49:25
“熊孩子”語義新探
語文知識(2014年2期)2014-02-28 21:59:18
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
主站蜘蛛池模板: 久久亚洲中文字幕精品一区 | 在线观看精品国产入口| 伊人无码视屏| 国产日韩丝袜一二三区| 欧美成人手机在线观看网址| 国产h视频在线观看视频| 国产丝袜无码一区二区视频| 毛片免费视频| 超碰aⅴ人人做人人爽欧美 | 国产呦精品一区二区三区下载| 亚洲人成人无码www| 91精品啪在线观看国产60岁| 国产伦片中文免费观看| 99热线精品大全在线观看| 91毛片网| 亚洲一级色| 日韩免费毛片| 国产尤物在线播放| 美女一级免费毛片| 国产精品护士| 亚洲不卡网| 亚洲熟女偷拍| a毛片免费在线观看| 老司机久久99久久精品播放| 亚洲色欲色欲www网| 国产精品免费入口视频| 激情午夜婷婷| 欧美天堂在线| 久久久久久久蜜桃| 久久久久久尹人网香蕉| 久久久久久久97| 国产交换配偶在线视频| 亚洲日韩精品无码专区97| 欧美国产日本高清不卡| 国产美女免费网站| 这里只有精品在线| 国产精品亚洲一区二区三区z| 制服丝袜亚洲| 女人18毛片水真多国产| 九一九色国产| 无码日韩精品91超碰| 女人一级毛片| 911亚洲精品| 天天摸夜夜操| 国产香蕉97碰碰视频VA碰碰看| 无码内射在线| 欧美自拍另类欧美综合图区| 国产精品三级专区| 日韩精品无码免费一区二区三区 | 亚洲午夜片| 欧美色99| 免费看美女毛片| 国产九九精品视频| 国产精品99久久久| 波多野结衣在线se| 97影院午夜在线观看视频| 国产高清免费午夜在线视频| 午夜国产理论| 91精品啪在线观看国产60岁| 青青草欧美| 无码 在线 在线| 国产va在线观看| 香蕉网久久| 乱系列中文字幕在线视频| 国产成人精品免费av| 天天色天天综合网| 亚洲第一综合天堂另类专| 亚洲黄色激情网站| 久久免费成人| 精品国产成人av免费| 福利视频久久| 999精品视频在线| 一级高清毛片免费a级高清毛片| 国产久操视频| 欧美人与性动交a欧美精品| 精品国产中文一级毛片在线看| 狠狠色噜噜狠狠狠狠色综合久| 伊大人香蕉久久网欧美| 蝌蚪国产精品视频第一页| 为你提供最新久久精品久久综合| 欧美精品三级在线| 国产办公室秘书无码精品|