張國興,李亞東,張磊,樊慶富,李想
中國礦業大學計算機科學與技術學院,江蘇徐州221116
基于SDZ-RNN的出租車出行目的地預測方法
張國興,李亞東,張磊,樊慶富,李想
中國礦業大學計算機科學與技術學院,江蘇徐州221116
隨著城市化進程加快,城市中出租車數量在急劇增加,大大方便了人們出行。出租車所帶來的一系列問題也成為城市化建設中不可忽略的部分。其中,出租車目的地預測問題頗為引人關注,正確預測出租車出行目的地對于城市交通合理規劃起著至關重要的作用。城市中許多出租車都搭載全球定位系統GPS(Global Positioning System),出租車在運行過程中產生了大量GPS軌跡數據,使得預測出租車目的地成為可能。
出租車目的地預測方法有多種,Mahmassani H S[1]基于滾動式預測模型,通過時間序列方法預測出租車出行目的地,但是此方法具有一定的滯后性。Tang J等[2]將出租車目的地預測問題轉換為動態規劃問題,但是此方法需要耗費大量資源。Xue A Y等[3]運用低階馬爾科夫方法進行出租車目的地預測,但是馬爾科夫預測方法僅僅依賴于前面2到3個GPS點,當一條軌跡中相互依賴點的個數較多時,馬爾科夫預測方法并不能很好地解決這種軌跡點之間的長期依賴關系[4]。
為了解決這種長期依賴關系,de Brébisson A等[5]采用循環神經網絡RNN(Recurrent Neural Network)等預測方法來對出租車出行目的地進行預測,取得了不錯的效果。因為RNN的層與層之間是有關聯的,所以RNN的隱藏層能夠在預測過程中儲存這種軌跡點之間的長期依賴關系[6],從而很好地解決軌跡點之間的長期依賴問題。Hochreiter[7]也針對需要解決的長期依賴問題,在RNN的基礎上提出了一種LSTM[8](Long Short-Term Memory)模型,被廣泛應用于時間序列數據來解決長期依賴關系。而Tang S[9]針對用戶可能需要的短期興趣,提出了一種BLSTM(Bidirectional Long Short-Term Memory)模型,在MovieLens[10]數據集上效果顯著。
但是RNN預測方法在解決長期依賴過程中,隨著數據量的增大,RNN的隱藏層對較小的擾動變得十分敏感,較小的擾動就會導致RNN產生的中間狀態中的錯誤成分在傳播過程中被指數級放大,最終導致預測的準確率不夠高。
為了限制這種狀態中錯誤成分的傳輸,保證正確成分的傳輸,Hinton[11]等提出了dropout,概率性地完全保留或者直接舍棄某些輸出狀態。dropout雖然能在一定程度上遏制錯誤狀態的傳輸[12],但它設置某一些神經元的激活函數為0,一定程度上舍棄了正確的輸出狀態。Krueger D[13]提出了一種改進的方法zoneout[13]。zoneout用它本身激活函數隨機地代替一些神經元激活函數,并不能很好地根據狀態本身來做出合適的選擇。2017年,Rocki K[14-15]等在zoneout的基礎上提出了一種概率化舍棄或保留前一次迭代所產生的輸出狀態的方法SDZ(Surprisal-Driven Zoneout)[14],SDZ能夠根據狀態本身來確定該狀態的傳輸情況,以此來最大限度地保證狀態中正確成分的傳輸,遏制錯誤成分的傳輸。
由于SDZ能夠根據狀態本身來最大限度地保證該狀態中正確成分的傳輸,所以將SDZ應用于RNN中,提出一種基于SDZ-RNN的出租車目的地預測方法:SRTDP。該方法采用SDZ來概率化神經元狀態在隱藏層的傳輸,遏制狀態中錯誤成分的傳輸,保證狀態中正確成分的傳輸,從而降低擾動對RNN的影響,使得預測出的狀態與實際狀態更加接近,提高預測的準確率。同時,SDZ的使用使得SRTDP中參數更新變成了部分更新,而不是像普通RNN預測方法中需要更新全部參數,降低了訓練完成所耗費的時間。
出租車目的地預測以出租車GPS軌跡數據為輸入,通過軌跡數據的內在關系,預測出租車目的地。
定義1出租車軌跡序列Tk。Tk={Pk1,Pk2,…,Pki,…,Pkn},軌跡序列Tk中共有n個GPS點,其中Pki(n≥i≥1)代表軌跡序列中每一個GPS數據點,每一個GPS點包含經緯度信息。
定義2預測的目的地x。預測目的地就是通過RNN預測出軌跡序列目的地的GPS點,其中包括對出租車目的地預測的經度λx和緯度φx,即x(λx,φx)。
定義3Haversine距離DH和等距形公式距離DE。半正矢距離公式可以計算出預測目的地x和真實目的地y之間的距離:

其中λy,λx分別代表真實目的地y和預測目的地x的經度,φy,φx分別代表其緯度,R代表地球半徑取值為6 371 km。通過計算DH(x,y)返回真實目的地y和預測目的地x兩地之間的距離,單位為km。
為簡化計算,使用近似的等矩形公式來計算兩地之間的距離:

2.2.1 SDZ(Surprisal-Driven Zoneout)
在SDZ中,通過Zt來控制狀態的傳輸。Zt的生成以及Zt如何影響神經元輸出如圖1所示。

圖1 SDZ結構
SDZ是在原始LSTM上增加了一個反饋環,如圖1中虛線所示。這個反饋環能夠根據當前獲得的前一次迭代神經元輸出pt-1,產生一個參數Zt來影響該神經單元的記憶狀態ct(可以理解通過Zt來過濾ct)。
在圖1中,st定義如下:


其中ft,it,ot代表相應門限的輸出狀態,ut代表在激活函數tanh的作用下處理輸入數據和隱藏層狀態形成的值。W,U,V代表各個分支的權重,ht-1代表在t-1時刻隱藏層的狀態,b代表各個門限的偏移量。
設置一個變量St,使得這個變量等于t-1時刻輸出層的輸出pt-1減去t時刻的輸入數據xt。由變量St作用產生zt,公式如下:

其中公式(10)中τ代表一個閾值參數,用于保持數值穩定,WTet是一個隱藏層狀態h→神經元輸出et的權重矩陣。同時zt攜帶參數更新的信息,由zt可以確定哪些參數需要更新而不是更新全部參數。根據zt的值簡化成一個參數zt,當zt≤0時,表明誤差較大,將其舍去,故取zt為0;當zt>0,表明相鄰狀態之間的差距較小,故取Zt=zt,公式如下:

Zt決定了神經單元的記憶狀態ct。特殊的,當Zt=0時,St將不會參與決定神經單元的記憶狀態,也就意味著沒有參數需要更新,公式如下:


從公式(12)中可以看出反饋環作用于t-1時刻神經單元的記憶狀態ct-1,形成t時刻的神經單元記憶狀態ct。在預測過程中,反饋環的加入使得SRTDP能夠最大限度地傳輸狀態中的正確成分,從而很好地消除擾動,增強SRTDP的魯棒性。
公式(13)、(14)表明激活函數tanh作用于ct,作用后的ct點乘輸出門限控制后的輸出狀態ot,從而得到在t時刻隱藏層狀態ht。由隱藏層到輸出層的輸出et:

Softmax回歸即為公式(16)得到概率分布p,進而得出預測目的地點x。

其中C為聚類點的個數。
2.2.2 基于SDZ-RNN的目的地預測方法框架
本文基于SDZ-RNN的目的地預測方法的關鍵在于:如何將SDZ整合到RNN中。基于SDZ-RNN的出租車目的地預測方法如圖2所示。
圖2中基于SDZ-RNN的目的地預測方法在輸入層將軌跡序列Tk和軌跡相關的嵌入數據包括出租車編號、一年的周數、一周的天數、一天的刻數、日期類型、站臺叫車起點和電話叫車起點共7種嵌入數據結合作為輸入數據,其中軌跡序列按順序輸入到上述模型中,每個GPS點又包含經緯度;從7種嵌入數據中各隨機選取10個。軌跡相關的嵌入數據充當了軌跡的特征,原始軌跡數據和相應的特征共同作為該方法的輸入。軌跡特征的加入使得預測過程中分類更加準確從而提高了預測的準確率。

圖2 基于SDZ-RNN的出租車目的地預測方法
隱藏層采用M個ReLU(Rectified Linear Unit)神經元,對應的激活函數也為ReLU。該函數將小于0的值過濾掉,大于0的值保持不變。通過激活函數將非線性元素加入到SRTDP中,增加了SRTDP的非線性映射學習能力。
輸出是對每個聚類點產生概率估計后所計算出的預測目的地。所以在原始輸出層神經元的個數N由對軌跡數據聚類后產生的聚類個數C來確定,聚類算法采用的MeanShift(詳見theano)。假設在原始輸出層每個輸出神經元對應的原始輸出為ei(i≤N),在Softmax層將ei轉變成一個對應聚類點的概率分布pi,見公式(16),進而得出預測的目的地。
整合SDZ到RNN中如圖2所示。在計算過程中,前一次迭代輸出層神經元的輸出pt-1和xt(xt代表在t時刻模型的輸入數據)作為后一次迭代輸入層神經元的輸入,Zt由SDZ根據pt-1產生,輸入層神經元的輸入在激活函數ReLU和Softmax的作用下產生神經元輸出pt,pt又通過SDZ產生下一次迭代的Zt。如此循環,在迭代完一次batch(訓練的一次樣本)之后,將公式(3)得出的值作為損失函數來計算預測目的地和實際目的地之間的差距。由于Zt中攜帶參數更新信息,通過更新部分參數而不是全部參數使得SRTDP的訓練時間減少;同時SDZ中的反饋環的加入提高了SRTDP的魯棒性,使之在隱藏層能夠輕松地應對小的擾動,從而提高預測準確率。
2.2.3 SRTDP提高精度和速度
傳統的RNN預測方法不能根據輸出層神經元的輸出pt進行動態調整隱藏層神經元的輸出ht,單純地將前一次迭代輸出層神經元的輸出pt-1直接作為后一次迭代輸入層神經元的輸入。應用SDZ使得SRTDP加入一個反饋環,可以根據pt-1來設置一個參數Zt,動態調整pt-1傳入后一次迭代過程,同時攜帶參數更新信息,這樣做的好處在于當pt-1較小時(即預測結果越正確),相鄰的數據點也會被充分利用來預測目的地,進而可以提高預測準確率,同時部分參數的更新也節約了時間。把SDZ應用于文獻[5]中RNN來預測出租車出行目的地,改變神經元輸出pt的影響方式。
在使用SRTDP預測方法時,改進了文獻[5]中RNN預測方法輸出神經元的輸出pt在相鄰兩次迭代之間的傳遞方式,通過設置Zt來過濾前一次迭代神經元的輸出pt-1,并且最大限度地保證pt-1中正確成分的傳播以及遏制錯誤成分的傳播,以此來保證神經單元的記憶狀態ct能夠更加契合真實的單元狀態,提高預測的準確率;SDZ中Zt攜帶參數更新的信息,由Zt可以確定哪些參數需要更新而不是更新全部參數,降低了訓練完成時間。同時,SDZ由LSTM構成,在解決長期依賴問題方面比RNN預測方法更有優勢。
本文以波爾圖出租車軌跡數據[5]為實驗數據集。該數據集包含了2013年7月1日到2014年6月30日期間,在波爾圖(葡萄牙)采集的442輛出租車的軌跡數據,軌跡數據包括:GPS點集合、出租車編號、一年的周數、一周的天數、一天的刻數、日期類型、站臺叫車起點和電話叫車起點。
首先隨機抽取原始數據集中15萬條軌跡數據作為訓練數據集,然后對抽取的軌跡數據做非空檢查,若該軌跡GPS點集合為空,則刪除該條軌跡數據。經過處理,共獲得149 259條軌跡。
測試數據采用文獻[5]中所用的320條軌跡數據。
實驗程序采用Python2.7編寫,使用theano、fuel、blocks等第三方庫。實驗操作系統采用Ubuntu16.04。實驗硬件環境:CPU四核,Core i5處理器2.3 GHz,內存為8 GB。
3.2.1 實驗內容
首先,采用MeanShift聚類算法對提取到的149 259條軌跡訓練數據的GPS點集合進行聚類得到1 379個簇,即公式(16)中,C=1 379。隱藏層神經元個數M取值為500,原始輸出層神經元個數。設置一個固定的學習率η=0.01,設置一個較低的學習率是為了保持訓練過程的相對穩定;動量系數α=0.9,主要為了改變梯度變化的幅度;權重初始值W為0.1,偏移量初始值b為0.01,設置較小的參數初始化是為了打破層與層之間的對稱性;batch_size為200,即每次訓練在訓練集中取200個樣本進行訓練。在確定好初始參數之后,將GPS軌跡數據和對應的嵌入數據共同作為SRTDP算法的輸入,SDZ-RNN開始訓練。
模型訓練完成之后,采用3.1節中測試數據集來測試訓練好的模型。
3.2.2 結果分析
為了評估SRTDP在出租車目的地預測上的性能,將SRTDP預測方法的精度和速度與文獻[5]中的RNN預測方法作比較。使用平均距離誤差(Average Distance Error,ADE)和預測準確率(Prediction Accuracy,PA)來量化SRTDP的性能。平均距離誤差(ADE)通過平均化每條軌跡的真實目的地和預測目的地之間的距離計算得出。真實目的地和預測目的地之間的距離在1.0 km之內視為預測正確。
SRTDP預測方法和文獻[5]中的RNN預測方法的比較結果如圖3和圖4所示。

圖3 平均距離誤差比較

圖4 預測準確率比較
在圖3中,SRTDP預測方法和文獻[5]中RNN預測方法的平均距離誤差(ADE)都隨著迭代次數的增加而降低,并且SRTDP預測方法的平均距離誤差(ADE)明顯低于文獻[5]中RNN預測方法。從圖3中還可以得出,SRTDP預測方法的最小平均距離誤差是2.24 km,而文獻[5]中RNN預測方法的只有3.14 km[5]。在最小平均距離誤差方面,SDZ-RNN比RNN降低了28%。在圖4中,SRTDP預測方法的預測準確率(PA)明顯高于文獻[5]中RNN預測方法。SRTDP預測方法的最大預測準確率是0.731,而文獻[5]中RNN預測方法只有0.611。在預測準確率方面,SRTDP預測方法比文獻[5]中RNN預測方法提高了大約12%。SRTDP預測方法的精度優于文獻[5]中RNN預測方法,因為SDZ的使用保證了隱藏層狀態中的正確成分的傳輸,遏制了錯誤成分的傳輸,使得預測出的狀態與真實狀態更加接近,進而提高預測的準確率。
由公式(12)可知Zt參與決定了ct的形成,從而影響了預測的準確率,在SRTDP預測方法中通過對Zt取不同的值來觀察Zt的敏感性,如圖5所示。

圖5 Zt取值不同時預測的平均距離誤差
在圖5中,Zt的取值越低使得平均距離誤差越低。當Zt取0.3時,最小的平均距離誤差為2.55 km。當Zt取值較低時意味著相鄰狀態之間的差距很小,預測出的狀態與真實狀態之間變化不大,進而降低了預測的平均距離誤差。
為了驗證SRTDP預測方法在解決長期依賴方面的優勢,從數據集中挑選出GPS點多于200個的軌跡。SRTDP預測方法和文獻[5]中RNN預測方法在解決長期依賴方面的比較如圖6和圖7所示。

圖6 長期依賴的平均距離誤差比較

圖7 長期依賴的預測準確率比較
在圖6和圖7中,SRTDP預測方法在解決長期依賴方面明顯好于文獻[5]中RNN預測方法,預測準確率明顯提高,平均距離誤差大幅度降低。這是因為SRTDP預測方法中SDZ是由LSTM構成的,在數量增大時仍然能夠很好地解決長期依賴。
最后,比較SRTDP預測方法和文獻[5]中RNN預測方法針對同樣的數據集模型訓練完成所需要的時間,比較結果如圖8所示。

圖8 兩種方法的時間比較
在圖8中,SRTDP預測方法和模型訓練完成的時間耗費明顯低于文獻[5]中RNN預測方法,SRTDP預測方法的最好結果是17 837 s,而文獻[5]中RNN預測方法的最好結果只有19 205 s,SRTDP預測方法在時間耗費方面比文獻[5]中RNN預測方法降低了7%,因為SRTDP預測方法通過每次更新部分參數,而并不是像文獻[5]中RNN預測方法一樣每次更新全部的參數,從而節省了時間。
為了進一步驗證SRTDP在精度和速度方面的優勢,將SRTDP與采用dropout的RNN預測方法(dropout-RNN)和采用zoneout的RNN預測方法(zoneout-RNN)在預測準確率,平均距離誤差,解決長期依賴和訓練完成時間方面進行比較。
在圖9中,SRTDP預測方法的平均距離誤差(ADE)低于dropout-RNN方法和zoneout-RNN方法。對比三種方法的平均距離誤差的最小值,dropout-RNN為2.90 km,zoneout-RNN為2.73 km,而SRTDP只有2.24 km。在圖10中,SRTDP預測方法的預測準確率(PA)也明顯高于dropout-RNN方法和zoneout-RNN方法,dropout-RNN的最大預測準確率為0.645,zoneout-RNN為0.690,而SRTDP高達0.731。SRTDP能夠使得預測產生的狀態與真實狀態更加接近,提高預測準確率。

圖9 平均距離誤差比較

圖10 預測準確率比較
SRTDP、dropout-RNN和zoneout-RNN在解決長期依賴方面的比較如圖11和圖12所示。

圖11 長期依賴的平均距離誤差比較

圖12 長期依賴的預測準確率比較
在圖11和圖12中,SRTDP預測方法在解決長期依賴方面明顯好于dropout-RNN方法和zoneout-RNN方法,預測準確率明顯提高。
在圖13中,SRTDP、dropout-RNN和zoneout-RNN的訓練完成時間相差不大。對比三種方法的最短訓練完成時間,SRTDP為17 837 s,dropout-RNN為18 000 s,zoneout-RNN為17 900 s。三種方法在訓練完成時間上基本一致。

圖13 訓練完成時間比較
從實驗可以得出,SRTDP預測方法在精度和速度上都優于文獻[5]中RNN預測方法。在時間耗費相差不大的基礎上,SRTDP預測方法比dropout-RNN和zoneout-RNN降低了預測的平均距離誤差,提高了預測的準確率,在解決長期依賴方面也更有優勢。
本文利用軌跡數據,對出租車出行目的地進行預測,對比文獻[5]中已有的RNN預測方法,提出了一種將基于SDZ-RNN的出租車目的地預測方法:SRTDP。SRTDP預測方法能夠動態地改變神經元輸出狀態在相鄰神經元之間的傳輸,并且通過設置Zt來過濾前一神經元的輸出狀態,以此來保證神經元記憶單元狀態能夠更加契合真實的單元狀態,進而提高預測的準確率;同時Zt攜帶的參數更新信息確定了哪些參數需要更新而不是更新全部參數,節約了時間。實驗表明,SRTDP預測方法降低了預測的平均距離誤差,提高了預測的準確率,在解決長期依賴方面也更有優勢。
[1] Mahmassani H S.Dynamic network traffic assignment and simulation methodology for advanced system management applications[J].Networks and Spatial Economics,2001,1(3/4):267-292.
[2] Tang J,Song Y,Miller H J,et al.Estimating the most likely space-time paths,dwell times and path uncertainties from vehicle trajectory data:A time geographic method[J].Transportation Research Part C:Emerging Technologies,2016,66:176-194.
[3] Xue A Y,Zhang R,Zheng Y,et al.Destination prediction by sub-trajectory synthesis and privacy protection againstsuchprediction[C]//IEEEInternationalConference on Data Engineering,2013:254-265.
[4] Besse P C,Guillouet B,Loubes J M,et al.Destination prediction by trajectory distribution based model[J].IEEE Transactions on Intelligent Transportation System,2016.
[5] de Brébisson A,Simon é,Auvolat A,et al.Artificial neural networks applied to taxi destination prediction[J].arXiv preprint arXiv:1508.00021,2015.
[6] Baskar M K,Karafiát M,Burget L,et al.Residual memory networks:Feed-forward approach to learn long-term temporal dependencies[C]//2017 IEEE International ConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),2017:4810-4814.
[7] Hochreiter S,Schmidhuber J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[8] Endo Y,Nishida K,Toda H,et al.Predicting destinations from partial trajectories using recurrent neural network[C]//Pacific-Asia Conference on Knowledge Discovery and Data Mining.Cham:Springer,2017:160-172.
[9] Tang S,Wu Z,Chen K.Movie recommendation via BLSTM[C]//International Conference on Multimedia Modeling.Cham:Springer,2017:269-279.
[10] MovieLens[EB/OL].[2017-03-20].https://grouplens.org/datasets/movielens/Keogh.
[11] Hinton G E,Srivastava N,Krizhevsky A,et al.Improving neural networks by preventing co-adaptation of feature detectors[J].Computer Science,2012,3(4):212-223.
[12] Tan Y K,Xu X,Liu Y.Improved recurrent neural networks for session-based recommendations[C]//Proceedings of the 1st Workshop on Deep Learning for Recommender Systems,2016:17-22.
[13] Krueger D,Maharaj T,Kramár J,et al.Zoneout:Regularizing rnns by randomly preserving hidden activations[J].arXiv preprint arXiv:1606.01305,2016.
[14] Rocki K,Kornuta T,Maharaj T.Surprisal-driven zoneout[J].arXiv preprint arXiv:1610.07675,2016.
[15] Rocki K M.Surprisal-driven feedback in recurrent networks[J].arXiv preprint arXiv:1608.06027,2016.
ZHANG Guoxing,LI Yadong,ZHANG Lei,et al.Taxi travel destination prediction based on SDZ-RNN.Computer Engineering andApplications,2018,54(6):143-149.
ZHANG Guoxing,LI Yadong,ZHANG Lei,FAN Qingfu,LI Xiang
College of Computer Science and Technology,China University of Mining and Technology,Xuzhou,Jiangsu 221116,China
In the prediction of the taxi destination,the traditional Markov prediction method relies only on the first 2 to 3 GPS points,and does not apply to trajectories that have very long dependencies.In order to solve the long-term dependencies,this paper uses Recurrent Neural Network(RNN)to predict the taxi destination,this is because the multiple hidden layers of RNN can store this dependencies.However,with the increasing amount of data,the hidden layers of RNN is very sensitive to small perturbations and the perturbations will be exponentially enlarge in the latter part of prediction,reducing the prediction accuracy.In order to improve the prediction accuracy of taxi destination and reduce the training time,this paper applies SDZ to RNN,and proposes a new taxi destination prediction method based on SDZ-RNN(SRTDP).SDZ can not only improve the robustness of SRTDP,but also reduce the training time by adopting partial update instead of full update.Experiments show that SRTDP is superior to RNN prediction method in accuracy and speed,the prediction accuracy is improved by 12%,and the training completion time is reduced by 7%.
taxi destination prediction;recurrent neural networks;SRTDP method;prediction accuracy
在預測出租車目的地時,傳統的馬爾科夫預測方法僅僅依賴于前面2到3個GPS點,對于那種具有很長依賴關系的軌跡并不適用。為了解決這種長期依賴關系,采用循環神經網絡(RNN)進行出租車目的地預測,因為RNN的多個隱藏層能夠存儲這種依賴關系。但是隨著數據量的增大,RNN的隱藏層對較小的擾動變得十分敏感,較小的擾動就會被指數級放大,最終導致預測準確率降低。為了提高預測準確率,同時縮短訓練時間,將SDZ應用到RNN中,提出一種基于SDZ-RNN的出租車目的地預測方法(SRTDP)。SDZ不但能夠提高SRTDP的魯棒性,而且SDZ采用局部更新而不是全部更新的方式,降低了訓練時間。實驗表明,SRTDP在精度和速度上都優于RNN預測方法,預測準確率提高了12%,訓練完成時間降低了7%。
出租車目的地預測;循環神經網絡;SRTDP方法;預測準確率
2017-07-07
2017-09-12
1002-8331(2018)06-0143-07
A
TP312
10.3778/j.issn.1002-8331.1707-0110
中央高校基本科研業務費專項資金(No.2014XT04);教育部博士點基金(No.20110095110010);江蘇省自然科學基金(No.BK20130208)。
張國興(1993—),男,碩士研究生,研究領域為移動對象軌跡數據挖掘,E-mail:zhangguoxing@cumt.edu.cn;李亞東(1993—),男,碩士研究生,研究領域為移動對象軌跡數據挖掘;張磊(1977—),男,博士,副教授,研究領域為移動對象軌跡數據挖掘;樊慶富(1993—),男,碩士研究生,研究領域為移動對象軌跡數據挖掘;李想(1993—),女,碩士研究生,研究領域為移動對象軌跡數據挖掘。