王全躍 朱海濤 馬瑞霞 趙丹 王銳敏
摘 要:為了解決由于航路設計不足而導致的航跡與預定航路存在偏差的問題,基于數據挖掘的理論,采用時空航跡聚類、航跡相似度度量及分層聚類航跡方法分析了航跡航路偏差。采用Matlab軟件處理了飛機飛行的ADS-B航跡數據,求得飛機飛行平均航跡。以天津上空航路網為例計算平均航跡。結果表明,此方法能分析出航跡與航路的偏差。
關鍵詞:數據挖掘;ADS-B數據;航路;航跡偏差
引言
隨著交通流的增大,飛行航跡與航路經常出現存在偏差的情況,原有設計的航路在一定程度上已不能夠完全滿足當前飛機運行需求。通過航路優化可以有效提高交通運行效率。
廣播式自動相關監視(ADS-B)是一種基于全球衛星定位系統(GPS)和地/空,空/空數據鏈通信的航空器運行監視技術[1],具有數據量大、易獲取的特點。文章以天津上空的航路為例分析,運用時空航跡聚類、航跡相似度量及分層聚類航跡方法,提出的基于ADS-B數據挖掘的航路航跡偏差分析研究方法,能夠為航路優化提供參考。
1 天津上空航路分析
天津位于北京東南方向,距離北京110公里。去往北京和從北京機場出發的航班大部分都需要經過天津上空,且該地區航路復雜(天津上空的主要航路圖如圖1所示)。
天津地區上空的A461和A593航路,作為京廣通道和京滬通道,是全國較繁忙的兩條航路。從目前的航路和飛行航跡來看,飛行航跡并不完全與按照航路所設計的路線一致,這在一定程度上不利于交通流量的控制,需要通過研究航跡偏差的原因來調整現有航路結構。
2 應用到的聚類方法
2.1 時空軌跡聚類方法
時空軌跡是移動對象的位置和時間的記錄序列[2]。時空軌跡是連續的,但通常用一組時空記錄點序列,以離散的方式表示。對時空對象的實際軌跡曲線進行采樣,用得到的集合來代表時空軌跡[3]。而航跡也可以看成是一種時空軌跡。因此,時空軌跡(航跡)的模型如式(1)所示:
式中:代表一條軌跡,序列中每一個(d+1)元組(xn,yn,tn)代表軌跡對象tn時刻在d維空間中的一個記錄點,其空間位置是tn
為了能夠從ADS-B軌跡數據中發現有用的信息,需要使用空間數據挖掘的方法,通過聚類識別出對象空間稠密和稀疏的區域,將數據中的相似性與異常特征提取出來,從而發現全局分布模式和數據屬性間的關系。具體的研究思路圖3所示。
具體思路如下:
首先,采用Hausdorff距離的方法對兩兩航跡進行相關性運算。
其次,計算一條航跡中一點到另一條航跡全部點的距離,求出d1,d2......dn;其次,求出該點到另一條航跡上全部點的最大距離,記為dmax;
再次,用該方法求得航跡上全部點到另一條航跡的最大距離;
最后,兩條航跡的近似距離D可以用所有該航跡上的點到另一條航跡的距離中取最小值表示,得到兩條航跡間的距離D后,就可以通過判斷D來得到兩條航跡的相關性。
其中,X表示航跡點的經度,Y表示航跡點的緯度,T表示采集到航跡點的時間。由于航跡數據采用的是按時間順序排列,所以處理時就可以不用三維點而直接用二維坐標進行處理即可簡化為:
兩兩航跡進行相關性運算,設兩條航跡為:
一條航跡T中特定m(xn,xy)點到另一條航跡U的距離可以簡化為歐式距離,即:
該點到另一條航跡的最大距離dmax(m)可以近似為:dmax(m)=max(d1,d2,......dn)
兩條航跡的近似平均距離D可以用所有該航跡上的點到另一條航跡的距離dmax中取最小值可以近似看成兩條航線間的距離D為:
D=min{dmax(1),dmax(2),dmax(3)......dmax(m),dmax(n)}
在通過對D進行判斷,就可以得出兩條航跡的相關性。
2.2 航跡相似度的度量方法
在這里,我們需要對D進行特殊分析。根據國內的國情,中國國內航路寬度設計標準一般為20km,所以我們度量的標準S也為20Km,相似度用距離來表示的話可以為R=■,判斷R可以得到兩條航跡間的相似度。當R>1時,表示兩條航跡完全無關,當R>1時,表示兩條航跡有相關性,R數值越小,兩條航跡之間的平均偏差越小,兩條航跡相似度越高。
2.3 分層聚類航跡分析
由于分層聚類是由不同層次的分割聚類組成,層次之間的分割具有嵌套的關系并且它不需要輸入參數,因此采用文獻[4]的分層聚類航跡分析方法,對航跡進行分層聚類分析,然后得到某航跡聚類Ci。
2.4 聚類的平均航跡構造
首先,針對聚類得到的航跡進行分析。在兩導航臺之間,每隔一定的距離取適當的航路點ti,把以該航路點為圓心,半徑為一定距離的圓內所有航跡點的平均值作為平均航跡的航跡點(如圖4所示)。航跡聚類所形成的平均航跡Mt是由沿進場方向離散的航跡點構成的。每個航跡聚類所形成的平均航跡從統計數據的角度描述了在指定條件下(如:時間段、航空器類別、跑道使用構型、管制負荷程度等)某條標準的飛行程序對應的最為典型的一個飛行軌跡。平均航跡的定義如下:
(1)平均航跡的航跡點Mt定義為向量集其中:nmt為航跡點的編號, 按距離大王莊VYK導航臺的地理位置由近到遠由小到大進行編號;nmt為航跡點總數,mpi為平均航跡中第i個航跡點;
(2)每一個航跡點mpi定義為一個二維的向量:mpi=(x,y),其中:x表示航跡點mpi的經度(橫坐標);y表示航跡點mpi的緯度(縱坐標)。文中使用分量mpi(x),mpi(y)分別表示平均航跡中航跡點mpi的相關信息。
構造平均航跡的基本思想為:從大王莊(VYK)導航臺開始,沿航路方向, 逐點構造每一個平均航跡點mpi來獲得所有的平均航跡點集Mt。其中平均航跡點mpi可以通過計算該航路點為圓心、一定距離為半徑的圓內所有航跡點的平均值,最后將平均航跡點連線成為平均航跡,具體處理過程為:
(1)需要選擇航路上以3海里為間隔的點集作為基準航路點集,以保證平均航跡中每一個航跡點的構造都包含所有航跡的信息(不妨設該航路點集為Ti={nmt為航路點總數;
(2)計算以一個基準航路點ti為中心、半徑為5海里的范圍內航跡聚類Ci中所有航跡點的平均位置,得到一個新的位置坐標,即為平均航跡點mpi,用mpi=(x,y)表示。對航路上其余點用相同方法,通過逐個構造每一個平均航跡點來生成平均航跡Mt。再將所有平均航跡點連線,得到平均航跡。其滿足: 平均航跡中每一條航跡的航跡點數量都與Ti相同,且任一條航跡中的航跡點都是與相同序號的航路點具有較好的局部相似性。
3 算例分析
應用上述航跡聚類和平均航跡構建方法對從大王莊到行唐航段進行實例研究。
(1) 將ADS-B航跡數據聚類,使用時空航跡聚類方法,用Hausdorff距離判斷并找出與從大王莊到行唐航段相似的航跡,用分層分析的方法,將相似的航跡歸為一類,得到航跡聚類C1,航跡聚類圖如圖5所示。
(2) 針對大王莊到行唐兩個NDB導航臺之間的航段,選取每隔3海里為一適當的航路點ti,把以該航路點為圓心,半徑為5海里的圓內所有航跡點的平均值作為平均航跡的航跡點Mt,將所有平均航跡點連線構成該航段的平均航跡,平均航跡圖如圖6所示。
圖5 某日大王莊-行唐航段ADS-B航跡數據聚類圖
圖6大王莊-行唐航段平均航跡圖
4 結束語
文章利用數據挖掘的方法對ADS-B數據航跡偏差進行分析研究,結合時空航跡聚類、航跡相似度量及分層聚類航跡方法,求得飛機飛行平均航跡。并以天津上空航路為例,計算了平均航跡,對航跡偏差分析具有一定的借鑒意義。最后感謝中國民航大學提供的大學生創新創業資金的資助。
參考文獻
[1]付強.ADS-B原理及在空中交通管制中的應用[D].吉林大學,2011.
[2]龔璽,裴韜,孫嘉,等.時空軌跡聚類方法研究進展[J].地理科學進展,2011.
[3]Nanni M. Clustering methods for spatio-temporal data. Pisa, Italy: University of Pisa[D].2002.
[4]王超,徐肖豪,王飛.基于航跡聚類的終端區進場程序管制適用性分析[J].南京航空航天大學學報,2013,45(1).
作者簡介:王全躍,朱海濤,馬瑞霞,趙丹,王銳敏,中國民航大學,空管學院學生。