999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于時間序列的多維距離聚類異常檢測方法

2020-07-20 06:16:04丁建立黃天鏡徐俊潔
計算機工程與設計 2020年7期
關鍵詞:特征檢測

丁建立,黃天鏡,徐俊潔,王 靜

(中國民航大學 計算機科學與技術學院,天津 300300)

0 引 言

在GPS定位、目標探測技術快速發展的時代,為了保障飛機飛行安全,需要存儲和分析大量的飛行相關的時空軌跡數據。民航飛行時空軌跡數據包含了經緯度坐標、記錄時間、飛行高度、飛行速度、航向等多種屬性[1]。在實際飛行中,民用飛機一般按照標準飛行程序,依靠地面空中交通管制人員的指揮來調配飛行[2],但特殊情況會出現實際航跡偏離標準程序的情況,通過對軌跡數據的檢測可以發現偏離正常飛行模式的軌跡[3],保障飛行安全。

已有的軌跡異常檢測算法主要分為以下4類:基于統計的方法、基于距離的方法、基于密度的方法和基于聚類的方法[4,5]。以上方法并沒有充分利用軌跡的類型、位置、速度和方向等多維特征,而傳統的聚類的方法主要采用距離作為相似度的評價指標,認為兩個對象的距離越近,其相似度就越大,忽略了飛行軌跡的數據點的有序性以及數據點本身具有的航向、速度等特征,不能有效挖掘飛行軌跡中的異常行為。

本文針對傳統聚類異常軌跡檢測方法中存在的局限性,使用廣播式自動相關監視(automatic dependent surveillance-broadcast,ADS-B),提出了基于時間序列的多維距離聚類異常檢測方法。利用改進Hausdorff距離計算不同軌跡數據之間的相似距離,并結合層次聚類算法檢測異常飛行軌跡。相比只采用軌跡位置的Hausdorff距離函數進行異常檢測方法,改進方法能夠更全面地對軌跡數據進行分析,找到軌跡數據在位置、速度、方向等特征上的異常,提高飛行軌跡數據的異常行為檢測的精確性。

1 相關概念描述

1.1 軌跡數據

軌跡數據是由一系列隨時間變化的時空數據點組成,即TR={P1,P2,…Pi,…,Pn}。 ADS-B系統可以自動地從相關機載設備獲取參數向其它飛機或地面站廣播飛機的位置、高度、速度、航向等信息[5],針對于ADS-B數據來說,這里第i個數據點可以表示為Pi=(loni,lati,vi,θi,ti),loni,lati為數據點的經度和緯度值,vi為數據點的速度,θi為數據點的航向,ti為該數據點的時間戳信息。

軌跡集合可以表示為n條軌跡數據的集合,即T={TR1,TR2,…,TRi,…,TRn}, 其中TRi表示第i條軌跡數據。

1.2 軌跡相似度

正常情況下某段航線的飛行軌跡是相似的,但不排除某些突發情況,如躲避物體或檢測數據丟失等情況,這些情況會導致軌跡數據發生異常,使得該飛行軌跡偏離正常軌跡,嚴重時可能導致軌跡相似度發生較大差異。僅考慮位置特征的軌跡異常檢測算法會忽略掉時間、速度和方向等運動狀態對飛行軌跡數據的影響,不能有效挖掘歷史數據[6],使得正常的軌跡行為被檢測為異常軌跡,或者真正的異常的軌跡行為不能準備被發現。

(1)時間因素對軌跡相似度的影響

飛機飛行的軌跡是隨時間而逐漸變化的,在已有軌跡異常檢測算法計算軌跡相似度時,僅考慮了軌跡的位置信息,沒有考慮時間因素對飛行軌跡的影響,導致檢測效果較差。例如在計算如圖1所示的4條軌跡的相似度時,如果僅考慮位置信息,很有可能得到4條軌跡相似度歸屬于相同的類,顯然得到的結果不能完全體現出軌跡的運動規律。圖1中4條軌跡的前期運動形態趨勢相似,但軌跡Tr3和Tr4隨著時間的變化后期的運動趨勢同Tr1和Tr2出現了較大的差異。在考慮時間特征情況下,就可以將Tr3和Tr4軌跡同Tr1和Tr2進行區分。

圖1 相似軌跡

(2)速度和方向因素對軌跡相似度的影響

為了更好地進行軌跡異常檢測,在考慮位置特征,時間特征的基礎上,引入軌跡本身具有的速度,方向等運動特征。如圖2所示,顯而易見,通過平移轉換圖中3條軌跡可以重疊,如果不考慮速度和方向的特征,在計算相似性時會判斷為3條軌跡是相似的。但是在考慮到速度和方向特征前提下,明顯Tr1、Tr2、Tr3軌跡兩兩均不相同。Tr2與Tr1速度相同卻方向不同;Tr3與Tr1方向相同卻速度不同,速度要比Tr1快[7]。

圖2 運動軌跡

針對上述問題,本文在利用Hausdorff距離計算軌跡相似性時,在時間特征的基礎上結合了軌跡的速度、方向、位置等多重特征[8,9],利用基于時間序列的多維特征對Hausdorff距離函數進行改進,提高了軌跡數據相似性計算的精確性,進一步提高軌跡異常檢測的效果。

2 基于多維距離的層次聚類算法

2.1 算法描述

本文提出的基于多維距離的層次聚類算法由兩部分組成:基于時間序列的多維Hausdorff距離算法和多維Hausdorff距離的層次聚類算法?;跁r間序列的多維Hausdorff距離算法首先將方向、速度、位置多維特征融入Hausdorff距離公式中,通過構造的多維Hausdorff距離計算航跡數據集中任意航跡的相似距離[10],構造出航跡間相似性矩陣。多維Hausdorff距離的層次聚類算法基于該相似性矩陣進行層次聚類,生成具有層次結構的聚類圖。由于異常與正常航跡之間的相似度值差異較大,可以通過聚類結果較為直觀的將異常航跡與正常航跡分類,從而發現異常航跡。

層次聚類(hierarchical clustering)是一種基于原型的聚類算法,試圖在不同層次對航跡數據集進行劃分,從而形成樹形的聚類結構,同時它不需要事先指定簇的數量[11]。

2.2 基于時間序列的多維Hausdorff距離算法

已有的計算Hausdorff距離算法中僅使用了軌跡數據的位置特征,而實際目標軌跡的時間特征和速度、方向等運動特征都是描述軌跡的重要信息,本文提出的基于時間序列的多維Hausdorff距離算法把軌跡數據看作是按照時間序列由有序的數據點組成的。假設軌跡TrA={a1,a2,…,ai,…,an} 和軌跡TrB={b1,b2,…,bi,…,bm}, 其中n,m≥3,ai、bi分別為TrA、TrB在第i時刻的數據點。本算法在考慮時間序列的基礎上,引入位置、速度、方向等特征來計算多維Hausdorff距離,即基于時間序列的多特征兩點距離(time series multi-feature distance,TMFD):具體如下所述:

(1)位置特征

posdis(ai,bi)=dist(ai,(bi,bi-1,bi+1)) 表示兩條軌跡上的兩點的經緯度距離,本文采用Haversine公式計算。其中,軌跡A中任意點ai僅與軌跡B中相對應點bi以及前后相鄰兩點比較。

(2)速度特征

spedis(ai,bi)=dist(Vai,(Vbi,Vbi-1,Vbi+1)) 表示兩條軌跡上兩點之間的速度歐式距離,點的速度分解為垂直速度v*sinθ、 水平速度v*cosθ。

(3)方向特征

angdis(ai,bi)=dist(θai,(θbi,θbi-1,θbi+1)) 表示兩條軌跡在內部方向改變程度,反應了軌跡的波動狀況,使用絕對值距離來表示。

即綜合上述公式

(1)

TMFD(ai,bi)=ωp×posdis+ωv×spedis+ωθ×angdis

(2)

其中,ωp+ωv+ωθ=1, 且ωp≥0,ωv≥0,ωθ≥0分別表示位置特征、速度特征、方向特征的權重因子,可根據應用場景的不同,適當調整權重的選擇。

該算法從3個方面體現出軌跡數據的時空運動特征對異常軌跡行為檢測的優勢:

(1)軌跡點的運行特征具有多維性。改進后函數表達式中不僅使用點的位置特征,將點的速度特征以及方向特征考慮進去,利用Hausdorff距離計算方法,提高復雜運動狀態下軌跡相似度計算的準確性。

(2)軌跡點的運動是有序的。假設TrA中的第一個點a1與TrB中最后一點bn之間距離最大,則按照最初計算Hausdorff距離原則,則定義h(TrA,TrB)=dist(a1,bn)。 明顯所選取點有一定的時間差,在計算相似度時誤差過大。且軌跡TrA中任意點與TrB中所有點比較也不能體現出時間有序性特征。為了避免上述問題,令點ai、bi分別為TrA、TrB在同一時刻i的軌跡點,僅使用軌跡TrA中的每個點ai與軌跡TrB上的bi點與點bi前后相鄰兩點之間比較,減少計算量同時體現出軌跡的有序性。

(3)軌跡點的運動是連續性。選取點bi以及bi前后相鄰兩點進行比較,最大程度滿足在時間排序上的一對一,由于軌跡前后相鄰兩點在速度及方向上變化不會過大,同時采用一對三保證了點與點之間的連續性,在計算軌跡相似度時提高準確率。

2.3 多維Hausdorff距離的層次聚類算法

對軌跡數據集使用基于時間序列的多維特征距離方法計算得到任意兩條軌跡之間的多維相似距離h(TrA,TrB),進而構造出計算航跡間的相似性矩陣R,即

其中,rij表示第i條軌跡與第j條軌跡之間的相似距離。主對角線元素0表示軌跡自身與自身比較的相似距離。

表1為結合軌跡數據的多維Hausdorff距離的層次聚類算法。該算法的輸入是軌跡數據集T,輸出是聚類圖。在多維Hausdorff距離的層次聚類算法中,步驟1使用基于時間序列的多維Hausdorff距離計算T中任意兩條軌跡之間的相似距離;步驟2使用步驟1中的相似距離構造相似性度量矩陣R;步驟3根據n條軌跡數據構造n個類,每個類中只包含一條軌跡,并設置每一個類的平臺高度均為0;步驟4采用自底向上的層次聚類算法合并相似距離最近的兩類為一個新類(也就是選擇矩陣R中rij的最小值,合并軌跡i和軌跡j對應的兩個類為新類),并且以軌跡i和軌跡j的相似距離作為該新類在聚類圖中的平臺高度;步驟5計算新類與其它各類的相似距離,若當前類的總個數已經等于1,則輸出聚類圖,否則繼續步驟4。

表1 多維Hausdorff距離的層次聚類算法

3 實驗分析

3.1 實驗數據集

本文采用的數據集是來自Flightradar24的ADS-B數據,該網站提供實時的航班信息數據。其中選擇北京到上海的45天以及北京到杭州的20天的部分飛行航跡。實驗場景根據位置、速度、航向特征的取值差異,按比例確定權重因子的大小,降低權值對構造的多維距離的層次聚類算法的影響。

為了更直觀觀察本文方法的聚類結果,圖3(a)為根據本文所提出的聚類算法對北京至上海45條正常航跡以及北京至杭州20條的聚類結果,杭州與上海在地理位置上的航線差別不明顯,能夠有效驗證方向及速度特征對聚類結果的影響。橫坐標表示航跡數據集中的樣本個數,坐標軸上的數字為對應的航跡編號,如圖3(a)左側聚類為 1~45 編號的航跡,表示北京至上海的45條航跡,右側聚類為46~65編號的航跡,表示北京至杭州的20條航跡;縱坐標表示航跡間的相似距離。根據軌跡相似性距離值,同一航線的航跡屬于同一聚類。如圖所示,北京至上海為一個聚類、北京至杭州為一個聚類,符合實際情況。圖3(b)為北京至上海航線的航跡聚類結果,圖中聚類線沒有較大落差,表示該航跡本身之間差距并不大,均在正常范圍內(相似度值90)波動。

圖3 航跡聚類

圖4為北京至上海的航跡經緯度坐標的二維顯示,橫坐標表示緯度、縱坐標表示經度,所有的航跡并不是沿著一條直線,而是在一定范圍內飛行。

圖4 北京到上海航跡二維圖

3.2 實驗評價標準

在進行異常檢測時,針對于位置、速度、航向等特征分別隨機選取北京至上海的5條航跡,修改航跡點使其偏離正常飛行航跡閾值,飛行速度為正常速度的1.5倍,修改航向為正常航向的相反方向。該實驗結果通過計算正確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1值(F1-score)來評價基于多維Hausdorff距離的層次聚類算法。以上評價指標計算公式

(3)

(4)

(5)

(6)

正確率定義為正確預測的正反樣本數占所有樣本的比例。精確率定義為預測是異常實際也是異常的樣本數占預測是異常的樣本數的比例。召回率定義為測試集中所有正樣本樣例中,被正確識別為正樣本的比例。F1值是準確率和召回率的加權調和平均。其中,TP表示正樣本被正確識別為正樣本,TN表示負樣本被正確識別為負樣本,FP表示負樣本被錯誤識別為正樣本,FN表示正樣本被錯誤識別為負樣本。

3.3 實驗結果

圖5為在北京至上海的航跡中采用本文所述方法實驗修改航跡速度、位置、航向的聚類結果。實驗結果分析,聚類圖中的橫坐標表示航跡條數,坐標軸上的數字表示對應的航跡編號,縱坐標表示航跡之間的相似度值。圖5(a)為對速度修改后的5條航跡與正常航跡的聚類結果,可以明顯區別出修改后的異常航跡,通過本文提出多維Hausdorff距離的層次聚類算法,提高了軌跡相似度度量對速度變化的敏感度,使得修改速度后的軌跡與正常軌跡的相似度值相差較大,將正常與異常航跡聚為兩類;圖5(b)為對航向角度修改后的5條航跡與正常航跡的聚類結果,同樣識別出異常航跡,將正常與異常航跡聚為兩類。圖5(c)為對軌跡點經緯度值修改的5條航跡與正常航跡的聚類結果,由圖3(b)可看出,正常軌跡的相似度值最高在90左右,在修改航跡位置后,聚類圖中異常航跡與正常航跡相比的相似度值約為120-130左右,遠超出正常航跡聚類時的相似度,其中各別航跡區分不明顯由于本身航跡并不是沿著一條固定線路不變,有一定的飛行范圍,所以修改后的異常航跡的位置對正常航跡的聚類稍加影響,但不妨礙判斷出異常的航跡,通過本文方法可以判斷出異常軌跡。為了說明本文提出的算法的有效性,使用未改進的Hausdorff距離分別進行了與本文實驗數據相同的5條位置異常航跡、5條速度異常航跡以及5條航向異常的航跡與正常航跡聚類的3組實驗,計算異常航跡與正常航跡的相似度,由于原始Hausdorff距離在計算中僅考慮位置特征,所以對于修改位置的異常航跡可以用該方法判斷出,但計算中并沒有考慮速度和航向特征,所以在修改速度和航向的對比實驗中并沒有有效檢測出速度和航向上的異常,表明本文方法在速度與航向上的檢測提高了準確率。

圖5 異常檢測聚類

表2即原始Hausdorff距離算法與本文改進算法基于時間序列的多維距離聚類異常檢測方法在相同修改條件下檢測異常軌跡的對比結果。

表2 與現有Hausdorff距離進行聚類對比

4 結束語

本文通過分析航跡數據的特征,針對現有的軌跡相似度度量方法存在的不足,提出了一種基于時間序列的多維Hausdorff距離,考慮軌跡本身的運動有序性以及軌跡點連續性特征的基礎上,從位置、速度、航向這3個方面來計算軌跡的相似度,同時針對于“軌跡點有序”這一特征,使用一對三的比較方法減少了軌跡點之間的比較次數,降低了計算復雜度。采用ADS-B數據集,利用改進的多維Hausdorff距離進行層次聚類實驗結果表明,該算法可以有效識別出異常航跡,驗證了改進方法的有效性,對比實驗結果表明,增加軌跡點的運動、方向特征提高了飛行軌跡數據的異常行為檢測的精確性。在實際應用中,發現異常航跡對于查找民航飛機出現故障及漏洞有著重要的參考意義。

猜你喜歡
特征檢測
抓住特征巧觀察
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
主站蜘蛛池模板: 国产成人a在线观看视频| 国产乱人激情H在线观看| 欧美黄网站免费观看| 久夜色精品国产噜噜| 国产白浆视频| 国产原创第一页在线观看| 国产幂在线无码精品| 2021国产精品自产拍在线观看| 欧美另类图片视频无弹跳第一页| 欧美精品高清| 精品人妻一区无码视频| 青青草国产免费国产| 欧美午夜在线播放| 少妇极品熟妇人妻专区视频| 人妻丰满熟妇AV无码区| 国产哺乳奶水91在线播放| a级高清毛片| 国产aⅴ无码专区亚洲av综合网| 蜜臀AV在线播放| 日韩毛片在线播放| 99久久国产精品无码| 久久精品中文无码资源站| 国产激情无码一区二区APP| 一本久道久久综合多人| 亚洲床戏一区| 亚洲全网成人资源在线观看| 国产高清无码第一十页在线观看| 免费观看成人久久网免费观看| 国产综合色在线视频播放线视| 久久精品丝袜| 国产精品视频系列专区| 一级毛片在线免费看| 白丝美女办公室高潮喷水视频 | 欧美亚洲日韩中文| 日韩国产综合精选| 啪啪免费视频一区二区| 国产爽歪歪免费视频在线观看 | 亚洲中文字幕av无码区| 国产极品美女在线| 国产成人一区| 黑色丝袜高跟国产在线91| 一级黄色片网| 日韩精品毛片| 国产无码精品在线| 中国黄色一级视频| 亚洲Va中文字幕久久一区 | 国产精品制服| 国产日本一区二区三区| 欧美精品亚洲二区| 蜜桃臀无码内射一区二区三区| 国产精品短篇二区| 中文无码影院| 人人91人人澡人人妻人人爽| 国产一区三区二区中文在线| 波多野结衣一二三| 久久亚洲黄色视频| 国产熟睡乱子伦视频网站| 国产乱肥老妇精品视频| 成人日韩精品| 婷婷午夜天| 色综合久久88| 亚洲国产亚综合在线区| 精品国产成人高清在线| 亚洲第一色网站| 日韩在线播放欧美字幕| 99中文字幕亚洲一区二区| 国产精品区视频中文字幕| 亚洲 日韩 激情 无码 中出| 久久天天躁夜夜躁狠狠| 亚洲最猛黑人xxxx黑人猛交| a毛片在线播放| 国禁国产you女视频网站| 久久亚洲中文字幕精品一区| a级毛片免费在线观看| 国产精品免费露脸视频| 中文字幕人妻av一区二区| 欧美第一页在线| 国产精品视频观看裸模| 亚洲中文字幕在线精品一区| 中文字幕精品一区二区三区视频 | 999精品在线视频| 色天天综合|