999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的ADS-B異常數據檢測模型

2019-12-27 05:05:02丁建立鄒云開王靜王懷超
航空學報 2019年12期
關鍵詞:特征檢測方法

丁建立,鄒云開,王靜,王懷超

1. 中國民航大學 計算機學院,天津 300300 2. 中國民航大學 中歐航空工程師學院,天津 300300

廣播式自動相關監視(ADS-B)通過全球衛星導航系統(GNSS)以及相關機載設備獲取參數,并向其他飛機或地面基站廣播飛機的位置、速度、航向、識別號等信息,相比于現行的雷達系統,ADS-B無需使用詢問/應答方式即可獲取航空器目標信息數據,并且更精確、更高效、更全面和更可靠。然而ADS-B協議開放共享式的特點使得位于相關頻段的任何接收端都可以獲取由飛機發出的ADS-B報文信息。另外,隨著軟件定義無線電(SDR)的發展,進一步降低了攻擊ADS-B系統的難度。例如,Sch?fer等[1]詳細描述了如何以較為簡單的技術手段成功對ADS-B系統進行欺騙干擾。此外,隨著空中交通輸運量的增加和ADS-B系統的進一步推廣應用,對其安全問題的擔憂也將不斷增加。

針對ADS-B系統的安全問題,國內外已經開展了很多研究。首先為基于密碼學的方法[2-3],此類方法通常需要改變現有的ADS-B協議,并且與目前的ADS-B系統不兼容,因此實施難度較大,附加成本很高。Strohmeier和Martinovic[4]提出了一種位于數據鏈路層的特征識別方法,該方法通過ADS-B應答機類型的不同以及它們在飛機上實現方式的不同來識別報文的合法性,但對于掌握應答機傳輸特點的高級攻擊者,該方法并不能提供相關安全保障。第2類為基于位置驗證的方法[5-7],這類方法通常是利用到達時間差/到達時間和(TDOA/TSOA)對飛行器或其他ADS-B報文發送者所宣稱的位置進行二次校驗,但此類方法對接收基站的安裝位置有一定的要求,還容易受到多徑效應的影響。Kacem等[8]提出了一種ADS-B系統的入侵檢測框架,將位置信息驗證與安全加密相結合,但作者并沒有從安全指標(如攻擊檢測率)的角度來評估該框架的性能。Strohmeier等[9]提出了一種基于k-NN算法的飛機位置驗證方法,雖然該方法克服了多點定位技術的一些缺點,但它仍然需要多個地面接收裝置之間的同步,因而復雜度很高。第3類為基于陣列天線驗證波達方向(DOA)的方法[10-11],雖然這類方法不需要多個地面基站之間的協同,只采用單一數據源,但通常需要空間搜索測向,計算復雜度較高。Wang等[12]使用陣列天線來直接抑制欺騙干擾,該方法雖然降低了計算復雜度,但受陣列誤差影響較大。

在各個研究與應用領域,異常數據檢測都是一個十分重要的問題。目前常見的異常數據主要分為兩種,分別為數據點異常和上下文異常。前者又稱為離群點,即異常數據的特征值與正常數據的特征值距離較遠,如飛機在某個時刻的速度、海拔、經緯度等離群距離和超過閾值,即為異常點。后者又稱時間序列異常,即該數據本身是正常數據,在對應的上下文出現時即為異常,如飛機在爬升階段速度信息顯示為300節,雖然該數字處于飛機機動性能的正常約束范圍內,但其超過了飛機爬升階段的正常速度范圍(160~200節),由此仍為異常數據。近年來,各個領域提出了多種基于機器學習的異常檢測方法,包括無監督方法[13-15]和監督方法[16-17],其中無監督學習方法因為不需要標簽數據因而可以處理大量數據,然而這些方法的性能都很低[18]。而監督學習方法相比無監督方法雖然具有更高的精度,但存在標簽標注成本過高,缺乏異常數據,位于異常邊界的數據難以劃分等問題。目前常用的異常檢測方法主要有4類,分別為基于線性模型的方法、基于距離的方法、基于集群的方法以及基于神經網絡的方法,值得注意的是,基于深度學習的異常檢測方法越來越流行,并被應用于各種不同的任務。Peng和Marculescn[19]以及Javaid等[20]研究表明,基于深度學習的方法已完全超越了傳統方法。

本文針對ADS-B系統欺騙干擾檢測方法所存在的成本、性能以及適應性方面的問題,利用ADS-B報文更新快、時間關聯性強等特點,從數據角度出發,采用深度學習的seq2seq模型[21],用于檢測異常ADS-B時間序列,并在此基礎上,通過對序列特征擴展,即增加序列特征維度,來提升檢測效果。該方法不需要改變現有的ADS-B協議,也不需要額外的節點或傳感器參與,只需要來自ADS-B系統的報文序列以及將異常檢測的結果通過可視化系統分類輸出即可。在實際應用中,可根據該方法開發相關軟件并集成在ADS-B可視化系統中,安裝于飛機(例如,以認證軟件的形式應用于電子飛行包)或地面基站。

1 ADS-B風險分析

ADS-B系統所面臨的風險本質上來源于射頻通信的廣播特性[22]。表1從可能性及影響程度列出了幾種對ADS-B系統潛在的攻擊類型。本文所使用的異常ADS-B序列即在此基礎上模擬生成。

竊聽(Eavesdropped):由于ADS-B傳輸系統沒有進行加密,因此其數據交換很容易被竊聽,但竊聽不會(直接)對空中交通管制系統造成危害,因此影響最小,但它是其他攻擊手段的基礎。

干擾(Jamming):通過靠近地面基站并在相關頻段擁有足夠高的發射功率即可實現對ADS-B系統的干擾,此類攻擊雖然會給監視系統帶來較大影響,但可以根據干擾信號的功率對攻擊者進行快速定位,因此認為干擾攻擊具有中等影響。

報文注入(Injection):通過構建一個能夠產生正確調制和符合ADS-B報文格式的發送器即可實現。攻擊者如果向系統中注入大量的虛假飛機,將嚴重擾亂空中交通,混淆防撞系統,甚至引起碰撞。其發生可能性為中,影響較高。

報文刪除(Deletion):可以通過構造性(Constructive)干擾或破壞性(Destructive)干擾手段在物理層實現報文刪除[23]。實施此類攻擊在某種程度上需要時間同步,因而實施難度較高。另外,這種攻擊雖然會對監視系統造成一定影響,使飛機從空管地圖中暫時消失,但監視系統還會由多點定位等備用系統支持,這在一定程度上降低了它的危害性,因此具有中等影響。

報文篡改(Modification): 可以在系統物理層通過掩蓋(Overshadowing)和位反轉(bit flipping)實現報文篡改(也可以通過結合報文注入與報文刪除這兩種攻擊方式來實現)[23]。雖然實施起來需要嚴格的時間同步和精度,具有較高的復雜性,但它對空管系統具有很大的影響。例如,攻擊者如果對ADS-B報文中的飛機位置信息進行不斷的小幅度修改,即“溫水煮青蛙”[24]式的欺騙式干擾,其他監視技術(如雷達監視系統)或定位技術會因精度問題將很難檢測到這些細微的差異,從而造成對空管人員的錯誤指引,或造成防撞系統的反應延遲。

2 ADS-B異常檢測模型構建

2.1 問題定義

定義n維時間序列表示ADS-B序列窗口,即

S={S1,S2,…,SC}

式中:C為時間序列的長度;Si=[s1,s2,…,sn](1≤i≤C)是一個n維的向量,其每一個維度對應一種特征。具體來說,S表示連續的C條ADS-B報文信息組成的窗口,而每一個向量Si又包含了從對應ADS-B報文中獲取的特征信息,即位置、海拔高度、速度等。

在訓練階段,使用正確的ADS-B時間序列作為訓練樣本輸入到異常檢測模型中,該模型會強制重構該序列。訓練完成后,輸入正確的ADS-B時間序列,其重構誤差將在一定范圍內,而當使用包含異常的序列作為輸入時,其重構誤差將會被放大,從而達到異常檢測的效果。圖1為本文總體流程(以包含特征維度擴展步驟為例)。

圖1 總體流程圖
Fig.1 Overall process

2.2 特征提取與維度擴展

將ADS-B報文中所包含的飛機速度、經度、維度、海拔高度與航向信息作為數據的基本特征。又因為時間序列中的向量通常不是相互獨立的,由此可以使用滑動窗口來計算依賴關系,而后再計算每個窗口中的統計特征來獲得特征更為豐富的時間序列。特征維度擴展主要分為3步,具體方法如下:

首先,定義窗口

Ti=〈Si,Si+1,…,Si+c-1〉

表示區間在[ti,ti+c-1]上的時間序列。

考慮一個步長為[b]的滑動窗口(b>1),其中兩個連續的窗口重疊步長為[b/2],由此,通過一個長度為C的時間序列,可以得到一個長度為C′=(2C-b)/b的新序列。如圖2所示,時間序列的長度C=14,窗口長度b=4,則第1個窗口包含的向量區間為[t1,t4],第2個窗口包含的向量區間為[t3,t6],第3個窗口為[t5,t8],以此類推,共計產生了6個窗口。

圖2 特征維度擴展的3個步驟
Fig.2 Three steps of feature expansion

對于每個窗口來說,可以從時間序列的每個特征中計算出兩個派生特征,分別稱為模(Norm,記作NOR)與模差(Difference of Norm,DON)。計算方法定義為

NORj(Ti)=

(1)

DONj(Ti)=NORj(Ti)-NORj(Ti-1)

(2)

式中:i表示第i個窗口。

NOR捕獲的為窗口序列中特征的大小信息,而DON捕獲的為兩個連續窗口中特征大小的變化信息,即時間依賴性。

經過計算之后,可以得到一個新的時間序列

T′=〈G1,G2,…,GC′〉

式中:Gi∈Rd×n為矩陣。

在此之后,考慮大小為[f]的滑動窗口來進行第2步轉換。定義連續兩個窗口之間的重疊長度為[f/2],對于每個窗口,分別計算序列T′中兩個派生特征(NOR,DON)的一系列統計特征,其目的是為了進一步捕獲派生特征隨時間的變化程度。由文獻[25-26]推薦,可計算派生特征對應的8個統計特征,分別為平均值、最小值、最大值、四分位數(25Q,50Q,75Q)、標準差以及峰峰值,由此得到又一個時間序列

T″=〈H1,H2,…,HC″〉

式中:Hi∈R(e×d)×n為矩陣。

最后,再將時間序列T″中所包含的矩陣Hi展開,并進行向量化,得到最終的時間序列

T′″=〈H′1,H′2,…,H′C″〉

如圖3所示,對于包含5維(n=5)特征(經度、維度、海拔高度、速度、航向)的ADS-B時間序列T,經過第1步轉換后得到時間序列T′,再經過第2步部轉換后得到序列T′,兩次轉換的滑動窗口大小分別為b=4,f=2,最后再經過向量化,得到最終的時間序列T′″,序列的特征維度由5擴展為80,時間序列的總長度變為原來的一半。

圖3 特征維度擴展的一個具體例子(n=5,b=4,f=2)
Fig.3 A specific example of feature expansion wheren=5,b=4, andf=2

2.3 異常檢測模型

本文以深度學習的seq2seq模型為基礎來重構該序列。seq2seq是一種通用的編碼器-解碼器框架,是指一般的序列到序列的轉換任務,常用于自動文摘、機器翻譯等。它包含了編碼器、解碼器以及連接兩者的中間狀態向量共3個部分。其中編碼器與解碼器部分為循環神經網絡(RNN)單元結構,編碼器通過學習輸入,并將其編碼為一個固定大小的狀態向量,進而再將該向量傳給解碼器部分,最后解碼器再通過對狀態向量的學習來進行相關輸出。

由于RNN具有一定的短期記憶優勢,因此常常將它作為對時序數據訓練的首選神經網絡。不過當序列數據的長度超過一定范圍后,利用RNN所訓練的數據將會出現嚴重的梯度消失問題,進而導致訓練停止,也就是說,RNN僅能學到一定間隔的時間序列信息。飛機所發送的ADS-B數據可以看作是一系列具有前后聯系的時間序列,因其長度較長,所以在這種條件下,RNN將很難有效利用這些長序列的歷史信息,即無法學習到長期依賴的特征。為了解決該問題,Hochreiter和Schmidhuber[27]首次引入了長短期記憶機制(LSTM)。此后,研究者們也提出了許多LSTM的變體,其中最為流行的為Graves和Schmidhuber[28]于2005年所描述的。

LSTM可以使用其內部存儲單元狀態來捕獲長期模式和依賴關系。因此,編解碼結構與LSTM網絡的結合可以作為一個有效的時間序列預測模型。

圖4 模型核心圖
Fig.4 Core model diagram

2.4 異常評估指標

(3)

式中:n為向量的特征維數。

在此基礎上,可定義時間序列的重構異常分數為

(4)

通過實驗可以確定異常分數的閾值,作為異常序列判定的標準。具體來說,計算訓練集的異常分數,并定義閾值為97%的異常分數值小于該值。

3 實驗與結果分析

3.1 數據獲取

實驗所使用的數據來自Flightradar24,該網站提供了從全球數千個地面ADS-B站收集的數據。虛假報文數據由模擬生成,方法描述如下:

隨機噪聲(干擾):將原始ADS-B報文中獲取的飛行信息數值乘一個0~2之間的隨機浮點數。

航路替換(報文注入):給定某條航路信息,對于選定的ADS-B序列段,注入另一條正確的航路信息來代替該段序列。

網絡延遲(報文刪除):在選定的ADS-B序列段,對于每10條連續的報文信息,只保留第1條,刪除后9條。這種情況模擬了現實情況中,只有在足夠大時間間隔的條件下,接收端才能接收到有效報文信息。

高度偏移(報文篡改):以400 ft(1 ft=0.304 8 m)尺為倍數,逐漸改變ADS-B報文中所包含的高度特征信息,具體來說,在選定的ADS-B序列段,將第1個向量所包含的高度特征增加400 ft,第2個增加800 ft,以此類推。

速度偏移(報文篡改):以5節為倍數,逐漸改變ADS-B報文中所包含的速度特征信息,具體來說,在選定的ADS-B序列段,將第1個向量所包含的速度特征增加5節,第2個增加10節,以此類推。

3.2 實驗策略

實驗過程中,選取100趟航班連續7天從起飛到降落的完整數據作為訓練樣本,每趟航班數據在1 500~2 000之間。另選取10趟單獨的航班作為測試樣本。在測試樣本中,分別在飛機飛行的不同階段(起飛、爬升、巡航、下降)選定長度為100的序列為異常序列段,按照前文描述的5種虛假報文類型進行修改。

用特征維度擴展后的時間序列與未擴展時間序列分別進行訓練,即進行相同過程的平行實驗。兩個模型訓練完成后,分別計算兩個訓練集的異常分數,并定義閾值為97%的異常分數值小于該值。在實驗過程中,輸入LSTM單元的原始時間序列長度為10,特征維度擴展過程中,兩個滑動窗口的大小分別為b=4,f=2。LSTM單元數為128,批尺寸(batch_size)為64,dropout比率為0.2,訓練所采用的損失函數為均方誤差(MSE)。

3.3 實驗結果

圖5為某條測試航班的實驗結果圖,其中橫坐標為序列號,縱坐標為異常分數,方框內為異常序列段(序號為199~299),橫線為異常閾值。其中圖5(a)~圖5(e)對應的是特征未擴展時間序列作為訓練樣本,圖5(f)~圖5(j)對應的特征維度擴展后的時間序列作為訓練樣本。

圖5(a)~圖5(c)表明,該模型對隨機噪聲、航路替換與網絡延遲這3種類型的異常序列檢測結果的可視化效果顯著。需要注意,將異常序列段按網絡延遲異常模擬方法修改后,其長度變為10。

圖5(d)和圖5(e)表明,模型在對高度偏移與速度偏移的異常檢測中,表現出延時檢測的結果。這是因為在異常變化的初期,數據變化幅度較小,特征變化并不明顯。在對特征維度擴展后的序列進行測試時,由于數據特征的時間依賴性被更好捕捉,因此這種現象得到了明顯的改善,具體表現為,在異常序列進入的初期,即可迅速觸發閾值,如圖5(i)和圖5(j)所示。

在對數據進行特征維度擴展后,數據的總量變為原來的一半,表現在實驗結果上,其對應的異常序號也變為原來的一半。圖5(f)~圖5 (h)為特征維度擴展后,模型對另外3種異常序列的檢測結果圖。

圖5 實驗結果圖
Fig.5 Experimental results figure

本文采用精確率(Precision),召回率(Recall)和F1分數來衡量該模型。其中精確率是指正確檢測出的異常ADS-B樣本數占所有實際被檢測出的異常樣本數的比例,召回率是指正確檢測出的ADS-B異常樣本數占所有應該檢測出的異常樣本數的比例,F1分數為精確率和召回率的調和均值。表2和表3為完整實驗結果,其中LSTM表示樣本為特征未擴展的時間序列,LSTM-EN表示樣本為特征維度擴展后時間序列。

可以看出,模型精確率較低,尤其是針對網絡延遲這種異常模式,這是因為異常序列段長度相對于整個測試航班所占比例較小。為提升模型精確率,在實驗過程中,設置模型使其只有在連續檢測到足夠多的異常點時,才觸發報警(現實情況中,ADS-B報文更新快,因此一些單獨的異常點可以忽略,在此將異常目標鎖定為序列)。對應現實情況,即給與一定的報警時間延遲(飛機平均每0.5 s 通過ADS-B報文廣播一次它的速度、位置等信息)。表4和表5為連續檢測到超過10個異常點再觸發異常報警的情況,可以發現模型檢測精確率大大提高。

表2 精確率、召回率與F1分數Table 2 Precision, recall, and F1 scores

表3 平均精確率、召回率與F1分數Table 3 Average precision, recall, and F1 scores

表4 精確率、召回率與F1分數(檢測目標為序列)

表5 平均精確率、召回率與F1分數(檢測目標為序列)

另外,本文還從4類不同的異常檢測方法中分別選取一種對5種類型的異常數據分別進行測試作為對比,這4種方法分別為基于線性模型方法的一類支持向量機 (OCSVM),基于集群方法的孤立森林(IF),基于距離方法的局部異常因子算法(LOF)以及由LSTM組成的神經網絡(SeqLSTM)。

在對比實驗中,從上述實驗樣本中選取約20 000條數據,再從中選取10趟航班對5種異常類型分別模擬2 000條數據組成5個新的數據子集,訓練集與測試集劃分比例為4∶1。其中OCSVM的核函數為徑向核函數(rbf),IF中樹的棵數為150,LOF中參數K為25,神經網絡由3層LSTM單元以及一個全連接層組成,損失函數為二元交叉熵(binary_crossentropy),輸入模型的時間序列長度為10,輸出為表示異常或正常的標簽。

前3種方法由于只使用了當前檢測點的特征信息,沒有考慮到當前點相鄰時間內的目標變化信息,因而檢測性能較低,且不能通過將目標鎖定為序列的方式來提高。其中LOF召回率較高,能檢測到更多真實的異常點,但其精確率較低。而由LSTM單元構成的神經網絡對ADS-B時間序列雖然具有較好的異常檢測效果,但因為在訓練之前需要對所有數據進行人為標注,因而具有一定的局限性。具體實驗結果如表6和表7所示,其中SeqLSTM表示由LSTM單元構成的神經網絡。

表6 各個方法精確率、召回率與F1分數

以上各類方法中,基于LSTM的seq2seq模型對異常ADS-B時序序列檢測效果最好,檢測能力更為全面。在對時間序列進行特征維度擴展后,該模型的各項檢測指標全面提升。

表7 各個方法平均精確率、召回率與F1分數

4 結 論

1) 該模型通過ADS-B報文數據的變化特點可以檢測針對系統的欺騙式干擾,檢測性能優于一類支持向量機,孤立森林,局部異常因子算法,以及由LSTM組成的神經網絡,且實施難度低于現有的欺騙干擾檢測方法。

2) 該模型在將異常目標鎖定為序列時可實現優異的檢測性能,具體表現為,針對連續超過10條的異常ADS-B數據,5種異常序列的平均檢測精確率為0.913,平均召回率為0.845。

3) 對序列進行特征維度擴展后,模型檢測性能提高,在保持高精確率的同時,平均召回率提高14%,由0.845提高為0.963。

后續工作將考慮添加環境因素以及飛機機動狀態改變所帶來的數據變化,并將時間序列中重要的數據點(起飛點、降落點、巡航開始點、巡航結束點等)作為編碼器和解碼器的附加特征和處理后的數據一起放入模型中進行訓練以應對更為復雜的異常數據類型。

猜你喜歡
特征檢測方法
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
小波變換在PCB缺陷檢測中的應用
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 国产伦片中文免费观看| 亚洲天堂视频网| 亚洲侵犯无码网址在线观看| 中国精品自拍| 国产在线一区二区视频| 国产啪在线| 一级毛片免费播放视频| 91国语视频| 黄色网址手机国内免费在线观看| 美女被操黄色视频网站| 亚洲一级色| 天天躁夜夜躁狠狠躁图片| 人妻无码AⅤ中文字| 亚洲人成成无码网WWW| 伊人久热这里只有精品视频99| 91小视频版在线观看www| 欧美综合一区二区三区| 欧美国产综合色视频| 在线观看免费黄色网址| 久草视频中文| 国产精品亚洲一区二区在线观看| av大片在线无码免费| 成年av福利永久免费观看| 欧美成人手机在线观看网址| 欧美日韩高清在线| 九九九精品视频| 成人午夜亚洲影视在线观看| 超碰精品无码一区二区| 亚洲精品视频在线观看视频| 国产99视频精品免费视频7| 色播五月婷婷| 亚洲人免费视频| 日韩东京热无码人妻| 一级毛片不卡片免费观看| 日韩欧美国产成人| 亚洲欧洲自拍拍偷午夜色| 国产亚洲现在一区二区中文| 国产乱码精品一区二区三区中文 | 亚洲成人在线网| 视频一本大道香蕉久在线播放 | 欧美精品xx| 国产精品主播| 精品国产香蕉伊思人在线| 亚洲国产日韩在线成人蜜芽| 亚洲国产成熟视频在线多多| 国产91成人| 激情乱人伦| 久久久国产精品无码专区| 久久永久免费人妻精品| 天堂在线视频精品| 欧美午夜精品| 欧美不卡视频一区发布| 国产精品区视频中文字幕| 久久精品人妻中文系列| 久久青草视频| 国产精品不卡片视频免费观看| 亚洲福利片无码最新在线播放| 亚洲精品第一在线观看视频| 欧美高清三区| 亚洲欧美极品| 久久特级毛片| 亚洲性视频网站| 97国产成人无码精品久久久| 欧美一区二区三区欧美日韩亚洲| 在线亚洲小视频| 欧美日韩免费在线视频| 5555国产在线观看| 97成人在线观看| 免费一级大毛片a一观看不卡| 国产亚洲欧美另类一区二区| 一级毛片免费观看不卡视频| 五月激情婷婷综合| 玖玖精品视频在线观看| 久久九九热视频| 久久婷婷色综合老司机| 精品自拍视频在线观看| 在线看免费无码av天堂的| 特级aaaaaaaaa毛片免费视频| 日韩av在线直播| 日本不卡在线| 欧美成人一区午夜福利在线| 亚洲成网777777国产精品|