王爾申,宋遠上,佟剛,王傳云,曲萍萍,徐嵩
(1.沈陽航空航天大學 電子信息工程學院,沈陽 110136;2.沈陽航空航天大學 遼寧通用航空研究院,沈陽 110136;3.沈陽航空航天大學 人工智能學院,沈陽 110136)
通用航空產業是中國經濟新常態下重要的經濟增長點[1]。隨著中國低空空域的逐步開放,低空空域中通航飛行器數量的增加,增大了彼此發生飛行沖突的可能性。低空空域原則上是指真高(地高度)1 000 m(含)以下空域[2]。為保障通航飛行器在低空空域的飛行安全,對飛行沖突探測技術開展深入研究是有必要的。飛行沖突探測與解脫是研究飛行器在未來一段時間內是否發生潛在沖突并對此潛在沖突建議規避碰撞飛行軌跡的過程,而準確的沖突探測是規避碰撞的前提。
受到復雜而多變的地形、建筑物及氣象條件等多種因素的影響,在低空空域內,多飛行器的飛行呈現復雜的相互制約性使得產生飛行沖突的概率增加,傳統的航路航線沖突探測算法在特定低空空域內存在局限性[3]。空中飛行器的飛行速度較快,因此要求飛行沖突探測過程在短時間內完成,并保證穩定性和可靠性。
飛行沖突探測主要分為幾何法與概率法[4]。文獻[5]將沖突的概率轉化為對應于某一時刻的沖突區域與聯合航跡誤差的交叉體積的積分,但沒有確定沖突類型。文獻[6]對沖突類型進行了數學描述,給出了確定沖突類型的方法。但是,受到天氣、環境、人為操作的誤差等因素的影響,飛行器之間不是嚴格的幾何關系,計算結果有較大誤差。概率型沖突探測方法考慮飛行數據的誤差,具有容錯性優點[7]。概率法主要使用概率流理論、馬爾可夫鏈、博弈論、復雜網絡等方法[8-10],該類方法的準確度依賴于閾值與參數的選擇,較為復雜。運用幾何法研制的第二代交通防撞系統(TCASⅡ)能對裝有該系統的飛機發送警告,不適用于未加裝該系統的通航飛行器。廣播式自動相關監視廣播(ADS-B)技術為空中交通管理能力提升提供服務[11],利用ADS-B信息,文獻[12]研究采用粒子群與支持向量機(SVM)算法得到飛行沖突概率模型,但計算復雜。
結合航跡預測,基于4D航跡的飛行器飛行動力模型可預測飛行器的位置[13],從而判斷飛行器之間是否存在飛行沖突。但由于通航飛行器飛行具有較強的機動性,該方法不適用于通航飛行器。利用意圖信息來推測航跡的沖突段[14]。通過飛行器的時空棱柱計算飛行器的沖突情況,但該方法適用于飛行員與管制員之間的提前協調。
為解決以上沖突探測模型不能適用于形狀各異及參數多樣化的通航飛行器的問題,保障通航飛行器在低空空域內的安全飛行,本文采用考慮到飛行器形狀的保護區模型作為沖突區域。為減少沖突探測模型中的復雜度,采用改進后的ID3決策樹算法與隨機森林(RF)減少分類器的復雜度,為解決該沖突探測模型中的sigmoid函數存在的容易飽和的問題,采用適應度更好、更敏感的tanh函數進行概率映射。
離群點是指在導航設備接收到的數據中,不符合數據一般特性或者運動模型的數據。用DBSCAN(density-based spatial clustering of applications with noise)高分辨率的聚類算法,去除飛行數據中的離群點。
設第i個飛行器的航跡集Qi=(V1,V2,…,Vm)表示m個航跡點的集合,其中Vk={xlat,xlon,xalt,xv,xr}表示第k個航跡點的具體信息,依次包括經度、緯度、高度、速度與航向信息。將聚類處理后的數據歸一化處理,設2個飛行器在t時刻的位置信息分別為Va={xlat1,xlon1,xalt1,xv1,xr1}與Vb={xlat2,xlon2,xalt2,xv2,xr2},利用位置信息得到2個飛行器的相對距離d,水平方向上的相對速率Δv=xv1-xv2,依據飛行數據中的航向角,計算出垂直方向上的相對速度Δvt,飛行器的相對航向角Δr=xr1-xr2,其中航向角以正北為0°,正東為90°,將樣本空間的特征量設為(Δr,d,Δv,Δvt,t)。
由于存在系統誤差及無法消除誤差的情況,飛行器的探測容易受到外界因素的干擾。故采用以飛行器為中心建立橢球體保護區。目標飛行器為有保護區的飛行器。
橢球體的保護區用公式可以表示為

式中:(x1,y1,z1)表示飛行沖突的飛行器坐標;(xo,yo,zo)為橢圓中心飛行器的位置;n、m、k分別表示x、y、z三個半軸的焦距。
依據《民用航空空中交通管理規則》[15],為簡化飛行器的保護區模型,設置橢球體的長焦距(水平焦距)為n1=m1=1 000 m,短焦距(垂直焦距)為k1=150 m。保護區模型如圖1所示。

圖1 保護區模型Fig.1 Protection zone model
SVM是按監督學習方式對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面。核函數將飛行數據映射到高維空間中進行分類。
常見的核函數有二次核函數、多項式核函數、徑向基核函數(radial basis function,RBF)和多層感知機核函數。在同樣的樣本情況下,飛行數據的特征維度較低、樣本中的標簽較少、樣本數量較多的情況下,高斯徑向基核函數的分類效果較好,分類界限更準確,因此高斯徑向基核函數的擬合度較好。故在此分類中,采用RBF。RBF函數作核函數,表達式為

式中:σ決定數據映射到新的特征空間分布,σ越大,支持向量越少,σ值越小,支持向量越多。
假設飛行器的位置、速度、航向角等數據構成的集合A={D1,D2,…,Dn}沒有被一個超平面錯誤分開,求解廣義最優分類超平面轉化為

式中:w為權重向量;b為偏置量;αj為松弛變量;Dj為輸入;C為懲戒因子,調節優化方向中2個指標(間隔大小和分類準確度)偏好的權重;針對錯誤分類的樣本,Uj為訓練樣本,j為訓練樣本的個數,使用懲戒因子進行懲罰。
使用決策函數h(x)獲得標準的硬輸出。

支持向量的個數影響訓練與預測速度,為選擇最優的σ與C,采用GA-PSO優化方法[16]。在GA-PSO方法中,利用遺傳算法(GA)機理對粒子進行變異,增大粒子群優化(PSO)算法中粒子的不確定度,從而增強全局搜索能力。
通過決策函數,比較h(x)值與0的大小,用輸出值的大小判斷風險的等級,常用sigmoid函數把SVM將分類結果輸出映射到[0,1]區間,帶有優化的sigmoid函數表達式為

由于sigmoid函數容易飽和,采用tanh函數優化概率輸出,tanh是機器學習中的激活函數,輸出區間為[-1,-1]。在數學中,tanh為雙曲正切,表達式為

式中:x為SVM 的輸出結果;a2、b2為優化參數,利用最小化訓練數據與極大似然函數可以求得優化參數;tanh x為輸出概率優化表達式。
圖2為sigmoid和tanh函數比較結果。由圖2的結果可知,sigmoid在輸入處于[-6,6]之間時,函數值變化敏感,一旦接近或者超出區間就失去敏感性,處于飽和狀態,影響神經網絡預測精度。tanh的輸出和輸入能夠保持非線性單調上升和下降關系,容錯性好,有界,漸近于0和1,符合飛行沖突探測中沖突概率變化規律。但由于tanh函數輸出區間為[-1,1],由于飛行沖突概率不存在負概率,采用輸出區間[0,1]的部分。

圖2 sigmoid與tanh函數的比較Fig.2 Comparison of sigmoid and tanh function
由于RBF函數在將飛行數據映射到高維度的空間和分類的過程中存在計算量大的問題,在大量的飛行航跡數據中,預先找到最有可能產生沖突的飛行航跡,可有效降低RBF函數分類過程中及飛行沖突探測過程中的復雜度。
決策樹是一種將樣本的搜索空間分為若干個子集再進行搜索的方法,具體如下:
設樣本數據集為X,類別數為n,設第i個數據樣本為Ti,X中總樣本為,則樣本屬于第i類的概率為

式中:Ci表示類別。
對決策樹劃分Ti的信息熵為

若選擇屬性a3進行測試,其信息熵為

則屬性a對于分類提供的信息量為

式中:I(X,a)表示屬性作為分類屬性后信息熵下降的程度,即信息增益。選擇使得I(X,a)最大的屬性作為分類屬性,得到決策樹的確定性最大。
改進的ID3決策樹算法具體步驟如下:
步驟1數據的歸一化處理、伸縮性處理。將訓練集的樣本數據分為若干個子集合,每個單獨的子集組成新的決策樹。
步驟2選出具有全部樣本X的、規律為W的子集X1(W稱為窗口規模,X1稱為窗口)。
步驟3當I(X,a)=H(X)-H(X|a)最大時,選取每次測試的屬性,形成當前窗口的決策樹。
步驟4將每個子集得到的分類規則組合,得到一個分類規則。
步驟5順序掃描子集類內的所有樣本數據,如果存在不符合當前分類規則的樣本,則進行步驟4,如果不存在,則算法結束。
改進后的分類方法具有全局性良好、抗噪聲性強、易于選取訓練集等特點。
在SVM 算法中,當訓練集較大時,訓練所需的時間及空間復雜度分別為O(n2)與O(n3),n為訓練集的數量,因此,需要準確取訓練集。RF是一種為分類器設計的組合方法,采用RF為SVM算法提供訓練集的組合。
改進后的探測模型在飛行前封裝成固定的模塊,將需要預測沖突的飛行器參數特征量作為輸入,獲得相應的沖突判斷與沖突概率輸出。為提高分類結果的準確率,對該模型產生虛報、誤報的測試集與訓練集進行剔除,提高該探測模型的準確度。改進模型的具體步驟如下:
步驟1對第i個飛行器的m個航跡歸一化處理后,使用DBSCAN算法去除離群點,得到預處理后的航跡集合。
步驟2將預處理后飛行器之間4個特征量D=(d,Δv,Δr,t),利用RF選取適合的組合作為訓練集合訓練SVM分類器。
步驟3將預處理后的樣本X,利用改進ID3決策樹算法選擇具有飛行沖突的飛行器集合Vm=(Va,Vb,…,Vx)。
步驟4重復步驟3,直到沒有新的元素出現在集合Vm中。
步驟5將具有飛行沖突飛行器的集合Vm加入已經訓練的SVM分類器,得到分類輸出集合Wm=(y1,y2,…,ym)。
步驟6將步驟5得到的集合Wm用tanh函數映射到[0,1],得到飛行沖突概率。
步驟7將得到的結果,去除產生虛報和誤報的數據,組成特征量訓練集,訓練SVM分類器。
為了驗證本文算法的性能,以遼寧通用航空研究院研制的RX1E型號飛行器為例,其翼展較長,翼展的長度不能忽略,不能將其看作質心。銳翔RX1E通航飛行器參數如表1所示。

表1 銳翔RX1E通航飛行器參數Table 1 Par ameters of RX1E general aircraft
為保證飛行人員安全,在飛行器實際飛行數據中沒有具有沖突的情況,故采用模擬雙機飛行的方法驗證,即一個飛行器為實際飛行器,設置一個與實際飛行器存在或不存在飛行沖突的仿真飛行器,從而實現模擬雙機飛行,記錄模擬雙機飛行的飛行數據。根據飛行航跡與保護區模型判斷飛行器在速度、高度、水平方向上是否存在飛行沖突,從而獲得類別標簽,同時獲得σ與C、a與b的值。實際飛行器的數據為銳翔RX1E飛行器于2019年11月14日在沈陽法庫財湖機場飛行數據。根據飛行航跡與保護區模型,對飛行器在速度、高度、水平方向上是否存在飛行沖突進行驗證。
在飛行數據中設置水平方向上的飛行沖突,即航線沖突。探測2個飛行器在0~100 s之間的距離與飛行沖突概率的變化情況,樣本容量為100個,時間步長為t=1 s,相對航向角≤90°,為交叉航向角,將研究的改進模型與SVM算法進行對比,2個飛行器的距離與飛行沖突概率如圖3所示。為分析tanh函數與sigmoid函數在飛行沖突探測過程對分類結果的映射效果,將水平方向上的飛行沖突分類結果用sigmoid函數和tanh函數進行映射,sigmoid函數和tanh函數的比較如圖3所示。

圖3 水平沖突概率變化值曲線與映射函數曲線Fig.3 Horizontal conflict probability curve and mapping function curve
由于sigmoid函數對一定的輸入范圍敏感,使得在0~25 s與95~100 s的較低概率區間與62~73 s的較高概率區間的輸出趨于飽和。tanh函數具有更敏感的輸入空間,使得在高概率輸出區間與低概率輸出空間都具有靈敏性,經過優化的tanh函數曲線結果更加準確。
由圖3可知,改進后的探測模型給出的飛行沖突概率曲線與飛行器間的距離變化一致。在21~23 s與45~47 s內,飛行器之間處于距離持續減小階段,改進后的探測模型在該階段給出的沖突概率具有更好的穩定性。與SVM 算法不同的是,改進后的探測模型給出的沖突概率不受在t=26 s時刻出現的異常點的干擾。在t=61 s時刻,兩飛行器的距離處于最低點,改進后的探測模型在t=62 s時給出了最高的沖突風險概率,而SVM算法在t=63 s時達到最高的沖突風險概率。
樣本容量為100個,時間步長t=1 s。由圖4可知,改進后的探測模型給出的飛行沖突概率曲線與飛行器之間的距離變化一致,在108~118 s與140 s~159 s內,改進后的探測模型得到的飛行沖突概率變化曲線更穩定。在t=159 s時刻,飛行器之間相距最近,改進后的探測模型給出的沖突概率也在t=159 s時刻達到最大,而SVM算法在t=160 s時刻給出最大沖突概率,該探測模型的性能更好。

圖4 高度沖突概率結果Fig.4 Vertical conflict probability results
在同一高度,以具有沖突的同向運動的兩飛行器作為研究對象,其中一個飛行器勻速運動,另一個飛行器非勻速運動。探測2個飛行器在0~100 s之間的相對速率與飛行沖突概率的變化情況。樣本容量為100個,設置時間步長為t=1 s。仿真結果如圖5所示,在0~42 s內,2個飛行器之間的相對速率減小階段,改進后的探測模型在該階段的沖突概率穩定減少,具有更好的穩定性。在42~93 s內,2個飛行器之間處于相對速率增加階段,改進后的探測模型在該階段給出的沖突概率處于穩定增加,具有更好的穩定性。與SVM算法不同,改進后的探測模型給出的沖突概率未受到t=23 s時刻出現的異常點的干擾,在t=42 s時刻給出了最低的沖突風險概率,而SVM算法在t=44 s時刻達到最高的沖突風險概率。

圖5 水平方向上相對速度沖突的概率變化曲線Fig.5 Probability curves of horizontal velocity conflict
在不同的高度以具有沖突的同向運動的2個飛行器作為研究對象,一個飛行器勻速運動,另一個飛行器非勻速運動,探測2個飛行器在0~100 s的垂直相對速度與飛行沖突概率的情況。樣本容量為100個,時間步長為t=1 s,結果如圖6所示。
由圖6看出,在0~4 s內,SVM 算法給出的沖突概率是先增加后減少,改進后的探測模型在該階段給出的沖突概率處于穩定增加,具有更好的穩定性。在22~38 s內,SVM算法給出的沖突概率是帶有波動的增加,改進后的探測模型在該階段給出的沖突概率處于穩定增加,具有更好的穩定性。

圖6 垂直方向上相對速度沖突的概率變化曲線Fig.6 Probability curves of vertical velocity conflict
為獲取訓練樣本,模擬300次雙機飛行,記錄飛行器飛行特征量,作為SVM 的訓練集,并根據飛機航跡與保護區模型判斷是否存在飛行沖突。每個飛行器的每個屬性的樣本容量為1 000個,將具有飛行沖突的飛行器作為研究對象,利用飛行器的飛行數據來驗證算法的準確度與復雜度,其中算法時間、誤報率與虛報率取300次模擬運行結果的平均值,結果如表2所示。
由表2可以看出,在相同條件下,相較于其他2種方法,改進后的探測模型降低了飛行沖突探測誤報率與虛報率,所運行的時間分別減少了0.21 s與0.49 s。

表2 三種探測方法的準確率比較Table 2 Comparison of accuracy among three detection methods
本文中提出了一種基于SVM 的飛行沖突探測改進模型。主要有以下改進:
1)采用橢球體保護區,降低了數據的誤差對沖突過程中的干擾,采用DBSCAN聚類算法、優化訓練集的方法減小了SVM算法的誤差。
2)利用RF、決策樹、降低數據維度的方法,減小了SVM算法的復雜度。
3)相較于SVM 算法,改進后的模型的誤報率與虛報率較低,算法運行時間較少,而且具有較好的抗干擾能力和穩定性。