











摘 要:針對(duì)現(xiàn)有航跡分類方法無(wú)法充分考慮航跡的時(shí)間序列特征與空間結(jié)構(gòu)特征,導(dǎo)致分類準(zhǔn)確率下降的問(wèn)題,提出了一種基于深度學(xué)習(xí)網(wǎng)絡(luò)的航跡分層分類方法。首先,將船舶航跡轉(zhuǎn)化成圖像層,構(gòu)建基于Swin-Transformer網(wǎng)絡(luò)的航跡圖像層分類模型;其次對(duì)于航跡序列層,基于多維信息的航跡壓縮算法優(yōu)化航跡序列的輸入,并構(gòu)建基于Gained-Transformer-Network深度學(xué)習(xí)網(wǎng)絡(luò)的航跡序列層分類模型。最后,建立基于置信度的融合層航跡分類模型,提高航跡分層分類的準(zhǔn)確率。經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,平均分類準(zhǔn)確率為90%,集成分類器的分類性能相較于其他單分類器平均提高了11%,平均F1分?jǐn)?shù)為0.82。上述結(jié)果表明,本文提出的集成分類器對(duì)船舶航跡具有較好的分類效果。
關(guān)鍵詞:航跡分類;深度學(xué)習(xí);Swin-Transformer;Gained-Transformer-Network;分層分類
中圖分類號(hào):TP317.4 文獻(xiàn)標(biāo)志碼:A DOI:10.3969/j.issn.1673-3819.2025.02.010
Research on trajectory hierarchical classification based on
deep learning networks
WANG Yifan, JI Linna, YANG Fengbao
(North University of China,Taiyuan 030000, China)
Abstract:In response to the issue that existing trajectory classification methods fail to fully consider the time series features and spatial structure features of trajectories, leading to a decline in classification accuracy, this paper proposes a trajectory hierarchical classification method based on deep learning networks. First, ship trajectories are transformed into image layers, and a trajectory image layer classification model based on the Swin-Transformer network is constructed. Next, for the trajectory sequence layer, a multi-dimensional information-based trajectory compression algorithm is utilized to optimize the input of trajectory sequences, and a trajectory sequence layer classification model based on the Gained-Transformer-Network deep learning network is developed. At last, a confidence-based fusion layer trajectory classification model is established to improve the accuracy of layered trajectory classification. Experimental validation shows an average classification accuracy of 90%, with the performance of the ensemble classifier improving by an average of 11% compared to other single classifiers, and an average F1 score of 0.82. The results indicate that the newly proposed method and the new ensemble classifier demonstrate good classification effectiveness for ship trajectories.
Key words:trajectory classification; deep learning network; swin-transformer; gained-transformer-network;hierarchical classification
作為重點(diǎn)目標(biāo)跟蹤和海域態(tài)勢(shì)感知的重要部分,航跡分類識(shí)別的研究受到了廣泛的關(guān)注。航跡分類是一個(gè)重要的研究領(lǐng)域。航跡分類有助于提高海域船舶監(jiān)管,能分析船舶是否存在異常可疑行為,分析歷史航跡能夠揭示船舶的行為模式,幫助預(yù)測(cè)未來(lái)行為,從而提升整體態(tài)勢(shì)感知和預(yù)警能力。航跡分類可以進(jìn)一步分析識(shí)別船舶行為,加強(qiáng)對(duì)船舶的監(jiān)控[1]。此外,船舶的歷史航跡信息包含豐富的船舶活動(dòng)信息,海上目標(biāo)航跡分類可以加大海域環(huán)境的感知能力,提高重點(diǎn)目標(biāo)的識(shí)別、跟蹤精度,分析目標(biāo)的行為意圖,提高戰(zhàn)場(chǎng)的態(tài)勢(shì)估計(jì),提高海域的航行安全。
目前,國(guó)內(nèi)外船舶軌跡分類方法的具體應(yīng)用場(chǎng)景主要包括船舶類型的識(shí)別和船舶運(yùn)動(dòng)模式的分類,實(shí)現(xiàn)過(guò)程分為船舶軌跡數(shù)據(jù)清洗預(yù)處理[2]、船舶航跡特征提取[3-5]和航跡分類模型建模[6-7]三個(gè)部分。航跡信息量大,地理范圍廣,豐富的信息量同時(shí)帶來(lái)了很大的冗雜,給船舶分類識(shí)別帶來(lái)了挑戰(zhàn)。航跡分類的方法主要包括:(1)機(jī)器學(xué)習(xí)的方法。Chen[8]基于稀疏表示分類算法對(duì)AIS船舶軌跡分類, 改進(jìn)基于Lp-norm 稀疏表示的傳統(tǒng)分類模型對(duì)船舶運(yùn)動(dòng)模式進(jìn)行分類,實(shí)現(xiàn)了對(duì)內(nèi)河航道中的船舶運(yùn)動(dòng)模式進(jìn)行分類。Tang[9]基于OPTICS尋找有序峰改進(jìn)FOP-OPTICS對(duì)子軌跡段進(jìn)行聚類, 在識(shí)別船舶軌跡的整體和局部特征上有明顯的優(yōu)勢(shì)。(2)人工提取特征和機(jī)器學(xué)習(xí)方法相結(jié)合的分類方法。Wang[10]提出一種基于寬度學(xué)習(xí)系統(tǒng)(BLS)的內(nèi)河航道船舶軌跡分類算法,利用分段三次Hermite插值法從等時(shí)距或等間距兩種角度提取特征點(diǎn)以構(gòu)造軌跡特征矩陣,將其代入訓(xùn)練好的BLS實(shí)現(xiàn)船舶軌跡的自動(dòng)分類。Xu[11]利用隨機(jī)森林算法,通過(guò)提取船舶軌跡的空間地理特征和目標(biāo)運(yùn)動(dòng)特征對(duì)船舶類型進(jìn)行分類。(3)深度學(xué)習(xí)網(wǎng)絡(luò)分類方法:主要包括基于船舶航跡圖以及海域環(huán)境圖分類網(wǎng)絡(luò)、基于船舶軌跡的時(shí)序特性與神經(jīng)網(wǎng)絡(luò)相結(jié)合來(lái)實(shí)現(xiàn)分類。Chen[12]提出了一種新的CNN-SMMC架構(gòu)對(duì)船舶進(jìn)行分類。有學(xué)者結(jié)合長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)建立了以速度、加速度、航向和曲率為特征的混合分類模型,采用CNN提取軌跡數(shù)據(jù)的空間特征、LSTM提取軌跡數(shù)據(jù)的時(shí)間特征[13-16]。Duan[17]提出了一種半監(jiān)督深度學(xué)習(xí)方法,以整合未標(biāo)記數(shù)據(jù)的知識(shí)進(jìn)行船舶軌跡分類。GUO[18]等船舶軌跡經(jīng)緯度數(shù)據(jù)轉(zhuǎn)換為船舶軌跡圖像數(shù)據(jù),使用ResNet殘差網(wǎng)絡(luò)構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)船舶軌跡分類模型。
但目前大多數(shù)研究集中在固定海域的船舶運(yùn)動(dòng)狀態(tài),而針對(duì)具有空間差異以及運(yùn)動(dòng)特征差異的航跡分類的研究較少。此外,軌跡分類研究主要將軌跡轉(zhuǎn)換為圖像用于分類,然后運(yùn)行機(jī)器學(xué)習(xí)進(jìn)行建模以判斷新的軌跡。然而,該方法沒(méi)有考慮航跡數(shù)據(jù)序列的變化特性,導(dǎo)致航跡數(shù)據(jù)的利用和分析不足。
針對(duì)上述問(wèn)題,本文提出了基于深度學(xué)習(xí)網(wǎng)絡(luò)的航跡分層分類方法,對(duì)船舶航跡所屬的船舶類別進(jìn)行分類。首先,將經(jīng)緯度坐標(biāo)按尺度映射到圖像像素坐標(biāo)上,提取船舶航跡數(shù)據(jù)的空間特征,建立船舶航跡圖像數(shù)據(jù)集。其次,建立了基于深度學(xué)習(xí)的船舶航跡分類模型,使用Swin-Transformer模型進(jìn)行訓(xùn)練,利用改進(jìn)的DP(Douglas-Peucker)算法對(duì)航跡數(shù)據(jù)進(jìn)行壓縮處理,以提高模型的訓(xùn)練效果,使用GTN(gained transformer network)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。最后利用改進(jìn)的D-S(Dempster/Shafer)證據(jù)理論對(duì)分類結(jié)果融合處理。主要貢獻(xiàn)為
提出了一種基于深度學(xué)習(xí)網(wǎng)絡(luò)的航跡分層分類模型算法,實(shí)現(xiàn)了對(duì)船舶航跡所屬船舶類別的分類和識(shí)別。
1 基于深度學(xué)習(xí)網(wǎng)絡(luò)的航跡分層分類方法
本研究旨在提出一種基于深度學(xué)習(xí)網(wǎng)絡(luò)的分層分類模型實(shí)現(xiàn)對(duì)大時(shí)空差異的航跡數(shù)據(jù)進(jìn)行分類。為充分研究航跡的時(shí)間序列特征與空間結(jié)構(gòu)特征,本文通過(guò)建立分層分類模型,從多角度的信息入手,提高航跡數(shù)據(jù)分類的準(zhǔn)確性和魯棒性,提升模型的計(jì)算效率。首先,排除AIS航跡異常數(shù)據(jù)點(diǎn),對(duì)AIS航跡數(shù)據(jù)進(jìn)行處理,包括消除重復(fù)點(diǎn)和航跡插值。模型分為三層。(1)圖像層:通過(guò)航跡序列建立航跡的圖像數(shù)據(jù),根據(jù)Swin-Transformer深度學(xué)習(xí)算法,使用swinv2預(yù)訓(xùn)練模型訓(xùn)練好航跡分類模型進(jìn)行分類識(shí)別,有效捕捉航跡的空間結(jié)構(gòu)特征。這種方法使得模型能夠識(shí)別復(fù)雜的模式和細(xì)節(jié);(2)序列層:通過(guò)對(duì)原始的航機(jī)序列數(shù)據(jù)處理,對(duì)于冗雜的航跡序列,利用改進(jìn)的DP算法對(duì)航跡進(jìn)行壓縮處理,對(duì)GTN網(wǎng)絡(luò)的序列輸入做精細(xì)化處理,利用GTN深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)航跡序列分類識(shí)別,更好地捕捉時(shí)間序列中的動(dòng)態(tài)變化和趨勢(shì),減少冗余信息對(duì)分類結(jié)果的干擾;(3)融合層:通過(guò)建立基于置信度理論的融合層融合多分類的結(jié)果,有助于綜合不同特征的優(yōu)勢(shì),提升最終分類結(jié)果的準(zhǔn)確性和可靠性。擬研究方法框架如圖1所示。
1.1 基于Swin-Transformer航跡圖像層分類
Swin-Transformer是基于Transformer模型的一種圖像分類模型,Transformer主要應(yīng)用在自然語(yǔ)言處理(NLP)領(lǐng)域,主要包括編碼器(encoder)與解碼器(decoder)兩個(gè)部分,每部分由多個(gè)相同的層構(gòu)成。注意力機(jī)制(attention mechanism)作為T(mén)ransformer的核心之一,捕捉輸入序列中不同位置之間的關(guān)系,使得其能夠有效地獲得輸入序列中的長(zhǎng)距離依賴關(guān)系,得到與之對(duì)應(yīng)的輸出。Swin-Transformer與Transformer的結(jié)構(gòu)類似,由分層窗口注意力機(jī)制和階段間連接的Transformer編碼器塊組成,其使用移位窗口(shift window)計(jì)算注意力,移位窗口方法通過(guò)將自注意力計(jì)算限制在不重疊的局部窗口的同時(shí),引入跨窗口連接來(lái)提高計(jì)算效率。 Swin-Transformer 通過(guò)其層次化和窗口化的注意力機(jī)制,能夠有效地處理這種長(zhǎng)距離依賴關(guān)系,提升分類性能。
Swin-Transformer體系如圖2所示[19],圖2(a)為Swin-Transformer的結(jié)構(gòu),它首先將輸入的航跡圖像分割成不重疊的圖像塊,經(jīng)由線性嵌入層將圖像特征投影到任意維度,而后經(jīng)由順序排列的Swin-Transformer塊與塊合并層組成的階段層,為了產(chǎn)生分層表示,隨著網(wǎng)絡(luò)階段的深入,合并層的圖像塊的數(shù)量將會(huì)減少,H為原始圖像的高度,W為原始圖像的寬度,C為自定義的特征表示維度;圖2(b)為兩個(gè)連續(xù)的Swin-Transformer塊,一個(gè)Swin-Transformer模塊由一個(gè)基于移動(dòng)窗口的自我關(guān)注模塊(MSA)組成,緊接著是一個(gè)兩層的多層感知器(MLP),其間帶有GELU非線性。在每個(gè)MSA模塊和每個(gè)MLP之前應(yīng)用LayerNorm(LN)層,并且在每個(gè)塊之后應(yīng)用剩余的連接。Swin-Transformer的模塊化結(jié)構(gòu)和可擴(kuò)展性,使其能夠靈活適應(yīng)不同類型和大小的航跡圖像數(shù)據(jù),連續(xù)的Swin-Transformer塊使用移位窗口的劃分方法,計(jì)算如下:
1.2 基于GTN網(wǎng)絡(luò)的航跡序列層分類
本節(jié)介紹了基于Transformer的深度學(xué)習(xí)方法,用于從軌跡序列數(shù)據(jù)中對(duì)船舶的類別進(jìn)行分類,首先利用基于多維信息的航跡壓縮算法優(yōu)化Transformer網(wǎng)絡(luò)的輸入,其次使用Gained-Transformer Network網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)航跡的分類。
1.2.1 基于多維信息的航跡壓縮算法
AIS航跡數(shù)據(jù)冗雜,航跡序列樣本長(zhǎng)度不一致,為了優(yōu)化GTN網(wǎng)絡(luò)的輸入,本文使用改進(jìn)的DP算法對(duì)航跡進(jìn)行壓縮處理,傳統(tǒng)的DP算法只考慮了航跡點(diǎn)與起終點(diǎn)連線的距離[20-21],而忽略了航跡數(shù)據(jù)中的其他維度信息,本節(jié)將速度、航向角差值加入航跡壓縮的閾值維度,并設(shè)置壓縮比例優(yōu)化航跡序列數(shù)據(jù),壓縮前后的航跡點(diǎn)數(shù)量比為N∶n,改進(jìn)的DP算法結(jié)構(gòu)如圖3所示,各閾值參數(shù)設(shè)置如表1所示。
DP壓縮算法如圖3所示,壓縮前航跡如圖4(a)所示,航跡點(diǎn)個(gè)數(shù)為36 082個(gè),壓縮后航跡圖如圖4(b)(c)(d)所示,航跡點(diǎn)個(gè)數(shù)分別為1 697個(gè)、2 702個(gè)、3 685個(gè),壓縮比例分別為21∶1、13∶1、9.7∶1。
由圖4可以看出,改進(jìn)的DP算法可以有效地將航跡點(diǎn)個(gè)數(shù)壓縮至預(yù)計(jì)的航跡點(diǎn)個(gè)數(shù),且保留原始航跡特征,進(jìn)一步優(yōu)化了后續(xù)深度學(xué)習(xí)網(wǎng)絡(luò)的輸入。
1.2.2 基于Gated-Transformer-Network的航跡分類網(wǎng)絡(luò)結(jié)構(gòu)
GTN(Gated-Transformer-Network)是基于Transformer的多維時(shí)間序列分類網(wǎng)絡(luò),GTN網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示[22], 航跡序列往往涉及時(shí)間和空間上的復(fù)雜關(guān)系。GTN 使用注意力機(jī)制和Transformer的自注意力機(jī)制,能夠有效地捕捉到序列中長(zhǎng)距離的依賴關(guān)系,不受序列長(zhǎng)度限制,從而更好地建模航跡序列中的時(shí)空動(dòng)態(tài)特征。GTN網(wǎng)絡(luò)可以更好地捕捉航跡序列信息多個(gè)維度的通道特征。航跡序列可能包含不同尺度和時(shí)間尺度上的特征。GTN 可以通過(guò)多頭注意力機(jī)制和層次化表示學(xué)習(xí),有效地整合和利用不同尺度的特征信息,提升分類準(zhǔn)確性。
GTN網(wǎng)絡(luò)建立了雙塔Transformer結(jié)構(gòu),其中每個(gè)塔中的編碼器通過(guò)注意和掩碼捕獲時(shí)間和空間的相關(guān)性,與原始Transformer不同的是,GTN對(duì)于連續(xù)的時(shí)間序列數(shù)據(jù),通過(guò)加入了一個(gè)非線性激活tanh代替線性投影將嵌入層改為全連接層。通過(guò)加入門(mén)控單元,在獲得每個(gè)塔的輸出后,通過(guò)級(jí)聯(lián)將它們合并為向量,然后進(jìn)行線性投影,得到h。如公式(3) 所示,在Softmax函數(shù)之后,門(mén)控權(quán)重計(jì)算為g1和g2。然后,每個(gè)權(quán)重對(duì)應(yīng)相應(yīng)塔的輸出,合并后為最終特征向量。
1.3 基于置信度的航跡融合層分類
D-S證據(jù)理論融合用于處理不確定性和不完全信息的推理方法,航跡的圖像層與序列層屬于不同的維度,不同層自身存在不確定性,通過(guò)對(duì)不同層分配基本的概率分配函數(shù)BMA,綜合考慮它們之間的沖突程度,可以得到對(duì)航跡類別的綜合信任程度,從而提高航跡分類的準(zhǔn)確性。
確定度通過(guò)一定的規(guī)則對(duì)證據(jù)體本身特性進(jìn)行量化,反映了概率分配函數(shù)的聚集程度以及證據(jù)體對(duì)于自身BPA的分配認(rèn)可度。確定度越高,聚集程度和分配認(rèn)可度也越高。證據(jù)體Ei的自身確定度ci能夠按照以下公式計(jì)算得到:
2 實(shí)驗(yàn)結(jié)果與分析
在本章,依據(jù)AIS航跡數(shù)據(jù)集做了基于Swin-Transformer的航跡圖像數(shù)據(jù)分類與基于改進(jìn)Transformer網(wǎng)絡(luò)的航跡序列數(shù)據(jù)分類實(shí)驗(yàn)研究,并對(duì)結(jié)果進(jìn)行F1得分分析,驗(yàn)證分類模型的效果。
2.1 數(shù)據(jù)集
本文的數(shù)據(jù)集源于“金海豚”杯競(jìng)賽發(fā)布于《雷達(dá)學(xué)報(bào)》的航跡分類科目專用數(shù)據(jù)集[23],該數(shù)據(jù)集由全球開(kāi)源AIS數(shù)據(jù)整理制備得到,該數(shù)據(jù)集包含兩大類航跡數(shù)據(jù),兩大類細(xì)分為14小類數(shù)據(jù)集,兩大類標(biāo)簽為0和1,其中細(xì)分14類標(biāo)簽為0~13,每條航跡包含數(shù)量不等的航跡點(diǎn),航跡點(diǎn)包括時(shí)間戳、經(jīng)度、緯度、速度、航向角信息。
本文選取該訓(xùn)練數(shù)據(jù)集的5類數(shù)據(jù)進(jìn)行研究,二分類標(biāo)簽以及細(xì)分類標(biāo)簽如表2所示,在對(duì)原始航跡進(jìn)行航跡預(yù)處理后,首先對(duì)時(shí)域跨度大的樣本進(jìn)行航跡分割,其次為不影響航跡的時(shí)域空間結(jié)構(gòu),使用改進(jìn)的DP算法對(duì)預(yù)處理后的航跡按不同壓縮比例進(jìn)行壓縮,以此優(yōu)化數(shù)據(jù)樣本。
2.2 實(shí)驗(yàn)平臺(tái)
本實(shí)驗(yàn)使用的平臺(tái)硬件規(guī)格為CPU為Intel Xeon W-2245@3.9 GHz, 內(nèi)存為32 GB,GPU為RTXA2000,網(wǎng)絡(luò)模型搭建以及訓(xùn)練采用深度學(xué)習(xí)平臺(tái)Pytorch 1.8.0、Keras 2.11.0、timm 0.4.12以及opencv-python 4.4.0.46。
2.3 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
本文使用F1得分作為本次實(shí)驗(yàn)的評(píng)價(jià)指標(biāo),F(xiàn)1分?jǐn)?shù)(F1 Score)是統(tǒng)計(jì)學(xué)中用來(lái)衡量分類模型精確度的一種指標(biāo),同時(shí)兼顧了分類模型的準(zhǔn)確率和召回率。其中,將樣本總量具體分為T(mén)P(真正,true positive)表示預(yù)測(cè)為正的正例;FP(假正,1 positive)表示預(yù)測(cè)為正的負(fù)例;TN(真負(fù),true negative)表示預(yù)測(cè)為負(fù)的正例;FN(假負(fù),1 negative)表示預(yù)測(cè)為負(fù)的負(fù)例。F1得分是精確率(precision)和召回率(recall)的調(diào)和平均數(shù)。
2.4 基于Swin-Transformer網(wǎng)絡(luò)的圖像層航跡數(shù)據(jù)分類實(shí)驗(yàn)
本節(jié)使用Swin-Transformer網(wǎng)絡(luò)對(duì)航跡的圖像數(shù)據(jù)進(jìn)行分類,采用前文所述訓(xùn)練數(shù)據(jù)集中的5類航跡數(shù)據(jù)進(jìn)行分類,并對(duì)結(jié)果進(jìn)行分析。
2.4.1 航跡數(shù)據(jù)預(yù)處理
基于航跡圖像數(shù)據(jù)對(duì)航跡進(jìn)行分類,由于使用的航跡信息不屬于同一片區(qū)域,經(jīng)緯度差異較大,為避免背景海島圖像信息對(duì)航跡分類訓(xùn)練的影響,本文基于航跡信息的經(jīng)緯度最值,使用墨卡托(Mercator)投影計(jì)算經(jīng)緯度在平面坐標(biāo)的投影點(diǎn)坐標(biāo),公式(12)介紹了將經(jīng)緯度點(diǎn)轉(zhuǎn)換為平面坐標(biāo)點(diǎn)的計(jì)算公式,其中,lon為該點(diǎn)的經(jīng)度信息,lan為該點(diǎn)的緯度信息。制作圖像數(shù)據(jù)集時(shí)舍去原圖像背景的海島信息,僅保留航跡點(diǎn)線圖。每張船舶軌跡圖像的分辨率為224*224。
航跡圖像數(shù)據(jù)集總量為989張,其中訓(xùn)練集、驗(yàn)證集、測(cè)試集各占0.8、0.1、0.1。
2.4.2 航跡數(shù)據(jù)分類實(shí)驗(yàn)
本實(shí)驗(yàn)將航跡劃分為五個(gè)類別,基于Swin-Transformer網(wǎng)絡(luò),模型的輸入圖層尺寸參數(shù)設(shè)置為224*224*3,將小型批處理大小設(shè)置為 64,并將輸出圖層類別分別設(shè)置為5。使用swinv2-tiny預(yù)訓(xùn)練模型,epoch設(shè)置為300,最大學(xué)習(xí)率為 1.25e-3,最小學(xué)習(xí)率為 1.25e-5。訓(xùn)練集LOSS收斂曲線如圖6(a)所示,測(cè)試集LOSS收斂曲線如圖6(b)所示。準(zhǔn)確率收斂曲線如圖7(a)所示,最大準(zhǔn)確率收斂曲線如圖7(b)所示。
本文進(jìn)行了收斂測(cè)試,以找到一個(gè)良好的基線學(xué)習(xí)率來(lái)訓(xùn)練圖像層航跡數(shù)據(jù)分類的模型。圖顯示了使用預(yù)先訓(xùn)練的swin-v2權(quán)重的模型在不同學(xué)習(xí)率下的200個(gè)訓(xùn)練周期的結(jié)果。在這個(gè)實(shí)驗(yàn)中,本文使用了一個(gè)恒定的學(xué)習(xí)速率計(jì)劃。在5e-3和1e-2的學(xué)習(xí)速率下,Swin-Transformer很快都達(dá)到了80%以上的驗(yàn)證準(zhǔn)確度,收斂率在 0.75左右,最終驗(yàn)證集準(zhǔn)確率穩(wěn)定在87%。
實(shí)驗(yàn)數(shù)據(jù)選取與測(cè)試使用數(shù)據(jù)集相同的五類航跡信息。為驗(yàn)證模型的有效性,本文設(shè)置3組實(shí)驗(yàn),每組在5類數(shù)據(jù)中各隨機(jī)選取50條航跡數(shù)據(jù)作為本次實(shí)驗(yàn)的數(shù)據(jù)集。圖像層航跡分類準(zhǔn)確率如表3所示,每類的F1得分及均值如表4所示,從圖8中可以看出,基于圖像層航跡數(shù)據(jù)分類的F1得分總均值為0.649 2,在驗(yàn)證集87%的準(zhǔn)確率下達(dá)到了F1得分良好的效果,驗(yàn)證了基于Swin-Transformer網(wǎng)絡(luò)的圖像層航跡數(shù)據(jù)分類的有效性。
2.5 基于Transformer網(wǎng)絡(luò)的序列層航跡數(shù)據(jù)分類實(shí)驗(yàn)
本節(jié)使用Transformer網(wǎng)絡(luò)對(duì)航跡的序列數(shù)據(jù)進(jìn)行分類,實(shí)驗(yàn)數(shù)據(jù)選取訓(xùn)練數(shù)據(jù)集中的五類航跡信息,并對(duì)結(jié)果進(jìn)行分析。
2.5.1 航跡數(shù)據(jù)預(yù)處理
航跡序列數(shù)據(jù)訓(xùn)練保留航跡數(shù)據(jù)中全部維度信息,由于數(shù)據(jù)集中航跡序列數(shù)據(jù)的航跡點(diǎn)個(gè)數(shù)不同,相差較大,本文使用改進(jìn)的DP算法將航跡序列的航跡點(diǎn)個(gè)數(shù)壓縮到1 500個(gè),對(duì)于不足1 500個(gè)航跡點(diǎn)的航跡序列,使用三次樣條法對(duì)航跡數(shù)據(jù)進(jìn)行插值,以此優(yōu)化Transformer網(wǎng)絡(luò)的輸入。航跡序列數(shù)據(jù)集中訓(xùn)練集、驗(yàn)證集、測(cè)試集各占0.5、0.3、0.2。
2.5.2 實(shí)驗(yàn)與結(jié)果分析
實(shí)驗(yàn)分為五類,基于Transformer網(wǎng)絡(luò),將小型批處理大小設(shè)置為 4,并將輸出序列類別設(shè)置為5。epoch設(shè)置為100,最大學(xué)習(xí)率為 1.25e-4,最小學(xué)習(xí)率為 1.25e-5。圖9顯示了本次實(shí)驗(yàn)訓(xùn)練Loss收斂曲線,loss收斂于0.53左右。圖10顯示了深度學(xué)習(xí)實(shí)驗(yàn)的結(jié)果,訓(xùn)練集準(zhǔn)確率最高為89.56%,測(cè)試集準(zhǔn)確率最高為80.2%。
圖10顯示了使用預(yù)先訓(xùn)練的模型在不同學(xué)習(xí)率下的100個(gè)訓(xùn)練周期的結(jié)果。在這個(gè)實(shí)驗(yàn)中,我們使用了一個(gè)恒定的學(xué)習(xí)速率計(jì)劃。在5e-3和1e-2的學(xué)習(xí)速率下,很快都達(dá)到了70%以上的驗(yàn)證準(zhǔn)確度,收斂率在0.75左右,最終驗(yàn)證集準(zhǔn)確率穩(wěn)定在78%。由于GTN網(wǎng)絡(luò)存在過(guò)擬合的現(xiàn)象,在后續(xù)融合時(shí),基于GTN網(wǎng)絡(luò)的置信度比重相較于基于Swin-Transformer網(wǎng)絡(luò),應(yīng)當(dāng)降低。
實(shí)驗(yàn)數(shù)據(jù)選取與測(cè)試用數(shù)據(jù)集相同的五類航跡信息,為驗(yàn)證模型的有效性,本文設(shè)置3組實(shí)驗(yàn),每組在5類數(shù)據(jù)中各隨機(jī)選取50條航跡數(shù)據(jù)作為本次實(shí)驗(yàn)的數(shù)據(jù)集。序列層航跡分類準(zhǔn)確率如表5所示,每類的F1得分及均值如表6所示,從圖11中可以看出,基于序列層航跡數(shù)據(jù)分類的F1得分總均值為0.6,在驗(yàn)證集78%的準(zhǔn)確率下達(dá)到了F1得分良好的效果,驗(yàn)證了基于Transformer網(wǎng)絡(luò)的序列層航跡數(shù)據(jù)分類的有效性。
2.6 基于置信度的D-S證據(jù)理論融合層航跡分類實(shí)驗(yàn)
在本節(jié),通過(guò)隨機(jī)選取多組測(cè)試集驗(yàn)證基于D-S證據(jù)理論融合實(shí)驗(yàn),融合基于Swin-Transformer模型與基于GTN網(wǎng)絡(luò)模型的分類結(jié)果,實(shí)驗(yàn)結(jié)果表明融合有效地提高了分類結(jié)果的準(zhǔn)確率。
2.6.1 融合測(cè)試數(shù)據(jù)集
實(shí)驗(yàn)數(shù)據(jù)選取測(cè)試數(shù)據(jù)集中的相同的五類航跡信息,為驗(yàn)證模型的有效性,在5類數(shù)據(jù)中各隨機(jī)選取50條航跡數(shù)據(jù)作為本次實(shí)驗(yàn)的數(shù)據(jù)集。
2.6.2 融合實(shí)驗(yàn)與結(jié)果分析
為驗(yàn)證算法的有效性,本節(jié)融合實(shí)驗(yàn)在5類航跡數(shù)據(jù)中隨機(jī)選取了3組數(shù)據(jù),作為本節(jié)實(shí)驗(yàn)的樣本,融合層航跡分類準(zhǔn)確率如表7所示,F(xiàn)1得分如表8所示,宏觀F1得分達(dá)到了0.82的優(yōu)秀評(píng)分,圖12為融合層對(duì)不同類F1得分更清晰和直觀的觀察。圖13為圖像層、序列層與融合層F1得分對(duì)比。在5類任務(wù)中,融合層都表現(xiàn)出優(yōu)秀的F1得分,證明了融合層航跡數(shù)據(jù)分類在圖像層與序列層航跡分類的基礎(chǔ)上,提高了分類算法的可靠性。
融合結(jié)果如表9所示,在單分類結(jié)果為55.3%的低準(zhǔn)確率時(shí),融合后準(zhǔn)確率依然有所提升,達(dá)到了70.7%的準(zhǔn)確率。由圖14可以看到,融合層航跡數(shù)據(jù)分類在圖像層與序列層航跡分類的基礎(chǔ)上有效提升了航跡數(shù)據(jù)分類的準(zhǔn)確率,驗(yàn)證了基于改進(jìn)D-S證據(jù)理論的融合分類算法,相較于單種分類算法,有效提升了航跡分類識(shí)別的準(zhǔn)確率,提高了航跡分類模型魯棒性。
2.6.3 對(duì)比試驗(yàn)
為了進(jìn)一步驗(yàn)證船舶軌跡分類網(wǎng)絡(luò)模型的分類能力,我們選擇了LSTM模型和CNN網(wǎng)絡(luò)模型,進(jìn)行對(duì)比分析。
模型訓(xùn)練為航跡5分類訓(xùn)練,將小型批處理大小設(shè)置為 16,輸入特征維度為4,并將輸出序列類別設(shè)置為5。epoch設(shè)置為300,隱藏狀態(tài)大小為128,LSTM層數(shù)為2,學(xué)習(xí)率為 1e-4。
CNN模型結(jié)構(gòu)如圖16所示,輸入層主要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,卷積層主要提取圖像特征,池化層目的是為了減少特征圖。池化層夾在連續(xù)的卷積層中間,用于壓縮數(shù)據(jù)和參數(shù)的量,減小過(guò)擬合。全連接層與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)神經(jīng)元連接方式一樣,是一個(gè)傳統(tǒng)的多層感知器,它在輸出層使用softmax 激活函數(shù),卷積層和池化層主要得到輸入圖像的高級(jí)特征。完全連接層的目的是利用這些基于訓(xùn)練數(shù)據(jù)集得到的特征,得到目標(biāo)圖像的類別。
模型訓(xùn)練為航跡5分類訓(xùn)練,將小型批處理大小設(shè)置為32,輸出序列類別設(shè)置為5。epoch設(shè)置為100,卷積核大小為5×5,最大學(xué)習(xí)率為 1.25e-4,最小學(xué)習(xí)率為 1.25e-5。
圖17為三個(gè)模型的驗(yàn)證結(jié)果,表10為實(shí)驗(yàn)對(duì)比,從結(jié)果可以看出,對(duì)于本文使用的數(shù)據(jù)集,提出的船舶軌跡分類網(wǎng)絡(luò)模型達(dá)到了91.8%的準(zhǔn)確性,高于LSTM網(wǎng)絡(luò)模型的80.6%的準(zhǔn)確性和CNN網(wǎng)絡(luò)模型的79.3%的準(zhǔn)確性,驗(yàn)證了船舶軌跡和航道分類模型在船舶軌跡分類性能上的優(yōu)越性。
3 結(jié)束語(yǔ)
本文的主要研究工作可以歸納為以下兩點(diǎn):
(1)針對(duì)具有空間差異以及運(yùn)動(dòng)特征差異的航跡分類問(wèn)題,為了提取船舶軌跡的空間特征與時(shí)序序列中的長(zhǎng)期依賴關(guān)系,本文將航跡數(shù)據(jù)分為圖像層航跡數(shù)據(jù)與序列層航跡數(shù)據(jù),為了優(yōu)化模型的輸入,采用改進(jìn)DP算法壓縮航跡,分別利用Swin-Transformer模型與GTN網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,獲得良好的實(shí)驗(yàn)結(jié)果;
(2)提出使用改進(jìn)的D-S證據(jù)理論融合兩種模型的分類結(jié)果,建立融合層航跡分類模型,提高分類的準(zhǔn)確性和魯棒性。融合結(jié)果相較于單種分類結(jié)果有了提升,并且高于LSTM網(wǎng)絡(luò)與CNN網(wǎng)絡(luò)的分類準(zhǔn)確率,驗(yàn)證了本文所提方法在跨時(shí)域航跡分類識(shí)別上的有效性。
由于此模型建立在完整航跡數(shù)據(jù)集的基礎(chǔ)上,未考慮航跡信息不全的情況,在下一步的工作中,我們將繼續(xù)優(yōu)化這個(gè)模型,從數(shù)據(jù)源出發(fā)融合圖像層與序列層航跡數(shù)據(jù),建立深度特征融合的深層網(wǎng)絡(luò)模型,進(jìn)一步提高模型的泛化性。
參考文獻(xiàn):
[1] LUO D,CHEN P,YANG J,et al. A new classification method for ship trajectories based on AIS data[J]. Mar. Sci. Eng.,2023(11):1 646.
[2] YANG W, AI T, LU W. A method for extracting road boundary information from crowdsourcing vehicle GPS trajectories[J]. Sensors (Basel), 2018, 18(4): E1 261.
[3] ZHANG Z H, HUANG L, PENG X, et al.Loitering behavior detection and classification of vessel movements based on trajectory shape and Convolutional Neural Networks[J]. Ocean Engineering, 2022(258):11 852.
[4] TAVAKOLI Y, PEA-CASTILLO L, SOARES A. A study on the geometric and kinematic descriptors of trajectories in the classification of ship types[J]. Sensors (Basel), 2022, 22(15): 5 588.
[5] TU E, ZHANG G, Rachmawati L,et al. Exploiting AIS data for intelligent maritime navigation: a comprehensive survey from data to methodology[J].IEEE Transactions on Intelligent Transportation Systems,2018, 19(5): 1 559-1 582.
[6] 宋強(qiáng), 彭翔宇, 黃仕林, 等. 基于序貫特征提取的無(wú)人機(jī)與飛鳥(niǎo)目標(biāo)分類[J]. 信號(hào)處理, 2024, 40(5): 839-852.
SONG Q, PENG X Y, HUANG S L, et al. Classification of UAVs and birds using sequential feature extraction[J]. Journal of Signal Processing, 2024, 40(5): 839-852.
[7] Manjunatha Veerappa, Mathias Anneken, Nadia Burkart, et al. Validation of XAI explanations for multivariate time series classification in the maritime domain[J].Journal of Computational Science,2022, 58:10 1539.
[8] CHEN Z J, XUE J, WU C Z, et al. Classification of vessel motion pattern in inland waterways based on automatic identification system[J]. Ocean Engineering, 2018, 161: 69-76.
[9] Chunhua Tang, Meiyue Chen, Jiahuan Zhao, et al. A novel ship trajectory clustering method for finding overall and local features of ship trajectories[J].Ocean Engineering,2021, 241:110 108.
[10]王顥程, 左毅, 李鐵山, 等. 基于寬度學(xué)習(xí)系統(tǒng)的內(nèi)河航道船舶軌跡分類算法[J]. 上海海事大學(xué)學(xué)報(bào), 2021, 42(3): 91-100.
WANG H C, ZUO Y, LI T S, et al. Classification algorithm of ship trajectory in inland waterways based on broad learning system[J]. Journal of Shanghai Maritime University, 2021, 42(3): 91-100.
[11]Xu H, Oliveira P, Guedes Soares C, et al. L1 adaptive back stepping control for path-following of under actuated marine surface ships[J].Eur. J. Control,2020, 58:357-372.
[12]CHEN X, LIU Y C, ACHUTHAN K, et al. A ship movement classification based on automatic identification system (AIS) data using convolutional neural network[J]. Ocean Engineering, 2020, 218: 108 182.
[13]Llerena, Juan Pedro, et al. LSTM vs CNN in real ship trajectory classification[J].Logic Journal of the IGPL,2024, 32(1):027.
[14]Addor N, G Nearing, C Prieto, et al. A ranking of hydrological signatures based on their predictability in space[J]. Water Resources Research,2018,54 (11): 8 792-8 812.
[15]YANG T, WANG X, LIU Z. Ship type recognition based on ship navigating trajectory and convolutional neural network[J]. J. Mar. Sci. Eng.,2022, 10: 84.
[16]SYED M A B, AHMED I. A CNN-LSTM architecture for marine vessel track association using automatic identification system (AIS) data[J]. Sensors (Basel), 2023, 23(14): 6 400.
[17]Hongda Duan, Fei Ma, Lixin Miao, et al. A semi-supervised deep learning approach for vessel trajectory classification based on AIS data[J]. Ocean & Coastal Management,2022,218:106 015.
[18]GUO T, XIE L. Research on ship trajectory classification based on a deep convolutional neural network[J].J. Mar. Sci. Eng,2022, 10:568.
[19]LIU Z, LIN Y T, CAO Y, et al. Swin transformer: hierarchical vision transformer using shifted windows[EB/OL]. 2021: 2103.14030. https://arxiv.org/abs/2103.14030v2.
[20]馬蘇上, 王澤宇, 劉明劍, 等. 基于特征點(diǎn)篩選的漁船軌跡壓縮方法及優(yōu)化[J]. 漁業(yè)現(xiàn)代化, 2023, 50(4): 118-125.
MA S S, WANG Z Y, LIU M J, et al. Trajectory compression method of fishing vessel based on feature point separation[J]. Fishery Modernization, 2023, 50(4): 118-125.
[21]董路熙, 張烈平, 王文成, 等. 基于DP-PSO的車輛GPS軌跡時(shí)空自適應(yīng)離線壓縮算法[J]. 桂林理工大學(xué)學(xué)報(bào), 2022, 42(4): 977-987.
DONG L X, ZHANG L P, WANG W C, et al. Vehicle GPS trajectory spatio temporal adaptive compression based on DP-PSO Algorithm[J]. Journal of Guilin University of Technology, 2022, 42(4): 977-987.
[22]LIU M H, REN S Q, MA S Y, et al. Gated transformer networks for multivariate time series classification[EB/OL]. 2021: 2103.14438. https://arxiv.org/abs/2103.14438v1.
[23]石敏, 龔誠(chéng), 李迅,等.海空目標(biāo)航跡智能分類數(shù)據(jù)集[EB/OL]. RADAR 數(shù)據(jù)集. https://radars.ac.cn/web/data/getData?dataType=DatasetintheCompetii,2023.
SHI M, GONG C, LI X, et al. Intelligent classification dataset for sea and air target trajectories[EB/OL]. RADAR dataset. https://radars.ac.cn/web/data/getData?dataType=DatasetintheCompetii,2023.
(責(zé)任編輯:許韋韋)