崔志偉,張宇琳,張飛舟,高 姍
基于AIS數據的海上電子圍欄選址
崔志偉1,2,張宇琳1,張飛舟1,高 姍3
(1.北京大學 地球與空間科學學院,北京 100091;2. 32011部隊,北京 100094;3. 中國自然資源航空物探遙感中心,北京 100083)
針對電子圍欄在海洋交通管理應用中的選址粗放問題,利用船舶自動識別系統(AIS)數據聚類分析實現海上電子圍欄的選址:通過數據清洗和特征抽取對AIS原始數據進行篩選,構建具有時序特征的屬性數組;并采用改進的基于密度聚類(DBSCAN)算法對AIS數據進行聚類計算,挖掘分析出船舶的實際空間分布特征;然后給出海上電子圍欄選址的具體方法和流程;最后以最小外接矩形方法獲得研究區域電子圍欄邊界位置。實驗結果表明,該方法獲取的海上電子圍欄在需求覆蓋率、流速穩定性和靠近航道距離等方面的性能都有較大的提高,具有較為廣闊的應用前景,可為港口的精細化、科學化管理提供技術支撐。
密度聚類(DBSCAN)算法;最小外接矩形;電子圍欄;自動識別系統;有效性分析
20世紀90年代初,為彌補船舶交通管理系統(vessel traffic service,VTS)和傳統雷達在高精度定位、船舶唯一編碼等方面的不足[1],加強全球海上交通管制,維護海上航行安全,歐、美等國家結合數字選擇呼叫(digital selective calling,DSC)技術開始研究測試船舶自動識別系統(automatic identification system,AIS)[2]。1998年瑞典率先建成一個全國性的AIS系統,帶動了國際AIS系統的建設發展。AIS系統的技術理念和運行模式由基站式逐步向網絡化、信息化、智能化過渡,如今已形成天基、岸基和船載AIS系統共同提供船舶管理服務的局面。當前,我國海上經濟迅猛發展,AIS系統每天產生海量具有時空屬性的航跡數據,量級上也將從現在的吉(十億)字節(gigabyte,GB)、太(萬億)字節(terabyte,TB)級逐步增長到拍(千萬億)字節(petabyte,PB)、艾(百億億)字節(exabyte,EB),乃至澤(十萬億億)字節(zettabyte,ZB)級[3],為水上交通、海洋漁業、海洋生態、安全監視等[4-7]海上活動的動態監管提供數據基礎。文獻[8]通過對AIS數據降噪處理,并在模型中融合歷史數據,提取了精度較高的船舶軌跡;文獻[9]基于實時的AIS數據建立了航道交通擁堵的快速判定模型,實現了航道交通流量的實時監測和及時管控;文獻[10]在分析大量AIS數據基礎上,對船舶軌跡異常進行了歸納分類,并實現軌跡異常的自動檢測;文獻[11]采用深度學習的方法從實時AIS數據中提取特征,提高了漁業活動識別預測的準確性;文獻[12]針對海上風電場在船舶航行、航路規劃等方面產生的不利影響,提出了將電子圍欄系統應用服務于海上風電場等重點監管海域的新型航海保障模式;文獻[13]面向海運大數據統計分析需求,以港口、泊位為中心,以特定值為半徑畫圓,計算生成特定海域的電子圍欄范圍。目前海上電子圍欄選址方法多為通過實地調研手工繪制,在選址精度和效率方面有待進一步提升,同時AIS數據挖掘研究成果卻非常豐富;因此本文基于AIS數據開展海上電子圍欄選址的研究,通過對AIS數據進行聚類處理,分析港口船舶停留的空間分布特征,并據此提出電子圍欄建設的選址方法,為實現船舶精細化、科學化助航監管提供技術參考。
AIS數據包括靜態信息、動態信息、航次相關信息和安全相關信息[14],如表1所示。其中,靜態信息指由船名、船型、海上移動業務標識等構成的固定不變的信息。動態信息指由傳感器獲得的船舶地理位置(經度、緯度)、航向、航速、時間等船舶動態信息。航次相關信息指由人工輸入的航線計劃、預計達港時間、吃水、載貨類型等信息。安全信息即對船舶航行安全構成影響的氣象、告警、禁航等信息。

表1 AIS數據屬性
AIS數據的挖掘主要可以分為時空模式挖掘、聚類、分類和時空異常檢測等類型,本文通過對AIS數據進行數據清洗、特征抽取和聚類計算實現船舶空間特征的挖掘分析,并在此基礎上對海上電子圍欄的選址計算進行研究。



算法主要步驟為:
6)標記出所有核心點、邊界點和噪聲點;
7)輸出聚類結果。


圖1 選址流程
3.2.1 數據清洗
由于數據在接收、傳輸過程中不可避免地受到環境、設備等因素的影響,AIS數據通常會存在信息重復、缺失、錯誤等問題。如天津港地理位置經度位于117°E—119°E之間,緯度位于38°N—40°N之間,而由于信息錯誤會出現航跡點坐標在上述范圍之外的漂移點。為消除異常數據對后續AIS數據時空聚類的影響,本文對前后信息完全一致的重復數據、定位偏離正常地理范圍的漂移數據和海上移動業務標識(maritime mobile service identify,MMSI)錯誤的噪聲數據進行篩選或剔除。另一方面,本文研究主要基于靜態船舶的空間分布特征來選取電子圍欄的建設位置,須對航行船舶數據進行二次篩除。在風、流共同作用下,走錨船只實際漂移速度通常不大于2節[17];因此,以航速大于2節作為航行船舶數據的判斷標準。AIS數據清洗相關屬性可信范圍如表2所示。

表2 AIS數據主要屬性可信范圍值
3.2.2 特征抽取


表3 特征抽取數據列表
3.2.3 聚類計算
改進的DBSCAN聚類算法將符合鄰域密度閾值的靜態船舶點位聚類后分組為由一個個點簇構成的集合,可以準確呈現出不同海域不同船舶的停留需求。本文通過航道數據將研究區域劃分為不同的子區域,在各子區域的所有需求集群中,分別查找需求量最大的集群,通過最小外接矩形方法計算集群邊界作為電子圍欄的近似范圍,如圖3所示為電子圍欄選址計算的具體過程。

圖3 電子圍欄選址計算具體過程





表4 實驗條件說明

圖4 實驗范圍示意


圖5 航跡點聚類結果
通過聚類挖掘可以看出,天津港大沽口北錨地、大沽口散化錨地、大沽口南錨地范圍分別為12.9 km×4.6 km、5.5 km×4.2 km和7.4 km×4.3km,與實際錨地范圍基本相符。船舶停泊在空間分布上總體呈現出規律性聚集的特點,如大沽口北錨地、大沽口散化錨地和大沽口南錨地等,而大沽口北錨地東側海域雖未規劃相應錨地范圍,大型船舶依然呈現出較強的聚集性,03登船區北側海域由于水深較淺,船舶以漁船為主,又呈現出較為明顯的離散性。不難發現,天津港船舶停泊整體規范之外,對部分船只的??亢凸芾磉€存在著薄弱環節,如十萬噸級錨地的船舶雖聚集性較好,但未嚴格按照錨地進行停泊,而大沽口北錨地東側海域船舶停留則缺乏有效的錨地規劃和船舶管理措施,如圖6所示。

圖6 錨地規劃范圍
基于固定航道和船舶空間分布特征,在研究區域給出3個密度較大集群的最小外接矩形作為電子圍欄的邊界,如圖7所示。

圖7 電子圍欄選址結果
對水深、底質、流速、距航道距離、需求覆蓋率等5項評價指標進行兩兩比較,采用1~9標度表述其差別,通過構建判斷矩陣求解各項權重值,最終獲得5項評價指標對應的權重值,如表5所示。

表5 各項指標權重值
針對對比方案中各項評價指標按照有效性分別進行10分制評分,并通過式(4)加權計算其綜合評分值,如圖8所示。

圖8 不同方案定量評分對比
可以看出:利用本文方法獲取的選址方案總體性能更優,2種方案在水深、底質方面的條件基本吻合;而本文選址方案內流速更小,利于錨泊船只航行安全,并且整體離航道的距離更近,需求覆蓋率更高。測試結果表明,該選址方法可以有效地幫助在研究區域內選擇合適的位置建立電子圍欄。
港口建設是我國深化對外開放的重要途徑。隨著大數據、物聯網等新技術的發展應用,我國港航業機遇與挑戰并存。為保障海上交通科學有序發展,海事部門構建了船舶自動識別系統、船舶交通服務系統、閉路電視監控系統等多元化管理手段,但依然存在船舶進出港口不報告、船舶停泊不進錨地等管理難點。本文基于AIS數據提出一種海上電子圍欄選址的方法框架,采用改進的DBSCAN聚類算法對天津港大沽口錨地的停留船舶進行時空聚類分析,并在此基礎上通過最小外接矩形方法找到電子圍欄建設的合理位置。通過對比分析,利用本文方法得出的選址結果在流速、距航道距離和需求覆蓋率等方面優勢更明顯。本文初步選取了天津港水域內靜態船舶的AIS數據進行處理和研究,下一步將結合航行船舶AIS數據對電子圍欄選址的影響進行深入研究。
[1] 牛健春. AIS在VTS船舶交通管理系統中的作用[J]. 航海技術, 2003(1): 38-39.
[2] 楊永康. 通用船舶自動識別系統(UAIS)性能和使用[J]. 航海技術, 2004(1): 21-24.
[3] 李德仁. 論時空大數據的智能處理與服務[J]. 地球信息科學學報, 2019, 21(12): 1825-1831.
[4] ZHANG L, MENG Q, FWA T F. Big AIS data based spatial-temporal analyses of ship traffic in Singapore port waters[J]. Transportation Research Part E: Logistics and Transportation Review, 2019, 129: 287-304.
[5] 李曉恩, 周亮, 肖楊, 等. 基于漁船AIS數據的南海北部海洋漁業捕撈強度空間特征挖掘[J]. 地球信息科學學報, 2021, 23(5): 850-859.
[6] LIU T K, TSAI T K. Vessel traffic patterns in the port of Kaohsiung and the management implications for preventing the introduction of non-indigenous aquatic species[J]. Marine Pollution Bulletin, 2011, 62(3): 602-608.
[7] FU P, WANG H, LIU K, et al. Finding abnormal vessel trajectories using feature learning[J]. IEEE Access, 2017, 5: 7898-7909.
[8] 高大為, 朱永生, 張金奮, 等. 基于AIS數據的船舶航跡多維預測方法[J]. 中國航海, 2021, 44(3): 56-63.
[9] 何正偉, 劉力榮, 楊帆, 等. 基于AIS實時數據的航道交通擁堵快速判定方法[J]. 中國航海, 2018, 41(2): 113-118, 129.
[10] 吳建華, 吳琛, 劉文, 等. 舶舶AIS軌跡異常的自動檢測與修復算法[J]. 中國航海, 2017, 40(1): 8-12, 101.
[11] SHEN K Y, CHU Y J, CHANG S J, et al. A study of correlation between fishing activity and AIS data by deep learning[J]. TransNav: International Journal on Marine Navigation and Safety of Sea Transportation, 2020, 14:527-531.
[12] 蘇斌, 王有軍, 李星. 淺談AIS海上電子圍欄系統及在海上風電場的應用[J]. 航海技術, 2021(5): 38-41.
[13] 趙龍飛, 姜曉軼, 孫苗, 等. 面向海運統計的AIS大數據挖掘分析研究[J]. 海洋科學, 2021, 45(12): 55-64.
[14] 衛桂榮, 楊春. 船舶AIS數據錯誤檢測方法[J]. 中國航海, 2016, 39(4): 11-14.
[15] ESTER M, KRIEGEL H P, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[C]// Proceedings of the Second International Conference on Knowledge Discovery and Data Mining(KDD-96). [S.l.]: [s.n.], 1996: 226-231.
[16] 宋董飛, 徐華. DBSCAN算法研究及并行化實現[J]. 計算機工程與應用, 2018, 54(24): 52-56, 122.
[17] 李學東. 港外錨地相對安全距離研究[J]. 中國港灣建設, 2015, 35(1): 16-18, 24.
[18] 周江華, 胡云平. 基于層次分析法的寧波港錨地選擇方案[J]. 浙江海洋學院學報(自然科學版), 2004, 23(4): 315-319.
[19] 董如梅, 王慶林, 陳錦娣. 一種兩兩比較判斷矩陣的探討[J]. 北京理工大學學報, 2000, 20(4): 407-411.
Siting of maritime electronic fence based on AIS data
CUI Zhiwei1,2, ZHANG Yulin1, ZHANG Feizhou1, GAO Shan3
(1. School of Earth and Space Sciences, Beijing University, Beijing 100091, China; 2. Troops 32011, Beijing 100094, China; 3.China Aero Geophysical Survey and Remote Sensing Center for Natural Resources, Beijing 100083, China)
Aiming at the problem of rough site selection in the application of electronic fences in marine traffic management, the paper proposed a site selection method of marine electronic fences by using the clustering analysis of automatic ship identification system (AIS) data: the original AIS data were screened by data cleaning and feature extraction to construct an attribute array with time-series characteristics; and an improved density-based spatial clustering of applications with noise (DBSCAN) algorithm was used to cluster the AIS data to mine and analyze the actual spatial distribution characteristics of ships; then a specific method and its process for siting the maritime electronic fence were given; finally, the boundary location of the electronic fence in the study area was obtained by the minimum enclosing rectangle method. Experimental result showed that the performance of the maritime electronic fence obtained by the proposed method would be greatly improved in terms of demand coverage rate, flow speed stability and distance close to the channel, which could have a relatively broad application prospect and provide technical support for the refined and scientific management of the port.
density-based spatial clustering of applications with noise (DBSCAN) algorithm; minimum enclosing rectangle; electronic fence; automatic identification system; validity analysis
崔志偉, 張宇琳, 張飛舟, 等. 基于AIS數據的海上電子圍欄選址[J]. 導航定位學報, 2023, 11(4): 49-55.(CUI Zhiwei, ZHANG Yulin, ZHANG Feizhou, et al. Siting of maritime electronic fence based on AIS data[J]. Journal of Navigation and Positioning, 2023, 11(4): 49-55.)DOI:10.16547/j.cnki.10-1096.20230407.
P228
A
2095-4999(2023)04-0049-07
2022-11-18
崔志偉(1988—),男,河南商丘人,碩士研究生,研究方向為衛星導航應用、空間信息智能處理。
張飛舟(1966—),男,北京人,博士,教授,研究方向為智慧城市、物聯網以及空間信息智能處理。