謝少榮, 劉堅堅, 張 丹
復雜海況無人艇集群控制技術研究現狀與發展
謝少榮1,2, 劉堅堅1, 張 丹1
(1. 上海大學 機電工程與自動化學院, 上海, 200444; 2. 上海大學 計算機工程與科學學院, 上海, 200444)
無人艇作為一種高度自治的系統, 是提高水上作業效率的可靠途徑之一, 可用于水文研究、科學勘探、水文測量、應急搜救以及安全巡邏等任務。通過信息交互與協同決策將多艘無人艇構建成集群, 使其具有更全的感知信息、更高的執行效率和更大的作業范圍, 能顯著增強無人艇自主完成任務的能力。但由于海洋環境復雜多變, 風、浪和涌流等因素擾動大, 無人艇集群的協同控制與優化決策面臨單艇自主完備感知難、多艇快速靈活交互認知難、實時高效集群協同難等挑戰。文中從復雜海洋環境下海洋環境智能感知方法、單艇準確完備自主感知機理、多艇實時交互認知機制、無人艇集群智能協同控制決策方法和無人艇集群應用平臺等方面對無人艇集群技術的研究現狀進行了論述, 并提出了關鍵技術和難點問題; 同時指出, 單艇自主完備感知、多艇快速靈活交互認知、實時高效集群協同是集群控制技術亟待深入的研究方向。
無人艇集群; 協同控制; 優化決策
我國是海洋大國, 約有3×106km2的海域面積, 7 000多個島礁。“向海而生, 背海而衰”, 爭奪世界海洋權益和資源是海洋大國與臨海國家永恒的戰略行為。黨的十八大提出了“提高海洋資源開發能力, 堅決維護國家海洋權益, 建設海洋強國”的戰略目標; 十九大報告明確要求“加快建設海洋強國”。從海洋大國到海洋強國邁進的戰略進程中, 離不開高端的海洋裝備。其中無人艇憑借其海-空界面運行的優勢, 能夠搭載各種傳感設備, 廣泛應用于海洋運輸與環境調查、海洋考古、水上搜救、情報搜集、偵察取證、警戒巡邏、火力打擊、艦艇護航、反水雷和反潛等領域, 高效地充當著立體化海洋空間的關鍵節點。
然而隨著海洋環境日益復雜、作業任務日漸多樣、活動范圍日趨擴大, 單一無人艇作業將遠遠不能滿足要求, 無人艇勢必朝著集群化、網絡化和智能化方向發展。作為海洋智能機器人技術發展到一定階段的產物, 無人艇集群是由多個可在局部范圍自主完成任務的單一無人艇, 通過有線、無線通信連接方式, 進行群體協作而形成的一個整體。各單一無人艇在空間上分散布置, 在功能上存在中心指揮節點。通過信息交互與協同決策在更廣的作業范圍內具備更高的作業效率、更強的魯棒性以及靈活性, 顯著增強無人艇自主完成更復雜任務的能力。
但是由于風、浪、涌流的作用, 海洋環境具有更加復雜多變的不確定因素。在這種條件下, 無人艇集群的協同控制與優化決策主要面臨如下挑戰。
1) 自主完備感知難。無人艇集群需克服復雜海況下海洋環境及其弱觀測目標信息難以獲取的困境, 從而對海洋環境信息進行準確感知, 對海洋弱觀測目標進行精確識別。
2) 多艇快速靈活交互認知難。無人艇集群需具有靈活的交互認知機制, 使多艇之間進行可靠的實時信息交互認知, 從而為集群控制決策提供更多的感知信息。
3) 實時高效集群協同難。無人艇集群需具有統一安全抗毀的知識傳輸框架, 使得無人艇集群系統決策時效性高、任務整體耗時短, 且具備基于交互認知的任務分解與最優任務分配能力。
文中對無人艇集群控制技術領域的研究現狀進行了論述, 并提出復雜海況無人艇集群控制存在的關鍵性問題以及未來的發展方向。
復雜海況下無人艇集群控制主要涉及海洋環境智能感知方法、單艇準確完備自主感知機理、多艇實時交互認知機制、無人艇集群智能協同控制決策等諸多基礎性的科學問題。
無人艇設計及傳感器搭載是感知海洋環境的基礎, 因此對海洋環境及目標數據采集方式的探索是無人艇智能感知的一個重要課題。受制于復雜海況及傳感器缺陷, 無人艇感知數據的擴充還需依賴各種數據增廣方法。無人艇集群的數據來源于多艇和多傳感器, 因此, 多源異構數據拼接重建是提升無人艇智能感知能力的重要研究內容。此外, 復雜海況下的多尺度弱目標識別研究也是無人艇集群執行后續跟蹤、防護和攻擊等海上任務的重要基礎。
1.1.1 海洋環境及目標數據采集
為更好地采集海洋場景數據, 國內外學者在無人艇設計和傳感器搭載方面取得了較大進展。如美國海軍的無人艇系統“Swarm II”、上海大學研制的“精海1號”及中科院沈陽自動化所的“先驅號”無人艇等, 均利用了雷達、激光、可見光相機和紅外相機等。這些傳感器各有優劣, 受制于復雜海況影響和傳感器缺陷, 采集大規模、高質量海洋環境及目標數據樣本比較困難[1-2], 現有樣本庫規模一般較小, 且多為從天空的俯視視角采集。除可視和紅外光譜海事影像(visible and infrared spectrums, VAIS)數據集及海洋障礙物檢測數據集(marine obstacle detection dataset, MODD)等僅包含幾千張圖片的數據集之外[3-4], 葡萄牙和新加坡學者曾分別公開過2個較大的數據集[5-6], 但仍未解決這類數據集的局限: 1) 數據集體量小, 且大多數數據為同一時段采集; 2) 高價值動態目標樣本少, 且采集視角和風格較為單一。
1.1.2 數據集增廣
傳統的數據增強方式包括旋轉、切割、翻轉及尺度變換等[7], 其運算簡單、使用便捷, 但對數據集增加的信息十分有限[8], 無法解決復雜海況下高價值樣本少、分布不均等問題。三維虛擬現實仿真技術是生成多樣化海洋場景的一個有效途徑。Song等[9-10]提出了基于注意力機制的三維重建方法, 在配準誤差和傳感器掃描噪聲較大的情況下, 實現了對目標物體的高質量三維仿真建模。與靜態物體的三維重建不同, 水作為一種流體, 其重建仿真往往需要模擬流體的物理特性, 如Schreck等[11]通過優化求解一組描述水波物理運動的方程, 實現了對水波的高逼真度動態仿真。但以上研究缺乏對海上目標與海水間相互作用的仿真。此外, 通過生成模型合成數據是豐富現有數據集的另一種重要方式。常見的生成方法包括生成對抗網絡[12]、變分自編碼器[13]和對抗自編碼器[14]等。生成對抗網絡近年來在風格遷移[15]和圖像修復[16]等領域取得較好效果。
1.1.3 多源數據拼接重建
受視域限制和海洋環境干擾, 單艇感知的信息一般不完備, 多艇信息拼接重建是實現信息增強的一種重要途徑。圖像的拼接重建在靜態和高信噪比圖像上已取得較好進展, 相關文獻主要集中在遙感圖像拼接。例如, Schwind等[17]利用無限對稱指數濾波器(infinite symmetric exponential filter, ISEF) 處理圖像后再進行尺度不變特征轉換(scale-invariant feature transform, SIFT)特征提取和配準拼接。Wang等[18]在神經網絡中直接學習圖像塊到匹配標簽的映射函數。需要指出的是, 遙感圖像是從高空對陸地或海洋成像, 目標的觀測視角及噪聲特點都與艦載圖像數據存在較大差異[19]。
1.1.4 海洋環境/目標識別
針對單一模態數據, Teutsch等[20]利用紋理、局部二值模式(local binary pattern, LBP)等特征開展了海洋船只紅外圖像數據分類研究; Wessman[21]利用具有噪聲的基于密度的聚類算法(den- sity-based spatial clustering of applications with noise, DBSCAN)實現了海洋目標雷達數據的自適應提取。另外, 為解決目標多尺度問題, 一般以多層特征融合[22-23]和數據層級的尺度縮放[24]2種方式為主。Zhang等[25]利用空間-尺度注意力機制設計了上下文感知檢測網絡模型, 融合了多層尺度自適應特征并實現了俯角海洋多尺度目標檢測識別; Bloisi等[26]針對海平面的多尺度目標識別設計固定輪廓模型并將圖像目標區域進行歸一化以適應該模型從而識別輪船、島礁等目標。然而, 目前的海上目標識別研究側重于單一模態或特定組合模態的數據, 且多基于良好海況, 缺乏復雜海況下弱目標的分析和識別。
綜上所述, 盡管以上研究針對樣本數據和模型設計的提升提出了各種各樣的方法, 卻都局限于簡單化、單一化的應用場景, 不適用于解決復雜海況下樣本獲取難、單艇感知不完備、多艇集群信息交互差、弱觀測目標識別精度低等問題。復雜海況環境下無人艇的自主感知、多艇交互、智能控制較為困難, 需依賴于大量高精度、高質量、多模態的數據以及涵蓋多種目標類別、尺度及異構數據的模型。因此, 迫切需要能夠實現大規模、高質量數據增強與模型提升的方法。面向復雜海況下海洋環境智能感知的難點和關鍵問題主要包括: 如何對復雜海況下難以獲取的弱觀測樣本, 設計有效的海洋環境及目標樣本的增廣方法; 如何在單艇無法觀測完備信息的情況下, 利用多源數據實現面向無人艇集群的數據互補重建;以及如何構建針對復雜海洋環境的目標識別庫, 以解決多海況、多尺度、多模態的目標識別問題。
目標實體屬性自主感知、實體關系的語義表達、場景信息補全和態勢重構是復雜海況下單艇準確完備自主感知機理的核心內容, 同時也是無人艇交互認知和集群控制的重要基礎。
1.2.1 目標實體屬性及其關系的語義表達方法
實體屬性抽取是指從非結構化或半結構化的句子中提取結構化的實體及其屬性的技術。信息抽取的研究方法主要有模式匹配方法和機器學習方法2種。基于模式匹配的方法對知識的表達比較直觀、自然, 類似于規則, 更接近人的思維方式。模式匹配多是面向領域的, 準確率較高; 基于機器學習方法靈活性較好, 不需要太多的背景知識, 但需要大規模手工標注的語料庫支持。Luan等[27]利用動態跨度圖實現信息的提取, 并對此提出了一個通用框架。
關系抽取研究同樣包括模式匹配方法和機器學習方法。模式匹配方法由專家預先依據限定領域實體關系的語法或語義信息人工制定出一套規則模板, 通過完全匹配將與模板語義相同的文本關系提取出來。如鄭家恒等[28]通過計算模式實例之間的相似度, 采用單鏈法聚類抽取模式, 并將模式一一分類, 歸并同一類型的模式實例并獲得最終的關系抽取模式。機器學習方法利用各種統計學習的算法, 將關系抽取看作一個分類問題, 從關系訓練樣例中抽取出特征進行學習, 自動從測試語料中抽取關系。如Pingle等[29]提出了一個系統來創建網絡安全文本的語義三元組, 并使用深度學習方法來提取存在的關系, 再使用該語義三元組在網絡安全知識圖中進行推斷。
雖然國內外學者對目標實體屬性及其關系抽取進行了深入研究, 但面向復雜海洋環境, 從相關的領域文本中抽取目標實體屬性及其關系的研究較少, 對無人艇智能感知和語義理解相關理論支撐不足。因此, 圍繞海洋目標實體屬性及其關系的抽取問題有待進一步研究。
1.2.2 知識圖譜的表達、補全與推理
知識圖譜是一種將不同種類的知識自然關聯在一起而得到的關系圖譜, 對領域知識進行高效的知識表達, 為海洋場景態勢感知提供準確完備的信息支撐。知識圖譜建立主要包含2個關鍵技術, 即知識圖譜的表示與補全。知識圖譜的表示是指采用某種數據結構來表示知識圖譜中的實體以及實體之間的關系。為了以更直觀的方式來表達實體之間的關系, 不同的翻譯模型(Trans)將實體表示為向量, 將實體之間的聯系表示為向量之間的平移向量。其中代表性的工作有: TransE模型[30]直接使用實體特征構造向量, 直接通過向量之間的平移關系表示實體之間的聯系; TransR模型[31]通過關系矩陣將向量投影到關系空間再計算實體向量之間的聯系; TransD模型[32]分別定義了頭實體向量與尾實體向量的關系矩陣, 從而得到更準確的實體聯系。
知識圖譜的補全一般可以分為靜態知識圖譜補全和動態知識圖譜補全。靜態知識圖譜補全是指所需的實體和關系均已存在, 只需要在已存在的實體中補充他們之間的關系。靜態知識補全算法與模型設計密切相關, 即通過模型訓練即可得到不同實體之間的關聯。動態知識圖譜補全是指所需的實體或關系不存在于訓練集中, 需要動態增添、修改或刪除實體以及實體之間的關系。
知識推理指從已知的事實出發, 通過已掌握的知識, 歸納出一些新的事實。基于轉移的表示推理[33]根據轉移假設設計得分函數, 多元組的得分函數越高, 說明存在該多元組的可能性越大。基于張量/矩陣分解的表示推理[34-36]通過張量/矩陣分解的方法進行學習, 分解得到的向量表示相乘重構成張量/矩陣, 元素值即為對應三元組的得分, 取得分值大于某一閾值的候選組作為推理結果。基于空間分布的表示推理[37-38]通過設計能夠反應空間分布特征的得分函數, 使得向量在表示空間中, 實體和關系的空間分布盡可能地與原知識圖譜一致。
雖然目前不斷有大型知識圖譜出現, 知識圖譜表達、補全與推理方法也在不斷更新, 但是依然存在許多問題和挑戰。現有的知識圖譜表示方式在效率、空間復雜度等方面依然無法平衡, 且補全方法的完備性和信息量仍比較低。同時, 現有建立知識圖譜的方法通常需要大量的高質量樣本進行學習, 而在實際應用中(例如無人艇的研究)常常難以獲取高質量的訓練樣本, 這極大地增加了構建知識圖譜的難度。
1.2.3 場景信息態勢重構方法
態勢重構是對一個動態變化的對象感知并對提取出來的態勢元素進行察覺、理解和預測的處理過程。
在場景態勢重構方面, 現有研究已經表明其在無人艇技術中的重要地位, 并且取得了有效進展[39-42], 但仍需解決2個問題: 1) 系統實時性。在復雜海況中, 無人艇的態勢變化很快, 如何快速準確地進行態勢重構, 是整個重構系統需要解決的首要問題; 2) 系統精確性。對于復雜海況下的干擾繁多、信息來源廣泛、航行不穩定等因素, 系統應該具有對集群場景中的各種不確定因素進行準確評估和重構的能力。
綜上所述, 國內外在自主感知機理方面的研究已經取得了豐富的研究成果, 但這些成果難以適用于復雜多變的海洋環境。首先, 復雜海洋場景下難以采集準確的結果, 使得無人艇感知能力受限。其次, 無人艇集群實時獲取實體關系信息存在難度高、數據稀疏及碎片化等問題。此外, 無人艇航行場景信息補全方面, 現有大部分研究集中于離線狀態算法, 很難適應不斷變化的場景, 無法準確估計無人艇的航行態勢。面向復雜海況下單艇準確完備自主感知的難點和關鍵問題主要包括: 1) 如何從領域文本集合中高效完備的抽取海洋目標實體及其屬性, 構建海洋目標屬性知識圖譜, 結合目標識別模型庫, 實現對復雜海洋環境下無人艇目標屬性的準確感知; 2) 如何構建并補全海洋場景目標實體關系知識圖譜, 形成海洋場景目標實體關系語義理解表達方法體系, 為無人艇集群海洋場景態勢感知提供準確完備的信息支撐; 3) 如何實現海洋場景信息補全, 提取海洋目標實體狀態信息并得到行為運動狀態, 建立態勢感知網絡, 為單艇準確完備自主感知提供方法支撐, 并為多艇交互提供更多的感知信息。
無人艇集群在執行任務過程中, 涉及單艇準確完備自主感知、多艇實時交互認知、無人艇集群協同控制決策等多個技術環節。其中, 多艇實時交互認知能夠對單艇感知信息進行補充, 并為無人艇集群協同控制決策提供更多的感知信息和領域知識。
1.3.1 多機器人集群交互認知機制
多機器人集群是多智能體集群的一種表現形式, 最早由Noreils[43]定義為: 多個智能體協同工作, 完成單個智能體無法完成的任務, 或改善工作過程, 并獲得更優的系統性能。美國底特律大學和麻省理工大學在內的很多高校學者提出諸多創新性的集群交互認知方法, 例如完全區域覆蓋的神經動力學方法, 利用仿生神經網絡進行多智能體之間的交互[44]。歐盟也很早開展了多智能體集群交互認知方面的研究, 如英國林肯大學和捷克理工大學提出了一種新的基于模型預測控制的指導生成方法, 該方法使用領導者-跟隨者多智能體交互策略[45]。日本的多機器人交互研究工作主要集中在仿生多機器人集群系統[46]。在國內, 中科院沈陽自動化研究所[47]、中科院自動化研究所、上海交通大學、哈爾濱工業大學和中南大學等單位也開展了多智能體集群系統交互認知關鍵技術的研究, 取得了較多的研究成果。
1.3.2 無人艇集群交互技術
無人艇在集群交互過程中的交互信息存在多樣性、碎片性、隱含性等特點, 針對無人艇集群交互機制和交互內容的獲取, 國內外很多機構和學者都開展了相關研究。Andre等[48]針對多機系統中何時合作以及與誰合作的問題, 提出了4種何時合作策略。Paliotta等[49]提出了一種基于領導者-跟隨者的自動尋源方法, 通過多艇間的信息交互指導整個無人艇群體的航向。Tolba等[50]提出了一種分布式水下群目標搜索算法-虛擬繩搜索(virtual tether search, VTS), 通過分布式交互, 對群體行為進行空間約束。Matignon等[51]提出了一種基于多機交互的分散決策者決策方法, 利用分散馬爾可夫決策過程協調多機器人在通信約束下的搜索。在國內, Qin等[52]提出了一種基于非策略強化學習的輸入飽和多智能體最優交互控制策略; Wang等[53]研究了不確定條件下的多艇跟隨一致性問題, 通過領導-跟隨交互, 實現多艇實時跟隨。
1.3.3 無人艇集群認知
無人艇集群認知是指多艇共享感知信息并進行推理認知[54], 最終使集群中的每個單艇都具有對環境和目標的全局感知和行為狀態預測的能力。無人艇集群認知首要問題在于將各單艇所感知到的環境信息進行統一描述與融合, 即對環境的協同感知與建模和對物體的協同感知與定位。如Hinzmann等[55]依靠對環境的快速精確三維建模, 依靠實時圖像感知與信息鏈路的共享信息對環境精確建模。基于協同認知的多艇集群作業系統近年來已經取得了長足發展, 并在實際環境中進行了多項測試[56-59]。隨著圖神經網絡的興起, 其強大的推理能力吸引了越來越多的研究者的興趣, 人們開始將圖神經網絡應用到多目標的認知推理中[60-61]。
綜上所述, 雖然國內外已經在多智能體集群交互認知方面取得了一些研究成果, 但仍存在交互機制不明確、交互結果不確定、信息傳輸實時性和準確性難以保證等問題, 解決這些問題是增強無人艇集群交互認知能力的關鍵, 亟需新的交互認知框架提升無人艇集群在復雜環境下的作業能力。同時, 在無人艇集群交互認知研究中必須考慮信息傳輸的拓撲網絡優化, 從而更好地完成集群任務。另外, 無人艇集群間交互觀測數據存在不確定、雜波和高沖突性, 因此還需要進一步開展更為深入的研究, 以提高無人艇交互信息融合的快速性和準確性。
復雜海況多艇實時交互認知機制研究的難點和關鍵問題主要包括: 1) 如何通過分析理解人類認知過程中的交互機制, 解決在多艇交互啟動機制的研究過程中, 交互機時以及交互需求難以確定的問題; 2) 如何解決知識多樣性、碎片性以及隱含性為知識獲取所帶來的影響; 3) 在交互認知過程中, 如何克服無人艇集群結構動態變化快、無法實時交互的問題; 4) 如何解決多艇交互信息之間的矛盾性、不一致性和模糊性為交互知識融合所帶來的問題, 在交互認知過程中, 為無人艇集群控制決策提供更多的信息和知識。
國內研制成型的無人艇集群主要從事固定編隊的巡邏、測量和水面監測等作業, 針對智能規劃、避障和無人艇集群控制的研究較少, 且研究難度更大。
1.4.1 無人艇集群自組織體系構建與信息安全傳輸
無人艇集群自組織體系結構分為平面式和分級式[62]。對于平面式結構網絡, 網絡中每架無人艇結點都擁有相同的功能, 并且在網絡中的地位也完全相同。網絡中無人艇的數量較多且無人艇節點高速運動的時候, 一方面網絡會出現大量額外的控制開銷, 降低無人艇節點的處理能力; 另一方面會導致網絡鏈路較易斷裂, 嚴重影響網絡性能。因此, 平面式網絡體系主要應用于規模較小且移動性較弱的網絡。在大中型無人艇自組織網絡中, 為了保證網絡體系的可擴展性, 普遍采用分級式的網絡體系, 即對網絡實施分簇管理[63]。分級結構相較平面結構具有開銷小、吞吐量高、網絡易擴充等優點, 但是簇首節點相比簇成員節點負責任務多, 能量消耗大, 因此需要依賴合理的簇首選舉和簇維護機制來實現網絡的分級管理, 保證網絡的負載均衡[64], 延長網絡的生存周期。王振[65]提出了一種新算法, 在分簇過程中, 既對節點按照節點度進行了排序, 從而減少簇頭數目, 又在權重公式中加入了節點屬性這一因素, 并對權重進行了歸一化處理, 使選舉的簇頭更加合理。張艷雙[66]采用免疫算法得到一條遍歷所有簇頭節點能效比最高的最優路徑, 有效地減少了節點的能量消耗。You等[67]利用離散粒子群優化算法, 解決了無線傳感器網絡拓撲控制信息安全傳輸的問題。Basu等[68]提出通過移動節點位置的方法來增強系統信息傳輸的健壯性。Ahmadi等[69]研究了一種能使多智能體系統實現雙連通拓撲結構的方法。
上述研究成果僅可在小規模、弱干擾和低動態的條件下實現信息的安全傳輸, 針對大規模、強干擾和高動態的復雜海洋環境, 則無法適用。目前, 國際上對適應于這種環境下的安全拓撲方法的一個可能的研究方向是利用各類自動機來實現, 然而目前尚無值得關注的成果發布。
1.4.2 無人艇集群任務分解與任務分配
1) 無人艇集群任務分解。為了實現無人艇集群系統的高效運行, 必須研究如何將一個復雜的無人艇集群任務進行分解[70], 使復雜任務轉化為若干可執行的簡單原子任務。任務分解的應用領域很廣, 可大致分為分類分解方法[71]、層次規范分解方法[72]和負載平衡分解方法[73]。分類分解方法只需要提供任務的靜態信息, 通過這些信息對任務進行分類; 層次規范分解方法考慮的是系統需要完成的總體計劃, 按照這一目標逐步建立任務與子任務之間的關系; 負載平衡分解方法主要考慮的是任務執行時所需要的通信量和計算量, 在分布式環境下應用較多。
然而這些算法或是沒有充分考慮任務分解的可達性原則, 即沒有根據實際中無人艇自身的特性考慮原子任務是否可執行, 或是沒有充分考慮具體任務的執行時間和整個任務的完成時間等時序約束。同時, 大部分算法中任務分解的層次性和表現形式也沒有得到很好的體現, 對任務之間的依賴關系沒有做出具體解釋。因此, 面對復雜海況下無人艇集群任務的繁瑣多變性, 如何在充分考慮任務時序約束和無人艇自身特性條件下實現復雜任務的自適應分解仍待進一步研究。
2) 無人艇集群任務分配。無人艇集群系統的任務分配從根本上看是一種具有動態性的分配過程, 任務可能是隨機不確定增加或刪減的, 任務的時間空間具有動態不確定性, 外部的海洋環境也是動態變化的。目前, 無人艇集群系統的任務分配問題一般從集中式任務分配和分布式任務分配2個方面展開研究。
相對于集中式任務分配, 分布式任務分配算法對通信中心依賴性小, 可擴展性和魯棒性都較好。隨著現代智能理論發展, 在處理大規模的多無人系統任務分配領域出現了智能分布式分配算法, 該方法能同時平衡全系統的任務大小、難度、周期和冗余等特點需求, 實現容錯分布式任務分配, 主要有市場機理算法、群智算法和情感招募算法等。Robert等[74]提出了市場機制的任務拍賣分配方法。在Robert的基礎上, Bethauh等[75]提出任務可拆分與組合的拍賣算法, 并通過舉例的方法論證了該方法在大規模復雜任務上能得到全局最優解。
目前大部分任務分配方法只適用于任務量較少、任務關聯性較低、執行任務簡單的多智能體系統沒有較大異構性等簡單情況。然而, 復雜海況下無人艇集群系統的任務分配環節所面臨的是關聯性較強的多個任務, 同時無人艇集群系統具有能力傾向、所處場景等方面的強異構性, 已有的任務分配方法無法針對上述難點做出兼具快速性和高效性的決策要求, 將導致集群系統反應遲滯、任務分配不合理從而無法最大化發揮出集群系統整體能力等問題。因此, 如何實現無人艇集群多任務的全局最優協同分配, 使得無人艇集群能夠快速決策并最大限度地發揮各個無人艇的能力, 從而實現整體任務收益最大化的目標, 仍待進一步研究。
1.4.3 無人艇集群協同控制與行為規劃
1) 無人艇集群協同控制。2008年, Aguiar等[76]對以往的理論設計進行了更深入的分析與總結, 并在此基礎上提出了關于協同路徑跟蹤, 包含控制層和協調層兩部分的理論框架。2011年, B?rhaug等[77]提出非線性同步控制方法, 使船只在直線航行時能夠保持編隊隊形。
為了進一步尋求復雜海況下無人艇集群的協同控制方法, 除了直接針對無人艇協同控制的研究, 還可從多智能體層面尋求設計方案。以往針對無人艇集群協同控制的研究存在以下不足: 簡化了復雜海況風、浪、涌產生的強干擾, 忽略了無人艇自身大慣性、高時滯、欠驅動的運動特性與無人艇集群系統各艇之間的高耦合特性, 導致設計的協同控制策略實用性不高, 控制精度不夠; 設計的協同控制策略只能實現特定幾種小規模的編隊行駛功能, 不能實現對無人艇集群系統的智能協同控制。因此, 針對復雜海況無人艇集群大規模、高時滯、強干擾、高耦合的難點, 如何利用分布式協同控制、智能優化、狀態預測等理論來實現復雜海況無人艇集群的精準協同控制有待進一步解決。
2) 無人艇集群行為規劃。按照規劃決策的計算方法劃分, 航路規劃算法可以分為確定型算法和隨機型算法兩大類[78]。確定型路徑規劃算法主要有窮舉法、動態規劃、數學規劃、梯度法和牛頓法等。確定型算法可以保證給出問題的最優解, 但是具有較高的時間或空間復雜性, 應用于航路規劃的大范圍復雜規劃環境時, 運行時間往往過于冗長。隨機型算法通過對問題空間進行某種隨機采樣, 借助于統計推斷的方法搜索較好的可行解, 雖然不能保證獲得問題最優解, 但卻能在計算時間和求解效果上進行權衡, 以很高的概率獲得較好的可行解, 適于處理復雜的航路規劃問題。作為典型的隨機型算法, 遺傳算法在大規模航路規劃中得到了廣泛的應用并體現出解決此類問題的有效性[79-80], 其中涉及到算法實現中的路徑編碼、群體初始化、適應度函數構造以及遺傳算子設計等方面的研究。遺傳算法的不足是速度較慢, 但其隱含的并行性可以縮短搜索時間, 在實時航路規劃上具有很大的發展潛力, 尤其在處理大范圍路徑規劃問題上, 遺傳算法的性能優于等A*傳統路徑規劃算法, 可以在較短時間內給出近似最優路徑。作為隨機搜索算法, 遺傳算法具有生成不同路徑的潛力, 可以以此為基礎構造多航路規劃算法。
綜上所述, 以往研究成果大多基于靜態全局場景信息對單個無人系統進行運動規劃, 不僅缺少對實際應用中全局場景信息如何獲取的考慮, 也缺乏對場景動態變化性的考慮, 更欠缺針對多智能體系統協同運動規劃的考慮。復雜海況中存在多種障礙且場景具備極強的動態性, 并且無人艇集群系統的協同運動規劃策略必須考慮多個無人艇之間的相互影響, 因而傳統的無人系統行為規劃方法不適用于復雜海況無人艇集群的協同行為規劃研究。同時, 在無人艇回轉特性的約束下, 無人艇集群協同行為規劃還需要具備平滑柔順的特性。因此, 如何在動態復雜海況下, 實現無人艇集群高效靈活的智能柔順協同行為規劃, 有待進一步研究。
面向復雜海況下無人艇集群智能協同控制的難點和關鍵問題主要包括: 1) 如何構建抗毀的無人艇集群自組織框架, 對大規模場景感知信息凝練得到的知識進行高效傳輸, 降低無人艇集群系統的控制代價與通信代價, 以解決信息安全傳輸難的問題; 2) 如何構建高效可靠的任務分解模型, 在充分考慮無人艇集群特性和任務時序約束的條件下, 實現無人艇集群自適應任務分解, 以解決集群任務分配難的問題; 3) 如何通過構建預測模型表示無人艇集群系統動態行為, 以實現復雜海況高時滯、信息不完整、各艇之間高耦合的條件下無人艇集群智能精準控制。
無人艇集群算法在實際應用之前的實驗驗證是關鍵環節之一。目前, 國內外無人艇集群應用驗證主要包含目標識別、協同控制、航跡跟蹤等算法研究, 以及跟蹤控制器、動力系統等硬件調試。驗證方法主要包括實艇水上驗證、虛擬仿真驗證等。
1.5.1 應用驗證平臺領域知識與模型管理
面向任務的無人艇集群算法的實現涉及多種領域知識和模型, 因此要實現無人艇集群算法的高效驗證需要對這些知識和模型進行合理的調度和管理。目前針對無人艇驗證平臺知識與模型管理的研究相對較少。胡建章等[81]根據無人艇集群驗證系統的功能需求, 設計系統的整體架構, 通過子系統模塊與模型高效調用和管理, 建立具備多任務、長航時、高精度導航及較高智能化的集群系統。秦梓荷[82]對無人艇的行為決策能力進行了研究, 在仿真試驗中, 通過運動策略的調度, 實現多種航行情況及復雜任務下無人艇集群的聯合作業。
1.5.2 虛擬場景離線預驗證平臺
隨著建模技術與虛擬現實技術的快速發展, 無人艇虛擬場景離線預驗證的方法被廣泛地應用到無人艇驗證之中。根據無人艇虛擬場景離線預驗證的特點可分為無人艇特定功能仿真及應用環境仿真兩大類。無人艇特定功能仿真針對無人艇特定功能進行虛擬仿真驗證設計, 主要涉及無人艇自身運動狀態及控制決策兩大部分[83-90]。無人艇應用環境仿真就整個無人艇的應用場景進行虛擬仿真平臺的設計[91-94]。
1.5.3 真實場景實艇集群水上驗證平臺
實艇水上驗證是無人艇集群應用最有效的驗證方法, 被國內外研究者廣泛使用。實艇水上驗證主要集中在無人艇定位、跟蹤和避障等算法的驗證[95-98]。蒲華燕等[99]針對無人艇在海洋環境下實際的碰撞問題, 提出了基于橢圓碰撞錐的無人艇動態避障方法, 以“精海3 號”無人艇為實驗平臺, 在實際海域驗證了該動態避障方法的有效性。
綜上所述, 由于驗證平臺領域知識與模型的管理存在較大難度, 國內外相關研究較少, 但驗證平臺領域知識及模型的有效管理和調度對提升無人艇集群驗證效率具有重要意義。虛擬場景離線預驗證方法能有效減少海上調試工作量, 避免驗證過程中時間與資源的浪費, 同時使得無人艇的操作更加方便。但是由于模型構建的誤差, 以及虛擬引擎環境與真實世界之間的誤差, 導致預驗證離線學習平臺的輸出結果并不能真實反映算法或軟硬件的可行性。而實艇水上驗證方法雖然使得驗證的準確性與可靠性更高, 但是本身存在成本高、風險大和周期長等缺陷。此外, 當前無人艇相關的驗證平臺主要集中于單艇運動狀態及控制決策的驗證, 而涉及多艇協同編隊問題的驗證研究較少。無人艇集群在執行救援、勘探等任務時能夠極大地提升工作效率, 因此, 無人艇集群驗證平臺的研究是當前迫切的需求。
面向典型無人艇集群應用驗證平臺研究的難點和關鍵問題主要包括: 1) 如何解決為無人艇集群驗證平臺提供知識模型管理框架問題, 建立無人艇集群知識管理系統; 2) 如何建立離線預驗證環境并對預驗證物理模型進行修正, 實現預驗證與真實環境的完整統一; 3) 如何實現復雜海況下無人艇集群各類方法模型的學習, 建立復雜海況下無人艇集群應用驗證系統。
復雜海況下, 無人艇受自身運動及海洋環境影響會導致航行狀態不穩定, 獲取的數據集存在高價值目標樣本少、質量低的問題, 在海浪、雨霧等影響下存在噪聲大、易變形、局部缺失等問題。并且, 無人艇配備的視覺、雷達、聲吶等傳感器所采集到的數據模態也各不相同, 導致單一的目標識別模型難以實現在不同海況下對多尺度弱觀測目標的精確感知。真實復雜海洋場景下, 無人艇難以從海洋環境智能感知過程中提供的多源異構數據與目標識別模型庫準確理解海洋環境及目標實體, 并且從大規模的領域文本集合中高效且完備的抽取海洋目標實體屬性及實體間關系進而構建海洋目標實體屬性與關系知識圖譜也存在許多困難。此外, 復雜的海洋環境易導致無人艇感知信息存在缺失, 從而影響無人艇的場景語義理解與推理, 無法為多艇信息交互及無人艇集群控制決策提供信息支撐。因此, 如何基于不完備的觀測信息實現樣本增廣并以此為基礎實現復雜海況下無人艇對海洋環境及多尺度弱觀測目標實體的準確感知, 以及在高冗余、強噪聲、復雜多變的多源異構數據下, 如何實現單艇準確完備自主感知是未來需解決的關鍵問題。
復雜海況限制了無人艇的感知范圍和能力, 使其感知信息難以覆蓋整個運動區域以及全天候、全氣象環境。通過多艇之間的信息交互和信息融合, 有助于提升其綜合態勢的認知能力。但是, 無人艇的信息交互機制尚不明確、交互目標難以闡明, 這為多艇之間的信息交互認知帶來了挑戰。因此, 有必要研究主動交互需求產生策略, 并在認知心理學的指導下實現多艇快速、靈活信息交互和信息融合, 增強無人艇的綜合態勢認知能力。
首先, 復雜海況下風浪干擾和多徑效應導致無人艇集群拓撲結構變化劇烈, 傳統的自組織體系僅僅依靠運動模型來建立對等的拓撲結構, 在這種惡劣環境下抗毀能力較弱, 無法保障系統的信息傳輸安全。其次, 復雜海況下無人艇集群系統任務分配所面臨的是關聯性較大的多任務, 同時無人艇集群具有能力傾向、所處場景等方面的異構性, 而傳統的任務分配方法無法針對上述問題滿足兼具快速性和高效性的決策要求。最后, 無人艇自身具有大慣性、欠驅動等運動特性, 并且高海況下無人艇集群控制面臨多種復雜動靜態障礙和較大的無人艇數量。因此, 以場景語義理解為基礎, 依托交互認知機制, 實現無人艇集群智能協同決策與控制是未來需解決的問題之一。
復雜海況下無人艇集群控制是提高無人艇工作效率、完成復雜艱難任務的有效手段。文中對近年來國內外有關復雜海況無人艇集群控制的關鍵問題進行了論述, 闡述了復雜海況下海洋環境智能感知方法、單艇準確完備自主感知機理、多艇實時交互認知機制、無人艇集群智能協同控制決策方法以及無人艇集群應用平臺驗證問題的研究現狀, 提出了關鍵技術和難點問題。同時歸納出了復雜海況無人艇集群控制亟待解決的問題, 指出針對復雜海況無人艇集群的協同控制與優化決策, 單艇自主完備感知、多艇快速靈活交互認知、實時高效集群協同是未來的研究方向。相信隨著控制、通信、數據融合等技術的交融發展, 復雜海況無人艇集群控制技術必將得到更深遠的發展。
[1] Larson J, Bruch M, Halterman R, et al. Advances in Autonomous Obstacle Avoidance for Unmanned Surface Vehicles[J]. Association for Unmanned Vehicle Systems International-Unmanned Systems North America Conference, 2007, 1: 484-498.
[2] 田明輝, 萬壽紅, 岳麗華. 遙感圖像中復雜海面背景下的海上艦船檢測[J]. 小型微型計算機系統, 2008, 29(11): 2162-2166.Tian Ming-hui, Wan Shou-hong, Yue Li-hua. Ship Detection in Remote Sensing Images with Complex Sea Surface Background[J]. Journal of Chinese Computer Systems, 2008, 29(11): 2162-2166.
[3] Mabel M Z, Jean C, Kostas D, et al. VAIS: A Dataset for Recognizing Maritime Imagery in the Visible and Infrared Spectrums[C]//The IEEE Conference on Computer Vision and Pattern Recognition Workshops. Boston, MA, USA: IEEE, 2015.
[4] Matej K, Vildana S K, Sulic K, et al. Fast Image-Based Obstacle Detection From Unmanned Surface Vehicles[J]. IEEE Transactions on Cybernetics, 2016, 46(3): 641-654.
[5] Ricardo R, Goncalo C, Jorge M, et al. A Dataset for Airborne Maritime Surveillance Environments[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2017, 29(9): 2720-2732.
[6] Dilip K P, Deepu R, Lily R, et al. Video Processing from Electro-optical Sensors for Object Detection and Tracking in Maritime Environment: A Survey[J]. IEEE Transactions on Intelligent Transportation Systems, 2017, 18(8): 1997- 2016.
[7] Perez L, Wang J. The Effectiveness of Data Augmentation in Image Classification Using Deep Learning[EB/OL]. arXiv, (2017-12-13)[2020-08-25]. https://arxiv.org/abs/1712.04621v1.
[8] Cubuk E D, Zoph B, Mane D, et al. AutoAugment: Learning Augmentation Policies from Data[EB/OL]. arXiv, (2019-04-11)[2020-08-25]. http://export.arxiv.org/ abs/1805.09501v3.
[9] Song R, Liu Y, Ralph R M, et al. Mesh Saliency via Spectral Processing[J]. ACM Transactions on Graphics, 2014, 33(1): 6.1-6.17.
[10] Song R, Liu Y, Ralph R M, et al. Saliency-Guided Integration of Multiple Scans[C]//IEEE International Conference on Computer Vision and Pattern Recognition (CVPR), Providence, RI, USA: IEEE, 2012.
[11] Schreck C, Hafner C, Wojtan C. Fundamental Solutions for Water Wave Animation[J]. ACM Transactions on Graphics, 2019, 38(4): 130.1-130.14.
[12] Goodfellow I J, Pouget-Abadie J, Mirza M, et al. Generative Adversarial Nets[J]. arXiv, (2014-06-10)[2020-08-25]. http://www.andrew.cmu.edu/user/rmorina/papers/GANs.pdf.
[13] Kingma D P, Welling M. Auto-encoding Variational Bayes[J]. arXiv, (2014-05-01)[2020-08-25]. https://arxiv. org/abs/1312.6114.
[14] Makhzani A, Shlens J, Jaitly N, et al. Adversarial Autoencoders[J]. arXiv, (2016-05-25)[2020-08-25]. https://arxiv.org/abs /1511.05644.
[15] Zhu J, Taesung P, Phillip I, et al. Unpaired Image- to-Image Translation Using Cycle-Consistent Adversarial Networks[C]//The IEEE International Conference on Com- puter Vision. Venice, Italy: IEEE, 2017: 2223-2232.
[16] Ledig C, Theis L, Huszar F, et al. Photo-realistic Single Image Super-Resolution Using a Generative Adversarial Network[J]. arXiv, (2017-05-25)[2020-08-25]. https:// arxiv.org/abs/1609.04802.
[17] Schwind P, Suri S, Reinartz P, et al. Applicability of the SIFT Operator to Geometric SAR Image Registration[J]. International Journal of Remote Sensing, 2010, 31(8): 1959-1980.
[18] Wang S, Quan D, Liang X, et al. A Deep Learning Framework for Remote Sensing Image Registration[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2018, 145(A): 148-164.
[19] Pastina D, Lombardo P, Farina A, et al. Super-resolution of Polarimetric SAR Images of Ship Targets[J]. Signal Processing, 2013, 83(8): 1737-1748.
[20] Teutsch M, Kruger W. Classification of Small Boats in Infrared Images for Maritime Surveillance[C]//2010 International WaterSide Security Conference. Carrara, Italy: IEEE, 2010: 1-7.
[21] Wessman M. Object Detection Using LIDAR in Maritime Scenarios[D]. Finland: ?bo Akademi University, 2018.
[22] Lin T, Dollár P, Girshick R, et al. Feature pyramid networks for object detection[C]//The IEEE Conference on Computer Vision and Pattern Recognition, Hawaii, USA: IEEE, 2017: 2117-2125.
[23] Yang S, Deva R. Multi-scale Recognition with DAG- CNNs[C]//The IEEE International Conference on Computer Vision. Santiago, Chile: IEEE, 2015: 1215-1223.
[24] Chen L, Yang Y, Wang J, et al. Attention to Scale: Scale-Aware Semantic Image Segmentation[C]//The IEEE Conference on Computer Vision And Pattern Recognition, Las Vegas, NV, USA: IEEE, 2016: 3640-3649.
[25] Zhang G, Lu S, Zhang W. CAD-Net: A Context-Aware Detection Network for Objects in Remote Sensing Imagery[J]. IEEE Transactions On Geoscience and Remote Sensing, 2019, 57(12): 10015-10024.
[26] Bloisi D D, Iocchi L, Fiorini M, et al. Camera Based Target Recognition for Maritime Awareness[C]//15th International Conference on Information Fusion. Singapore, Singapore: IEEE, 2012: 1982-1987.
[27] Luan Y, Wadden D, He L, et al. A General Framework for Information Extraction Using Dynamic Span Graphs[C]// Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Minneapolis, Minnesota: NAACL, 2019.
[28] 鄭家恒, 王興義, 李飛. 信息抽取模式自動生成方法的研究[J]. 中文信息學報, 2004, 18(1): 49-55.Zheng Jia-heng, Wang Xing-yi, Li Fei. Research on Automatic Generation of Extraction Patterns[J]. Journal of Chinese Information Processing, 2004, 18(1): 49-55.
[29] Pingle A, Piplai A, Mittal S, et al. RelExt: Relation Extraction Using Deep Learning Approaches for Cybersecurity Knowledge Graph Improvement[J]. arXiv, (2019- 05-16)[2020-08-25]. https://arxiv.org/abs/1905.02497?co- ntext=cs.AI.
[30] Bordes A, Usunier N, Garcia-Duran A, et al. Translating Embeddings for Modeling Multi-Relational Data[C]//Proc of NIPS. Cambridge, MA: MIT Press, 2013: 2787-2795.
[31] Lin Y, Liu Z, Sun M, et al. Learning Entity and Relation Embedding for Knowledge Graph Completion[C]//Proc of AAAI. Menlo Park, CA: AAAI, 2015.
[32] Ji G, He S, Xu L, et al. Knowledge Graph Embedding Via Dynamic Mapping Matrix[C]//Pro. of ACL. Stroudsburg, PA: ACL, 2015: 687-696.
[33] Hu Z, Huang P, Deng Y, et al. Entity hierarchy embedding[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing. Beijing, China: ACL, 2015.
[34] Nickel M, Volker T, Kriegel H P. A Three-Way Model for Collective Learning on Multi-Relational Data[C]//Pro- ceedings of the 28th International Conference on International Conference on Machine Learning. Washington, USA: ICML, 2011.
[35] Chang K W, Yih W, Yang B, et al. Typed Tensor Decomposition of Knowledge Bases for Relation Extraction[C]// Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Doha, Qatar: EMNLP, 2014.
[36] He W, Feng Y, Zou L, et al. Knowledge Base Completion Using Matrix Factorization[C]//Asia-Pacific Web Confe- rence. Guangzhou, China: APWeb, 2015.
[37] Xiao H, Huang M, Hao Y, et al. TransG: A Generative Mixture Model for Knowledge Graph Embedding[J]. arXiv, (2017-09-08)[2020-08-25]. https://arxiv.org/abs/ 1509.05488.
[38] He S, Liu K, Ji G, et al. Learning to Represent Knowledge Graphs with Gaussian Embedding[C]//Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. Melbourne, Australia: ACM, 2015.
[39] 巴宏欣, 趙宗貴, 楊飛. 態勢估計——概念、內容與方法[J]. 解放軍理工大學學報, 2004, 5(6): 10-16. Ba Hong-xin, Zhao Zong-gui, Yang Fei. Concepts, Contents and Methods of Situation Assessment[J]. Journal of PLA University of Science and Technology(Natural Science Edition), 2004, 5(6): 10-16.
[40] 趙宗貴, 李君靈, 王珂. 戰場態勢估計概念、結構與效能[J]. 中國電子科學研究院學報, 2010, 5(3): 226-230.Zhao Zong-Gui, Li Jun-Ling, Wang Ke. The Concept, Structure and Efficiency of Battlefield Situation Assessment[J]. Journal of China Academy of Electronics and Information Technology, 2010, 5(3): 226-230.
[41] 邵勇, 馬豐文. 戰場態勢評估關鍵技術綜述[C]//2007系統仿真技術及其應用學術會議, 珠海, 中國: 中國系統仿真學會, 2007: 913-915.
[42] Wen H, Song J. Using Big Data to Enhance the Capability of the Situational Awareness of Battlefield[C]//Proceed- ings of 2018 Chinese Intelligent Systems Conference. Singapore, Singapore: Springer, 2019: 311-318.
[43] Noreils F R. Toward a Robot Architecture Integrating Cooperation Between Mobile Robots: Application to Indoor Environment[J]. Int. J. Robot. Res., 1993, 12(1): 79-98.
[44] Luo C, Yang S X, Li X, et al. Neural-Dynamics-Driven Complete Area Coverage Navigation Through Cooperation of Multiple Mobile Robots[J]. IEEE Trans. Ind. Electron., 2017, 64(1): 750-760.
[45] Saska M, Vonásek V, Krajník T, et al. Coordination and Navigation of Heterogeneous MAV–UGV Formations Localized by a “Hawk-Eye”-Like Approach Under a Model Predictive Control Scheme[J]. Int. J. Robot. Res., 2014, 33(10): 1393-1412.
[46] Wu M H, Ogawa S, Konno A. Symmetry Position/Force Hybrid Control for Cooperative Object Transportation Using Multiple Humanoid Robots[J]. Adv. Robot., 2016, 30(2): 131-149.
[47] 王越超, 談大龍, 黃閃, 等. 一個多智能體機器人協作裝配系統[J]. 高技術通訊, 1998, 8(7): 6-10. Wang Yue-chao, Tan Da-long, Huang Shan, et al. A Multi-agent Robot Cooperative Assembly System[J]. Chinese High Technology Letters, 1998, 8(7): 6-10.
[48] Andre T, Bettstetter C. Collaboration in Multi-robot Exploration: to Meet or Not to Meet?[J]. J. Intell. Robot. Syst., 2016, 82(2): 325-337.
[49] Paliotta C, Belleter D J, Pettersen K Y. Adaptive Source Seeking with Leader-Follower Formation Control[J]. IFAC-Pap., 2015, 48(16): 285-290.
[50] Tolba S, Ammar R. Virtual Tether Search: A Self-Constraining Search Algorithm for Swarms in an Open Ocean[C]//2017 IEEE Symposium on Computers and Communications(ISCC). Heraklion, Greece: IEEE, 2017: 1128-1135.
[51] Matignon L, Jeanpierre L, Mouaddib A I. Coordinated Multi-Robot Exploration Under Communication Constraints Using Decentralized Markov Decision Processes[C]//Proceed- ing of the Twenty-sixth AAAI Conference on Artificial Intelligence. Toronto, Ontario, Canada: AAAI, 2012.
[52] Qin J, Li M, Shi Y, et al. Optimal Synchronization Control of Multiagent Systems with Input Saturation via Off-Policy Reinforcement Learning[J]. IEEE Trans. Neural Netw. Learn. Syst., 2018, 30(1): 85-96.
[53] Wang S, Huang J. Adaptive Leader-Following Consensus for Multiple Euler–Lagrange Systems with an Uncertain Leader System[J]. IEEE Trans. Neural Netw. Learn. Syst., 2019, 30(7): 2188-2196.
[54] Mavrovouniotis M, Li C, Yang S. A Survey of Swarm Intelligence for Dynamic Optimization: Algorithms and Applications[J]. Swarm Evol. Comput., 2017, 33: 1-17.
[55] Hinzmann T, Stastny T, Conte G, et al. Collaborative 3D Reconstruction Using Heterogeneous UAVs: System and Experiments[C]//2016 International Symposium on Experimental Robotics.Tokyo, Japan: Springer, 2017: 43-56.
[56] Martins A, Dias A, Almeida J. Field Experiments for Marine Casualty Detection with Autonomous Surface Vehicles[C]//2013 OCEANS-San Diego. San Diego, CA, USA: IEEE, 2013: 1-5.
[57] Sullivan A, York A M, An L, et al. How Does Perception at Multiple Levels Influence Collective Action in The Commons? The Case of Mikania Micrantha in Chitwan, Nepal[J]. Forest Policy and Economics, 2017, 80: 1-10.
[58] Hussain Qureshi A, Ayaz Y. Intelligent Bidirectional Rapidly-Exploring Random Trees for Optimal Motion Planning in Complex Cluttered Environments[J]. Robotics and Autonomous Systems, 2015, 68: 1-11.
[59] Hinostroza M A, Xu H, Guedes Soares C. Cooperative Operation of Autonomous Surface Vehicles for Maintaining Formation in Complex Marine Environment[J]. Ocean Eng., 2019, 183: 132-154.
[60] Zhang Z, Cui P, Zhu W. Deep Learning on Graphs: A Survey[J/OL]. IEEE Transactions on Knowledge and Data Engineering, (2018-03-17)[2020-08-25]. https://ieeexplo- re.ieee.org/document/9039675.
[61] Yao T, Pan Y, Li Y, et al. Exploring Visual Relationship for Image Captioning[C]//Proceedings of 15th European Conference. Munich, Germany: Springer, 2018.
[62] Neamatollahi P, Abrishami S, Naghibzadeh M, et al. Hierarchical Clustering-Task Scheduling Policy in Cluster-Based Wireless Sensor Networks[J]. IEEE Transactions on Industrial Informatics, 2018, 14(5): 1876-1886.
[63] 張鵬, 崔勇. 移動自組織網絡路由選擇算法研究進展[J]. 計算機科學, 2010, 37(1): 10-22, 38. Zhang Peng, Cui Yong. Survey on Routing Algorithms of Mobile Ad Hoc Networks[J]. Computer Science, 2010, 37(1): 10-22, 38.
[64] Yang W. Research on Ad Hoc Clustering Algorithm[J]. Com- puter Engineering & Applications, 2010, 46(21): 111-115.
[65] 王振. 無線自組織網絡自適應算法研究[D]. 北京: 北京郵電大學, 2019.
[66] 張艷雙. 基于免疫算法的無線傳感器網絡路由算法的研究[D]. 哈爾濱: 哈爾濱工程大學, 2009.
[67] You B, Chen G, Guo W. A Discrete PSO-based Fault- Tolerant Topology Control Scheme in Wireless Sensor Networks[C]//Proceedings of 5th International Symposium. Wuhan, China: Springer, 2010: 1-12.
[68] Basu P, Redi J. Movement Control Algorithms for Realization of Fault-Tolerant Ad Hoc Robot Networks[J]. IEEE Network, 2004, 18(4): 36-44.
[69] Ahmadi M, Stone P. Keeping in Touch: Maintaining Biconnected Structure by Homogeneous Robots[C]//Pro- ceedings of the National Conference on Artificial Intelligence. Boston, Massachusetts: USA, 2006.
[70] 馬巧云. 基于多系統的動態任務分配研究[D]. 武漢: 華中科技大學, 2006
[71] 張榮國, 劉靜, 張繼福, 等. 產品并行設計多Agent系統中任務分解和協調模型的研究[J]. 太原重型機械學院學報, 2002, 23(2): 166-170. Zhang Rong-guo, Liu Jing, Zhang Ji-fu, et al. Study on Task Decomposition and Coordination Modeling in Product Concurrent Design Based on Multi-Agent System[J]. Journal of Taiyuan Heavy Machinery Institute, 2002, 23(2): 166-170.
[72] 龔卓君. 衛星應用任務分解技術研究[D]. 長沙: 國防科學技術大學, 2009.
[73] 宋言偉. 基于網絡節點上下文的任務分解和調度方法研究[D]. 濟南: 山東大學, 2012.
[74] Robert Z, Tony S A, Bernardine D M, et al. Multi-robot Exploration Controlled by a Market Economy[C]//Pro- ceedings of the IEEE International Conference on Robotica and Automation. Piscataway, USA: IEEE, 2002: 3016- 3023.
[75] Bethauh M, Huang H, Keskinecad P. Robot Exploration with Combinatorial Auctions[C]//Proceedings of IEEE/ RSJ International Conference on Soft Computing for Problem Solving. Las Vegas, Nevada, USA: IEEE, 2003: 1957-1962.
[76] Aguiar A P, Kaminer I, Ghabcheloo R, et al. Coordinated Path Following of Multiple UAVs for Time-Critical Missions in the Presence of Time-Varying Communication Topologies[J]. IFAC Proceedings Volumes, 2008, 41(2): 16015-16020.
[77] B?rhaug E, Pavlov A, Panteley E, et al. Straight Line Path Following for Formations of Underactuated Marine Surface Vessels[J]. IEEE Transactions on Control Systems Technology, 2011, 19 (3): 493-506.
[78] Li D, Li Q, Cheng N, et al. Sampling-Based Real-Time Motion Planning under State Uncertainty for Autonomous Micro-Aerial Vehicles in GPS-Denied Environments[J]. Sensors, 2014, 14(11): 21791-21825.
[79] 李明. 基于改進遺傳算法的移動機器人路徑規劃研究[D]. 蕪湖: 安徽工程大學, 2017.
[80] Nikolos I K, Valavanis K P, Tsourveloudis N C, et al. Evolutionary Algorithm Based Offline/Online Path Planner for UAV Navigation[J]. IEEE Transactions on Systems, Man, and Cybernetics-Part B: Cybernetics, 2003, 33(6): 898-912.
[81] 胡建章, 唐國元, 王建軍, 等. 水面無人艇集群系統研究[J]. 艦船科學技術, 2019, 41(7): 83-88.Hu Jian-zhang, Tang Guo-yuan, Wang Jian-jun, et al. Research on Unmanned Surface Vehicle Cluster System[J]. Ship Science and Technology, 2019, 41(7): 83-88.
[82] 秦梓荷. 水面無人艇運動控制及集群協調規劃方法研究[D]. 哈爾濱: 哈爾濱工程大學, 2018.
[83] Breivik M, Hovstein V E, Fossen T I. Straight-line Target Tracking for Unmanned Surface Vehicles[J]. Modeling, Identification and control, 2008, 29(4): 13l-149.
[84] Kjerstad K, Breivik M. Weather Optimal Positioning Control For Marine Surface Vessels[J]. IFAC Conference on Control Applications in Marine Systems, 2010, 43(20): 114-119.
[85] Breivik M, Strand J P, Fossen T I. Guided Dynamic Positioning For Fully Actuated Marine Surface Vessels[C]// Proceedings of the 7th IFAC MCMC.Lisbon, Portugal: Elsevier, 2006: 1-6.
[86] Breivik M, Fossen T I. Guidance Laws for Planar Motion Control[J]. IEEE Conference on Decision and Control, 2008, 16(5): 570-577.
[87] Breivik M, Nonlinear Maneuvering Control of Underactuated Ships[D]. Trondheim: Norwegian University of Science and Technology, 2003: 75-79.
[88] 于海軍. 基于抗傾覆性與浮態恢復性無人艇仿真研究[D]. 哈爾濱: 哈爾濱工程大學, 2012.
[89] Larrazabal J M, Penas M S.Intelligent Rudder Control of an Unmanned Surface Vessel[J].Expert Systems with Applications, 2016, 55: 106-117.
[90] 吳恭興. 水面智能高速無人艇的控制與仿真[D]. 哈爾濱: 哈爾濱工程大學, 2008.
[91] 劉鵬. 基于Vega Prime的無人艇運動控制視景仿真[D]. 大連: 大連海事大學, 2018.
[92] 王卓, 馮曉寧, 萬磊, 等. 水面無人艇協同仿真平臺設計方法[J]. 哈爾濱工程大學學報, 2012, 33(3):275-282. Wang Zhuo, Feng Xiao-ning, Wan Lei, et al. Research on the Platform Design Method of a USV Collaborative Simulation[J]. Journal of Harbin Engineering University, 2012, 33(3):275-282.
[93] 伍文暉. 水面無人艇試驗平臺設計[D]. 大連: 大連海事大學, 2013.
[94] 胡辛明, 張鑫, 鐘雨軒, 等. 無人水面艇仿真系統設計與實現[J]. 上海大學學報(自然科學版), 2017, 23(1): 56-67.Hu Xin-ming, Zhang Xin, Zhong Yu-xuan, et al. Design and Implementation of USV Simulation System[J]. Journal of Shanghai University(Natural Science Edition), 2017, 23(1): 56-67.
[95] 徐博, 肖永平, 高偉, 等. 主從式無人水面艇協同定位濾波方法與實驗驗證[J]. 兵工學報, 2014, 35(11): 1836-1845. Xu Bo, Xiao Yong-ping, Gao Wei, et al. A Cooperative Navigation Approach and Its Verification of USVs with Leader-fellower Structure[J]. Acta Armamentarii, 2014, 35(11): 1836-1845.
[96] 范云生, 李長飛, 王國峰, 等. 無人水面艇航向跟蹤控制器的設計與驗證[J]. 大連海事大學學報, 2017, 43(1): 1-7. Fan Yun-sheng, Li Chang-fei, Wang Guo-feng, et al. Design and Validation of Course Tracking Controller for Unmanned Surface Vehicle[J]. Journal of Dalian Maritime University, 2017, 43(1): 1-7.
[97] 文元橋, 楊吉, 王亞周, 等. 無人艇自適應路徑跟蹤控制器的設計與驗證[J]. 哈爾濱工程大學學報, 2019, 40(3): 482-488. Wen Yuan-qiao, Yang Ji, Wang Ya-zhou, et al. Design and Validation of Adaptive Path Following Controller for USV[J]. Journal of Harbin Engineering University, 2019, 40(3): 482-488.
[98] Shin J, Kwak D J, Lee Y I. Adaptive Path Following Control for an Unmanned Surface Vessel Using an Identified Dynamic Model[J]. IEEE/ASME Transactions on Mechatronics, 2017, 22(3): 1143-1153.
[99] 蒲華燕, 丁峰, 李小毛, 等. 基于橢圓碰撞錐的無人艇動態避障方法[J]. 儀器儀表學報, 2017, 38(7): 1756-1762. Pu Hua-yan, Ding Feng, Li Xiao-mao, et al. Maritime Autonomous Obstacle Avoidance in a Dynamic Environment Based on Collision Cone of Ellipse[J]. Chinese Journal of Scientific Instrument, 2017, 38(7):1756-1762.
Current Development of Control Technology for Unmanned Surface Vessel Clusters under Complex Sea Conditions
XIE Shao-rong1,2, LIU Jian-jian1, ZHANG Dan1
(1. School of Mechatronic Engineering and Automation, Shanghai University, Shanghai 200444, China; 2. School of Computer Engineering and Science, Shanghai University, Shanghai 200444, China)
As highly autonomous systems, unmanned surface vessels (USVs) are a reliable means of improving working efficiency on water in such areas as hydrology research, scientific exploration, hydrographic surveys, emergency search and rescue, and security patrol. Advancements in exchange information and collaborative decision-making have enabled the development of USV cluster systems. These systems can obtain more complete perception information and have a high execution efficiency and greater operating range, which considerably enhance the capabilities of USVs to complete tasks autonomously. However, because of complex and changeable marine environmental factors such as wind, waves, and sea currents, collaborative control and optimization decision-making of USV cluster systems face challenges related to single USV autonomous and complete perception mechanism, rapid and flexible interactive cognition of multiple USVs, and real-time efficient cluster collaboration. This study summarizes the latest developments of USV cluster systems in the following four respects: 1) the single USV complete autonomous perception mechanism, 2) the multiple-USV real-time interactive cognition mechanism, 3) the intelligent collaborative control decision methodology, and 4) the USV verification platform. Finally, problems that remain to be addressed as well as future research directions in the field are also briefly discussed. Single USV autonomous and complete perception, rapid and flexible interactive cognition among multiple USVs, and real-time efficient cluster collaboration are the research directions of cluster control technology.
unmanned surface vessel cluster; cooperative control; optimization decision-making
謝少榮, 劉堅堅, 張丹. 復雜海況無人艇集群控制技術研究現狀與發展[J]. 水下無人系統學報, 2020, 28(6): 584-596.
TJ630; U664.82; TP273.2
A
2096-3920(2020)06-0584-13
10.11993/j.issn.2096-3920.2020.06.001
2020-09-27;
2020-11-23.
國家自然科學基金重大項目(61991410).
謝少榮(1972-), 女, 教授, 博導, 長期從事先進的機器人技術、眼球運動的仿生控制機制和圖像監控系統研究.
(責任編輯: 陳 曦)