馬 捷,李 雅
(1. 海軍裝備部,北京 100071;2.中國電子科技集團公司第五十四研究所,河北 石家莊 050081)
隨著無人機(Unmanned Aerial Vehicle,UAV)技術的不斷發(fā)展,UAV將成為未來戰(zhàn)場上的重要作戰(zhàn)裝備,將在戰(zhàn)爭中發(fā)揮越來越突出的作用。目前UAV系統(tǒng)的智能水平和自主能力還比較低,對操作員的指控依賴強,鏈路中斷后任務執(zhí)行能力有限;對衛(wèi)星導航依賴強,衛(wèi)星拒止條件下導航能力有限;不能有效處理各種突發(fā)威脅,生存能力有限;無法根據(jù)需要對時敏目標進行實時定位、跟蹤和打擊。因此現(xiàn)階段UAV系統(tǒng)無法滿足高動態(tài)對抗環(huán)境下的作戰(zhàn)運用需求。
當前,人工智能技術日益成為國際戰(zhàn)略競爭的新焦點,并成為推動新一輪科技革命和軍事變革的重要力量,使未來作戰(zhàn)朝著智能化方向發(fā)展。UAV系統(tǒng)作為未來戰(zhàn)場的重要作戰(zhàn)力量,為適應這一變化,必須加快人工智能技術與UAV系統(tǒng)的深度融合,實現(xiàn)UAV的自主控制,從而提升UAV在復雜對抗環(huán)境下的任務效能和生存能力。人工智能技術與UAV的深度融合是UAV系統(tǒng)的重要發(fā)展趨勢,也是UAV向集群化、智能化、跨域化發(fā)展的內在要求。
以美國為首的世界軍事強國非常重視無人裝備的智能化發(fā)展,在國家頂層戰(zhàn)略層面堅決推進人工智能軍事化應用[1]。在人工智能應用于UAV系統(tǒng)方面更是啟動了一系列項目,經過多年努力,取得了諸多成果。
(1)DARPA “空戰(zhàn)演進”項目
DARPA“空戰(zhàn)演進”項目完成首次人工智能虛擬二對一混戰(zhàn)。“空戰(zhàn)演進”項目旨在攻克人機協(xié)同空中格斗難題,為空戰(zhàn)開發(fā)可信任、可擴展、人類水平、人工智能驅動的自主系統(tǒng)。2021年2月,“空戰(zhàn)演進”項目算法開發(fā)團隊使用2架藍隊F-16戰(zhàn)斗機與1架紅隊戰(zhàn)斗機,演示了人工智能二對一虛擬交戰(zhàn)。這標志著“阿爾法空中格斗”試驗后首次人工智能虛擬混戰(zhàn)成功完成[2]。
(2)DARPA“拒止環(huán)境協(xié)同作戰(zhàn)”項目
CODE項目通過開發(fā)先進人工智能算法和模塊化軟件架構,探索分布式作戰(zhàn)中UAV的自主和協(xié)同技術,提升美UAV系統(tǒng)在拒止環(huán)境或復雜電磁環(huán)境下的高效協(xié)同交互能力,以實現(xiàn)無人機集群能夠在GPS拒止環(huán)境下執(zhí)行作戰(zhàn)任務[3]。
美軍已經針對CODE軟件開展了多次測試,早在2019年2月就對CODE項目所研究的拒止環(huán)境中協(xié)同作戰(zhàn)技術進行了演示驗證。由裝備CODE軟件的6架RQ-23UAV與14架虛擬UAV在無法使用GPS的情況下,應對虛擬目標與威脅等,成功采取對策完成了目標任務。2022年1月,作為“拒止環(huán)境協(xié)同作戰(zhàn)”項目的一部分,美國通用原子公司(General Atomics)對1架MQ-20復仇者真機與5架硬件在環(huán)虛擬機的協(xié)同搜索任務進行測試。該現(xiàn)實-虛擬編隊利用虛擬紅外搜索和跟蹤傳感器網絡進行探測,當虛擬敵方進入指定的搜索區(qū)域,編隊將利用人工智能算法決定哪架飛機自動脫離編隊并執(zhí)行空對空戰(zhàn)術[4]。
CODE人工智能軟件與自主算法等的結合在提升針對空對空目標的大型UAV平臺的人工智能處理能力水平的同時,也提升了UAV集群在GPS拒止環(huán)境下的通信與導航能力,將推動UAV向更復雜的自主能力方向發(fā)展。
(3)美空軍“天空博格人”項目
天空博格(Skyborg)項目由美國空軍研究實驗室(AFRL)主導,旨在通過開發(fā)一套軟硬件系統(tǒng),充當UAV大腦,實現(xiàn)基于人工智能的輔助決策、自主駕駛等核心功能,最終部署在有人機或UAV上,實現(xiàn)虛擬副駕駛和自主無人作戰(zhàn)能力,以構建有人-無人協(xié)同或者UAV集群作戰(zhàn)能力,其核心軟件“自主核心系統(tǒng)”能支持UAV完全自主和聯(lián)網環(huán)境中運行,包括進行自主飛行、導航和通信[5]。
2021年4月29日,美國空軍“天空博格人”項目團隊使用UTAP-22“鯖鯊”UAV搭載其“自主核心系統(tǒng)”(ACS),進行了歷時2 h 10 min的飛行試驗。5月5日,配備“自主核心系統(tǒng)”的UTAP-22UAV由F-16C戰(zhàn)斗機陪同再次進行試飛,后續(xù)美國空軍還將開展一系列飛行試驗,展示載人飛機和多架“自主核心系統(tǒng)”控制的UAV之間的有人-無人協(xié)同能力[6]。2023年7月,作為“天空博格人”項目的一部分,“女武神”UAV在AI軟件操控下完成了多個空對空和空對地任務,飛行過程歷時3 h,這是AI軟件首次在真實環(huán)境中駕駛“女武神”無人機,標志著AI代替駕駛員執(zhí)行現(xiàn)代空對空和空對地任務成為可能[5]。
(4)美空軍“協(xié)同作戰(zhàn)飛機”項目
2022年5月美空軍首次對外公開“協(xié)同作戰(zhàn)飛機”(CCA)計劃,該計劃是該軍種規(guī)模更大的下一代空中優(yōu)勢(NGAD)計劃的組成部分。該項目將在“天空博格人”計劃基礎上推進,旨在實現(xiàn)利用人工智能技術自主操控忠誠僚機,以獲得具有重大自主能力的先進UAV,實現(xiàn)UAV與F-35戰(zhàn)機、未來的NGAD戰(zhàn)機編隊作戰(zhàn),緊密合作。美空軍宣布將至少采購100架CCA,與 NGAD以及F-35A聯(lián)合攻擊戰(zhàn)斗機配對,每架有人作戰(zhàn)飛機將配置2架CCA作為武器庫、傳感器節(jié)點和電子戰(zhàn)平臺等,以增強載人戰(zhàn)術戰(zhàn)斗機的能力[7]。
在國內,UAV與人工智能結合的算法已經在UAV控制領域得到了應用。其中,UAV路徑規(guī)劃是一個重要的應用領域,利用人工智能算法對UAV的路徑進行智能優(yōu)化,使其能夠在復雜的環(huán)境中高效地完成任務。例如,在農業(yè)領域,UAV可以通過人工智能算法確定最佳飛行路徑,實現(xiàn)精準的農藥噴灑和作物監(jiān)測。人工智能算法可以用于對UAV群的編隊控制,提高UAV群編隊的飛行效率和任務執(zhí)行能力。另外,人工智能算法可以根據(jù)環(huán)境和任務需求,幫助UAV自主決策,提高UAV的任務執(zhí)行效率。
目前,國內針對UAV與人工智能算法結合的算法大體可以劃分為群體智能和人工智能算法。
(1)群體智能
群體智能算法是一類模擬自然界群體行為的算法,如粒子群優(yōu)化(PSO)算法、蟻群(ACO)算法、遺傳算法(GA)。這些算法通過模擬群體中個體之間的相互作用和信息交流,實現(xiàn)群體之間的協(xié)同優(yōu)化。在UAV群體中,每個UAV可以看作一個個體,它們通過通信網絡進行信息交流和協(xié)作。群體智能算法可以有效解決UAV群的路徑規(guī)劃、任務分配和資源優(yōu)化等問題。
國內學者對于群體智能算法的研究,在很大程度上是在國外研究的基礎上進行擴展和深化的,對算法進行創(chuàng)新和優(yōu)化。例如,文獻[8]針對傳統(tǒng)粒子群算法全局搜索能力差,容易陷入局部最優(yōu)的問題,提出了一種新的動態(tài)簇粒子群優(yōu)化(DCPSO),在保留PSO算法原有優(yōu)勢的基礎上,對其全局搜索能力和魯棒性進行了進一步優(yōu)化。文獻[9]針對傳統(tǒng)鴿群算法中存在重復搜索、目標靜止等搜索效率低的問題,在鴿群優(yōu)化算法模型的基礎上,引入柯西因子、高斯因子和模擬退火(SA)機制,結果表明新型算法能夠有效避免傳統(tǒng)鴿群中的缺陷,避免算法陷入局部最優(yōu),由此顯著提升了鴿群算法的準確性和有效性。
(2)人工智能算法
過去UAV群的控制往往依賴于人工設定的規(guī)則和指令,無法適應復雜多變的環(huán)境,人工智能算法的出現(xiàn)為UAV自主控制提供了新的解決方案。通過使用機器學習、深度學習等人工智能算法,UAV可以從大量的數(shù)據(jù)中學習和優(yōu)化自身的行為,逐漸形成適應性更強的控制策略,能夠在復雜的環(huán)境中具備更高的自主性。
國內研究中,人工智能算法主要應用于UAV的自主導航與路徑規(guī)劃、自主協(xié)同決策等方面。例如,在自主導航與規(guī)劃方面,文獻[10]針對UAV集群協(xié)同控制問題,基于深度強化學習構建了UAV集群體智能自主協(xié)同控制策略,并基于固定規(guī)則涉及UAV防撞策略,能夠自主避免UAV之間發(fā)生碰撞,同時實現(xiàn)了單步運行耗時小于2 ms的運行效率。文獻[11]提出了一種基于多智能體強化學習(MARL)的路徑規(guī)劃救援方案,將UAV團隊與環(huán)境交互的問題轉換為部分可觀的馬爾可夫決策過程,并基于DDQN 算法優(yōu)化UAV團隊的飛行路徑,有效解決了UAV群在不確定環(huán)境下的搜救問題。
在自主協(xié)同與決策方面,文獻[12]針對多UAV協(xié)同目標分配最優(yōu)問題,提出了一種AC-DSDE 混合雙策略差分進化算法,根據(jù)不同類型的個體選用不同的變異策略,同時構建動態(tài)縮放因子,解決了目前進化過程中存在的探索性和開發(fā)性平衡的問題。文獻[13]針對戰(zhàn)場環(huán)境部分已知、突然出現(xiàn)動態(tài)威脅情況下的多UAV任務分配與航跡規(guī)劃問題,采用“預規(guī)劃—在線軌跡跟蹤”的模式,預先規(guī)劃出多無人機飛行的參考航跡,然后采用DMPC-PSO進行航機規(guī)劃,使多UAV可以有效避開突發(fā)的威脅和已知的威脅。文獻[14]針對UAV群體間的攻防對抗問題,提出了基于執(zhí)行-評判(Actor-Critic)算法的集中式評判和分布式執(zhí)行的算法結構,實現(xiàn)了多UAV的穩(wěn)定自主學習、不斷演化的能力。文獻[15]構建了基于深度確定性策略梯度網絡(DDPG)算法,解決了強化學習的稀疏回報問題,提高了算法的訓練效率,任務成功率達到了95%。
在對算法研究和開發(fā)的基礎上,國內已經將人工智能算法應用于UAV自主控制的實際場景中,目前已有許多突破性進展。
(1)翼龍
翼龍系列是成都飛機工業(yè)集團研發(fā)的中高空長航時(MALE)UAV系列,包括翼龍-1、翼龍-2等,能夠執(zhí)行各種任務,包括偵察、監(jiān)視和精確打擊。其中,翼龍-2采用了高度智能化的自主識別系統(tǒng),首次引入了人工智能算法,能夠進行自我反饋、敵我識別和自我判斷威脅程度等,具備全自主水平輪式起降、巡航飛行等能力。
(2)彩虹
彩虹系列UAV被設計用于軍事和民用等領域,并已成功用于情報收集、監(jiān)視和作戰(zhàn)行動。其中,CH-5彩虹是一種無人作戰(zhàn)飛行器(UCAV),配備先進的人工智能能力,用于自主飛行、目標識別和武器部署。彩虹-7隱形無人攻擊機通過AI技術和自主飛行控制系統(tǒng),可在極端天氣條件下飛行,并能在飛行途中進行自我保護。
(3)天鷹
天鷹UAV具有較高的自主化水平,已實現(xiàn)停機位出動,自主起飛、自主飛行、自主偵察、自主識別與定位、自主返航和自主降落等功能,真正達到“一鍵式”操作。
(4)飛行試驗驗證
國內企業(yè)和高校在UAV集群控制方面做出了許多突破性進展,促進了UAV智能產業(yè)的發(fā)展。例如,中國電科憑借領先的UAV群體智能單元技術,分別于2016年10月、2017年5月和2017年11月實現(xiàn)了67架、119架和200架固定翼UAV集群飛行試驗,試驗驗證了涵蓋管式發(fā)射、自主編隊控制及隊形變換等多項關鍵技術,展示出我國UAV在編隊控制等方面取得的優(yōu)異成果。國防科技大學的UAV系統(tǒng)創(chuàng)新團隊成功開展了UAV集群自主協(xié)同飛行試驗,驗證了涵蓋分組分簇自適應分布體系架構、自組織任務規(guī)劃等多項重要的關鍵技術。北京航空航天大學完成基于狼群機制的多UAV分布式任務分配飛行試驗,其研究的油動固定翼UAV和雙關節(jié)大鳥型撲翼UAV分別于2021 年與2022 年連續(xù)2年創(chuàng)最長續(xù)航時間世界紀錄。
UAV在國內被視為未來重要的技術和產業(yè),具有廣泛的應用前景。國內正在努力推動UAV的自主化、智能化和集群化發(fā)展,積極投資參與民用和軍用自主UAV控制系統(tǒng)的研究和發(fā)展。
以深度學習為代表的人工智能算法通常包含大量的參數(shù)和隱藏的結構,使得人工智能系統(tǒng)在開發(fā)、使用過程中,輸入數(shù)據(jù)和輸出結果之間存在一種難解釋性和不可預測性,使得用戶難以理解和解釋其決策過程,限制了其在UAV等安全和可靠性要求較高的領域中應用。在UAV上應用可解釋人工智能技術有助于UAV操作員充分理解人工智能系統(tǒng)的內在決策過程,從而增強作戰(zhàn)人員對人工智能系統(tǒng)的信任。另外,UAV操作員只有更好地理解人工智能系統(tǒng),才能更好地與之進行交互,在實現(xiàn)人工智能系統(tǒng)預期功能的同時,及時發(fā)現(xiàn)、分析并修正缺陷,進而打造出更加可靠的人工智能系統(tǒng)。開展更加透明和可解釋的人工智能算法和技術研究,構建可解釋人工智能基礎理論體系,能夠為人工智能技術應用于UAV系統(tǒng),賦予UAV智能推理與決策能力提供可靠保障。
面對對抗條件下的高動態(tài)任務場景,僅靠地面控制站操作人員進行態(tài)勢分析、行動決策,對操作人員的指控和認知負荷較大,高度緊張的條件下容易出現(xiàn)判斷和決策失誤,導致嚴重后果。同時信息從UAV傳到地面站控制站進行分析處理形成決策再發(fā)送給UAV執(zhí)行,會導致OODA環(huán)的周期較長,無法滿足高動態(tài)環(huán)境下的作戰(zhàn)需求。另外,對抗環(huán)境下,UAV通常會面臨通信受限的境況,無法與地面控制站進行正常通信以獲取行動指令。為此需要開展智能體智能自主決策框架、模型等理論研究,突破基于人工智能算法的態(tài)勢感知與理解、任務規(guī)劃與重規(guī)劃、自主導航與定位、健康管理與故障重構、碰撞檢測與威脅規(guī)避、多約束博弈對抗等關鍵技術,實現(xiàn)對復雜戰(zhàn)場態(tài)勢數(shù)據(jù)的高效快速處理、分析和決策,使UAV具備更強的動態(tài)任務場景適應能力,從而提升UAV的任務效能和應用范圍。
雖然人工智能已經應用于情報數(shù)據(jù)、目標識別和輔助決策等領域,但目前人工智能仍具有非常明顯的局限性,人工智能類比遷移能力極其脆弱,沒有處理關聯(lián)結構的自然方法,實際應用中還需要依靠人為的綜合分析、研判,并做出最終決策[16-17]。隨著人工智能技術的不斷發(fā)展和應用,對人和機器的自然、精準、安全交互的要求越來越高,人機協(xié)同將人的認知和分析能力與智能系統(tǒng)的數(shù)據(jù)處理能力和決策支持能力完美結合,真正實現(xiàn)了“1+1>2”的效果。為此需開展人機智能協(xié)同機制、機理等相關理論研究,突破人機權限動態(tài)分配、人類意圖評估和先進人機交互等關鍵技術,實現(xiàn)人在回路的混合增強智能。
目前人工智能系統(tǒng)大都通過海量訓練數(shù)據(jù)的預訓練具備應對某一任務場景的自主能力,但由于UAV任務環(huán)境的不確定性和復雜性,搭載于UAV的人工智能系統(tǒng)往往需要不斷地適應新的數(shù)據(jù)和情境,這就要求人工智能系統(tǒng)具有很強的靈活性和適應性,能夠快速地學習和更新知識[18]。同時,如果UAV能夠在實際任務和仿真訓練中,通過與操作人員交互,基于現(xiàn)有經驗和知識進行無監(jiān)督學習,不斷學習飛行控制和任務決策等技能,將使得UAV的自主能力不斷得到提升。為此需開展人工智能系統(tǒng)自主學習進化理論研究,基于強化學習、遷移學習、進化算法和生成對抗網絡等技術,實現(xiàn)UAV系統(tǒng)的自主學習和不斷進化,以提升UAV的自主能力和環(huán)境適應能力。
目前,國內UAV與人工智能技術起步較晚,發(fā)展相對較為落后。雖然國內在UAV制造方面已經取得了很多進展,但是在UAV領域的應用還相對較少,與國際先進水平相比存在差距,仍有較大的提升空間。一方面,國內相關法規(guī)還不夠完善,對于UAV與人工智能的應用場景和安全管理等方面缺乏規(guī)定;另一方面,UAV與人工智能的融合也需要具備相關技術和領域知識的人才支持,但目前國內在這方面的培養(yǎng)和引進還存在不足,科研投入也相對不足。由此,提出以下三方面建議。
(1)注重人工智能技術的軍事應用
當前,人工智能技術在軍事領域的應用不斷深入,各種智能自主武器裝備不斷涌現(xiàn),世界主要軍事強國都希望以技術優(yōu)勢掌握未來戰(zhàn)爭主導權。面對這一新形勢,必須積極應對,主動求變,建立國家政策與布局規(guī)劃,明確人工智能技術的重點發(fā)展領域和要求,整合技術資源,加大政策和資源支持,持續(xù)推進軍事人工智能技術的高質量發(fā)展,從而占領先機,贏得優(yōu)勢。首先,要在UAV與人工智能領域進行早期投資和研發(fā),以獲取技術優(yōu)勢和市場競爭力。這需要政府、軍隊和企業(yè)共同合作,建立研發(fā)中心和實驗基地,吸引優(yōu)秀的科研人才,加大對UAV和人工智能技術的研究和開發(fā)力度。其次,在UAV和人工智能技術的發(fā)展過程中,要進行整體規(guī)劃和協(xié)調,確保各個環(huán)節(jié)的順利推進,包括制定技術標準、推動產業(yè)鏈協(xié)同發(fā)展、加強國際合作等。此外,還需要加強對UAV和人工智能技術的監(jiān)管和管理,確保其安全可靠地應用于軍事領域。通過超前布局、統(tǒng)籌規(guī)劃和牽引人工智能技術的軍事應用,實現(xiàn)UAV系統(tǒng)的智能化和高效化,提升軍事作戰(zhàn)能力。
(2)加強軍民技術融合
近年來,圖像識別、路徑規(guī)劃、建圖定位和語義解析等人工智能技術已成功應用于UAV系統(tǒng),極大地提升了無人系統(tǒng)的智能化水平。因此,應加快構建更加通暢的軍地協(xié)同技術創(chuàng)新機制。
一方面,鼓勵高校、民營企業(yè)積極參與融合項目,實現(xiàn)軍民創(chuàng)新實力和技術的優(yōu)勢互補,積極推動人工智能技術在軍事裝備上的發(fā)展應用。具體來說,要加強合作研究,建立協(xié)同研發(fā)倡議,匯集軍民專家,共同開展UAV和人工智能研究,利用軍事和民用部門的專業(yè)知識和資源,加速創(chuàng)新,創(chuàng)造尖端的解決方案。另一方面,政府出臺相關政策,加大軍民技術研發(fā)經費投入,提供資金支持和優(yōu)惠政策,積極開展與私營企業(yè)和研究機構的合作,例如建立UAV實飛測試和驗證的專用試驗臺和示范區(qū)。此外,共同培養(yǎng)UAV和人工智能領域的專業(yè)人才,開展人才交流和培訓活動,也有利于提高我國UAV智能化領域的技術水平和應用能力。
(3)構筑人工智能基礎前沿技術體系
以深度學習、強化學習為代表的人工智能技術取得了巨大發(fā)展,將其引入UAV感知、決策與控制系統(tǒng),是提高UAV作戰(zhàn)性能的重要技術途徑,以美軍為首的西方軍事強國已經在這方面取得重大突破,實現(xiàn)了利用人工智能系統(tǒng)駕駛飛機完成特定任務。目前國內在腦機、VR/AR和深度學習等基礎理論研究方面還相對落后,基本處于跟跑和應用研究階段。
為推進這一領域的發(fā)展,需構建一個自主可控的基礎前沿技術體系與系統(tǒng),集成尖端的人工智能算法、機器學習技術和計算機視覺算法,提升UAV的自主能力。在感知和傳感方面,結合先進的計算機視覺人工智能算法,感知和理解周圍環(huán)境,實現(xiàn)UAV的自主目標檢測、跟蹤和識別。在決策和規(guī)劃方面,采用深度強化學習和規(guī)劃等算法,使UAV能夠實時做出智能決策、對飛行路徑進行自動優(yōu)化,快速適應動態(tài)環(huán)境。在控制和導航方面,集成人工智能算法與UAV的飛行控制、軌跡規(guī)劃和路徑跟蹤等算法,實現(xiàn)對UAV路徑和導航的精確控制。在通信和協(xié)作方面,開發(fā)群體智能、合作決策和分布式感知的算法,促進多架UAV之間的通信和協(xié)作,能夠共同完成復雜的任務。此外,人工智能系統(tǒng)有能力從數(shù)據(jù)中學習,隨著時間的推移調整其行為,并通過持續(xù)分析和處理傳感器數(shù)據(jù)、飛行日志和用戶反饋,利用在線學習、遷移學習和模型更新等技術來增強其自主控制的水平。因此,構筑自主可控的人工智能基礎前沿技術體系對UAV自主控制具有重要的意義,可以有效提高UAV的自主決策能力、實時適應能力、智能決策能力和自主學習能力。
人工智能技術是以UAV為代表的無人裝備技術發(fā)展的重要驅動力量,世界各國已經將軍事人工智能技術發(fā)展提升到戰(zhàn)略高度。在此情形下,應當主動作為,積極應對,避免在全球人工智能和軍事能力軍備競賽中處于落后。通過對美軍人工智能技術在UAV上的應用發(fā)展現(xiàn)狀的總結,分析了人工智能技術應用與UAV的關鍵技術和挑戰(zhàn),并提出基于人工智能的UAV技術發(fā)展建議,以期對我國UAV自主能力提升和發(fā)展有所啟發(fā)。