許威, 蘇波*, 江磊, 閆曈, 許鵬, 王志瑞, 邱天奇
(1.中國北方車輛研究所 無人中心, 北京 100072; 2.中兵智能創新研究院有限公司, 北京 100072;3.群體協同與自主實驗室, 北京 100072)
足式越野機器人集群是指能夠在復雜地形環境下協同移動作業的自主系統,它是山地、叢林等復雜環境作戰和污染、廢墟等復雜場景救援的重要裝備,在軍民領域有著緊迫的應用需求,其基礎理論和關鍵技術既是當前學術領域研究的重點和熱點,也屬于面向國家重大需求的經濟社會發展和國防建設所需要解決的短板和弱項。
集群協同攻防是陸戰場典型的作戰樣式(見圖1)。現代戰爭正在由傳統的大規模集群遭遇戰向小規模集群奪控戰和襲擾戰轉變,戰場環境也由原來的野外開闊陣地向山地、叢林、城市廢墟等惡劣環境轉變,傳統輪、履式戰車的編隊集群在上述環境中行動受限、協同不暢,難以發揮群體攻擊的優勢,因此對高機動足式越野機器人戰斗集群的需求迫切;在民用領域,自然災害和恐怖事件的現場充斥著廢墟和危險,普通車輛難以深度介入,人員隨時面臨二次損傷和被攻擊的威脅,進而造成救援不及時和救援人員傷亡事件,因此急需能夠越過廢墟或在野外極端地形下開展探測危險物品、搜尋遇難人員的足式越野機器人,并通過多機器人協作實施營救行動。
緊迫的需求帶動了學術研究的熱點和方向。2019—2022年,足式機器人研究多次登上Science Robotics、Nature等頂級期刊,并被選為封面文章;谷歌學術對Swarm Robotics的引用次數呈倍率級增長,顯示出足式機器人和群體協同的研究熱度。將足式機器人與群體協同理論結合,集成驗證能夠在復雜未知環境下快速移動和高效協作的集群,可以為無人系統進入人類難以抵達的極端環境提供新思路,相關的理論研究是當今機器人領域的熱點,符合國際前沿科技的發展趨勢。
為進一步探索足式越野機器人集群協作的技術途徑,本文從足式機器人集群協作的仿生學機理出發,以陸域復雜環境下足式機器人集群系統高機動越野運動、高效率協同感知與高智能協同作業為總體需求,深入調研并分析了國內外相關研究機構在機器人群體仿生學機理、單體足式越野機器人、集群感知與協作和集成演示與應用等方面的研究現狀,提出當前足式越野機器人集群系統面臨的技術挑戰和科學問題,并深入剖析了亟待解決的核心關鍵技術,最后對足式越野機器人集群在軍民領域的發展前景提出了設想和建議。
高機動足式越野機器人群體協作主要面向足式越野機器人單體與環境共融和機器人群體共融研究。足式機器人研究開始于20世紀中葉,并一直保持著熱點趨勢。機器人群體協作研究起步于20世紀末,被認為是有可能帶來顛覆性變革的新技術而廣受關注。基于上述背景,國內外研究者取得了大量的研究成果,下面分別從基于仿生學的機器人群體共融機理、群體中的單體機器人、機器人群體感知與協作技術、機器人群體集成演示與示范應用等方面介紹研究進展。
集群協同源于對動物行為的模仿,而動物的群體行為主要體現在特征抽取、協作分工和組織架構等三個方面。
在特征抽取方面,Reynolds[1]提出了Boid模型,基于靠近、對齊和避碰規則,復現出自然界中鳥類動物的集群行為;Couzin等[2]通過改變排斥區、適應區和吸引區的大小,模擬不同生物群體的運動。在協作分工方面,Ulrich等[3]通過克隆蟻群行為跟蹤試驗,揭示了蟻群規模與勞動分工機理;段海濱團隊結合狼群的等級特性與社會組織,建立了狼群合作狩獵運動模型。上述研究主要基于社會學理論揭示了群體內的等級和分工[4]。在組織架構方面,Cassidy等[5]通過對狼群的長期實證觀察和分析,指出自發形成的種群規模和構成方式是影響其獵捕攻擊目標的主要因素;Ducatelle等[6]研究螞蟻的協同導航行為,構建了自組織機器人集群,實現了復雜環境自組織路徑搜索。上述研究主要基于外部任務觸發建立群體自重構理論。
機器人群體由一定規模的同構或異構的、單功能或多功能的單體機器人共同組成[7],機器人主要來源有兩種途徑,一是根據群體的需要新研制的特定機器人;二是在已有單體機器人的基礎上優化改進的機器人。足式機器人群體適應復雜環境的基礎條件是單體機器人的高機動性、強魯棒性和智能性,當前研究的重點包括新型腿足/軀干機構與結構、高效驅動與控制、敏捷步態與行為控制等。
在腿足結構方面,以美國波士頓動力公司的Bigdog四足機器人為代表,意大利技術研究院的HyQ、瑞士蘇黎世聯邦理工大學(ETH)的ANYmal、中國北方車輛研究所的“大狗”(見圖2)和“牦牛”(見圖3)、山東大學的Scalf、宇樹科技公司的B1、云深處科技公司的“絕影”等一系列四足仿生機器人[8-12],基于犬類原型的串聯式腿足機構研制了12自由度或16自由度四足機器人,實現了自然路面的穩定行走;日本早稻田大學的WL-X、上海交通大學的“章魚”[13]等足式機器人,采用并聯式腿足機構,實現了高承載行走。上述機器人均采用整體式剛性機身加對稱分布的腿足構型,適合低速行走。為了提高機器人的行走速度和敏捷性,國內外學者開展了仿生軀干的探索:美國麻省理工學院(MIT)在Cheetah1四足機器人上實現了柔性軀干,為高速奔跑提供了爆發式的能量,但柔性結構降低了機器人的穩定性和承載力[14];美國波士頓動力公司在Cheetah和WildCat機器人上實現了多連桿軀干,通過主動驅動連桿釋放能量,平坦路面的奔跑速度達到25 km/h,但連桿機構與動物軀干的生理結構差別較大,柔順度欠缺。上述研究通過能量釋放提升了奔跑速度,但奔跑時穩定性和靈活性受到了機構制約,易發生摔倒和碰撞。因此,如何實現高速越野奔跑的腿足與軀干機構,并解決其爆發性、穩定性和敏捷性協調問題,是目前亟待解決的問題。

圖3 央視四足機器人專題報道
在驅動與控制方面,美國波士頓動力公司的Bigdog、LS3、Wildcat,意大利理工學院的HyQ,中國北方車輛研究所的“Runner”,山東大學的Scalf等機器人采用液壓驅動方式[15-16],具有響應快、爆發力強的優點,但存在系統復雜、效率低、噪音大的問題。針對液壓驅動的問題,瑞士ETH的ANYmal、美國波士頓動力公司的SpotMini、美國MIT的Cheetah、中國北方車輛研究所的“警犬”(見圖4)、宇樹科技公司的B1、云深處科技公司的“絕影”等機器人采用電機驅動方式,實現了低噪音、輕量化腿部機構,但由于電機功率密度和扭矩不足,動態響應能力和爆發力不足,僅在輕小型機器人上應用,且越野速度不高。為解決上述問題,機器人領域提出了大扭矩、高功率密度空心電機和驅動的需求[10,17],但目前尚未形成有效的應用成果。因此,高爆發力的軀干與大扭矩的驅動機構,以及該類機構與其他機構的一體化融合問題,是當前高機動足式越野機器人關注的重點問題。

圖4 Panda5 四足仿生機器人
在步態與行為控制方面,美國MIT提出了基于動力學模型的全身控制算法,在Cheetah四足機器人上應用[18],實現了自主移動中的軌跡優化與穩定平衡結合,但復雜地形下高速奔跑時魯棒性不足;英國愛丁堡大學與浙江大學聯合提出了基于深度強化學習的多專家體系結構控制方法,實現了未知環境下足式機器人的自主行走控制[19];瑞士ETH提出了無模型的強化學習方法,在ANYmal四足機器人上得到應用[20-21],實現了復雜地形的自適應行走。但上述研究限于低速行走的穩定性,在高速奔跑時容易失穩和碰撞。因此,面向任務信息鏈和行為特征鏈關聯的奔跑和變速行為步態,是足式機器人高速奔跑亟待解決的問題。
根據群體需要研制特定機器人具有較好的針對性和集群特征,因此得到廣泛關注。Wei等[22]針對群體移動作業需求研究一種Sambot機器人,通過重構和重組集群實現了蠕動、滾動等多種移動方式。Dorigo等[23]針對非結構環境的群體移動任務,研究了一種swarm-bot機器人,可通過履帶機構組合鏈式形態,從而跨越壕溝。上述研究主要通過群體重構方式提升機器人的移動能力。更多的群體機器人是在已有的單體機器人基礎上進行優化改進。Jdeed等[24]針對群體機器人實驗需求改進了一款小型六足機器人,使其可以協同移動。Howard等[25]針對建筑物內測繪需求,研究了一款輪式機器人,實現了資源以及成本的有效分配和利用。由于多數群體機器人多處于實驗室研究、算法驗證階段,使用環境單一,需求量大,基于低成本輪式小車底盤進行改進依舊為群體機器人的主要形式,難以滿足開放越野環境下的集群作業需求。
機器人群體在未知開放動態環境下協同作業,既需要感知環境及任務態勢,還需要解決系統及環境不確定性情況下群體全局狀態空間和操作空間的時變問題。為此,國內外學者分別從協同環境及任務態勢感知、群體智能協作等方面展開研究,并取得一批有價值的研究成果。
在協同環境及任務態勢感知方面,Zhu等[26]提出了異構機器人的空間型分布式感知-跟蹤算法,實現了機器人先驗知識與交互信息的融合建模;Papaioannou等[27]研究了不完全信息條件下多機器人協同定位問題,實現了干擾場景下的環境建模;Sung等[28]研究了多機聯合感知和自動分組問題,建立了集群變結構時的環境建模方法。Franchi等[29]提出了應用估計濾波的分布式算法,實現了未知載荷慣性參數的感知。Habibi等[30]提出了分布式樹狀算法,實現了未知載荷形心的感知測算,使機器人協同運輸過程中的運動更加平穩靈活。上述研究以多源分布信息的融合為基礎,解決了群體局部信息不完備情況下的環境及任務態勢感知問題。
在多機器人信息融合方面,Banfi等[31]提出了基于高斯過程的信號分布模型,引導智能體在信息交互中進行數據采集;Paliotta等[32]提出了一種基于領導者-跟隨者的多目標自動尋源方法,通過多機器人間的信息交互來指導整個集群系統的航向;Shorinwa等[33]基于深度圖像處理技術,提出了一種可拓展的分布式滑動窗口跟蹤方法,通過集群內各單體機器人減輕遮擋和通信影響;Hinostroza等[34]提出了多機器人感知融合的復雜環境下對目標的認知方法,形成更精細劃分的認知結果;Xiao等[35]提出了空中-水面協同環境感知和輔助導航方法,實現了協同海上救援。上述研究以機器人間的能力差異性為基礎,提出了基于多源異構傳感器的信息融合辦法,但未涉及本體高機動擾動和環境遮擋帶來的突變性、碎片化交互信息的融合問題。
群體協同運動方面,Reynolds[36]提出了模擬鳥群協同運動的理論模型,個體遵循3個簡單的規則:碰撞避免、速度匹配和向群體中心運動;Couzin等[37]進一步構建了3層規則模型,以排斥、吸引、對齊為基本相互作用,重現了魚群的多種協同運動行為;Vicsek等[38]從統計物理的角度,提出了基于鄰居間相互作用建立個體運動方向的方法,實現了自驅動粒子的一致性運動;Cucker等[39]研究了空間內群聚現象,提出通過其他單體作用調整自身速度,解決了群體內速度不統一的問題。上述研究通過構建具備群體同步規則的粒子點集群模型,實現了機器人群體的協調高效移動,但均以協同一致性為主要目標,未考慮個體之間的分工,個體之間不具備互動與協作能力。針對以上問題,Spears等[40]提出了一種基于勢能和力平衡方程的物理學分析方法,建立了自然物理定律驅動的虛擬力預測模型,用于集群內大量移動物理代理的分布式預測;Soysal等[41]提出了隨機有限狀態機的模型,將群體機器人抽象為若干狀態,通過狀態轉換實現機器人的聚集;Theraulaz等[42]提出了反應-閾值模型,用于隨機狀態機轉移,實現了集群決策與任務分配。上述研究通過動力學模型與有限狀態切換的方法建立集群行為規則,但動力學約束下的粒子點模型無法描述多末端機器人行為狀態,清晰邊界下的狀態切換不適用于存在環境噪聲、隨機因素、信息受限的陸域環境。
在群體智能協作方面,Sung等[43]提出了基于網絡認知的機器人編組協同方法,增強了群體的任務執行能力;2019年,以谷歌Deepmind團隊AlphaStar[44]為代表的智能群體,通過在星際爭霸中戰勝人類而獲得廣泛關注;2020年,啟元科技團隊運用多智能體SCC[45]在星際爭霸中擊敗人類全國冠軍,證明了多類別大規模集群實施中心化協同控制的可行性。針對群體智能的訓練和執行,Lowe等[46]提出了多智能體深度確定性策略梯度模型,實現了中心化訓練、去中心化執行;Foerster等[47]提出了基于反事實的多智能體策略梯度模型,解決了多智能體信用分配問題。上述研究在數字化場景中得到了較好的驗證,但由于模型對邊界條件具有一定的依賴,在開放環境和物理實體應用還存在一定距離。
Kim等[48]提出了對多智能體之間通信動態特性的仿真,拉近了仿真與現實之間的差距。美國分布智能實驗室Parker教授提出了運用群智激發匯聚機理的目標搜索方法,在智能群體機器人的室內搜索項目中實現了物理應用[49]。上述研究在物理系統中進行了驗證,但僅解決清晰邊界和設定場景下的智能體協同對抗問題,未考慮環境的對抗性,因此環境變化時泛化性欠缺,無法滿足復雜開放環境的群體動態協同需求。
綜上所述,當前的機器人群體協同運動研究主要基于Vicsek模型和Cucker-Smale模型實現運動方向和速度的協調,群體動力學研究主要基于虛擬力模型和隨機狀態機模型實現理想條件與簡單任務約束下的粒子群運動規劃,均未考慮機器人多點接觸地面時運動學和動力學影響,缺少群體與地面之間的共融關系。上述研究適用于空中、水上和均勻材質的平臺地面,難以解決開放動態環境下快速移動地面群體適應復雜地面環境的問題[50]。因此,需要針對多末端系統的行為特征建立機器人群體運動規劃和動力學模型,以解決群體與地面環境之間的共融問題。在群體協同博弈與圍捕方面,當前研究主要集中在特定環境邊界下與圍捕目標的對抗博弈,無法解決開放環境下實體智能群體的對抗問題。因此,需要將環境和目標同時作為對抗主體,建立環境與目標(對抗者)結盟的三方對抗的博弈研究,解決未知環境與動態目標的群體協作圍攻問題。
在單體機器人技術趨于成熟和明確的群體協同作業需求下,國內外研究團隊先后開展了大量空中、水面、水下集群機器人的構建和驗證,并逐漸開始地面機器人集群的應用探索[51]。
在空中集群構建方面,Hauert等[52]基于蜂群特征研究了多架固定翼飛機在空曠地形的無碰撞飛行;Vásárhelyi等[53]研究了大量四旋翼無人機在受限區域內的自組織蜂擁飛行;Soria等[54]基于鳥群特征提出了模型預測控制方法,實現了無人機集群在復雜環境下的飛行;Zhou等[55]利用時空軌跡規劃方法,在定位、計算條件受限的情況下,實現了無人機集群在密集叢林中的分布式穿越、隊型保持、目標跟蹤等任務。美國國防部高級研究計劃局(DARPA)提出了“進攻性蜂群使能戰術(OFFSET)”集成項目(見圖5),針對蜂群戰術、蜂群自治、人機組隊、虛擬環境、物理實驗平臺等方面進行城市作戰場景下的無人機與地面無人車異構蜂群系統演示示范。上述研究從實用化角度驗證了空中群體構建基礎理論,促進了空中群體協同技術的廣泛應用,但研究主要基于空中環境特征,僅考慮了遮擋和阻攔問題,未涉及環境作用力擾動問題,難以解決地面環境下群體高機動協同問題。

圖5 OFFSET想象圖(Northrop Grumman)
在水域集群構建方面,研究主要集中在弱信息交互條件下的艦船編隊和基于仿生魚群的多機器人攻防。水上集群驗證方面,2014年,美國海軍開展了13艘水面無人艇集群協同搜索、圍捕的試驗,驗證了人工輔助條件下分散與數據自動融合系統(DADFS)和機器人智能感知系統控制體系架構CARACaS的有效性[56];2018年,云洲智能團隊進行了56艘無人艇集群協同避障等任務的演示示范[57]。在水下集群驗證方面,2009年,歐盟的GREX項目驗證了有限通信條件下的編隊航行[58];2016年,美國海軍在分布式偵察與探測的協作自主性系統CADRE協同框架下開展并驗證了無人水下機器集群掃雷任務[59];2020年,哈爾濱工程大學進行了小型無人水下機器人集群的中繼通信、動態組網、航行控制等試驗[60],驗證了分布式優化算法對降低通信影響的可行性。上述研究基于物理場景和實際任務驗證了水域集群構建的基礎理論,促進了群體協同技術在水面和水下環境的應用,其中水下信息不完全條件下的協同方法可以為地面群體協同提供參考,但研究主要基于水域環境特征,僅考慮了通信干擾問題,同樣未涉及環境作用力擾動問題,難以解決地面環境下的群體高機動協同問題。
在地面集群構建方面,目前只有少數實驗成功地演示了自治自組織機器人,而集群機器人的實踐應用仍是一片空白[61],美國陸軍于2017年發布了《機器人與自主系統戰略》,指出無人作戰系統發展的遠期目標(2030—2040年)應實現多個機器人系統的組合作戰。顯然,當前的能力水平落后于需求:一方面,由于未解決開放環境對地面集群行為級的致命影響,大量研究成果局限在既有規則的封閉環境下運用,無法適應來自諸如地形地貌等方面的環境干擾;另一方面,空中、水域機器人集群的廣泛應用和地面集群的需求,不斷激發出對地面機器人集群的期待,進而產生大量的應用需求概念。上述研究動態和趨勢,進一步表明開展高機動足式越野機器人集群構建和集成驗證的必要性和緊迫性。
綜上所述,當前空中、水上和水下機器人集群構建的基礎理論已經趨于成熟,地面機器人集群構建面臨復雜環境的挑戰,尚處于簡單環境驗證或復雜環境概念研究階段。因此,需要設計、開發和部署一個融合地面復雜環境因素的集群系統開放式驗證架構,用于在虛擬環境和物理現實中進行地面集群系統的新功能驗證與測試評估,以達到機器人集群與地面環境、集群內機器人之間以及人與群體之間共融的科學目標。
盡管當前單體足式越野機器人可以實現在特定環境下行走,但還沒有足式越野機器人集群能達到在山地、密林中協同作業的能力,其主要挑戰是地面復雜環境帶來的地形復雜未知、信息不完全、角色動態變化。其中:
1)地形復雜未知:戰場和救援環境是未知、復雜和動態變化的,影響機器人群體安全的地形信息出現在機器人前方1~2 m空間位置和1~2 s的臨機時刻,難以預測,要求機器人奔跑時既快又穩,尤其不能相互碰撞,但目前這三者在時空上難以統一。
2)信息不完全:地面復雜環境普遍存在通信受阻、衛星受限、視覺遮擋等情況,足式機器人集群既缺少精確現場地圖、也缺少精確的目標與本體定位,難以同指揮中心建立暢通的聯系,甚至群體內交互信息也時斷時續,造成單體感知信息不完全、群體態勢不準確。
3)角色動態變化:地面機器人群體協同作業過程中時刻面臨著環境動態變化、目標動態變化的情況,由此帶來群體內角色分工與任務分配的動態變化,要求群體具備根據環境和目標變化情況實現動態角色分工和單體行為約束的能力。上述問題是制約陸域集群系統發展與應用的關鍵,需要從仿生學、力學、機械、信息等多角度進行探索,以獲得實質性突破。
首先,在群體協作機理研究方面,當前研究主要體現在特征抽取、協作分工和組織架構單方面的成果,但動物群體協作蘊含于三者的緊密耦合之中,需要開展動態環境群體行為建模、動態角色/任務分配和不完全信息下的自組織演化機制研究,從根本上揭示動物群體共融的內在機理。
其次,目前對地面群體中的單體機器人研究較少,主要采用輪式、履帶或多足方式,滿足室內或平坦環境使用。盡管近年來足式機器人發展迅速,但主要面向單體機器人的應用,尚未從群體共融和應用的角度開展研究。自然界中的狼群等具有高度越野機動能力、敏捷攻擊能力和較高智能的群體對單體具有特定的需求,如奔襲能力、敏捷避讓等,進而影響到機器人的形態與功能。因此,具有類似功能特點的足式機器人是實現越野機器人集群的基礎,開展相關研究極為重要。
再次,群體在未知環境下的靈活移動依賴于面向整個群體的環境模型,群體的精準協同作業依賴于當前任務情景態勢模型及群體協作決策模型。開放動態環境下,群體快速移動并協同作業時,上述模型緊密耦合,并伴隨信息的缺失和突變。該問題是越野群體共融系統感知與協同作業的難題,盡管國內外針對群體聯合建模、群體聯合情景感知、群體協作技術開展了大量的研究工作并取得一定成果,但目前仍未解決定位信息完全缺失的建模、快速奔襲下的群體內角色動態分配與規劃調度等問題。需要基于動物群體行為機理,探索仿生感知途徑、群體內部信息交互及融合機制、基于專家先驗知識的多層多時間尺度群體決策方法。
最后,在現階段集成應用方面,典型案例僅針對地面、空中、水面等簡單場景進行了集群協作技術的部署與演示驗證,尚未開展對不完全信息、開放環境、角色變換應用場景下的地面集群共融協作的集成演示示范研究。
足式機器人集群在地面上面臨特有的環境挑戰:一是復雜的地形地貌下,群體內機器人難以獲得持續精準的定位信息,特殊情況下甚至整個集群定位和通信受阻,使群體面臨突出的不確定性決策問題;二是開放的作業場景中,伴有隨機的人員、動物、車輛等合作或非合作動態目標,同時機器人集群自身快速奔襲帶來感知和操作擾動,難以保證群體在全局狀態空間和操作空間的魯棒性和敏捷性;協作任務的持續延伸帶來群體內機器人角色不斷的轉變,進而帶來群體結構穩定性與靈活性之間的矛盾。上述問題是環境-任務-角色三元素耦合作用帶來的挑戰,本質上要建立一種群體內默契協同與合作的機-機共融機制,需要從心理學、社會學和能量學交叉融合角度尋求突破。
開放動態環境給足式機器人奔襲的穩定性、安全性帶來極大挑戰。盡管當前足式機器人研究取得了重大進展,但仍處在程式化跳躍翻騰、跌倒后自救、操作閥門等初級水平,既未實現野外復雜地形快速奔襲,也未研究多機器人奔跑中的避讓與穩定問題。狼群在開放動態環境下既表現出極強的奔襲能力,又表現出敏捷的形態與行為,一是因為狼本身具有強大的柔性軀干和頭/尾等平衡器官,二是因為狼在奔襲過程中可以采取變節律、變步幅方式保持高速穩定,對于仿狼群系統中的足式機器人,本質上不是形態,而是行為上具備上述能力,即需要解決機器人對環境的動態順應問題,進而突破基于群體交互、視覺、力學感知驅動的奔襲步態和滿足該步態的機構結構。
單體機器人的高機動越野能力是足式越野機器人集群系統的關鍵。足式越野機器人高機動越野技術主要是基于仿生學與地面力學理論,研究越野環境與動物機動行為之間的內在耦合關系,揭示環境與機器人結構/行為的耦合機理;研究典型環境幾何與力學特征,建立地形支撐和牽引性模型;研究脊椎動物行走時骨骼結構/觸地機構與地面作用關系,建立靜力學耦合模型;研究脊椎動物行走規律、時空特征和能量轉換方式,建立動態力學耦合模型。
在足式行走機器人構型設計方面,基于映射仿生方法,開展多源仿生機構之間的功能聚類、仿生機構與非仿生機構的耦合;研究多自由度仿生軀干和附著-支撐-緩沖-儲能功能一體化的四關節仿生腿足構型,并進行運動學、動力學優化迭代。
在足式行走步態與動態穩定、柔順控制方面,研究基于地形環境感知和地面力學信息的大閉環穩定與柔順控制,建立包含地形理解與行為步態的大閉環行為步態節律控制模型;基于欠驅動控制原理和模型預測與優化控制思想,建立多接觸點支撐的力分配模型,優化復雜地形行走效率;基于模糊聚類的行為辨識,建立多步態自主切換模型。
在傳統研究方法的基礎上,借助當前蓬勃發展的強化學習技術,可以有效提高足式機器人的越野能力。基于模型的步態規劃要求對機器人行走過程中的每個細節進行詳細描述,機器人行走的實際效果對模型的精確度要求高,設計高可靠的在線修正控制算法十分復雜。當前,在機器人領域很多任務可以使用強化學習的框架進行描述。將深度強化學習應用到四足機器人的運動控制上,一項重要的工作就是訓練環境的設計,其中包含機器人狀態空間、動作空間和獎勵函數的設計,這項工作往往需要根據具體學習的任務目標制定。在訓練過程中策略網絡是不斷更新的,更新的過程也就是深度強化學習算法訓練運動控制器的過程。當前存在的一個普遍問題就是從仿真環境移植到物理平臺極其困難。需要在仿真環境中導入更精準的機器人動力學模型;同時,由于足式機器人是一個典型的欠驅動復雜動力學系統,現有的足地接觸動力學仿真環境很難模擬真實環境中的機械足與復雜陸域地面環境的各種力學接觸特性,需要在仿真環境中引入大量精確的足壤力學模型,減小與物理平臺的誤差,同時加入一些其他未知干擾量,增強系統的魯棒性。
地面集群中個體行為的獨立性與組織機制變化時刻受到地面環境因素的影響與制約。需要以地面仿生集群自組織行為為研究對象,重點圍繞群體協作奔襲、狩獵等典型場景,研究群體在角色分工、個體自治行為,以及復雜環境中自組織自重構機理。通過群體協作行為特征提取與數學表征,構建群體感知、奔襲、圍攻等典型行為模型;開展群體角色分配/分工機制研究,解析動物群體等級特性及演化機制,建立群體柔性角色分工模型;構建群體中的智能單體自治行為模型,建立滿足群體協作行為需求的智能單體行為庫;揭示群體自組織自重構機理,研究復雜動態環境中的生物群體自組織自重構能力構建機制,形成群體自組織自重構策略模型。
戰場環境下集群系統多任務決策規劃控制技術是足式越野機器人集群系統關鍵技術的核心[62]。集群融合態勢感知能夠對未知環境形成更大范圍的態勢理解,依靠可靠的集群通信網絡,或者在通信不暢條件下基于視覺傳感形成相對位置判斷,根據戰場任務完成對足式集群的決策規劃與統籌控制。研究基于知識引導和數據驅動的對手決策建模方法,實現任務級指令的實時動態規劃;建立基于融合規劃調度與深度強化學習自主執行的分層決策框架,完成分層智能體的群體智能自主決策訓練;探討復雜對抗條件下面向人機交互指令的結構化指令搜索優化問題,實現結構化指令搜索優化;形成基于反事實推理的決策指令策略持續演進方法,實現群體智能體在任務決策指令間的實時調度;研究面向場景窗口的強化學習的群體決策執行方法,以提升群體智能策略的魯棒性和適應性。
群體在開放動態環境下的態勢感知與情境認知是群體智能產生的前提,陸域集群系統區別于空域、水域集群系統的特征之一,是更加突出了群體分布對未知環境的主動適應性。開展開放動態環境下的地圖信息多維度構建與關聯增強研究,實現多維地圖集構建及動態優化調整;研究面向動態環境和任務的關聯情境認知與行為約束的激勵生成,提出基于多屬性地圖集的認知模型集聯方法;形成面向協同感知的集群自組織機制及能力自涌現方法,增強群體之間的交互主動性和智能性;研究應對環境變化的協同感知自主演化方法與動態調控策略,提升機器人的情境認知能力。
信息不完全條件下的群體協同感知、交互與認知推理研究主要圍繞足式越野機器人集群對動態目標搜尋、圍捕的作業任務中機器人和目標動態遮擋、感知信息缺失的需求,按照信息感知、認知、交互、融合推理的遞進方式開展。在感知方面,側重于面向不完備感知的多源信息關聯機制與群體聯合建模,為認知提供基礎信息;在認知方面,重點突破環境和任務啟發的情景認知與行為約束機制,實現主動感知;在交互方面,重點研究基于集群自組織機制的信息交互,建立主動交互機制;在融合推理方面,重點研究基于關聯語境的信息融合和認知推理,實現智能機-機協作。在群體協同態勢感知領域,足式越野集群系統的研究側重多機器人的相互關聯、啟發、自組織、交互和融合,通過多機器人的信息互補性解決個體機器人信息不完全的問題,實現機器人與機器人的共融。面向不完備感知的多源信息關聯機制與群體聯合建模,需要將多源異構感知數據統一到一個共同框架下進行一致性表征與處理,建立面向非結構化環境的多尺度多層次地圖及跨層級耦合增強模塊。針對復雜動態場景中的環境特征多種多樣且屬性變化不定的特點,則需要研究動態場景語義建模與關聯理解方法和復雜情境-安全行為的關系模型。
對于足式越野機器人集群系統,從理論到實踐的關鍵步驟在于搭建高可靠低延時的通訊網絡,通信與網絡既是單體足式機器人到集群系統的橋梁,也是連接前端數據采集和后端數據處理的紐帶以及集群系統信息化和智能化的前置條件。
對于足式越野機器人集群系統,數據采集端的集群化仿生機器狗與顯示控制端及智能識別端之間存在一定的距離,并且很可能存在障礙物的阻隔,這會導致無線電波信號產生大幅度的衰減和反射,極大地影響通信傳輸的質量和容量。多個機器狗組成的集群與顯示控制端及智能識別端共同構建了一個無線通信網絡(見圖6),網絡中存在測控、圖像等多種業務數據,不同的業務數據對網絡質量的需求不同,需要網絡能夠對不同業務數據進行差異化的質量保障。無線通信網絡中的機器狗在工作時處于運動狀態,隨時可能存在新的機器狗加入網絡和原有機器狗退出網絡的情況,導致網絡拓撲處于不穩定的變化狀態,這要求無線網絡具備極高的穩健性和可靠性,滿足上述“動中通”的應用需求。此外,仿生機器狗屬于小型化的無人機動平臺,具有長續航的要求,因此安裝于機器狗的通信網絡載荷的質量、功率和體積均需要進行嚴格控制。
最后,構建基于足式越野機器人的集群系統,并在仿真及物理環境中進行開放動態場景應用驗證與評估,是推動足式越野機器人集群技術加速發展的直接動力。首先需要應用基于仿生學的機構設計方法,同時集成多模信息融合感知平臺,構建多型異構高機動足式越野機器人智能平臺;突破基于陸域集群系統的分布式虛擬仿真總體技術,進行開放動態環境足式機器人集群仿真平臺設計與開發,完成集群協同感知與協作控制策略的仿真驗證;突破集成智能行為控制、集群態勢感知、智能協作控制核心算法,構建與驗證集群系統控制體系架構;在通信方面,設計開發分布式實時通訊平臺,構建可拓撲重構的集群通訊網絡;面向典型地面集群場景應用目標,構建開放動態物理環境,開展足式越野機器人集群系統的應用驗證。
在軍事領域,集群協同攻防是陸域戰場的典型作戰樣式。高機動足式越野機器人集群作戰將會對未來陸域作戰模式變革起到重大的推動作用,主要表現在以下三方面:
一是未來戰爭必然是以軍用越野機器人士兵為殺手锏的智能化戰爭,戰斗機器人的加入明顯是一個時代變換的里程碑標志物(見圖7)。雙方軍事力量的對抗將不僅是人類,而是大量的無人機器。足式越野機器人集群在陸域戰場的高機動適應能力、靈巧作業能力和信息獲取能力更強。同時,軍用機器人集群作戰取代有人作戰的意義很大一部分是降低士兵死亡率,能夠有效對敵軍進行巨大的心理威懾。

圖7 四足機器人發展概況
二是推動群體智能理論的創新式發展,為未來多域無人系統集群提供技術支撐,隨著足式越野機器人應用領域的擴展及需求的日益復雜,機器人集群系統實現了在動態乃至未知環境中執行任務(見圖8)。單一足式機器人系統受體積、質量、載荷以及處理能力等方面的約束,難以獨立應對復雜的任務需求。而機器人協同作戰有效解決了單個機器人作業時載荷相對較小、信息感知處理能力相對較弱的問題。當然,這都離不開群體智能理論和共性關鍵技術的持續攻關。

圖8 四足機器人群體協同技術
三是足式機器人集群研究必將極大地推進人工智能在軍事戰場的應用落地。陸域機器人集群智能協同是人工智能+陸域無人系統深度融合發展的一項基礎性創新性技術(見圖9)。應用人工智能技術,在足式機器人集群協同技術的信息共享、協同感知、協同決策、認知協同等基礎理論算法方面展開系統深入的研究。

圖9 人工智能技術與四足機器人技術融合
在民用領域,足式機器人集群系統可以大量應用在地下空間探索、災害場景救援等復雜的陸域環境。通過搭建多角色/多場景/多任務的集群協作集成示范環境,按照多維度綜合評估體系,進行面向應用場景的集群系統綜合測試評估,驗證足式機器人集群系統在復雜開放場景下的集群協作能力。
本文針對足式機器人集群在陸域場景上面臨的環境-任務-角色耦合動態變化挑戰,圍繞解決機器人群體默契協同與合作和開放動態環境順應性的科學問題,立足地面仿生集群共融機理,從機構學、力學、控制學和信息學多學科交叉研究的方法入手,提出了開展足式越野機器人群體共融基礎研究與集群構建的關鍵技術和解決途徑。
本文工作為陸域集群系統協同作業提供了一個可供參考的總體研究思路。陸域集群系統是一個與地面環境強相關的動態復雜大系統,在前期設計計算、集群仿真環境的搭建與驗證是一個十分重要的研究方向。限于篇幅,本文未對此部分內容詳細展開。下一步工作的重點是開展基于陸域環境的集群系統仿真與測試評估等基礎內容研究,以期為集群協同感知與規劃算法開發提供支撐。