李成鳳,田彥濤
(1.綏化學院 信息工程學院,黑龍江 綏化 152061;2.吉林大學 通信工程學院,吉林 長春 130025)
群體機器人的群集行為研究綜述*
李成鳳1,田彥濤2
(1.綏化學院 信息工程學院,黑龍江 綏化 152061;2.吉林大學 通信工程學院,吉林 長春 130025)
針對群體機器人的群集行為,對其適應性、可控性和優化性三個方面的研究現狀進行總結,并指出了群集行為研究中有待解決的一些問題,以促進對群體系統協調控制理論與應用的進一步研究.
適應性;可控性;優化性
生物群體行為是自然界中極為常見的現象,如蜂群筑巢,魚群覓食和鳥群遷徙等,其共同特點是:個體數量龐大且智能相對簡單;僅具有局部感知能力,信息來自于自身、鄰居個體和外部環境;不存在統一的管理者,可以涌現出協調有序的狀態;具有生存(如覓食、遷徙或逃生等)優勢.受此啟發,群集行為作為群體機器人協調控制中最基本的問題之一成為現今的研究熱點.所謂群集行為,是指群體中每個個體利用自身信息、與其鄰居進行交互獲取的局部信息,以及所在運行環境反饋的導航信息不斷更新自身控制策略,使整個群體聚集有序地按相同方向運動.
本文將對群集行為的研究現狀從群體對環境的適應、穩定狀態可控和性能優化進行總結及分析.
群集行為的適應性是指群體機器人能夠根據跟蹤目標和外界環境的改變產生不同的協調控制策略而使整個群體仍能實現群集.從外界環境的角度來看,目前的研究逐步從理想無障礙物環境過渡到了存在障礙物的復雜環境,并取得了豐碩的研究成果.
最初關于群集行為的研究都是基于理想的無障礙環境展開的,如 Boid 模型[1],Vicsek 模型[2]以及吸引排斥模型[3]等經典群體動力學模型的建立.
Boid模型所遵循的三條規則為:①中心靠攏;②避免碰撞;③速度匹配.雖然只是實現了計算機仿真實驗,但之后很多研究都是基于該模型的規則.文獻[4]運用圖論、非光滑分析以及Lyapunov穩定性理論等給出了集群現象的理論解釋,提出了局部控制策略,使群體最終實現穩定的群集運動.Vicsek模型是對Boid模型進行簡化,其更新規則是將鄰近個體速度方向的非線性均值作為下一時刻個體的速度方向,并通過仿真實驗驗證了策略的有效性.文獻[5]利用圖論、矩陣論和控制論對Vicsek模型的穩定性進行了理論證明.顯然,上述研究均沒有考慮環境對系統的影響.文獻[6]提出了一系列吸引排斥函數來描述個體間的相互作用,并設計了分布式控制器來分析n維空間中某種特定環境下的群體聚集行為.文獻[7]分析了具有不同虛擬力的群集系統的穩定性.文獻[8]利用虛擬力和最近鄰居原則來實現群集運動.文獻[6-8]的研究中雖然沒有考慮環境中存在障礙物的情況,但是卻利用特定的梯度函數對環境進行了描述,同時環境的作用也反饋到群體的控制策略當中,起到了導航作用.
障礙物環境接近群體機器人實際應用的真實環境,故研究此環境中的群集行為更具現實意義.
文獻[9]假設群體中部分個體能夠對其遇到過的障礙物產生有限記憶,從而使群體更快到達目標區域,實現自組織的群集行為.通過對六種不同障礙物地形進行了仿真實驗,結果表明:至少在某些領域這個猜想是正確的.文獻[10]定義當個體與障礙物的距離小于臨界值時,該障礙物邊緣對應產生一個虛擬障礙物個體,并利用人工勢能函數設計了分布式群集避障算法,避免了個體在運動過程中與障礙物的碰撞.但此算法只適用于凸形障礙物環境.文獻[11]提出了障礙物環境中的自適應群集算法,群體可以根據環境條件分散成多個群體或重新組合為一個群體,實驗結果表明:群體能夠不斷重復分區過程并通過多個狹窄通道.文獻[12]利用模糊邏輯設計分布式避障控制算法,使群體實現了障礙物環境中群集運動,進行了穩定性分析,并通過仿真實驗進行了進一步的驗證.文獻[13]在網絡初始狀態處于連通的條件下,結合人工勢能函數與流函數設計了能夠使群體實現期望的穩定群集運動的分布式群集避障控制算法,該算法能夠使群體保持連通,并且順利避開障礙物而沒有陷入局部極小.
盡管關于群體對環境的適應的研究取得了一定進展,但對于實際應用中更為復雜多變的不確定環境,群體適應性研究還有待進一步地深入.
群集行為的可控性是指通過設計控制策略使群體最終達到期望的協調有序狀態(速度和位置).目前,為解決群集行為的可控性問題,研究者分別在群體引入了領導者和軟控制的概念.
文獻[14]指出海洋中的魚群里有一部分魚在起“領導者”作用.可見,在群體機器人中引入領導者是合理的.文獻[10]引入了具有恒定速度的全局作用范圍的虛擬領導者,設計了分布式協調控制算法,并從理論和仿真上證明群體能夠實現期望的群集行為.文獻[15]指出僅有少數個體能夠獲得虛擬領導者的信息,群體就能夠在通信拓撲結構保持連通的條件下實現群集行為的可控.此虛擬領導者的作用范圍不再是全局的而是局部的,這更符合群體機器人中的個體僅具有局部通信能力的特點.文獻[16]利用圖論、非光滑分析結合群集勢能函數、速度一致性和導航反饋思想,對多智能體的分布式領導者跟隨者群集算法展開研究.群體中僅有一個具有時變期望速度的虛擬領導者,每個知情個體只感知到領導者的部分信息,但群體速度仍可漸近收斂到期望速度,同時,具有領導者位置信息的知情個體的中心也可最終跟隨上領導者的軌跡.另外,發現勢能函數的局部最小可以不形成α格形式.
文獻[17]所設定的領導者不再是虛擬的,而是群體中能感知到全局信息的部分真實個體,其他普通個體則僅能感知到局部信息,經理論分析和仿真實驗驗證所設計的群集算法有效.文獻[18]仍存在多個能夠獲取全局信息的領導者,與之前研究不同的是采用模糊控制方法對個體之間的相互作用力關系進行描述,除從理論上證明群體能夠實現穩定群集運動外,還利用實體機器人進行實驗驗證了控制器的有效性.
群集系統的突出特點是每個個體具有相對簡單的結構、有限的計算能力和局部的通信能力.實際上在想要使整個系統實現期望的控制目標時,不能夠以群體中個體復雜度的增加為代價,否則就違背了群體機器人系統上述最典型的特征.所以在遵循該原則的基礎上,文獻[19]中提出了“軟控制”這一概念,用于實現在破壞群體局部交互機制和個體的動力學規則的情況下對群體狀態的控制.所謂“軟控制”,即在群體機器人系統中引入的可以人為控制的特殊智能體“shill”,其運動更新策略與群體中的普通個體是不同的,但群體中的普通個體僅將其以普通個體看待進行鄰居范圍內的局部信息交互,而不會視其為特殊個體,這是與領導者控制算法最大的不同.同時,理論和仿真分析已經證明該控制策略的正確性和可行性.
但在上述文獻中,當有多個不同的期望狀態時,在不破壞群體局部規則的基礎上實現群集系統的可控問題仍沒有解決,需要進一步的研究.
群集行為的優化性是指利用優化算法實現群集系統的性能優化.
文獻[20]利用粒子群優化算法進行群體機器人群集算法的速度在線優化,使群體的收斂速度達到最大值.文獻[21]則是考慮群體機器人運行中的能量消耗問題,利用粒子群優化算法實現能耗最小的優化目標.文獻[22]將群體交互過程中通信量作為適應度函數,利用粒子群優化算法得到了最優的通信半徑和通信頻率.文獻[23]對基于粒子群優化建立起的群集算法進行了定性分析,并通過相應的仿真實驗驗證了算法的有效性,其最終目標是利用粒子群優化算法實現多目標跟蹤的群集行為.文獻[24]研究了結合拓撲優化的群集運動,提出一個分布式優化方案來降低群體跟蹤虛擬的目標時為保持連通性而造成的通信復雜度,并在此基礎上設計了分布式控制算法以實現群集行為.
上述研究均沒有考慮群集系統的綜合性能優化,即選擇主要性能指標,如能耗指標、通信量指標、快速性指標和準確性指標等,實現多目標優化.
群集行為的研究雖取得了一定進展,但想要應用于工程實際,還需專家學者進行更進一步的研究,并著重解決如下問題:①如何建立更合適的群集行為數學模型?②如何設計基于局部信息交互的群集控制算法?③如何達到群體最終協調有序狀態的可控?④如何實現群體對多種任務或復雜環境變化的適應?⑤如何獲得群體在個體失效或出現干擾情況下所表現出的魯棒性?⑥如何完成群體在實現群集行為基礎上的綜合性能優化?
[1]C.W.Reynolds,Flocks,birds,and schools:a distributed behavioral model[J].Proc.Of ACM Computer Graphics(SIGGRAPH'87),1987,21(4):25 -34.
[2]T.Vicsek,A.Czirok,E.Ben - Jacob,I.Cohen,O.Shochet.Novel type of phase transition in a system of self- driven particles[J].Physical Reviews Letter,1995,75(6):1226 -1229.
[3]A.Jadbabaie,J.Lin,A.S.Morse.Coordination of groups of mobile autonomous agents using neighbor rules[J].IEEE Transaction on Automatic Control,2003,48(6):988 -1001.
[4]H.G.Tanner,A.Jadbabaie and G.J.Pappas,Flocking in fixed and switching networks[J].IEEE Trans.Autom.Contr.,2007,52(5):863-868.
[5]V.Gazi and K.M.Passino.A class of attraction/repulsion functions for stable swarm aggregations[C].Proc.of Conference on Decision Control,Los Vegas,NV,Dec 2002:2842 -2847.
[6]V.Gazi and K.M.Passino.Stability analysis of swarms in an environment with an attractant/repellent profile[C].Proc.of the American Control Conference,Anchorage,AK,May 2002:1819 -1824.
[7]Xiaohai Li,Zhijun Cai and Jizhong Xiao.Biologically inspired flocking of swarms with dynamic topology in uniform environments[C].Proceedings of Conference on Decision and Control,New Orleans,LA,Dec.2007:2522 -2527.
[8]Dan Jin,Lixin Gao.Stability analysis of a double integrator swarm model related to position and velocity[J].Transactions of the Institute of Measurement and Control,2008.30(3 -4):275 -293.
[9]R.Winder,J.A.Reggia.Using distributed partial memories to improve self- organizing collective movements[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2004,34(4):1697-1707.
[10]R.Olfati- Saber.Flocking for Multi- agent Dynamic Systems:Algorithms and Theory[J].IEEE Transactions on Automation and Control,2006,51(3):401 - 420.
[11]Y.Hanada,Geunho Lee;Nak Young Chong.Adaptive Flocking of a Swarm of Robots Based on Local Interactions[C].Proceedings of Conference on Swarm Intelligence Symposium,Honolulu,HI,2007:340 -347.
[12]Hui Yu,Tiecheng Zhang,Jigui Jian.Flocking with obstacle avoidance based on fuzzy logic[C].Proceedings of Conference on Control and Automation,Xiamen,China,June,2010:1876 -1881.
[13]Qiang Wang,Hao Fang,Jie Chen,Yutian Mao,Lihua Dou.Flocking with obstacle avoidance and connectivity maintenance in multiagent systems[C].Proceedings of Conference on Decision and Control,Maui,HI,2012:4009 -4014.
[14]I.D.Couzin,J.Krause,N.R.Franks,S.A.Levin.Effective leadership and decision making in animal groups on the move[J].Nature,2005,433(7025):513 -516.
[15]Huosheng Su,Xiaofan Wang,and Zongli Lin.Flocking of Multi- Agent with a Virtual Leader[J].IEEE Transactions on Automation and Control,2009,54(2):293 - 306.
[16]Wenwu Yu,Guanrong Chen,Ming Cao.Distributed Leader-Follower Flocking Control for Multi-Agent Dynamical Systems with Time- Varying Velocities[J].Systems & Control Letters,2010,59:543 -552.
[17]Dongbing Gu,Zongyao Wang.Leader- Follower Flocking:Algorithms and Experiments[J].IEEE Transactions on Control Systems Technology,2009,17(5):1211 -1219.
[18]Dongbing Gu,Huosheng Hu.Using Fuzzy Logic to Design Separation Function in Flocking Algorithms[J].IEEE Transactions on Fuzzy System,2008,16(4):826 -838.
[19]Jing Han,Ming Li and Lei Guo.Soft Control on Collective Behavior of a Group of Autonomous agent y a Shill agent[J].Journal of Systems Science and Complexity 2006,19(1):54 -62.
[20]R.Vatankhah,S.Etemadi,M.Honarvar,A.Alasty,M.Boroushaki.Vossoughi,G.Online velocity optimization of robotic swarm flocking using particle swarm optimization(PSO)method[C].Proceedings of International Symposium on Mechatronics and its Applications,Sharjah,March,2009:1 -6.
[21]Mao Yang,Chengfeng Li,Yantao Tian.Flocking for Swarm Robot System:Distributed Coadaptive Control and Optimization[C].Proceedings of Conference on Information Engineering and Computer Science,Wuhan,Dec.2009:1 -4.
[22]Li Chengfeng,Hong Wei,Liu Zongchun and Tian Yantao.Traffic in cooperative consensus behavior of swarm robots[C].Proceedings of the International Conference on Machine Learning and Cybernetics.Guilin,2011:1368 -1375.
[23]A.S.Barrera,A.López - López,G.R.Gomez.Self- organization of agents for collective movement based on particle swarm optimization:A qualitative analysis[C].Proceedings of Conference on Electrical Communications and Computers,San Andres Cholula,2011:71 -76.
[24]X.Luo,D.Liu,X.Guan,S.Li.Flocking in target pursuit for multi- agent systems with partial informed agents[J].IET Control Theory & Applications,2012,6(4):560 -569.
TP24
A
1008-7974(2014)03-0036-03
2010-06-10
李成鳳(1986-),女,黑龍江巴彥人,碩士,教師.
國家自然科學基金項目(60675057).
(責任編輯:王前)