999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網絡系統的容錯控制、優化與博弈研究綜述

2022-11-02 09:47:46許宇航
南京航空航天大學學報 2022年5期
關鍵詞:智能故障系統

姜 斌,許宇航,楊 浩

(南京航空航天大學自動化學院,南京 211106)

隨著人工智能技術及其相關產業的空前發展, 人類社會生活和生產的方式發生了翻天覆地的變化。從系統規模的角度來看,傳統的單一、獨立的控制系統早已無法滿足與日俱增的生產需求,取而代之的是大規模網絡化和信息化的系統。從控制技術創新的角度來看,以往通常以實現系統穩定性為主要目標;而現今,如何在保證系統穩定性的同時降低系統的能源消耗、優化系統的性能成為重要的控制目標。在這樣一個生產和需求相互矛盾的時代背景下,網絡系統的模型和架構應運而生。網絡系統是一類由多個子系統相互耦合構成的系統,包括互聯系統[1-2]、多智能體系統[3-4],以及近幾年成為研究熱點的信息-物理系統[5-6]等。網絡系統的耦合機制主要有兩種:機械耦合和通信耦合。互聯系統是一類典型的以機械耦合的網絡系統,廣泛應用于高速列車[7]和智能電網[8]等場景中。多智能體系統是一類典型的以通信耦合的網絡系統,廣泛應用于集群飛行器[9]和智能交通[10]等場景中。

在如此復雜的網絡系統中,其安全性成為首要考慮的因素。然而由于機械老化、儀表失靈等因素導致的故障時有發生[11],給人類的生命和財產安全帶來了巨大的威脅。1979 年5 月25 日,美國航空191 航班,在起飛過程中發生一側引擎脫落,引起飛機的襟翼失控,僅起飛不到1 min 便發生墜毀,事故造成共273 人不幸罹難。2011 年7 月23日,由于受到雷擊等惡劣天氣的影響,鐵路甬溫線發生數據采集回路保險管的熔斷事件,致使調度中心錯誤地以為當前鐵路區間空閑,造成兩列車追尾事故和重大人員傷亡。這些事例警示故障診斷和容錯控制的重要性[12-13]。在網絡系統中,故障可分為個體故障和網絡故障兩種類型[14]。個體故障指的是發生在子系統內部的故障,如執行器故障和傳感器故障等[15-18]。這類故障首先影響的是故障子系統的穩定性,如果不加以處理,個體故障容易通過子系統之間的耦合,進而影響其他子系統的穩定性。網絡故障指的是影響耦合機制的故障[19-20],如通信鏈路故障、網絡拓撲變化等。這類故障通過改變耦合機制,進而影響每個子系統的穩定性。以上兩類故障都是威脅網絡系統安全性的關鍵因素,如果處理不當,極有可能導致整個網絡系統的崩潰和瓦解。

為了保障網絡系統的安全性,亟需設計可靠的容錯控制方法來降低甚至消除故障對系統的影響,使得系統可以穩定安全地運行。經典的容錯控制方法主要分為兩類[21-23]:被動容錯控制和主動容錯控制。被動容錯控制[24-25]基于魯棒控制的思想,在固定控制器結構的情況下,設計對故障不敏感的控制器。當故障發生時,無需重新配置控制器,其自身對故障具有容錯能力。但是這種方法只適用于預設范圍內的故障,無法靈活處理預設之外的故障。為了彌補被動容錯控制的局限性,主動容錯控制得以發展。主動容錯控制[26-28]通過設計故障診斷機制,采集故障信息,進行有效的故障估計,從而利用故障估計的信息來重新配置控制器,以保證系統的穩定性。

隨著科學技術的不斷發展,僅僅維持系統的穩定性已然不夠,如何優化系統的性能成為重要的控制目標。最優控制理論為實現系統性能的優化提供了結實的理論基礎[29-30]。最優控制理論不僅可以有效地處理網絡系統中各個子系統的動力學約束,還可以處理其他附加約束條件,比如最小能耗和最短時間等特殊的需求。而針對具有多個子系統的網絡系統,其優化過程往往面臨著雙邊或者多邊共同優化的問題。博弈論成為處理這類問題的一個強有力的工具。

博弈論大致誕生于二戰之后,起源于經濟學,博弈論之父——馮諾依曼教授所著的《博弈論與經濟行為》是博弈論學科的奠基性著作[31]。20 世紀60 年代,數學家Issacs 教授在研究追逃問題時,將最優控制理論中的相關概念和思想引入博弈論中,進而催生了微分對策理論[32]。而在國內,張嗣瀛院士是微分對策理論與應用研究的先驅。他建立了一套完整的定量和定性的微分對策的理論體系[33],并將其成功地應用于導彈制導等軍事場景中。博弈論和控制論的關系就好比一對孿生兄弟[34]。它們最大的相同之處在于優化所設定的目標;最大的區別在于研究對象的智能化程度不同。控制論面向的是非智能化的系統,而博弈論面向的是智能化的玩家。因此,博弈論中的玩家像“人”一樣擁有自私屬性,并發揮這種自私屬性,試圖將自己的利益最大化。博弈論和控制論在各自發展了大半個世紀之后,在今天由于系統對象的復雜化和控制目標的多樣化而融合到一起,從而誕生了一個新興的交叉學科——博弈控制論。由于博弈控制論具有靈活處理多邊沖突、合作與競爭關系的能力,其諸多優點和巨大的應用潛力已經被廣大學者認可,近幾年陸續取得了一系列代表性的成果[35-39]。而值得一提的是,在博弈論和容錯控制理論的交叉領域,其相關成果幾乎空白,至今鮮見。

博弈論在航空航天領域發揮著重要作用,特別是集群飛行器的相關領域,博弈論可以迎合集群飛行器的任務需求,設計不同的博弈類型,實現規定的任務目標并優化系統的性能。根據集群的結構特點,其編隊控制的設計可以分為基于領導者-跟隨者模式的編隊控制、基于行為模式的編隊控制和基于虛擬結構的編隊控制等[40-42]。基于集群的結構特點,設計對應的容錯控制方法能夠有效提升集群飛行器的安全性能[43],從而降低由于物理故障導致的經濟損失。在此基礎上,根據集群飛行器任務分配、航跡規劃和編隊控制3 個環節各自的特點,設計面向博弈的機制,能夠有效提升無人機決策的智能性,使集群性能達到更高的品質要求。

基于以上研究背景,本文將緊緊圍繞以下問題進行梳理總結。

問題描述 考慮兩類典型的網絡系統,即通過機械耦合的互聯系統和通過網絡耦合的多智能體系統,并以此類網絡系統的容錯控制、優化與博弈為研究目標來梳理國內外相關的研究成果。

下面將從網絡系統的容錯控制、容錯優化和容錯博弈3 個角度梳理現有的研究成果,并總結博弈論在集群飛行器中的應用現狀,最后給出幾個未來值得深入研究的方向。

1 網絡系統的容錯控制

本節首先總結網絡系統中3 種常用的控制器結構,接著根據容錯控制方法的不同特點,梳理網絡系統容錯控制的研究成果。

1.1 控制器結構

根據網絡系統中各個子系統之間信息交互的不同方式,容錯控制器的結構可分為3 種類型:集中式容錯控制器[44]、分布式容錯控制器[45]和分散式容錯控制器[46]。3 類容錯控制器的特點如圖1所示。

圖1 網絡系統容錯控制器的結構Fig.1 Structure of fault-tolerant controllers for network systems

3 種容錯控制器的優缺點總結如下。

(1)集中式控制器:在網絡系統中設計一個集中監測器,所有的子系統將自己的信息傳遞給集中監測器,再通過監測器把信息傳播給各個子系統。其造價昂貴,僅適用于規模較小的網絡系統[47]。

(2)分布式控制器:每個子系統均可以獲取其自身的信息以及鄰居子系統的信息。相較于集中式控制器,分布式控制器有助于節省信息交互的代價。因此,分布式控制器更適用于大規模的網絡系統[48]。

(3)分散式控制器:每個子系統僅獲取與自身相關的信息。因此,分散式控制器結構較為簡單,且易于實現,然而通常對系統的拓撲結構有較強的約束[49-50]。

1.2 容錯控制方法

根據網絡系統容錯控制方法的不同特點,其容錯控制方法可以分為獨立容錯控制和協同容錯控制[14]。獨立容錯控制方法通過單獨調節故障子系統的控制器實現網絡系統的容錯目標;協同容錯控制方法通過綜合調節故障子系統和健康子系統的控制器實現網絡系統的容錯目標。針對這兩種容錯控制方法,目前已經取得了相當豐富的研究成果。下面分別梳理這兩種容錯控制方法的研究成果。

獨立容錯控制方法延續傳統的被動/主動容錯控制[21-22]的思想,實現網絡系統的容錯目標。文獻[51]針對存在執行器故障和領導者未知有界輸入的多智能體系統,設計在線故障估計算法,并基于此設計自適應容錯跟蹤控制,保證系統的穩定性。文獻[52]基于分布式觀測器實現自適應故障估計,并將估計的故障作為補償項設計容錯控制器,保證多智能體的期望編隊構型。進一步,文獻[53]為分布式故障估計器設計了一個可調參數,有效地改善了故障估計的精確度。此外,人工智能相關的技術,例如模糊控制、神經網絡控制等也已滲透入容錯控制的領域。文獻[54]結合模糊控制理論,設計了自適應模糊跟蹤容錯控制方法,有效地解決了多智能體系統存在未知系統動態和時變執行器故障的問題;文獻[55]基于神經網絡技術,設計在線故障估計器,通過最小化估計誤差獲得最優神經網絡的權重,進而盡可能精準地逼近故障的信息。文獻[56]針對發生執行器故障的多智能體系統設計了基于迭代學習的智能容錯控制算法,從而擺脫了對精準參考軌跡的依賴。文獻[57]針對非線性互聯系統,將耦合項當作是子系統的不確定項,進而設計魯棒容錯控制器,有效實現了對故障的補償。文獻[56-57]通過結合人工智能領域的相關方法,成功將針對單個智能體的容錯控制方法推廣至網絡系統中實現其智能獨立容錯控制。文獻[58]設計了分布式魯棒跟蹤控制器,有效解決了互聯系統同時發生執行器故障和耦合故障時的容錯控制的問題。

協同容錯控制方法基于耦合機制的特點,量身定制網絡系統的容錯控制。文獻[59]針對具有機械耦合的互聯系統,提出基于環小增益原理的協同容錯控制方案;其主要思想為通過同時調整故障和健康子系統的控制增益,使得小增益條件得以滿足,保證整個互聯系統的穩定性。該方法首次提出協同容錯控制的思想,通過健康智能體和故障智能體之間的相互協作共同完成容錯目標,有效彌補了單個子系統容錯能力的不足。文獻[60]進一步地將研究成果推廣至非線性互聯系統,實現其容錯安全控制。文獻[61]針對多智能體系統發生執行器故障的情形,設計了分布式有限時間觀測器,并基于此設計分布式自適應容錯控制器保證系統在有限時間內收斂至理想值。文獻[62]提出基于分數階(Proportional integral derivative,PID)的自適應協同容錯控制方法,實現網絡化無人機在執行器故障和風擾的雙重影響下的安全控制。

獨立容錯控制方法是傳統的單個系統的容錯控制方法的直接推廣。協同容錯控制方法則立足于網絡系統的耦合特性,進而開發出的新的容錯控制方法。較之于獨立容錯控制方法,協同容錯控制方法通過充分調動健康子系統的控制器,從而有效地避免了故障子系統容錯能力的不足,保證了容錯目標的順利完成。

2 網絡系統的容錯優化

在保證網絡系統穩定性的基礎上,網絡系統的性能也備受關注。本節將從網絡系統的局部性能優化和全局性能優化兩個角度,梳理有關網絡系統容錯優化的研究成果。

2.1 局部系統的性能優化

局部系統性能優化關注的是容錯過程中子系統的性能變化情況。文獻[63]針對線性多智能體系統的3 種執行器故障:失效故障、卡死故障和浮動故障,建立其穩定性和局部最優性能的條件。研究表明,失效故障和卡死故障不會影響系統的穩定性和團隊的一致性,但是會影響智能體的收斂速率。不同于以上兩種故障類型的影響,浮動故障將會影響多智能體系統的一致性,而不影響系統的穩定性。進一步,文獻[63]設計了一個協同容錯控制方案使得領導者和健康跟隨者的策略可以隨著故障跟隨者策略的變化而變化。文獻[64]針對非線性多智能體系統提出了一個協同容錯控制方案,揭示了通訊協議和協同控制性能之間的關系,并且通過調整健康多智能體的控制率來實現多智能體的集結。

除了建立關于智能體本身的性能指標,還可以建立關于故障的指標作為控制器重構的依據。文獻[65]建立了一個量化故障估計不準確性的指標,并構建其與多智能體一致性之間的聯系。所設計的性能指標可以用來幫助重構健康智能體的權重,從而有效地彌補故障智能體對系統性能的影響。

2.2 全局系統的性能優化

全局系統的性能優化關注的是容錯控制過程中子系統局部性能和全局系統性能之間的平衡關系。文獻[66-67]建立了一個分層協同容錯控制的框架,如圖2 所示。整個分層協同容錯控制由3 層構成:底層為子系統容錯層,中間為隊形恢復層,頂層為性能監測層。子系統容錯層負責通過設計獨立容錯控制方案實現對故障的補償。隊形恢復層通過調節健康子系統的控制器來補償整個多智能體系統由于故障產生的性能損失,保證系統的穩定性。性能監測層負責綜合協調子系統容錯層和隊形恢復層,從而在最小化代價的情況下實現容錯目標。為了應對復雜多變的實際環境,這個分層協同容錯控制的框架被進一步擴展至離散系統[68]中實現其容錯控制的目標。以上文獻說明了分層協同容錯控制框架在理論上的完備性,以及在各類復雜系統中的可擴展性。不僅如此,該協同容錯控制框架還被廣泛地應用于航空航天領域,例如飛行器編隊和衛星編隊[69-70],有效保障了系統的安全性。

圖2 分層協同容錯控制框架Fig.2 Framework of hierarchical cooperative fault-tolerant control

另一種行之有效地可以同步實現子系統性能優化和全局系統性能優化的方法是微分博弈。文獻[71]針對同時具有狀態耦合和輸入耦合的互聯系統,提出基于零和微分圖博弈的被動容錯最優控制方法。通過在每個子系統內部構建零和博弈,設計魯棒最優控制器,并且在每個子系統之間構建圖博弈,實現全局Nash 均衡。為了降低被動容錯最優控制方法的保守性,文獻[72]針對互聯系統及其診斷觀測器之間存在的雙向交互影響而導致的分離原理無法成立的問題,提出基于斯坦伯格微分圖博弈的主動容錯最優控制方法。通過分析互聯系統與其對應的診斷觀測器之間的雙向交互影響,揭示兩者的運行機理,建立其主從決策機制,進而將互聯觀測器作為跟隨者,設計分布式最優故障估計,并且將互聯系統作為領導者,利用故障估計的信息,進一步設計分布式容錯最優控制器。所設計的控制策略可以保證閉環互聯系統的漸近穩定性,并實現博弈的交互式斯坦伯格均衡。

局部系統性能優化方法有利于各個子系統在容錯過程中單獨實現各自的控制目標并進行自身系統的優化,然而由于網絡系統中各個子系統相互耦合,一個子系統的性能優化可能會引起其他子系統性能的降級。為了解決這個問題,全局系統優化方法油然而生。這種方法在容錯控制過程中同時兼顧了子系統局部性能和全局系統性能之間的關系,有效化解了兩者相互矛盾的問題。

3 網絡系統的容錯博弈

本節沿著容錯博弈控制技術發展的進程,從網絡系統的博弈控制到面向物理故障的容錯博弈控制再到面向惡意決策的容錯博弈控制,梳理當前相關的研究成果。

3.1 網絡系統的博弈控制

博弈控制論通過融合博弈論和控制論的共同優點,為實現網絡系統的多方優化問題提供了強有力的理論基礎[73]。根據玩家之間關系的不同,博弈 分 為 多 種 類 型,如 零 和 博 弈[74,75-77]、追 逃 博弈[32,78]和斯坦伯格博弈[79-80]等。下面分別從零和博弈、追逃博弈和斯坦伯格博弈3 個方面總結國內外博弈控制的研究成果。

零和博弈具有玩家雙方代價之和為零的特點,即,一方獲利,則另一方必然利益受損[73]。利用這個特點,文獻[74]基于零和博弈,設計多智能體系統的H∞控制器,有效地抑制了外界擾動對智能體的影響。文獻[75]針對導彈攔截制導的問題,設計一對一的魯棒攔截制導率,保證導彈打擊的精準度。文獻[76]將事件觸發問題中的控制器和控制輸入誤差的閾值當做是零和博弈中兩個對抗的玩家,將最壞情況下控制輸入誤差作為閾值來設計事件觸發的條件。文獻[77]將信息-物理系統中攻擊和防御的問題轉化為零和博弈的問題,進而設計攻擊檢測機制和彈性安全控制策略來抵御攻擊的侵擾,保障信息-物理系統的安全。零和博弈在控制領域可以理解為一種魯棒控制,面對一定預設范圍內的對抗策略,所設計的另一方的博弈策略可以保證預期目標得以實現。

追逃博弈的玩家為追擊者和逃逸者,追擊者的目標是追捕逃逸者,而逃逸者的目標是逃離追擊者的追捕[32,78]。追逃博弈的問題通常可以轉化為零和博弈[32,78]或者非零和博弈[81-83]來研究。文獻[78]將航天器之間的追逃博弈問題轉化為零和博弈的問題,通過設計追逃雙方航天器的反饋控制率,形成零和博弈的鞍點,保證逃逸者可以被成功捕獲。針對多追1 的追逃博弈問題中存在追捕雙方視野差異的情形(即追擊者只能觀測到部分逃逸者和部分追擊者的情況,而逃逸者可以觀測到所有追擊者的實際情況),文獻[82]通過改進性能指標,設計最優追捕策略,保證追捕任務可以順利完成。文獻[84]基于非零和博弈設計多追多的追逃博弈策略,有效實現了有限時間內對逃逸者的捕獲,并保證追擊者系統的漸近收斂性。針對出現超級逃逸者的情形,即逃逸者的速度比追擊者的速度快,文獻[84]設計了一套合作包圍逃逸者的方案,依靠團隊合作,逮捕逃逸者。進一步,文獻[85]研究追擊者和逃逸者的角色不斷切換的目標-攻擊-防御博弈,其中攻擊者既需要扮演逃逸者,逃離防御者的追擊,也需要扮演追擊者,負責打擊目標。在這樣一個角色需要切換的追逃博弈中,文獻[85]分析了攻擊者打擊目標成功的可能性,并針對不同的追捕階段,設計目標和防御者的控制策略,保證追捕任務的順利完成。

斯坦伯格博弈的玩家由領導者和跟隨者構成[86],因此又稱之為主從博弈。這類博弈的特點是領導者和跟隨者構成主從決策機制。其中,領導者有“一步優先權”,可以將自身策略強加給跟隨者,在跟隨者收到領導者發布的策略之后,跟隨者會隨之做出最佳響應。與此同時,領導者具有觀察當前局勢的能力,可以根據跟隨者的策略調整自身的策略,進而做出當前最有利于自己利益的決策。文獻[79]基于斯坦伯格博弈主從決策的特點,研究智能電網中的供電公司和終端用戶之間的供需關系,分析如何合理定價的問題。在供電公司和終端用戶只能獲取局部信息的情況下,設計分布式算法,保證其可以收斂至斯坦伯格均衡點。文獻[80]研究在平均場的影響下,由一個領導者和N個跟隨者構成的斯坦伯格博弈的問題,提出了最優分散式控制器,所設計的控制策略可以收斂至改進的斯坦伯格-納什均衡點。文獻[39]針對網絡系統受到虛假數據注入攻擊的問題,利用斯坦伯格博弈設計防御者的策略,以最大程度地保護防御者的資源。

3.2 網絡系統的容錯博弈控制

雖然博弈控制論在各個領域呈現百花齊放之態勢,然而目前針對容錯控制和博弈控制的交叉研究領域的成果比較罕見。文獻[87]針對追逃博弈中追擊者和逃逸者發生執行器故障的情形,采用傳統的主動容錯控制技術,建立故障估計器,設計容錯最優控制器來補償故障對網絡系統的影響,保證逃逸者可以被成功捕獲。文獻[88]建立了電動車的4 個執行器發生故障情況下的合作博弈,通過設計帕累托最優解實現其容錯控制。文獻[89]進一步研究人的行為對容錯控制的影響,進而減輕了電動車的工作負載。此類基于博弈的容錯控制擁有一個共同的特點:博弈的特性僅體現在各個子系統之間,而所采取的容錯控制方法仍為傳統的主動容錯控制或者被動容錯控制,可稱之為外環容錯博弈控制。為了讓容錯控制本身帶上博弈色彩,文獻[71-72]設計內外環容錯博弈控制,通過深入挖掘控制器和故障之間博弈的機理設計了互聯系統的分布式被動和主動容錯最優控制方法,同步實現了子系統性能和全局系統性能的優化,并擺脫了互聯系統的主動容錯控制對分離原理的依賴。這種方法利用博弈將傳統的主動和被動容錯控制方法的工作機理加以實現,有效地解決容錯目標和系統優化目標相互矛盾的問題。

在博弈控制中,除了物理部件會發生故障,由于博弈本身的特性,玩家還有可能出現惡意決策的情形。相較于客觀因素造成的物理故障,惡意決策具有玩家的主觀性,帶有玩家的個人感情色彩,體現玩家感知能力的差異性。惡意決策的相關研究起始于行為學,近年來隨著人工智能的發展,慢慢滲透至工程領域。特別是針對人機交互的系統[90],如智能交通網絡等系統,研究其惡意決策行為對提升網絡系統的安全性具有重要意義。文獻[91]建立分層感知的框架,賦予每個智能體不同的感知水平以處理各種不同的突發狀況。文獻[92]提出一種基于強化學習的算法,以迭代的形式來捕捉智能體不同等級的想法和行為。文獻[93]通過在性能指標中設計吸引因子和排斥因子,研究蜂群的覓食行為。目前現有文獻大多以移除惡意決策個體為主要解決方法[94]。雖然這種方法可以減輕惡意個體對全局系統的負面影響。然而,面對具有幾何約束和動態約束的網絡系統,比如蜂群,這種方法不具有普適性。因為在蜂群中,移除惡意個體非常有可能造成正常個體和惡意個體之間的碰撞,從而導致蜂群的瓦解。另一方面,大多數關于惡意個體的研究成果關注的是由于資源或者通信交流限制等客觀因素造成的個體有限理性行為。為了研究主觀惡意行為對博弈的影響,文獻[95]建立了3 類具有主觀惡意決策行為的追擊者:貪婪型、懶惰型和背叛型追擊者,設計協同容錯博弈方法,并從可追捕性、Nash 均衡和追捕時間3 個方面分析了惡意決策對系統穩定性和博弈均衡性的影響。相較于基于魯棒控制思想設計的容錯博弈控制方法,文獻[95]通過設計協同容錯追捕方案實現了對逃逸者的合作圍捕,在面對不同類型的惡意追擊者時,具有更強的容錯能力。

4 博弈論在集群飛行器中的應用

本節以集群飛行器執行任務過程中核心的3個環節:任務分配、航跡規劃和編隊控制為線索,總結和梳理博弈論在集群飛行器上的應用成果,并分析當前研究現狀中3 個環節的設計特點以及不足之處。

集群飛行器作為一類以通信耦合的網絡系統,在軍事和民用方面都發揮著重要作用,例如森林防火[96]、敵情監測[97]等。近幾年,眾多學者開始將博弈論應用于在集群飛行器上,以尋求更優的系統性能。

在任務分配環節,聯盟編隊博弈及其衍生的博弈可以幫助建立無人機的個體偏好[98-102],進而將無人機分成不同的簇,實現多線程多區域的無人機的部署。文獻[100]基于享樂聯盟編隊博弈,建立無人機的自私偏好,使得在無人機在僅關注自身利益的情況下完成任務分配。此方法有利于提高無人機對環境的適應能力,使其可以靈活地應對新任務的加入和舊任務的移除。除了自私偏好,文獻[101]基于聯盟編隊博弈建立了無人機的利他偏好,使得無人機在考量自身利益的情況下,同時考量團隊的集體利益,有效實現了無人機的任務和頻譜的雙重分配。進一步,隨著無人機的個體偏好從關注聯盟成員的身份轉換成了關注聯盟成員的數量,文獻[102]建立匿名享樂博弈,研究了具有社會性抑制特性的無人機,在盡可能減少合作成員的情況下,實施聯盟切換準則,形成與任務匹配的Nash穩定的無人機分區。從以上文獻中可以看出聯盟編隊博弈及其衍生的博弈可以充分考量無人機的個體偏好,賦予無人機猶如人一樣的社會屬性,例如自私、利他和社會性抑制等屬性,進而無人機可以根據自己的喜好,選擇距離近的,燃油消耗較少的任務,以及選擇想要合作的聯盟成員。因此,在聯盟編隊博弈框架下的無人機越來越趨于智能化,符合當前人工智能的時代背景,擁有巨大的應用前景。

在航跡規劃環節,博弈可以適合集群所具有的系統規模龐大、通信耦合密切的特點,實現無人機路徑的自主規劃,并同時實現自主避障、最小化能耗等多方面的功能[103-106]。文獻[104]基于非零和博弈,實現避障條件約束下的無人機期望飛行軌跡的規劃。基于這個理論,文獻[105]設計了一個在線運行的機制,實現了軌跡規劃和軌跡跟蹤的同步優化。面向具有作戰需求的集群飛行器,文獻[106]將前景理論引入至博弈論中,建立無人機對作戰時間的主觀評估以及對風險的感知能力,實現無人機最優攻擊路徑的選擇,從而在盡可能降低自身損耗的情況下,保護目標點的資源。

在編隊控制環節,博弈能夠有效地刻畫各個無人機的不同目標,實現多無人機的一致性與構型保持[107-113]。文獻[107]基于非合作博弈,實現了領導者-跟隨者模式的集群編隊控制。進一步,通過將非合作博弈和收縮區間技術相結合,可以實現編隊飛行過程中的完全分布式控制[108]。文獻[109-110]基于Shapley 值建立各架無人機貢獻評價機制,利用超模博弈中策略互補的特性,可以選出最適合擔任領導者的無人機,進而實現有限領導者數量約束下性能指標的優化,以及有限性能約束下領導者數目的優化。文獻[111]針對存在外界擾動的編隊控制,構建零和博弈,有效地保證無人機編隊過程中的魯棒性,并且設計了分布式編隊控制策略,有效地降低信息交互的代價。在編隊重構的場景中,文獻[112]運用多目標多人博弈將編隊重構控制轉化為納什談判過程,結合分布式模型預測控制方法,實現無人機的威脅規避、協同保護和相互支援,同時有效降低無人機編隊自主重構控制問題的求解規模。

值得一提的是,在博弈框架下,目前集群飛行器的任務分配、航跡規劃和編隊控制3 個環節的策略通常是分開獨立設計的。這有利于實現每個環節的目標,并順著任務分配→路徑規劃→編隊控制的方向正向調節每個環節的性能,可稱之為開環設計。然而這種開環設計忽略了各個環節之間的雙向互動,無法建立反饋機制,難以根據實際情況對策略進行及時地調整。因此,亟需建立針對3 個環節一體化的博弈機制,使得每個環節的性能可以雙向可調。據調研,目前尚未有相關的研究成果。

5 結 論

本文從網絡系統的容錯控制、容錯優化和容錯博弈3 個角度總結了國內外相關的研究成果,并根據研究的問題、異常行為的類型以及所采取的容錯控制方法將現有的代表性文獻進行分類,總結為表1。進一步,梳理了博弈論在集群飛行器中的應用情況。下面給出未來值得繼續深入探索的研究方向。

表1 網絡系統的容錯控制、優化與博弈的相關研究成果Table 1 Representitive studies on fault-tolerant control,optimization,and game for network systems

(1)隨著科學技術的高速發展,現代控制系統呈現出復雜化和網絡化的特點,其故障特性更加難以捉摸。如何結合切換系統理論、非線性系統理論和圖論等理論知識,設計針對一般性線性/非線性網絡系統且滿足時變/切換等多種通信拓撲結構需求的容錯博弈控制技術是一個挑戰。

(2)博弈論作為多邊優化的有力工具,具有沖突消解的能力,如何將博弈論和容錯控制理論恰如其分地融合,發揮學科交叉的優勢,從而推動容錯控制理論的發展是未來一個重要的研究方向。值得一提的是,目前控制領域廣泛使用的零和博弈、非零和博弈等微分博弈,僅為博弈論的冰山一角。博弈論中尚存大量的博弈類型,比如共演化博弈、超模博弈等,如何汲取這些博弈的思想,并將其引入至容錯控制領域,解決容錯控制中難以解決的問題是一個值得深入研究的課題。

(3)發展人工智能乃大勢所趨,如何實現人-機混合增強智能是一個值得深入研究的課題。通過結合前景理論、強化學習和深度學習等理論,研究人類行為對容錯博弈控制的影響,進而設計智能容錯博弈控制算法,有助于從智能決策和智能學習兩個維度提升系統的安全性。

(4)當前容錯博弈控制技術大多處于理論研究階段,未來亟需將容錯博弈控制技術應用于例如衛星組網、集群無人機和智能電網等實際網絡系統中,實現其安全可靠的運行,這將具有重要的實際應用價值。

猜你喜歡
智能故障系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
故障一點通
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
奔馳R320車ABS、ESP故障燈異常點亮
主站蜘蛛池模板: 国产综合日韩另类一区二区| 97在线视频免费观看| JIZZ亚洲国产| 欧美中出一区二区| 毛片在线区| av大片在线无码免费| 激情综合网址| 乱码国产乱码精品精在线播放| 青青国产在线| 四虎成人免费毛片| 亚洲Av激情网五月天| 漂亮人妻被中出中文字幕久久 | 99视频精品在线观看| 国产日产欧美精品| 99在线视频网站| 日韩欧美国产综合| 最新国产成人剧情在线播放| 久996视频精品免费观看| 久久综合亚洲色一区二区三区| 精品一区二区三区四区五区| 欧美色亚洲| 黄色网在线| 久久亚洲国产视频| 日韩精品资源| 97视频在线观看免费视频| 亚洲日本一本dvd高清| 在线日韩日本国产亚洲| 欧美.成人.综合在线| 久视频免费精品6| 久久久久国产精品熟女影院| 香蕉视频在线观看www| 免费在线a视频| 日韩a在线观看免费观看| 一区二区在线视频免费观看| 久久熟女AV| 国产成人毛片| 国产91特黄特色A级毛片| 理论片一区| 亚洲精品卡2卡3卡4卡5卡区| 国产网站免费观看| 亚洲三级影院| 18禁影院亚洲专区| 国产爽爽视频| 亚洲国模精品一区| 最新国产你懂的在线网址| 国产精品30p| 国产成人久久综合777777麻豆 | 久久77777| 69综合网| 国产欧美在线视频免费| 欧美乱妇高清无乱码免费| 在线观看免费AV网| 亚洲V日韩V无码一区二区| 中文字幕伦视频| 色成人亚洲| 亚洲香蕉久久| 中文字幕 91| 亚洲女人在线| 另类欧美日韩| 日本道综合一本久久久88| 5555国产在线观看| 久久人与动人物A级毛片| 亚洲第一黄色网址| 喷潮白浆直流在线播放| 亚洲欧洲日韩综合色天使| 亚洲天堂精品视频| 色婷婷狠狠干| 成人综合久久综合| 无码电影在线观看| 国产大片喷水在线在线视频| 免费a在线观看播放| 国产精品亚洲va在线观看| 久久国产精品无码hdav| 国产日韩欧美一区二区三区在线| 国产亚洲精| 日韩精品中文字幕一区三区| 色AV色 综合网站| 国产一区二区三区精品久久呦| 理论片一区| www.精品国产| 黄色网在线免费观看| 国产欧美日韩在线在线不卡视频|