999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進(jìn)目標(biāo)收益函數(shù)的無人機集群空地對抗模型

2021-12-31 02:21:46王爾申肖明明曲萍萍
關(guān)鍵詞:模型

王爾申,郭 靖,宏 晨,肖明明,劉 暢,曲萍萍

(1.沈陽航空航天大學(xué)電子信息工程學(xué)院,沈陽 110136;2.沈陽航空航天大學(xué)遼寧通用航空研究院,沈陽 110136;3.北京聯(lián)合大學(xué)多智能體系統(tǒng)研究中心,北京 100101;4.北京聯(lián)合大學(xué)北京市信息服務(wù)工程重點實驗室,北京100101;5.北京聯(lián)合大學(xué)機器人學(xué)院,北京 100101;6.北京聯(lián)合大學(xué)智慧城市學(xué)院,北京 100101)

近年來,智能集群技術(shù)已成為無人機(Unmanned aerial vehicle,UAV)技術(shù)的發(fā)展熱點,直接催生了一種新的無人機作戰(zhàn)模式——無人機集群作戰(zhàn)[1]。集群作戰(zhàn)的理論基礎(chǔ)是群體智能。就像飛機的靈感來自于飛鳥,雷達(dá)的靈感產(chǎn)生自蝙蝠,集群技術(shù)的靈感來源于蜂群,蟻群,狼群等群居自然生物。集群內(nèi)部分工明確,每個個體遵循簡單的行為和規(guī)則,不需要核心個體的統(tǒng)一調(diào)度,便能自發(fā)地形成一個有機整體,實現(xiàn)復(fù)雜而強大的系統(tǒng)功能[2]。無人機集群對抗中,每個作戰(zhàn)個體可以根據(jù)作戰(zhàn)場景中雙方的態(tài)勢不斷學(xué)習(xí),并自動調(diào)整自身的行為以應(yīng)對各種復(fù)雜戰(zhàn)場態(tài)勢[3]。

無人機集群對抗模型的研究發(fā)展主要有空空對抗和空地對抗2個方面。在空空對抗方面,Zohdi等引入短程與長程作用力,提出基于“點-質(zhì)量群”的機械力學(xué)模型模擬蜂群行為,建立一種離散multi-agent模型去模擬無人機集群對抗博弈行為[4-6];陳燦等根據(jù)多智能體強化學(xué)習(xí)(Multi agent reinforcement learning,MARL)的集中式訓(xùn)練分布式執(zhí)行(Centralized training with decentralized execution,CTDE)范式,在Actor-Critic框架下建立無人機集群對抗博弈模型[7];羅德林等引入多Agent系統(tǒng)、態(tài)勢評估和空戰(zhàn)對抗等理念,為每個無人機建立獨立的Agent,設(shè)計相應(yīng)的決策方法,以此建立無人機集群對抗模型[8];軒書哲等針對大規(guī)模無人集群攻防對抗問題,使用強化學(xué)習(xí)將問題建模為基于馬爾科夫決策過程(Markov decision process,MDP)的多智能體近端策略優(yōu)化(Multi-agent proximal policy optimization,M-PPO)無人機集群對抗模型[9];符小衛(wèi)等針對多無人機協(xié)同對抗博弈問題,通過強化學(xué)習(xí)和無人機動力學(xué)模型建立了無人機協(xié)同對抗追逃博弈模型[10];章豪等通過無人機運動學(xué)模型以及協(xié)同約束,建立了無人機集群協(xié)同規(guī)避的博弈模型[11];Liu等在二維視角下通過質(zhì)點運動模型,建立分布式無人機協(xié)同編隊博弈策略模型[12];Xing等針對無人機協(xié)同對抗任務(wù)搜索,建立分布式柵格化無人機集群運動模型,提出基于人工勢場-蟻群的路徑規(guī)劃決策優(yōu)化算法[13];Jia等針對異構(gòu)無人機集群協(xié)同對抗路徑規(guī)劃問題,提出擴展多智能體的分布式任務(wù)的基于共識捆綁算法(Consensus based bundle algorithm,CBBA)[14];王爾申等針對無人機集群協(xié)同對抗問題,根據(jù)復(fù)雜網(wǎng)絡(luò)理論,構(gòu)建無人集群協(xié)同對抗網(wǎng)絡(luò),基于邊攻擊成本分析協(xié)同網(wǎng)絡(luò)級聯(lián)效應(yīng)及魯棒性[15-17]。

在空地對抗方面,Cruz等將集群空地對抗行為看作是高度復(fù)雜的非線性動態(tài)系統(tǒng),把動態(tài)博弈過程分為多級決策,建立非線性動力學(xué)模型[18-19];趙玉亮等針無人機空地對抗的不確定性和復(fù)雜性,考慮多因素提出了一種多目標(biāo)雙矩陣博弈模型[20];魯鴻軒等針無人機空地自主對抗問題,分析對抗行為,提出一種三支理論的無人機空地對抗模型[21];薄寧等針對有/無人機協(xié)同空地對抗博弈問題,將博弈對抗建模為MDP模型并通過求解MDP模型得到對抗策略[22]。

現(xiàn)有的群體動態(tài)博弈模型的收益參數(shù)多是在初始狀態(tài)下設(shè)定的,動態(tài)博弈過程中不再變化,使得目標(biāo)收益函數(shù)不能實時反映戰(zhàn)場態(tài)勢的動態(tài)變化,導(dǎo)致博弈決策滯后于戰(zhàn)場態(tài)勢的變化[18-19]。本文針對戰(zhàn)場態(tài)勢實時變化導(dǎo)致目標(biāo)收益函數(shù)動態(tài)變化的問題,以無人機集群與地面防空陣地為博弈雙方,應(yīng)用非合作博弈理論,使用空間狀態(tài)矩陣表征戰(zhàn)場態(tài)勢,給出基于戰(zhàn)場態(tài)勢的自適應(yīng)權(quán)重表達(dá)式,建立了無人機集群空地對抗博弈模型。仿真驗證了基于自適應(yīng)權(quán)重的博弈模型的合理有效性。本文主要貢獻(xiàn)是在于提出的自適應(yīng)收益權(quán)重因子以及命中因子衰減,目的是為了提高無人機集群對抗模型的適應(yīng)性。

1 無人機集群空地對抗博弈模型

設(shè)定作戰(zhàn)雙方為紅方(Red)和藍(lán)方(Blue),紅方為防守方,藍(lán)方為進(jìn)攻方。藍(lán)方是由無人戰(zhàn)斗機UCAV(Unmanned combat air vehicle),偵察無人機RUAV(Reconnaissance UAV)組成的無人機集群。紅方由電子雷達(dá)陣地(Electronic radar fronts,ERF)和地面防空導(dǎo)彈陣地(Ground air defense fronts,GADF)組成。

1.1 戰(zhàn)場態(tài)勢

設(shè)紅藍(lán)雙方的作戰(zhàn)單位分別有NRER、NRAD、NBC、NBR,其中RER表示紅方的電子雷達(dá),RAD表示紅方的防空導(dǎo)彈,BC表示藍(lán)方的戰(zhàn)斗無人機集群,BR表示藍(lán)方的偵察無人機集群。用k=0、1、…、K表示離散的對抗時間步,k=0表示初始狀態(tài),K為對抗的最大時間步。對抗時間步k的間隔設(shè)定為1s,即對抗在第0s初始化,第1s開始,第Ks結(jié)束。不妨將博弈的參與者統(tǒng)一定義為X={RER,RAD,BC,BR}(i=1,2,…,NX),Xi表示參與者X的第i類作戰(zhàn)單位。

1.1.1 基礎(chǔ)狀態(tài)矩陣

根據(jù)空地對抗場景,給出作戰(zhàn)單位的基礎(chǔ)狀態(tài)矩陣

式中:(k)=[(k)(k)(k)]為k時刻Xi三維坐標(biāo),(k)為Xi的數(shù)量,(k)為Xi的武器載荷量,(k)表示Xi的基礎(chǔ)狀態(tài)矩陣。

1.1.2 作戰(zhàn)參數(shù)矩陣

根據(jù)無人機、雷達(dá)以及地空導(dǎo)彈等作戰(zhàn)單位的攻擊特性,建立參數(shù)矩陣

式中:為Xi的作戰(zhàn)半徑,為Xi的飛行高度,(k)為Xi的飛行速度,(k)為Xi的最大火力,表示Xi的參數(shù)矩陣。

1.1.3 決策參數(shù)矩陣

把雙方的位移,火力以及目標(biāo)選擇設(shè)為對抗行為控制因素,表示博弈決策信息

式中θ為投影在XOY面上無人機的目標(biāo)偏角。通過雙方位置得到θ從而求得坐標(biāo)增量。

得到基于空間狀態(tài)的Xi戰(zhàn)場態(tài)勢矩陣MX i(k)

式中:TX i(k)為4維向量,ZX i(k)和UX i(k)為5維向量,MX i(k)為14維向量。

因此,整體戰(zhàn)場態(tài)勢矩陣可表示為

式中

式中:MBlue(k)為無人機群狀態(tài)矩陣,MRed(k)為地面部隊狀態(tài)矩陣,M為NRed+NBlue維矩陣。

1.2 對抗過程

復(fù)雜而多變的無人機集群對抗環(huán)境具有狀態(tài)不確定性,為了簡化對抗過程而提出如下約束。

1.2.1 攻擊約束

式 中:Δsx、Δsy、Δsz分 別 為x、y、z軸 的 距 離 分 量;ΔxyzXY為計算XY之間的歐氏距離。紅藍(lán)雙方的有效射程限定了火力輸出(k),在k時刻 敵 方Y(jié)進(jìn)入我方X有效射程RX內(nèi),我方才可攻擊。

1.2.2 武器載荷約束

下一時間步的火力輸出不能超過當(dāng)前時間步的載荷儲備

式中CX(k+1)為k+1時刻X的最大火力值。

1.3 狀態(tài)更新

1.3.1 位移更新

位置坐標(biāo)的狀態(tài)轉(zhuǎn)移方程為

式中ΨX i(k)、ζX i(k)分別為Xi的坐標(biāo)向量和坐標(biāo)增量向量。

1.3.2 數(shù)量更新

(1)判決函數(shù)

上面兩函數(shù)實現(xiàn)了描述的二值化,從而可以利用0~1分布作為目標(biāo)及距離的判定函數(shù)。

Q(k)是Xi投入的單位數(shù)量防御因子去抵消Yj投入的單位數(shù)量攻擊因子,即滿足Xi單位數(shù)量防御因子等于Yj單位數(shù)量攻擊因子。討論兩種特殊情況:

(3)損耗因子A(k)

式中:K(k)為命中因子,Yj表示攻擊Xi時,Xi被命中的概率。

在對抗過程中,紅方的RER第1類作戰(zhàn)單位(簡寫RER1)擁有電子偵察能力,RER2具有電子干擾能力。電子干擾能夠擾亂無人機的導(dǎo)航信息和通信鏈路,導(dǎo)致無法正常工作,從而降低甚至喪失作戰(zhàn)能力,是反制無人機的重要方式[23],可以對藍(lán)方無人機集群造成嚴(yán)重影響。RER2使得無人機集群的攻擊,飛行以及通信等能力受到制約,將影響集中體現(xiàn)在命中因子中,本文提出了如下命中因子衰減方式。

1.3.3 載荷更新

1.4 收益(支付)函數(shù)

博弈對抗的目的是給予雙方一定量的初始對抗資源的前提下:(1)盡可能保留己方在博弈結(jié)束時的作戰(zhàn)資源;(2)最大化減少敵方在博弈結(jié)束時的作戰(zhàn)資源。雙方的收益(支付)函數(shù)表示如下

式 中:αi、βi(i=1,2,3,4)都 是 靜 態(tài) 權(quán) 重;JB(k)和JR(k)分別為藍(lán)方和紅方在k時刻的目標(biāo)收益函數(shù);(k)為歸一化的Xi作戰(zhàn)單位數(shù)量變化量。其中,(0)是Xi作戰(zhàn)單位數(shù)量的初始值

2 自適應(yīng)權(quán)重的收益函數(shù)

考慮無人機集群的復(fù)雜對抗環(huán)境,針對收益函數(shù),靜態(tài)權(quán)重的收益函數(shù)不能有效的反映當(dāng)前對抗局勢[8-9]。對抗博弈的收益簡單認(rèn)定為作戰(zhàn)單位數(shù)量的線性表征會使得誤差增大,還應(yīng)考慮作戰(zhàn)單位的武器載荷量,作戰(zhàn)單位的作戰(zhàn)狀態(tài)等對局勢有影響的因素,復(fù)雜的戰(zhàn)場環(huán)境應(yīng)使得對抗博弈的收益考慮多方面因素的組合。

2.1 自適應(yīng)權(quán)重

作戰(zhàn)單位數(shù)量是反映收益函數(shù)的關(guān)鍵因素,而其權(quán)重表征了在對抗中作戰(zhàn)單位數(shù)量變化的重要程度。作戰(zhàn)單位數(shù)量變化的重要程度與火力值(k),命中因子K(k)和武器載荷量WiX(k)等作戰(zhàn)指標(biāo)有關(guān)。

2.1.1 火力值權(quán)重分量

式中:ηc1為火力值權(quán)重分量,Xi的σiX經(jīng)驗取值區(qū)間為[0,1.8]。

2.1.2 武器載荷權(quán)重分量

根據(jù)式(8),武器載荷量WiX(k)限制了下一時間步的攻擊閾值CiX(k+1)。作戰(zhàn)單位的武器載荷量代表了該作戰(zhàn)單位在戰(zhàn)場局勢的潛在威脅程度,結(jié)合數(shù)量變化量能更合理表征潛在威脅程度。引入均衡冪因子,調(diào)節(jié)作戰(zhàn)單位的潛在威脅程度表征重要程度的比例關(guān)系

式中WiX(0)為Xi武器載荷量的初始值。

2.1.3 命中因子權(quán)重分量

根據(jù)式(14),命中因子是單調(diào)減函數(shù),命中因子越小則對戰(zhàn)場態(tài)勢的影響越小,使得k時刻Xi的重要程度減小,引入命中因子均衡因子,調(diào)節(jié)命中因子對權(quán)重的影響

式中K(0)為Xi命中因子的初始值。

綜上所述,針對不同作戰(zhàn)單位,根據(jù)戰(zhàn)場態(tài)勢,綜合k時刻的決策信息,提出一種用來動態(tài)計算目標(biāo)收益函數(shù)的自適應(yīng)權(quán)重,自適應(yīng)權(quán)重表達(dá)式如下

紅藍(lán)雙方權(quán)重更新式如下

2.2 改進(jìn)的收益函數(shù)

加入自適應(yīng)權(quán)重的博弈雙方目標(biāo)收益函數(shù)如下

3 博弈策略

無人機集群空地對抗是一種非合作博弈,為求解納什均衡,根據(jù)極小極大值方法,表征出雙方一般和博弈目標(biāo)收益和

其目的是最大化己方的收益,同時減小敵方的收益。

式中:(ΠB,ΠR)分別表示雙方所有可選的策略空間,(πB,πR)為雙方的策略空間中的任一策略。

其中(ΠB,ΠR)策略空間中包括了雙方狀態(tài)下對應(yīng)所執(zhí)行的多維動作,有位移增量、火力值、目標(biāo)選擇以及電子干擾的4維動作。

空地對抗博弈算法具體流程如下所示。

輸入:初始化作戰(zhàn)雙方位置,速度等狀態(tài)數(shù)據(jù)輸出:J是目標(biāo)收益

初始化:仿真次數(shù)E=7200,對抗回合數(shù)K=25,X=[blue,red],N=[Nblue,Nred],=[ZiX(k),TiX(k)],=[UiX(k)](i=1,2,…,N),動作探索參數(shù)ε=0.5

4 實驗仿真

4.1 初始數(shù)據(jù)

設(shè)定對抗活動處于恒定高度的三維空間內(nèi),高度可以通過參數(shù)設(shè)置,即(k)=HiX。對抗示意圖如圖1所示,藍(lán)方處于左下角,紅方處于右上角,為了顯示清晰,作戰(zhàn)單位在示意圖中適當(dāng)偏移。

圖1 紅藍(lán)雙方對抗初始示意圖Fig.1 Initial picture of the red-blue confrontation

模型的初始化參數(shù)如表1~4所示,其中表1參考了實際戰(zhàn)爭的作戰(zhàn)參數(shù),描述了作戰(zhàn)單位的初始狀態(tài),表2~4參考了文獻(xiàn)[17-18]的設(shè)定,其中表2是自適應(yīng)權(quán)重的初始值;表3是作戰(zhàn)單位的命中因子的初始值;基于攻擊目標(biāo)選擇策略的不確定性,設(shè)定雙方的選擇目標(biāo)概率如表4所示。其中,RER2=0表示紅方不對藍(lán)方施加電子干擾,RER2=1表示紅方對藍(lán)方施加電子干擾。例如:0.6 (0.8 )表示不加干擾的選擇概率為0.6 ,施加干擾時選擇概率為0.8 。

表1 作戰(zhàn)單位基礎(chǔ)數(shù)據(jù)Table1 Basic data of combat units

表2 收益函數(shù)的初始權(quán)重Table2 Initial weight of reward function

表3 作戰(zhàn)單位的命中概率Table3 Hit rate of combat units

表4 作戰(zhàn)單位的選擇目標(biāo)概率Table4 Rate of target selection for combat units

自適應(yīng)權(quán)重的各因子在近似最佳值左右各取一個對稱的合理范圍進(jìn)行試驗,如表5、6所示,括號外為有電子干擾(Electromagnetic interference,EI)的值,括號里為無電子干擾(Non-EI,NEI)的值。如 在表5中BC1的為0.5 ~1.5 (0.4 ~1.6 )。表示在EI情況下取值范圍為0.5 ~1.5 ,NEI情況下取值范圍為0.4 ~1.6 。

表5 藍(lán)方α權(quán)重的均衡因子Table5 Balance factor of blue α weight

表6 紅方β權(quán)重的均衡因子Table6 Balance factor of red β weight

4.2 仿真結(jié)果

在求解納什均衡時,采用蒙特卡洛方式進(jìn)行7200次仿真,對每一步的收益函數(shù)取期望-JβR、-JαB作為納什均衡的近似解,數(shù)據(jù)經(jīng)均值化處理,誤差棒為標(biāo)準(zhǔn)差,實驗結(jié)果如下。

4.2.1 目標(biāo)收益

如圖2所示,藍(lán)色矩形表示藍(lán)方無人機集群,紅色圓表示紅方地面部隊,黑色三角表示雙方的收益和,實心表示有EI,空心表示NEI。縱坐標(biāo)為目標(biāo)收益J,橫坐標(biāo)為對抗時間步k,施加電子干擾EI的對抗區(qū)間為[7,15]。

圖2 靜態(tài)權(quán)重和自適應(yīng)權(quán)重的目標(biāo)收益Fig.2 Target reward of static weights and adaptive weights

圖2(a)表示在NEI情況下,紅方的目標(biāo)收益NEI-JR減小,藍(lán)方的目標(biāo)收益NEI-JB增大,藍(lán)方在對抗中更占優(yōu)勢;在EI情況下,紅方的目標(biāo)收益EI-JR增大,藍(lán)方的目標(biāo)收益EI-JB減小,紅方在對抗中更占優(yōu)勢。收益和EI+與NEI+均減小。圖2(b)表示在NEI情況下,NEI-JR減小,NEI-JB增大。藍(lán)方在對抗中更占優(yōu)勢;在EI情況下,EI-JR增大,EI-JB減小,紅方在對抗中更占優(yōu)勢。而收益和EI+增大NEI+減小。圖2(b)子圖中,收益和NEI+持續(xù)減小,表明藍(lán)方持續(xù)占優(yōu)勢,收益和EI+先減小后增大,表明藍(lán)方在初期占優(yōu)勢,中后期紅方更占優(yōu)勢。

無人機集群對抗過程是一種高度復(fù)雜的非線性動態(tài)過程。對比EI和NEI條件下的目標(biāo)收益函數(shù),發(fā)現(xiàn)靜態(tài)權(quán)重的目標(biāo)收益隨著對抗演化,呈現(xiàn)了單調(diào)下降趨勢;而根據(jù)圖2(b)子圖更易看出自適應(yīng)權(quán)重的目標(biāo)收益隨著對抗演化,呈現(xiàn)非單調(diào)性。說明靜態(tài)權(quán)重的目標(biāo)收益曲線對復(fù)雜對抗過程的適應(yīng)性不足,自適應(yīng)權(quán)重的目標(biāo)收益曲線可以更加合理地表征對抗過程,使得改進(jìn)的目標(biāo)收益函數(shù)具有一定的動態(tài)適應(yīng)性。

4.2.2 對抗過程

由圖3可知藍(lán)方BR1、BR2與紅方RER1均未有損失。在NEI情況下,BC1、BC2、RER2的數(shù)量下降趨勢較小,RAD1、RAD2的數(shù)量下降趨勢較大;在EI情況下,BC1、BC2、RER2的數(shù) 量下降趨勢較大,RAD1、RAD2的數(shù)量下降趨勢較小。表明施加電子干擾可以擊毀更多的BC1和BC2,同時減少RAD1和RAD2的損失。

圖3 作戰(zhàn)單位數(shù)量Fig.3 Number of combat units

4.2.3 對抗結(jié)果

對抗雙方的作戰(zhàn)單位數(shù)量直方圖如圖4(a)所示,NEI是未施加電子干擾的剩余數(shù)量,EI是施加電子干擾的剩余數(shù)量。雙方獲勝的條件是可攻擊單位總數(shù)量的損失超過80%。圖4(a)中,在NEI情況下,藍(lán)方BC1+BC2的損失未超過80%,紅方RAD1+RAD2的損失超過80%,因此在NEI情況下,藍(lán)方較易獲勝;而在EI情況下,藍(lán)方BC1+BC2的損失超過80%,而紅方RAD1+RAD2的損失未超過80%,因此在EI情況下,紅方較易獲勝。

圖4 作戰(zhàn)單位剩余數(shù)量及獲勝率直方圖Fig.4 Surviving number of combat units and histogram of win rate

將對抗結(jié)果分為3種情況:平局,紅方勝和藍(lán)方勝。如圖4(b)所示,在NEI情況下,藍(lán)方獲勝的比率為94.61 %,紅方獲勝的比率為2.78 %,平局的比率為2.61 %;在EI情況下,紅方獲勝的比率為100%,藍(lán)方獲勝和平局的比率均為0%。

4.2.4 自適應(yīng)權(quán)重差

自適應(yīng)權(quán)重差值等于EI時的權(quán)重值減去NEI時的權(quán)重值。如圖5所示,藍(lán)色a表示藍(lán)方無人機集群的權(quán)重差值(簡稱為a差值),紅色b表示紅方地面部隊的權(quán)重差值(簡稱為b差值)。由 圖5可知,BR1、BR2、RER1的 權(quán)重沒有變化,表明在對抗過程中其收益權(quán)重是相互獨立的。BC1、BC2的a差值曲線遞減,說明藍(lán)方認(rèn)為EI使 得BC1、BC2的 作 戰(zhàn) 能 力 削 弱;b差 值 曲 線也遞減,說明紅方認(rèn)為EI使得BC1、BC2的威脅程度降低。

圖5 自適應(yīng)權(quán)重差值曲線Fig.5 Curves of adaptive weight difference

RER2的a差值曲線遞增,說明藍(lán)方認(rèn)為EI使得RER2的威脅程度增加;b差值曲線也遞增,說明紅方認(rèn)為EI使RER2的作戰(zhàn)能力增強。RAD1的a差值曲線非線性遞增,說明藍(lán)方認(rèn)為EI使得RAD1的威脅程度非線性增加;b差值曲線非單調(diào)增加,k∈[1,9]時紅方認(rèn)為EI使得RAD1的 作戰(zhàn)能力增強,k∈[10,16]因受損較大使得增強后的作戰(zhàn)能力有所削弱。RAD2的a差值曲線非單調(diào)增加,k∈[1,14]時藍(lán)方認(rèn)為EI使得RAD2的威脅程度增加,k∈[15,16]因受損較大使得增加的威脅程度有所降低;b差值曲線非單調(diào)增加,k∈[1,14]時 紅 方 認(rèn) 為EI使 得RAD2的作戰(zhàn)能力增強,k∈[15,16]因受損較大使得增強后的作戰(zhàn)能力有所削弱。

5 結(jié) 論

針對無人機集群對抗博弈時目標(biāo)收益函數(shù)的動態(tài)變化問題,本文以無人機集群空地對抗為作戰(zhàn)場景,分析動態(tài)變化的戰(zhàn)場態(tài)勢,提出一種基于戰(zhàn)場態(tài)勢的收益權(quán)重自適應(yīng)計算方法,改進(jìn)動態(tài)博弈的目標(biāo)收益函數(shù),主要結(jié)論:(1)非線性動態(tài)系統(tǒng)與博弈論相結(jié)合,建立無人機集群空地對抗博弈模型,提出非完全信息下目標(biāo)選擇概率的生成方法,得出的動態(tài)命中因子能適應(yīng)不同打擊策略下的對抗行為;(2)空地對抗仿真實驗表明,提出的自適應(yīng)收益權(quán)重能夠表征對抗策略差異下的不同收益,通過權(quán)重差曲線可以表征自適應(yīng)權(quán)重對不同策略的靈敏程度。與靜態(tài)權(quán)重模型相比,自適應(yīng)權(quán)重模型的目標(biāo)收益刻畫態(tài)勢的準(zhǔn)確性更高。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 久久这里只有精品2| 久久黄色影院| 在线观看免费黄色网址| 午夜国产不卡在线观看视频| 精品少妇人妻一区二区| 久久久精品国产SM调教网站| 成人av手机在线观看| 91青青在线视频| 亚洲AⅤ波多系列中文字幕| 1级黄色毛片| 国产成人综合在线视频| 国产成人无码久久久久毛片| 久久国产毛片| 中文字幕无码电影| 国产精品久久久精品三级| 国产亚洲精品91| 国产乱子伦一区二区=| 色综合天天娱乐综合网| 国产日韩丝袜一二三区| 青青国产视频| 色视频久久| AV不卡在线永久免费观看| 亚洲欧美不卡| 国产一级做美女做受视频| 毛片大全免费观看| 亚洲天堂视频网| 中文国产成人久久精品小说| 天天综合网亚洲网站| 国产美女精品人人做人人爽| 狠狠综合久久| 青青网在线国产| 国产精品成人啪精品视频| 欧美国产综合视频| 国产亚洲欧美另类一区二区| 精品综合久久久久久97| 69av在线| 成年人久久黄色网站| 高清无码手机在线观看| a级免费视频| 精品无码国产自产野外拍在线| 国产成人啪视频一区二区三区| 亚洲精品高清视频| 久久精品国产999大香线焦| 无码免费试看| 伊人大杳蕉中文无码| 亚洲国产成人综合精品2020| 国产综合精品日本亚洲777| 九九精品在线观看| 色窝窝免费一区二区三区| 国产精品一区二区久久精品无码| 久久永久免费人妻精品| 老熟妇喷水一区二区三区| 国产偷倩视频| 91丨九色丨首页在线播放| 找国产毛片看| 免费一看一级毛片| 国产在线观看一区精品| 激情爆乳一区二区| 亚洲三级片在线看| 99精品久久精品| 亚洲福利一区二区三区| 无码国产伊人| 欧美在线综合视频| 国产欧美精品午夜在线播放| 国产真实乱子伦视频播放| 一区二区理伦视频| 91精品啪在线观看国产91九色| 男人的天堂久久精品激情| 欧美乱妇高清无乱码免费| 91成人在线免费观看| 色综合天天操| 99久久国产综合精品2020| 中文字幕免费在线视频| 国产成人精品在线| 丁香六月激情综合| 日本少妇又色又爽又高潮| 亚洲精品第一页不卡| 国产精品理论片| 国产va在线观看免费| 天天色天天综合网| 亚洲va欧美ⅴa国产va影院| 国产va在线观看免费|