999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

認知無線傳感器網絡功率控制研究

2020-12-24 07:41:28張涌逸
無線互聯(lián)科技 2020年21期

張涌逸

(太原師范學院 計算機系,山西 晉中 030619)

0 引言

相關學者有討論無線傳感器網絡功率控制的,但他們主要是從降低無線傳感器網絡的能耗方面來研究的[1]。本文討論無線的功率控制,是為了充分利用頻譜資源,認知無線電頻譜分配行為有合作和非合作頻譜共享。由于無線傳感器網絡常常是某個機構部署的,所以給頻譜合作共享帶來了可能。在認知無線電中合作頻譜共享討論的比較多的是議價博弈和聯(lián)盟博弈,但本研究引入了多智能體強化學習的方法來討論無線傳感器網絡功率控制,實現(xiàn)一個無線傳感器網絡在功率控制情形全局頻譜獎勵最大化。

1 完全去中心化無線傳感器網絡功率控制算法分析

(1)

其中,Aku是信道增益。

如果在一個時間段上討論每個用戶群的發(fā)送功率問題。在完全競爭的時候,由于每個用戶群都想使得自己得收益最大化,最終每個用戶群都會用自己得最大發(fā)送功率來發(fā)送。這樣造成信道之間干擾很大。一個無線傳感器網絡常常是一個機構部署的,這樣就給合作帶來了可能。本文不考慮一個用戶群收益最大化,而是考慮無線傳感器網絡收益全局最大化。

本文考慮一個由n個節(jié)點構成的無線傳感器網絡(用N={0,1,…,n-1}表示),共用開放頻段,是一個隨時間變化得通信網絡,節(jié)點之間得通信過程可用上面的鄰接矩陣Dt來表示。我們把時間劃分成一個個時隙,整個通信看成是一個馬爾可夫決策過程。此時MDP是一個四元組:。其中S為全局狀態(tài)的集合,可由鄰接矩陣Dt決定。A=P1×P2×…×Pn,Pi為節(jié)點i所在用戶群的功率。R=R1×R2×…×Rn,Rj為節(jié)點j的回報函數(shù),可用(1)式來計算。假設狀態(tài)和功率的選擇是全局性的,而回報只能在局部觀察到。

(2)

T是終點。

為實現(xiàn)目標,我們使用了文獻[3]中的完全去中心化MARL方法。在文獻[3]中使用了actor-critic算法,并且得到了下面的梯度公式。

定理[3](MARL的策略梯度定理)對于任何θ∈Θ,πθ:S×A→[0,1]是策略,讓J(θ)是在(2)中定義全局長期平均回報。qθ和Aθ行為價值函數(shù)和優(yōu)勢函數(shù)。定義了局部優(yōu)勢函數(shù):

(3)

(4)

則J(θ)的策略梯度可寫為:

ΔθjJ(θ)=Es~pθ,a~πθ[ΔθjlogπjQj(s,aj)*qθ(s,a)]

=Es~pθ,a~πθ[ΔθjlogπjQj(s,aj)*Iθ(s,a)]

(5)

在actor-critic 算法中,critic算法如下:

(6)

(7)

(8)

(9)

在actor-critic算法中,actor 算法如下:

(10)

(11)

(12)

2 完全去中心化無線傳感器網絡功率控制算法

根據(jù)上面的分析,給出算法如下:

Repeat:

for j∈{0,1,…,n-1} do

end for

Forj∈{0,1,…,n-1} do

end for

forj∈{0,1,…,n-1} do

end for

t←t+1。

一直到滿足條件。

上面的計算中需要輸出下一個時間步的功率pt+1,這會降低去中心化訓練的效率。能不能只是用(st,pt,st+1)來更新參數(shù)?是可以的。事實上,可以用狀態(tài)值的TD-error來估計優(yōu)勢函數(shù)[3]:

這樣,需要估計J(θ)和Vθ。與前面的算法相似,每個節(jié)點的維護共享本地參數(shù)ut、wt,更新參數(shù):

(13)

(14)

(15)

(16)

上面的優(yōu)化問題與下式等價:

這兩式子的關系導致了為最小化目標(16)參數(shù)κt的更新如下:

(17)

(17),(13),(14)和(15)構成critic網絡的更新步。

acror網絡的更新步變?yōu)椋?/p>

(18)

綜上所述,一共有三部分參數(shù)需要滿足一致性約束,和前面的算法相比多了兩部分參數(shù)。與上面的算法類似,基于狀態(tài)值函數(shù)的TD-error算法的在線實現(xiàn)要求每個節(jié)點的空間復雜度為O(N+nj+L+F),在N很大的情況,大大降低了空間復雜度。具體算法與參考文獻[3]算法2類似,此處不再贅述。

3 結語

為了使無線傳感器網絡能充分利用頻譜資源,我們在無線傳感器網絡中引入了認知無線電的功能,同時利用了多智能提深度學習中的完全去中心化MARL算法來對無線傳感器的節(jié)點的無線傳輸功率進行控制來充分地利用頻譜資源,通過一些參數(shù)化函數(shù)來近似策略和值函數(shù),結合去中心化的網絡框架和函數(shù)擬合值函數(shù)[4],使得算法非常適合大規(guī)模的節(jié)點情,而且算法是分布式的,不需要集中控制,故適合大規(guī)模無線傳感器網絡。但在無線傳感器中引入認知無線電和深度強化學習功能對無線傳感器網絡的軟硬件都提出了要求,增加了節(jié)點的成本。

主站蜘蛛池模板: 日本一区高清| 丁香五月激情图片| 手机在线国产精品| 亚洲成人黄色在线| 四虎影视8848永久精品| a天堂视频在线| 国产人妖视频一区在线观看| 久久国产V一级毛多内射| 爱做久久久久久| 97国产在线播放| 原味小视频在线www国产| 一本大道香蕉中文日本不卡高清二区| 亚洲一区二区成人| 999国内精品久久免费视频| 九色在线观看视频| 久久99蜜桃精品久久久久小说| 性视频久久| 久久精品国产精品一区二区| 亚洲第一区欧美国产综合| 精品视频在线观看你懂的一区| 国内精品伊人久久久久7777人| 在线国产欧美| 婷婷亚洲视频| 丁香五月婷婷激情基地| 久久国产香蕉| 欲色天天综合网| 亚洲男人在线天堂| 亚洲无线一二三四区男男| 毛片在线看网站| 日本一区高清| 在线欧美日韩国产| 日日拍夜夜嗷嗷叫国产| 日韩无码精品人妻| 97se亚洲综合在线韩国专区福利| 成人va亚洲va欧美天堂| 亚洲日本中文字幕乱码中文 | 18禁影院亚洲专区| 久久永久免费人妻精品| 久久精品电影| 美女国产在线| 国产a网站| 美女国内精品自产拍在线播放 | 国产又黄又硬又粗| 囯产av无码片毛片一级| 精品一区二区三区无码视频无码| 欧美一级大片在线观看| 亚洲欧美另类专区| 国产成人免费手机在线观看视频 | 国产一区二区三区在线观看视频| 香蕉精品在线| 国产chinese男男gay视频网| 黄色网址免费在线| 欧美在线中文字幕| 天天激情综合| 免费国产在线精品一区| 好紧太爽了视频免费无码| 亚国产欧美在线人成| 在线观看精品国产入口| 5388国产亚洲欧美在线观看| 老司机久久精品视频| 97久久免费视频| 中文无码精品A∨在线观看不卡 | 亚洲中字无码AV电影在线观看| 九九热视频在线免费观看| 日本黄色a视频| 国产精品对白刺激| 日韩第一页在线| 国产成人91精品| av在线无码浏览| 欧洲一区二区三区无码| 国产精女同一区二区三区久| 精品国产网| 亚洲aaa视频| 久久国产亚洲偷自| 国产精品成人啪精品视频| 亚洲无线视频| 亚洲天堂日本| 国产精品香蕉| 国产本道久久一区二区三区| 67194在线午夜亚洲| 免费看a毛片| 久久综合色播五月男人的天堂|