999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器類通信中集中式與分布式Q學習的資源分配算法研究

2021-12-10 07:59:48余云河孫君
電信科學 2021年11期
關鍵詞:系統

余云河,孫君

機器類通信中集中式與分布式Q學習的資源分配算法研究

余云河,孫君

(南京郵電大學通信與信息工程學院,江蘇 南京 210023)

針對海量機器類通信(massive machine type communication,mMTC)場景,以最大化系統吞吐量為目標,且在保證部分機器類通信設備(machine type communication device,MTCD)的服務質量(quality of service,QoS)要求前提下,提出兩種基于Q學習的資源分配算法:集中式Q學習算法(team-Q)和分布式Q學習算法(dis-Q)。首先基于余弦相似度(cosine similarity,CS)聚類算法,考慮到MTCD地理位置和多級別QoS要求,構造代表MTCD和數據聚合器(data aggregator,DA)的多維向量,根據向量間CS值完成分組。然后分別利用team-Q學習算法和dis-Q學習算法為MTCD分配資源塊(resource block,RB)和功率。吞吐量性能上,team-Q和dis-Q算法相較于動態資源分配算法、貪婪算法分別平均提高了16%、23%;復雜度性能上,dis-Q算法僅為team-Q算法的25%及以下,收斂速度則提高了近40%。

資源分配;集中式Q學習;分布式Q學習;余弦相似度;多維向量

1 引言

機器型通信(machine type communication,MTC)允許智能物體在沒有人為干預情況下實現相互通信,3GPP(3rd Generation Partnership Project)認為MTC將會對物聯網(internet of things,IoT)的發展起到關鍵作用[1-2]。隨著IoT的普及,對“物”之間的通信具有很高的需求,即使5G也不能保證滿足未來新業務的所有需求,因此在B5G(beyond 5G)和6G網絡中,MTC將會是研究人員關注的重點[3-4]。思科預測到2022年各行業中將會有39億個MTC設備連接到網絡中[5],而海量機器類通信設備(machine type communication device,MTCD)連接不僅導致頻譜資源匱乏,還會造成網絡擁塞,給基站(base station,BS)帶來沉重負擔。

在部署了高密度MTCD的mMTC網絡中,將MTCD分組為較小集群被視為一種有助于緩解MTC網絡擁塞,提高MTCD接入成功率,進而促進吞吐量提升的技術[6]。為此,國內外學者提出了一系列關于MTCD分組聚類算法。文獻[6-7]分別依據設備的QoS要求、地理位置進行分組,文獻[8]為了延長網絡壽命,依據MTCD剩余能量以及與BS間的距離進行聚類。文獻[9-10]在傳統-means算法基礎上作出改進,分別針對MTCD能量效率與MTC網絡傳輸時延要求,對MTCD進行聚類。然而,上述研究中提出的MTCD聚類策略,有的僅考慮了地理位置和QoS要求中的單個因素,并未充分發掘MTCD之間的關聯性,導致在MTCD聚簇內不能很好地協調干擾,潛在影響系統吞吐量;有的僅針對特定優化目標進行聚類,不具有普遍適用性。

文獻[11-12]均考慮H2H(human to human)與M2M(machine to machine)共存場景中系統用戶過載情況下的資源分配問題。然而,文獻[11]未考慮時延敏感M2M業務的傳輸需求,導致無法滿足此類M2M業務的QoS要求,文獻[12]則利用基于背包模型的資源分配算法,保證了時延敏感M2M通信業務的QoS,但在文獻[12]中僅將所提算法同傳統的優先為H2H終端分配資源的算法進行性能比較,無法充分驗證該算法的優越性。文獻[13]提出了一種動態資源分配策略用于解決MTCD間的資源分配問題,雖然考慮了MTCD請求過載的情況,但并不允許資源復用,導致頻譜利用率較低,同時由于接入網絡的MTCD數量較少,也造成系統吞吐量下降。文獻[14]針對多輸入多輸出系統中動態資源分配問題,提出了一種確保用戶最低QoS要求的資源分配算法,能獲得較高的系統吞吐量,然而該方法是在用戶功率等分配的前提下執行的,并不符合實際,具有一定的局限性。文獻[15]討論了在頻譜資源匱乏條件下,基于設備到設備(device to device,D2D)分簇的車通信資源分配問題,在保證車用戶正常通信下,最大化蜂窩用戶的吞吐量。文獻[16]研究了基于容量最大化地mMTC場景的資源分配問題,但使用的是傳統粒子群算法,該算法對容量提升作用有限,且沒有考慮MTCD分組問題。在功率有限、頻譜資源匱乏的MTC網絡中,傳統資源分配方法難以滿足MTCD不斷增長的QoS要求。近年來研究表明基于機器學習的資源分配策略已經優于傳統的方法[17-18],而Q學習作為一種著名無模型強化學習(reinforcement learning,RL)算法引起了人們的關注。

基于以上分析,本文在確保承擔高信噪比傳輸任務的MTCD最低QoS要求前提下,提出兩種Q學習算法:team-Q學習算法和dis-Q學習算法,解決網絡內MTCD之間的資源塊和功率聯合分配問題。該資源分配算法分為兩個階段:第一階段設計一種基于CS的聚類方案,即借鑒商品推薦系統中求取用戶之間相似度的做法,分別為MTCD、DA構造多維向量,再利用向量之間余弦相似度進行分組。第二階段中,針對分組后的MTC網絡上行鏈路資源塊和功率分配問題,提出了兩種基于Q學習的分配算法:team-Q學習和dis-Q學習,其中dis-Q算法在team-Q算法基礎上改進了Q值表和獎勵函數。最后,通過仿真驗證了所提算法能在復雜性、收斂速度以及對系統吞吐量促進作用等方面的有效性。

2 系統模型

本文研究的系統模型如圖1所示,隨機分布的MTCD經過聚類后形成MTCD聚簇,每個聚簇內含有一個數據聚合器DA,構成MTC網絡。在MTC網絡中,MTCD通過稀疏碼分多址技術[19]與DA連接,DA充當數據接收和轉發的角色,即負責接收MTCD數據并轉發至BS,使得整個網絡變成雙層架構,可以減輕BS的接入負擔。假定聚簇與聚簇間使用正交的頻譜資源,而聚簇內的MTCD之間以非正交多址方式共用資源塊。因此,在MTC網絡內由于資源塊的復用會產生多址干擾,在接收端則可采用串行干擾消除(successive interference cancellation,SIC)技術進行正確解調。

圖1 系統模型

所以針對使得整個MTC網絡吞吐量最大化的目標,根據香農信道容量計算公式可以構造出如下最優化問題:

上述問題屬于混合整數非線性規劃(mixed integer nonlinear programming,MINLP)問題,通常是NP難[17]的,很難直接求解,在本文中使用Q學習算法解決。

3 算法的提出

3.1 MTCD聚簇形成

算法1 基于余弦相似度的MTCD聚類算法

初始化:

循環:

3.2 MTC網絡內部資源分配

(1)基于team-Q學習算法的資源分配策略

(2)基于dis-Q學習算法的資源分配策略

算法2 dis-Q學習資源分配算法

初始化:

迭代:

根據式(10)更新Q值表;

4 仿真結果與性能分析

本節主要對本文所提算法的性能進行分析驗證,包括收斂性、復雜度和系統吞吐量等,仿真平臺是MATLAB工具,仿真參數見表1[12,20]。

表1 仿真參數

首先對比兩種Q學習算法的收斂速度。如圖2所示,可以得到team-Q算法和dis-Q算法隨著迭代次數增加都趨向于收斂,但從迭代次數角度出發,dis-Q學習算法的收斂速度相比team-Q學習算法提高了近40%。這是由于在team-Q學習算法中,Q值表的維度遠大于dis-Q學習算法,當動作空間和智能體agent數量都增大時,team-Q算法復雜度會呈現指數級增長,最終導致dis-Q學習算法的收斂速度快于team-Q學習算法。

圖2 兩種Q學習算法收斂性分析

圖3 不同下team-Q、dis-Q算法中Q值表維度對比

圖4 不同算法下系統吞吐量對比

圖5 不同聚類算法下系統吞吐量對比

5 結束語

本文研究了在mMTC場景中以系統吞吐量最優化為目標的資源分配問題。首先,提出了一種基于余弦相似度的聚類算法,根據MTCD與DA之間的相對位置和QoS要求,將MTCD分組。該算法能充分發掘出MTCD之間的關聯性,能更好地協調MTC聚簇內的干擾,有利于提升系統性能。此外,針對MTC網絡中的資源分配問題,提出了team-Q學習算法和dis-Q學習算法。仿真結果表明,兩種Q學習算法對系統吞吐量的提升作用相較于對比算法均有較大幅度的提高,其中team-Q算法在系統吞吐量性能上略優于dis-Q算法,但是dis-Q算法在信令消耗、收斂速度方面明顯優于team-Q算法,這也更加符合“綠色通信”的理念。

[1] CHEN S Y, MA R F, CHEN H H, et al. Machine-to-machine communications in ultra-dense networks—A survey[J]. IEEE Communications Surveys & Tutorials, 2017, 19(3): 1478-1503.

[2] 錢志鴻, 王義君. 物聯網技術與應用研究[J]. 電子學報, 2012, 40(5): 1023-1029.

QIAN Z H, WANG Y J. IoT technology and application[J]. Acta Electronica Sinica, 2012, 40(5): 1023-1029.

[3] Service-aware transport network: opportunities and chanenges[J]. Proceedings of SPIE - The International Society for Optical Engineering, 2005.

[4] ZHOU Y Q, TIAN L, LIU L, et al. Fog computing enabled future mobile communication networks: a convergence of communication and computing[J]. IEEE Communications Magazine, 2019, 57(5): 20-27.

[5] Cisco visual networking index: global mobile data traffic forecast update 2014-2019[EB]. 2014.

[6] LIANG L, XU L, CAO B, et al. A cluster-based congestion-mitigating access scheme for massive M2M communications in internet of things[J]. IEEE Internet of Things Journal, 2018, 5(3): 2200-2211.

[7] GHAVIMI F, LU Y W, CHEN H H. Uplink scheduling and power allocation for M2M communications in SC-FDMA-based LTE-A networks with QoS guarantees[J]. IEEE Transactions on Vehicular Technology, 2017, 66(7): 6160-6170.

[8] GAO H, XU X D, HAN S J. Homogeneous clustering algorithm based on average residual energy for energy-efficient MTC networks[C]//Proceedings of 2018 24th Asia-Pacific Conference on Communications (APCC). Piscataway: IEEE Press, 2018: 28-33.

[9] HUSSAIN F, HUSSAIN R, ANPALAGAN A, et al. A new block-based reinforcement learning approach for distributed resource allocation in clustered IoT networks[J]. IEEE Transactions on Vehicular Technology, 2020, 69(3): 2891-2904.

[10] XU Y Q, FENG G, LIANG L, et al. MTC data aggregation for 5G network slicing[C]//Proceedings of 2017 23rd Asia-Pacific Conference on Communications (APCC). Piscataway: IEEE Press, 2017: 1-6.

[11] 王鑫, 邱玲. H2H與M2M共存場景的準入控制及資源分配[J].中國科學院大學學報, 2016, 33(3): 427-432.

WANG X, QIU L. Admission control and resource allocation of H2H & M2M co-existence scenario[J]. Journal of University of Chinese Academy of Sciences, 2016, 33(3): 427-432.

[12] 蔣繼勝, 朱曉榮. H2H與M2M共存場景下的上行資源分配算法[J]. 電子學報, 2018, 46(5): 1259-1264.

JIANG J S, ZHU X R. An uplink resource allocation algorithm under the scenario of coexistence of H2H & M2M based on knapsack model[J]. Acta Electronica Sinica, 2018, 46(5): 1259-1264.

[13] SALAM T, REHMAN W U, TAO X F. Cooperative data aggregation and dynamic resource allocation for massive machine type communication[J]. IEEE Access, 2018, 6: 4145-4158.

[14] 郭濤, 李有明, 雷鵬, 等. MIMO中繼系統中一種基于用戶QoS的資源分配方法[J]. 電信科學, 2015, 31(4): 121-126.

GUO T, LI Y M, LEI P, et al. A resource allocation scheme based on user’s QoS in MIMO relay system[J]. Telecommunications Science, 2015, 31(4): 121-126.

[15] 張海波, 向煜, 劉開健, 等. 基于D2D通信的V2X資源分配方案[J]. 北京郵電大學學報, 2017, 40(5): 92-97.

ZHANG H B, XIANG Y, LIU K J, et al. V2X resource allocation scheme based on D2D communication[J]. Journal of Beijing University of Posts and Telecommunications, 2017, 40(5): 92-97.

[16] 劉佳言, 秦鵬, 趙雄文, 等. 基于容量最大化的mMTC場景的資源分配問題研究[J]. 電力信息與通信技術, 2020, 18(12): 17-22.

LIU J Y, QIN P, ZHAO X W, et al. Research on resource allocation of m MTC scenario based on capacity maximization[J]. Electric Power Information and Communication Technology, 2020, 18(12): 17-22.

[17] SHARMA S K, WANG X B. Toward massive machine type communications in ultra-dense cellular IoT networks: current issues and machine learning-assisted solutions[J]. IEEE Communications Surveys & Tutorials, 2020, 22(1): 426-471.

[18] HUSSAIN F, HASSAN S A, HUSSAIN R, et al. Machine learning for resource management in cellular and IoT networks: potentials, current solutions, and open challenges[J]. IEEE Communications Surveys & Tutorials, 2020, 22(2): 1251-1275.

[19] NIKOPOUR H, BALIGH H. Sparse code multiple access[C]//Proceedings of 2013 IEEE 24th Annual International Symposium on Personal, Indoor, and Mobile Radio Communications (PIMRC). Piscataway: IEEE Press, 2013: 332-336.

[20] KAI C H, LI H, XU L, et al. Joint subcarrier assignment with power allocation for sum rate maximization of D2D communications in wireless cellular networks[J]. IEEE Transactions on Vehicular Technology, 2019, 68(5): 4748-4759.

Research on resource allocation algorithm of centralized and distributed Q-learning in machine communication

YU Yunhe, SUN Jun

College of Telecommunications and Information Engineering, Nanjing University of Posts and Telecommunications, Nanjing 210023, China

Under the premise of ensuring partial machine type communication device (MTCD)’s quality of service (QoS) requirements, the resource allocation problem was studied with the goal of maximizing system throughput in the massive machine type communication (mMTC) scenario. Two resource allocation algorithms based on Q-learning were proposed: centralized Q-learning algorithm (team-Q) and distributed Q-learning algorithm (dis-Q). Firstly, taking into account MTCD’s geographic location and multi-level QoS requirements, a clustering algorithm based on cosine similarity (CS) was designed. In the clustering algorithm, multi-dimensional vectors that represent MTCD and data aggregator (DA) were constructed, and MTCDs can be grouped according to the CS value between multi-dimensional vectors. Then in the MTC network, the team-Q learning algorithm and dis-Q learning algorithm were used to allocate resource blocks and power for the MTCD. In terms of throughput performance, team-Q and dis-Q algorithms have an average increase of 16% and 23% compared to the dynamic resource allocation algorithm and the greedy algorithm, respectively. In terms of complexity performance, the dis-Q algorithm is only 25% of team-Q algorithm and even below, the convergence speed is increased by nearly 40%.

resource allocation, centralized Q-learning, distributed Q-learning, consine similarity, multi-dimensional vector

TP929.5

A

10.11959/j.issn.1000?0801.2021244

余云河(1995? ),男,南京郵電大學通信與信息工程學院碩士生,主要研究方向為大規模機器類通信網絡中的資源分配。

孫君(1980? ),女,南京郵電大學碩士生導師,主要研究方向為無線網絡資源管理。

s: The National Natural Science Foundation of China (No.61771255), Open Project of Key Laboratory of Chinese Academy of Sciences (No.20190904)

2021?04?30;

2021?10?20

孫君,sunjun@njupt.edu.cn

國家自然科學基金資助項目(No.61771255);中國科學院重點實驗室開放課題(No.20190904)

猜你喜歡
系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
基于UG的發射箱自動化虛擬裝配系統開發
半沸制皂系統(下)
FAO系統特有功能分析及互聯互通探討
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
一德系統 德行天下
PLC在多段調速系統中的應用
主站蜘蛛池模板: 激情六月丁香婷婷| 成人欧美日韩| 国产三级国产精品国产普男人| 91九色国产porny| 日本尹人综合香蕉在线观看 | 亚洲日韩在线满18点击进入| 国产欧美亚洲精品第3页在线| 91久久夜色精品| 久久福利网| 国产玖玖视频| 免费观看无遮挡www的小视频| 欧美色综合网站| 99尹人香蕉国产免费天天拍| 国产麻豆永久视频| 一级一毛片a级毛片| a级高清毛片| 自慰高潮喷白浆在线观看| 熟妇丰满人妻| 99激情网| 国产免费人成视频网| 国产欧美在线观看精品一区污| 亚洲精品在线影院| 日韩麻豆小视频| 国产手机在线观看| 日韩福利在线观看| 亚洲女人在线| 亚洲免费黄色网| 午夜毛片免费观看视频 | 亚洲an第二区国产精品| 91精品国产丝袜| 亚洲AⅤ永久无码精品毛片| 亚洲国产日韩一区| 夜夜高潮夜夜爽国产伦精品| 狠狠色成人综合首页| 伊人久综合| 国产产在线精品亚洲aavv| 巨熟乳波霸若妻中文观看免费| 精品欧美视频| 国产人碰人摸人爱免费视频| 国产免费观看av大片的网站| 日本免费一级视频| 国产成人精品在线1区| 自拍偷拍欧美日韩| 亚洲综合狠狠| 色综合天天视频在线观看| 亚洲va欧美va国产综合下载| 亚洲无码A视频在线| 无码专区在线观看| 欧美一区福利| 国产JIZzJIzz视频全部免费| 亚洲二区视频| 欧美日韩一区二区在线播放| 亚洲性影院| 欧美精品亚洲二区| 国产精品永久不卡免费视频| 精品国产www| 狠狠色婷婷丁香综合久久韩国| 久久久久久久久亚洲精品| 一本久道久久综合多人| 久久99热66这里只有精品一| 精品伊人久久久大香线蕉欧美| 91国内在线视频| 国产国产人免费视频成18| 中文字幕 欧美日韩| 99视频只有精品| 综合天天色| 精品久久久久成人码免费动漫 | 免费国产高清视频| 久久婷婷色综合老司机| 久久黄色一级视频| 国产乱肥老妇精品视频| 精品欧美日韩国产日漫一区不卡| 毛片网站在线播放| 久久国产精品无码hdav| 国产精品视频第一专区| 尤物国产在线| 丝袜高跟美脚国产1区| 亚洲综合九九| 国产成人一级| 日韩国产高清无码| 一本大道香蕉中文日本不卡高清二区 | 日本亚洲成高清一区二区三区|