999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

動態環境下多智能體協作學習方法的研究

2011-12-31 00:00:00王全武胡曉輝
科技創新導報 2011年9期

摘 要:將預測分析技術和強化學習技術有機結合,使多Agent系統中的各Agent,不僅具有了高度反應自適應性,而且擁有了高效而準確的預測分析能力;使Agent的行為更具有針對性,盡可能地減少錯誤,保證學習的正確方向,提高Agent間進行信息共享,融合單個Agent的Q值表。相當于相同情況下增加了學習次數,不僅盡可能地消除策略中的冗余動作,以高效的方式實現最終目標,而且提高多Agent系統執行效率和收斂速度及性能。本文提出了一種改進的多Agent間協作學習方法,適用于環境不完備的復雜情況。以追捕問題作為仿真實驗。結果表明所提方法能夠有效地促進多智能體系統中各Agent間協作學習能力。

關鍵詞:多智能體系統 強化學習 協作學習 預測分析技術 追捕問題 黑板模型

中圖分類號:TP18 文獻標識碼:A 文章編號:1674-098X(2011)03(c)-0253-02

1 引言

近年來,分布式人工智能研究者對多Agent協作完成任務的研究越來越多。這是因為隨著計算機網絡,分布式計算技術等不斷發展和完善,所要研究的系統往往異常復雜龐大,并且呈現動態多變的分布式特性,要解決問題單憑單Agent所擁有的有限的資源和能力是無法完成的,或者完成任務的效益不是理想的,同時,成本也很高。因此,對多Agent間的協作學習方法的研究是十分必要的,也是非常重要的,更是多Agent系統發展的必然趨勢。學習可以使多Agent能夠在開放、復雜、動態的環境中提高自反應適應性,更是學習機制可能有效地實現多Agent間的協作。反之,為多Agent系統增加協作學習機制也能起到加速多Agent的學習進程。……

登錄APP查看全文

主站蜘蛛池模板: 在线无码九区| 国产免费看久久久| 亚洲国产中文精品va在线播放 | 欧美成人免费午夜全| 成人在线天堂| 手机在线看片不卡中文字幕| 久久久无码人妻精品无码| 2021国产精品自拍| 美女一级免费毛片| 国产美女丝袜高潮| 高清不卡一区二区三区香蕉| 国产主播一区二区三区| 日韩欧美国产精品| 一级毛片无毒不卡直接观看| 亚洲三级成人| 久久免费视频播放| 激情综合网址| 人妻无码一区二区视频| 人妻出轨无码中文一区二区| 亚洲AⅤ无码国产精品| 97超爽成人免费视频在线播放| 播五月综合| 伊人久久婷婷五月综合97色| 国产精品三级av及在线观看| 国产男女免费完整版视频| 香蕉在线视频网站| 久久久久人妻一区精品| 国产一区二区人大臿蕉香蕉| 又爽又大又黄a级毛片在线视频| 无码内射中文字幕岛国片| 成人在线第一页| 一本色道久久88亚洲综合| 九一九色国产| 在线观看91香蕉国产免费| 国产主播福利在线观看| 97久久精品人人| 亚洲成人在线网| 久草青青在线视频| 秋霞午夜国产精品成人片| 亚洲欧美在线看片AI| 国产无码精品在线播放| 国模粉嫩小泬视频在线观看| 国产大片喷水在线在线视频| 国产精品久久久久鬼色| 婷婷综合亚洲| 国产主播一区二区三区| 日本不卡在线播放| 伊人无码视屏| 一本综合久久| 日本三区视频| 久久久久中文字幕精品视频| 国产性爱网站| 免费观看男人免费桶女人视频| 免费毛片视频| 婷婷色婷婷| 亚洲人网站| 亚洲欧美成aⅴ人在线观看| 亚洲精品少妇熟女| 午夜综合网| 成人国产精品视频频| www.国产福利| 一级片一区| 国产精品自在线天天看片| 九九视频在线免费观看| 青草免费在线观看| lhav亚洲精品| 在线国产欧美| 亚洲欧美日韩中文字幕在线| 亚洲AV无码乱码在线观看代蜜桃| 亚洲码一区二区三区| 午夜国产大片免费观看| 国产亚洲欧美日韩在线观看一区二区| 一区二区三区四区精品视频| 久久国产精品娇妻素人| 在线欧美日韩| 国产在线啪| 91精品最新国内在线播放| 天堂岛国av无码免费无禁网站| 亚洲人成亚洲精品| 91区国产福利在线观看午夜 | 日韩欧美国产三级| 国产成人啪视频一区二区三区 |