999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

強化學習研究綜述

2010-12-31 00:00:00陳學松楊宜民
計算機應用研究 2010年8期

摘要:在未知環境中,關于agent的學習行為是一個既充滿挑戰又有趣的問題,強化學習通過試探與環境交互獲得策略的改進,其學習和在線學習的特點使其成為機器學習研究的一個重要分支。介紹了強化學習在理論、算法和應用研究三個方面最新的研究成果,首先介紹了強化學習的環境模型和其基本要素;其次介紹了強化學習算法的收斂性和泛化有關的理論研究問題;然后結合最近幾年的研究成果,綜述了折扣型回報指標和平均回報指標強化學習算法;最后列舉了強化學習在非線性控制、機器人控制、人工智能問題求解、多agent系統問題等若干領域的成功應用和未來的發展方向。

關鍵詞:強化學習;多智能體;馬爾可夫決策過程

中圖分類號:TP181 文獻標志碼:A 文章編號:1001-3695(2010)08-2834-05

主站蜘蛛池模板: 国产精品免费入口视频| 高清乱码精品福利在线视频| 国产日韩欧美精品区性色| 国产小视频a在线观看| 亚洲欧美h| 久久成人免费| 免费国产福利| 久久夜色精品国产嚕嚕亚洲av| 日本AⅤ精品一区二区三区日| 狠狠色香婷婷久久亚洲精品| 麻豆精品国产自产在线| 色综合网址| 久久99精品久久久大学生| 午夜一级做a爰片久久毛片| 国产欧美视频在线| 免费无码AV片在线观看中文| 亚洲swag精品自拍一区| 国产精品美女免费视频大全| 5555国产在线观看| 91精品日韩人妻无码久久| 亚洲国产成人久久精品软件| 亚洲无码91视频| 国产视频一二三区| 国产亚卅精品无码| 亚洲一区毛片| 日韩专区欧美| 免费一级全黄少妇性色生活片| 色婷婷在线影院| 免费A级毛片无码免费视频| 免费在线观看av| 欧美精品成人| 又爽又大又光又色的午夜视频| 日本国产精品| 国产免费一级精品视频 | 国产精品一区在线观看你懂的| 久久久国产精品无码专区| 国产女人在线| 免费99精品国产自在现线| 国产精品福利导航| 欧美精品伊人久久| 老司机精品一区在线视频| 免费va国产在线观看| 日韩大片免费观看视频播放| а∨天堂一区中文字幕| 国产日本欧美在线观看| 亚洲国产中文精品va在线播放| 欧美日韩一区二区三区在线视频| 欧美精品综合视频一区二区| 亚洲成aⅴ人片在线影院八| 伊人久久婷婷五月综合97色| 国产成人亚洲精品蜜芽影院| 免费可以看的无遮挡av无码 | 欧美精品亚洲精品日韩专区| 5555国产在线观看| 97免费在线观看视频| 国产精品香蕉| 久久精品视频亚洲| 国产99久久亚洲综合精品西瓜tv| 久久久91人妻无码精品蜜桃HD| 久久久久亚洲精品无码网站| 青青热久麻豆精品视频在线观看| 又黄又湿又爽的视频| 亚洲人成亚洲精品| 亚洲无码高清一区| 麻豆精品视频在线原创| 无码AV动漫| 91精品网站| 国产精品白浆在线播放| 99久久精品国产自免费| 五月婷婷亚洲综合| 91在线播放免费不卡无毒| 国产99欧美精品久久精品久久| 日本一区二区三区精品视频| 日本在线视频免费| 在线看免费无码av天堂的| 国产亚洲精品自在线| 91久草视频| 欧洲av毛片| 在线永久免费观看的毛片| 97人人模人人爽人人喊小说| 亚洲第一区欧美国产综合| 在线视频亚洲欧美|