999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看

<tfoot id="ww824"><noscript id="ww824"></noscript></tfoot><nav id="ww824"><sup id="ww824"></sup></nav>

<sup id="ww824"></sup>

<nav id="ww824"></nav>

<tfoot id="ww824"><dd id="ww824"></dd></tfoot>

?

強化學習研究綜述

2010-12-31 00:00:00陳學松楊宜民

計算機應用研究 2010年8期

摘要：在未知環境中，關于agent的學習行為是一個既充滿挑戰又有趣的問題，強化學習通過試探與環境交互獲得策略的改進，其學習和在線學習的特點使其成為機器學習研究的一個重要分支。介紹了強化學習在理論、算法和應用研究三個方面最新的研究成果，首先介紹了強化學習的環境模型和其基本要素；其次介紹了強化學習算法的收斂性和泛化有關的理論研究問題；然后結合最近幾年的研究成果，綜述了折扣型回報指標和平均回報指標強化學習算法；最后列舉了強化學習在非線性控制、機器人控制、人工智能問題求解、多agent系統問題等若干領域的成功應用和未來的發展方向。

關鍵詞：強化學習；多智能體；馬爾可夫決策過程

中圖分類號：TP181 文獻標志碼：A 文章編號：1001－3695(2010)08－2834－05

計算機應用研究2010年8期

計算機應用研究的其它文章: 基于空間聚類的應急物資儲備一體化區域劃分; 辮群上的不經意傳輸協議; DCAM平臺下的分布式方面構件模型及協同框架的研究; FLUX中負析取約束的研究與實現; 一種基于風險的需求優先級排序方法; 自適應的移動Ad hoc網絡貪婪地理路由協議

主站蜘蛛池模板：国产精品免费入口视频| 高清乱码精品福利在线视频| 国产日韩欧美精品区性色| 国产小视频a在线观看| 亚洲欧美h| 久久成人免费| 免费国产福利| 久久夜色精品国产嚕嚕亚洲av| 日本AⅤ精品一区二区三区日| 狠狠色香婷婷久久亚洲精品| 麻豆精品国产自产在线| 色综合网址| 久久99精品久久久大学生| 午夜一级做a爰片久久毛片| 国产欧美视频在线| 免费无码AV片在线观看中文| 亚洲swag精品自拍一区| 国产精品美女免费视频大全| 5555国产在线观看| 91精品日韩人妻无码久久| 亚洲国产成人久久精品软件| 亚洲无码91视频| 国产视频一二三区| 国产亚卅精品无码| 亚洲一区毛片| 日韩专区欧美| 免费一级全黄少妇性色生活片| 色婷婷在线影院| 免费A级毛片无码免费视频| 免费在线观看av| 欧美精品成人| 又爽又大又光又色的午夜视频| 日本国产精品| 国产免费一级精品视频 | 国产精品一区在线观看你懂的| 久久久国产精品无码专区| 国产女人在线| 免费99精品国产自在现线| 国产精品福利导航| 欧美精品伊人久久| 老司机精品一区在线视频| 免费va国产在线观看| 日韩大片免费观看视频播放| а∨天堂一区中文字幕| 国产日本欧美在线观看| 亚洲国产中文精品va在线播放| 欧美日韩一区二区三区在线视频| 欧美精品综合视频一区二区| 亚洲成aⅴ人片在线影院八| 伊人久久婷婷五月综合97色| 国产成人亚洲精品蜜芽影院| 免费可以看的无遮挡av无码 | 欧美精品亚洲精品日韩专区| 5555国产在线观看| 97免费在线观看视频| 国产精品香蕉| 久久精品视频亚洲| 国产99久久亚洲综合精品西瓜tv| 久久久91人妻无码精品蜜桃HD| 久久久久亚洲精品无码网站| 青青热久麻豆精品视频在线观看| 又黄又湿又爽的视频| 亚洲人成亚洲精品| 亚洲无码高清一区| 麻豆精品视频在线原创| 无码AV动漫| 91精品网站| 国产精品白浆在线播放| 99久久精品国产自免费| 五月婷婷亚洲综合| 91在线播放免费不卡无毒| 国产99欧美精品久久精品久久| 日本一区二区三区精品视频| 日本在线视频免费| 在线看免费无码av天堂的| 国产亚洲精品自在线| 91久草视频| 欧洲av毛片| 在线永久免费观看的毛片| 97人人模人人爽人人喊小说| 亚洲第一区欧美国产综合| 在线视频亚洲欧美|

<tr id="wwwww"></tr>

<nav id="wwwww"><sup id="wwwww"></sup></nav>

<nav id="wwwww"><sup id="wwwww"></sup></nav>

<tfoot id="wwwww"><noscript id="wwwww"></noscript></tfoot>

<nav id="wwwww"><code id="wwwww"></code></nav>

<noscript id="wwwww"><dd id="wwwww"></dd></noscript>

<tfoot id="wwwww"><noscript id="wwwww"></noscript></tfoot>