999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度強化學習在地形自適應運動技能上的應用

2017-07-10 03:40:59劉仕超
科技風 2017年7期
關鍵詞:深度動作技能

劉仕超

摘 要:強化學習為開發模擬特性技能提供了一種很有效的方法,但強化學習通常需要稀疏手動的來獲取特征。依賴于深度強化學習,我們引進了動作-評價和專家學習混合的學習方法(MACE)來學習動態地形自適應技能,把高緯度狀態和地形描述作為該方法的輸入,參數化的跳躍或行走作為輸出動作。MACE方法比單一的動作-評價方法的學習效率更快,從而使動作-評價和專家學習變得更具獨特性。

關鍵詞:深度強化學習;地形自適應;卷積神經網絡

人和動物在環境中優雅敏捷的運動,在動畫片中,動物的動作通常是在熟練的動畫片制造者和捕獲到的動作數據的幫助下創造出來的。從基本原理出發,應用強化學習和基于物理特性的仿真,呈現出了研發不同種類運動技能的美好前景。這需要通過一個連續的決策問題,涉及狀態,動作,獎勵和控制決策的鏡頭看問題。給定當前狀態的特性,作為捕獲的狀態,控制策略決定采取最佳動作,從而導致隨后的狀態,以及獎勵發生改變??刂茮Q策的目的是最大限度地提高預期的未來回報,即,任何直接的獎勵以及所有預期的回報。

本文應用深度神經網絡與強化學習相結合的方式來解決上述問題。在運動技能領域,我們應用控制結構建立設計動作參數的預期工作。強化學習過程中,值函數或者動作-值函數已經作為導向函數應用于動作的合成上,基于深度神經網絡的控制策略已經能夠借助可微神經網絡來控制動作。

1 原理

系統原理圖如圖1所示,它有三個嵌套循環,每個嵌套對應于不同的時間尺度。最內層循環模型是底層控制和基于物理特性的仿真過程;中間循環是在運動周期的時間尺度上運行;最外層循環是以動作-評估參數來進行決策更新。決策由動作評價對來決定,這些動作評價對的輸出就是深度神經網絡的輸出。每個動作,都有其獨自的決策模型,動作選擇,根據基于軟最大化的模型,以一定的概率進行選擇,這個選擇是把動作賦予具有較高評價函數值Q的。在做出動作選擇時,可能會摻雜高斯噪聲,使得噪聲以一定的概率參與到輸出。

3 結論

本文應用深度強化,和基于物理特性的動作-評價專家學習模型,以及Boltzmann探索,使得學習性能更佳。這也避免了需要設計緊湊的手工制作的特征,并且允許針對可能不容易開發緊湊特征描述的地形進行學習策略的開發。

參考文獻:

[1] COROS, S., BEAUDOIN, P., YIN, K.K., AND VAN DE PANNE,M.2008.Synthesis of constrained walking skills.ACM Trans. Graph.27,5,Article 113.

[2] COROS, S., BEAUDOIN,P.,AND VAN DE PANNE,M.2010. Generalized biped walking control. ACM Transctions on Graphics 29,4,Article 130.

[3] HAUSKNECHT,M.,AND STONE,P.2015.Deep reinforcement learning in parameterized action space. arXiv preprint arXiv:1511.04143.

[4] HESTER, T., AND STONE, P.2013.Texplore: real-time sampleefficient reinforcement learning for robots. Machine Learning 90,3,385-429.

[5] LEE, Y., KIM, S., AND LEE, J. 2010.Data-driven biped control.ACM Transctions on Graphics 29,4,Article 129.

猜你喜歡
深度動作技能
高級技能
深度理解一元一次方程
深度觀察
深度觀察
深度觀察
動作描寫要具體
秣馬厲兵強技能
中國公路(2017年19期)2018-01-23 03:06:33
拼技能,享豐收
畫動作
動作描寫不可少
主站蜘蛛池模板: 日韩精品免费一线在线观看| 亚洲女人在线| 青青青视频91在线 | 久久久久亚洲精品成人网| 永久在线播放| 国产成人三级| 国产亚洲欧美日韩在线一区二区三区| 在线播放国产一区| 四虎AV麻豆| 午夜无码一区二区三区| 国产视频 第一页| 国产一二视频| 精品91视频| 无码精品一区二区久久久| 日本久久免费| 亚洲欧美成人综合| 国产亚洲精| 精品黑人一区二区三区| 亚洲性一区| 国产欧美网站| 国产精品综合久久久| 丁香综合在线| 国产哺乳奶水91在线播放| 日韩高清欧美| 九九免费观看全部免费视频| 99热国产这里只有精品无卡顿" | 国产精品九九视频| 欧美日韩一区二区三区四区在线观看| 精品人妻AV区| 国产白丝av| 国产成人亚洲精品蜜芽影院| 在线视频精品一区| 亚洲av片在线免费观看| 一区二区欧美日韩高清免费| 亚洲AV电影不卡在线观看| 欧美色视频在线| 国产在线一区二区视频| av手机版在线播放| 亚洲无码91视频| 精品国产免费观看一区| 国产欧美日韩另类精彩视频| 国产v欧美v日韩v综合精品| 天天躁狠狠躁| 亚洲精品成人片在线播放| 成人综合久久综合| 伊人久久久久久久久久| 精品国产成人av免费| 无码内射在线| 国产免费网址| 欧美人与牲动交a欧美精品| 香蕉视频在线观看www| 中文字幕乱码二三区免费| 亚洲国产天堂久久综合| 另类综合视频| 99热亚洲精品6码| 色综合久久88| 九九视频免费在线观看| 中文精品久久久久国产网址| 奇米精品一区二区三区在线观看| 91精品免费高清在线| 国产国语一级毛片在线视频| 亚洲午夜18| 欧美日韩国产成人在线观看| 国产综合另类小说色区色噜噜 | 第一区免费在线观看| 秋霞一区二区三区| 四虎影视无码永久免费观看| 97se亚洲综合在线| 欧美一级片在线| 热久久综合这里只有精品电影| 2021最新国产精品网站| 亚洲精品欧美重口| 亚洲天堂免费观看| 国产精品欧美亚洲韩国日本不卡| 中文字幕欧美日韩高清| av在线5g无码天天| 国产人人乐人人爱| 69国产精品视频免费| 亚洲成a人片77777在线播放| 手机在线看片不卡中文字幕| 91系列在线观看| 欧美日韩国产精品va|