999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于融合離散動作的雙延遲深度確定性策略梯度算法的自動駕駛端到端行為決策方法*

2022-03-20 14:42:30王一權劉佳琦段玉林張榮輝
交通信息與安全 2022年1期
關鍵詞:動作環境模型

楊 璐 王一權 劉佳琦 段玉林 張榮輝

(1.天津理工大學天津市先進機電系統設計與智能控制重點實驗室 天津 300384;2.天津理工大學機電工程國家級實驗教學示范中心 天津 300384;3.中國農業科學院農業資源與農業區劃研究所 北京 100081;4.中山大學廣東省智能交通系統重點實驗室 廣州 510275)

0 引 言

在復雜多變的環境中學習最優駕駛策略是自動駕駛領域一直面臨的挑戰,傳統的決策方法主要基于規則[1-3],通過有限狀態機、決策樹等方法對狀態、規則進行劃分,進而進行計算、決策。然而基于規則的方法無法覆蓋所有可能出現的場景,難以適應復雜的環境。隨著機器學習在自動駕駛領域的應用,決策模型利用神經網絡處理駕駛相關環境信息,輸出車輛控制信號,實現端到端的決策控制,成為了研究熱點。

目前端到端的自動駕駛決策方法主要基于模仿學習和強化學習。基于模仿學習的方法旨在模仿專家(人類駕駛員)進行學習,實現對專家行為的再現[4]。英偉達最初基于深度神經網絡,在端到端自動駕駛系統中取得了成功,然而在新的環境中表現不佳。為此,巴明月[5]在輸入中增加語義分割深度圖像,并在動作輸出前加入高級控制命令提高模型的魯棒性。Toromanoff等[6]對數據進行增強,僅使用1個魚眼相機實現了端到端自動駕駛橫向控制。Chen等[7]在專家數據中加入了隨機噪聲,提高了模型的泛化能力。然而,基于模仿學習的決策方法仍存在局限:①訓練時需要大量的專家數據以保證其泛化性,導致算法難以訓練;……

登錄APP查看全文

猜你喜歡
動作環境模型
一半模型
長期鍛煉創造體內抑癌環境
一種用于自主學習的虛擬仿真環境
重尾非線性自回歸模型自加權M-估計的漸近分布
孕期遠離容易致畸的環境
環境
動作描寫要具體
動作描寫不可少
3D打印中的模型分割與打包
非同一般的吃飯動作
主站蜘蛛池模板: 97综合久久| 国产一区在线视频观看| 最新亚洲人成无码网站欣赏网 | 国产小视频在线高清播放| 免费毛片a| 亚洲第一成年免费网站| 欧美成人午夜视频| 国产微拍一区二区三区四区| 伊人蕉久影院| 日本亚洲成高清一区二区三区| www.91中文字幕| 亚洲国产精品日韩av专区| av一区二区三区在线观看| 国产真实乱子伦视频播放| 亚洲综合片| 欧美成人午夜在线全部免费| 97久久人人超碰国产精品| 天堂中文在线资源| 久久精品视频亚洲| 免费国产黄线在线观看| 怡春院欧美一区二区三区免费| 成年片色大黄全免费网站久久| 久久天天躁狠狠躁夜夜2020一| 免费a级毛片18以上观看精品| 2021天堂在线亚洲精品专区 | 免费激情网址| 欧美福利在线| 国产91精选在线观看| 福利在线不卡| 婷婷六月在线| 欧美一区二区三区香蕉视| 在线观看无码av免费不卡网站 | 精品久久久无码专区中文字幕| 男女性午夜福利网站| 中文字幕无码av专区久久| 欧美成人手机在线观看网址| 97综合久久| 五月天久久婷婷| 亚洲精品欧美日韩在线| 欧美色图久久| 激情無極限的亚洲一区免费| 成人午夜视频网站| 三级毛片在线播放| 人人艹人人爽| 天天爽免费视频| 婷婷亚洲视频| 亚洲成aⅴ人在线观看| 免费一极毛片| 夜夜操天天摸| 免费AV在线播放观看18禁强制| 中文字幕 91| 四虎亚洲国产成人久久精品| 亚洲一区二区三区国产精华液| 青青热久免费精品视频6| 亚洲性影院| 亚洲天堂首页| 国产精品短篇二区| 久久黄色视频影| 黄色污网站在线观看| 国产精品hd在线播放| 狠狠色成人综合首页| 国产污视频在线观看| 亚洲福利网址| 色视频国产| 亚洲精品麻豆| 国产欧美综合在线观看第七页| 国产黄色爱视频| 日韩av无码DVD| 国产精品香蕉在线| 波多野结衣一区二区三视频| 2020最新国产精品视频| 波多野结衣在线一区二区| 欧美亚洲第一页| 99在线视频免费观看| 中国成人在线视频| 久久影院一区二区h| 91成人在线免费视频| 午夜精品影院| 欧美日韩高清在线| 92午夜福利影院一区二区三区| 制服丝袜国产精品| 五月婷婷欧美|