999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于加權(quán)密集連接卷積的深度強化學(xué)習(xí)方法總結(jié)

2018-07-23 08:09:28大連理工大學(xué)劉朋碩
電子世界 2018年13期
關(guān)鍵詞:深度特征方法

大連理工大學(xué) 劉朋碩

0.引言

強化學(xué)習(xí)到目前為止,已經(jīng)有了幾十年的發(fā)展歷程了,這是一種集結(jié)理解能力、自動指向目標以及決策為一體的計算方式,近幾年來對強化學(xué)習(xí)有了新一步的突破,傳統(tǒng)的強化學(xué)習(xí)在解決簡單問題的時候有出色的表現(xiàn),但是在大規(guī)模問題中就存在較大的不確定性,因此,加權(quán)密集連接卷積的深度強化學(xué)習(xí)方法值得被提倡,也吸引了越來越多的人去研究這種深度強化學(xué)習(xí)方法,從而達到事半功倍的效果。

1.深度強化學(xué)習(xí)總體框架分析

在現(xiàn)實生產(chǎn)與生活活動中,如果遇到了大規(guī)模的問題,傳統(tǒng)的強化學(xué)習(xí)在處理這些大規(guī)模問題的時候只能夠解決表面,但是仍舊會出現(xiàn)維度災(zāi)難,尤其是實際生活中存在問題更是多種多樣,需要更好的方法去解決,這也就是深度強化學(xué)習(xí)法,這種方法有多層單元組合,通過這種特征組合的方式,將原始的輸入形式逐漸轉(zhuǎn)化為淺層的特征、中層的特征以及高層的特征,這便是整個目標任務(wù)的過程,如果將深度學(xué)習(xí)和強化學(xué)習(xí)進行科學(xué)有效的結(jié)合,并且通過深度化的學(xué)習(xí)動進行數(shù)據(jù)的抽象表征,以此進行激勵,從而有效的彌補傳統(tǒng)的強化學(xué)習(xí)中發(fā)現(xiàn)的不足。

深度強化學(xué)習(xí)方法可以在不同的實際環(huán)境中使用,這種學(xué)習(xí)方法的適應(yīng)性較強,但是如果卷積神經(jīng)網(wǎng)絡(luò)的層數(shù)太少,那么游戲的狀態(tài)和信息是無法完全提取出來的。卷積神經(jīng)網(wǎng)絡(luò)可以讓網(wǎng)絡(luò)朝著更深或者更寬的方向發(fā)展,隨著信息化技術(shù)的發(fā)展和網(wǎng)絡(luò)科技的進步,網(wǎng)絡(luò)層數(shù)不斷在加深,節(jié)點不多增加,需要計算的量也有了成倍數(shù)的增加,這個時候使用加權(quán)密集連接卷積的深度強化學(xué)習(xí)方法就會起到更加理想的效果。

對于深度強化學(xué)習(xí)方法的整體框架,首先,提出的問題成為樣本數(shù)據(jù)被輸入,隨后變?yōu)槌跏蓟疃染W(wǎng)格參數(shù),參數(shù)完成后再對訓(xùn)練樣本進行科學(xué)的預(yù)測,根據(jù)預(yù)測得到的結(jié)果分析樣本之間是否存在偏差,如果偏差過大,就要根據(jù)實際情況擴大訓(xùn)練樣本的次數(shù),如果偏差不大就可以繼續(xù)分析樣本之間存在的方差情況,如果方差過大,那么經(jīng)過正規(guī)化的處理方式進行訓(xùn)練樣本的預(yù)測工作,如果方差不大,接下來就可以直接設(shè)置深度學(xué)習(xí)的網(wǎng)格超參數(shù),可以使用蒙特卡洛模擬數(shù)據(jù)抽樣對網(wǎng)絡(luò)中的數(shù)據(jù)流進行一次預(yù)測,隨后設(shè)置好強化學(xué)習(xí)匯報的函數(shù),根據(jù)函數(shù)的表現(xiàn)運用深度強化學(xué)習(xí)的策略對當(dāng)前擁有的資源做好分析工作,最終得到結(jié)果[1]。

2.基于加權(quán)密集連接卷積的深度強化學(xué)習(xí)方法

2.1 密集連接卷積網(wǎng)絡(luò)

與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)不同,加權(quán)密集連接卷積在傳統(tǒng)的模式基礎(chǔ)上是一種全新的網(wǎng)絡(luò)連接模式,不同的層次之間需要進行跨層連接,網(wǎng)絡(luò)中前后兩層信號可以在輸出層和輸入層之間進行高速的流通,加權(quán)密集連接卷積網(wǎng)絡(luò)能夠?qū)⑵渲兴械膶右詢蓛傻姆绞竭B接在一起,這樣網(wǎng)絡(luò)當(dāng)中每一層都可以去接受之前所有層表現(xiàn)出來的特征,并且以此進行輸入操作。在密集連接狀態(tài)下的網(wǎng)絡(luò)結(jié)構(gòu)中,每一層特征圖都需要經(jīng)過批量歸一化、Relu激活和卷積操作,如果在卷積操作的時候遇到了瓶頸,可以根據(jù)實際情況減少輸入特征圖的數(shù)量,從而有效的提高整個計算的效率。如果想要每一層的特征都能夠得到反復(fù)的利用,在跨層連接的時候可以使用并聯(lián)的方式,也就是在加權(quán)密集連接卷積網(wǎng)絡(luò)中每一層的輸入信息都能包含之前每一層的實際輸出。

經(jīng)過分析得知,密集連接卷積網(wǎng)絡(luò)主要有著兩個特性,第一個特性是密集連接卷積網(wǎng)絡(luò)在反向誤差傳播的時候,每一層網(wǎng)絡(luò)都可以接收到在這之后所有層中傳遞過來的梯度信號,這種情況下,即使密集連接卷積網(wǎng)絡(luò)層數(shù)在不斷增加,靠近輸入層的梯度也會變得越來越小,這個時候在一定程度上就可以減少整個訓(xùn)練過程中出現(xiàn)梯度消失的問題。第二個特性是密集連接卷積網(wǎng)絡(luò)結(jié)構(gòu)中有大量的特征在重復(fù)使用的時候,可以使用少量的卷積核生成大量的特征,有效的降低模型中需要用到的計算量,這個時候整個模型的尺寸也能夠得到有效的控制,達到比較小的狀態(tài)[2]。

2.2 加權(quán)密集連接

密集連接卷積網(wǎng)絡(luò)跨層連接的過程中,每一層之間都屬于平等的關(guān)系,如果只是將當(dāng)前的密集連接卷積網(wǎng)絡(luò)層與之前所有的密集連接卷積網(wǎng)絡(luò)層之間并聯(lián)完成后再進行操作,這個時候每一層之間的密集連接卷積操作都有著不同的作用和效果,得到的特征信息也不會相同,所以在進行密集連接卷積網(wǎng)絡(luò)跨層連接的時候要保持分明的主次關(guān)系,也就是說密集連接卷積網(wǎng)絡(luò)跨層連接的時候當(dāng)前的網(wǎng)絡(luò)層會起到主要的作用,之前所有的密集連接卷積網(wǎng)絡(luò)可以起到輔助的作用。如果加權(quán)密集連接卷積網(wǎng)絡(luò)層在進行跨層連接的時候,需要進行權(quán)重的分配,如果當(dāng)前密集連接卷積網(wǎng)絡(luò)層權(quán)重的系數(shù)為1,那么每一層的權(quán)重設(shè)置就是w,w的大小范圍在0和1之間,最小不低于0,最大不超過1,加入加權(quán)密集連接卷積網(wǎng)絡(luò)連接塊中當(dāng)前的層之前一共有i層密集連接卷積網(wǎng)絡(luò),那么到了第i層的時候整個密集連接卷積網(wǎng)絡(luò)的權(quán)重就是:

深度卷積神經(jīng)網(wǎng)絡(luò)是這一波 AI 浪潮背后的大功臣。雖然很多人可能都已經(jīng)聽說過這個名詞,但是對于這個領(lǐng)域的相關(guān)從業(yè)者或者科研學(xué)者來說,淺顯的了解并不足夠。近日,約克大學(xué)電氣工程與計算機科學(xué)系的 Isma Hadji 和 Richard P. Wildes 發(fā)表了一篇《我們該如何理解卷積神經(jīng)網(wǎng)絡(luò)?》的文章,幫助人們加深了對深度卷積神經(jīng)網(wǎng)絡(luò)的理解,闡述了幾種多層神經(jīng)網(wǎng)絡(luò),并介紹當(dāng)前計算機視覺領(lǐng)域應(yīng)用中最成功的卷積結(jié)構(gòu);具體介紹了標準卷積神經(jīng)網(wǎng)絡(luò)中的各構(gòu)成組件,并從生物學(xué)和理論兩個角度分析不同組件的設(shè)計方案;討論了當(dāng)前卷積神經(jīng)網(wǎng)絡(luò)設(shè)計的趨勢及可視化理解卷積神經(jīng)網(wǎng)絡(luò)的相關(guān)研究工作,還重點闡述了當(dāng)前結(jié)構(gòu)仍存在的一些關(guān)鍵問題[3]。

2.3 網(wǎng)絡(luò)模型的具體實現(xiàn)

加權(quán)密集連接卷積網(wǎng)絡(luò)之間層數(shù)越深,關(guān)于特征的維度就會增長的越快,由于每隔一層的時候都需要根據(jù)實際情況采樣,最終完成降維操作。如果將加權(quán)密集連接卷積網(wǎng)絡(luò)分為三個部分,這樣就可以降低特征維度的增加,加權(quán)密集連接卷積網(wǎng)絡(luò)可以在環(huán)境當(dāng)中將當(dāng)時存在的狀態(tài)進行截圖處理,并且以其作為網(wǎng)絡(luò)的輸入模式,經(jīng)過一層加權(quán)密集連接卷積網(wǎng)絡(luò)的常規(guī)卷積過程,然后進入第一個需要加權(quán)密集處理的連接塊,在整個加權(quán)密集連接卷積網(wǎng)絡(luò)運行訓(xùn)練中會產(chǎn)生大量的樣本數(shù)據(jù),所以在開始的時候需要隨機的方式選擇動作,使這些動作在最短時間內(nèi)熟悉好語言環(huán)境信息,并且將數(shù)據(jù)保留在經(jīng)驗池當(dāng)中,人們需要的時候來到經(jīng)驗池根據(jù)訓(xùn)練的情況與內(nèi)容隨機抽取一部分進行網(wǎng)絡(luò)學(xué)習(xí)。

2.4 經(jīng)驗池回放

加權(quán)密集連接卷積網(wǎng)絡(luò)的深度強化學(xué)習(xí)方法中,關(guān)于經(jīng)驗池回放這一個概念早在上個世紀末就提出來了,訓(xùn)練的全過程中需要進行大量的樣本數(shù)據(jù)深度學(xué)習(xí),傳統(tǒng)的樣本學(xué)習(xí)方法已經(jīng)無法滿足加權(quán)密集連接卷積網(wǎng)絡(luò)的深度強化學(xué)習(xí)的要求,因此,人們需要根據(jù)樣本數(shù)據(jù)的情況進行多次的使用,保證經(jīng)驗池的技術(shù)可以解決這個問題。加權(quán)密集連接卷積網(wǎng)絡(luò)的深度強化學(xué)習(xí)方法中經(jīng)驗池回放指的就是將之前擁有的樣本數(shù)據(jù)全部存儲起來,每一次訓(xùn)練的時候再找出一部分樣本進行網(wǎng)絡(luò)學(xué)習(xí),經(jīng)驗池的存在可以克服了數(shù)據(jù)分布不平衡的問題,同時在一定程度上也有效的提高了數(shù)據(jù)的利用效率。使用者經(jīng)過多次的反復(fù)樣本學(xué)習(xí)以后,可以避免學(xué)習(xí)中再次接觸到同樣的樣本,如果加權(quán)密集連接卷積網(wǎng)絡(luò)的深度強化學(xué)習(xí)方法下經(jīng)驗池中樣本數(shù)據(jù)已經(jīng)達到了設(shè)定的上限,新的樣本就會將原有的舊樣本替換下去,從而保證加權(quán)密集連接卷積網(wǎng)絡(luò)中樣本被抽到的概率一直處于相似的情況。

3.總結(jié)

總而言之,隨著學(xué)習(xí)方法的更新和信息化手段的創(chuàng)新,將加權(quán)密集連接卷積網(wǎng)絡(luò)的深度強化學(xué)習(xí)方法中所有的元素緊密聯(lián)系在一起,在訓(xùn)練的過程中不斷的調(diào)整每一層網(wǎng)絡(luò)的權(quán)重值,隨后有效的提取到特征性信息,保證加權(quán)密集連接卷積網(wǎng)絡(luò)的深度強化學(xué)習(xí)處理圖像時更加省時高效,對于這種深度強化學(xué)習(xí)方法的研究不會止步不前,而是隨著時代的進步和發(fā)展不斷有新的發(fā)現(xiàn)。

猜你喜歡
深度特征方法
深度理解一元一次方程
如何表達“特征”
不忠誠的四個特征
深度觀察
深度觀察
深度觀察
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 国产精品免费电影| 在线观看国产黄色| 欧日韩在线不卡视频| 日韩中文字幕亚洲无线码| 在线观看国产精品日本不卡网| 亚洲无码高清一区二区| 亚洲性日韩精品一区二区| 福利国产微拍广场一区视频在线| 性网站在线观看| 亚洲欧美精品日韩欧美| 国产永久在线视频| 欧美精品v欧洲精品| 午夜精品国产自在| 久热中文字幕在线观看| 国产迷奸在线看| 成人无码区免费视频网站蜜臀| 午夜免费视频网站| 97狠狠操| 99视频在线精品免费观看6| 国产97视频在线| 久久久久国产精品熟女影院| 久久久久国产精品嫩草影院| 免费啪啪网址| 亚洲日韩每日更新| 免费在线不卡视频| 国产欧美专区在线观看| 成人一级免费视频| 91麻豆精品国产高清在线| 制服无码网站| 亚洲欧美国产高清va在线播放| 九色在线观看视频| 色播五月婷婷| 久久久精品无码一区二区三区| 污污网站在线观看| 亚洲第一在线播放| 欧美性色综合网| 思思99热精品在线| 97人妻精品专区久久久久| www.亚洲一区二区三区| 亚洲V日韩V无码一区二区| 97国产成人无码精品久久久| 91年精品国产福利线观看久久| 国产中文一区a级毛片视频| 自拍中文字幕| 国产高清在线精品一区二区三区| 丝袜久久剧情精品国产| 亚洲精品不卡午夜精品| 欧美成人午夜视频免看| 亚洲中文在线看视频一区| 99伊人精品| 72种姿势欧美久久久久大黄蕉| 久久无码av三级| 国产在线高清一级毛片| 免费啪啪网址| 欧美日本在线观看| 国产美女无遮挡免费视频网站| 99热这里只有精品5| 无遮挡国产高潮视频免费观看| 久久人妻系列无码一区| 欧美精品黑人粗大| 国产精品无码久久久久久| 久久婷婷国产综合尤物精品| 波多野结衣视频一区二区| 91久草视频| AV不卡国产在线观看| 在线观看国产一区二区三区99| 国产女人18水真多毛片18精品| 国产女人在线| 日韩国产精品无码一区二区三区| 青青青国产在线播放| 伊人色在线视频| 国产精品人人做人人爽人人添| 久久精品人人做人人综合试看| 国产精品永久免费嫩草研究院| 国产欧美日韩综合一区在线播放| 国产成人91精品| 亚洲永久色| 国产男女免费完整版视频| 亚洲 欧美 偷自乱 图片 | 色丁丁毛片在线观看| 欧美精品亚洲精品日韩专区| 91久久国产综合精品女同我|