999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于3D卷積深度強化學(xué)習(xí)的交通燈配時優(yōu)化技術(shù)研究

2021-12-25 19:23:08沈國慶
科學(xué)與信息化 2021年3期
關(guān)鍵詞:深度模型

沈國慶

沈陽理工大學(xué) 遼寧 沈陽 110000

1 基于時間和空間序列的交通配時模型設(shè)計

(1)交叉口和路網(wǎng)模型。我們考慮使用的由兩車道組成的交叉口模型,交叉口的車輛在交通信號的控制下行駛:綠燈表示車輛可以穿過交叉口;紅燈表示車輛必須停車。

路網(wǎng)主要由多個交叉口和連接交叉口的道路組成,路網(wǎng)中所有的道路方向都不是規(guī)則的正北正南,道路也不規(guī)定為固定的長短,這樣的設(shè)定更貼合實際的路網(wǎng)。在當前的信號時長結(jié)束后,通過調(diào)整路網(wǎng)中所有交叉口下一信號時長的相位,處理不同的交通狀況。

(2)將路網(wǎng)狀態(tài)數(shù)據(jù)規(guī)范化。一般的CNN(卷積神經(jīng)網(wǎng)絡(luò))應(yīng)用于圖像處理中[1],圖像是二維的空間結(jié)構(gòu),感受也可以在空間維度上進行卷積來獲取特征。而本文提出的3D CNN在對路網(wǎng)中的車輛數(shù)據(jù)進行預(yù)處理時需要提取出路網(wǎng)狀態(tài)的時間和空間特征的能力,由于路網(wǎng)中的車輛數(shù)據(jù)不同于圖像這種本身就自帶自然的時間和空間結(jié)構(gòu),因此需要將路網(wǎng)狀態(tài)數(shù)據(jù)規(guī)范化,使得不同拓撲結(jié)構(gòu)的節(jié)點可以獲取相同大小的感受野,為之后輸入卷積神經(jīng)網(wǎng)絡(luò)計算提供了保障。我們在路網(wǎng)中建立的感受野相互之間都有重疊的部分,這樣既能保證了相鄰道路之間數(shù)據(jù)的相關(guān)性,又保證了整體道路感知的全局性。

(3)構(gòu)建3DCNN模型。本課題雖采用卷積神經(jīng)網(wǎng)絡(luò)對路網(wǎng)進行特征提取,但基本CNN網(wǎng)絡(luò)的輸出無法滿足本課題路網(wǎng)中多個交叉點同時決策和提取時間特征的要求,所以通過閱讀文獻與學(xué)習(xí)在深度學(xué)習(xí)領(lǐng)域的新技術(shù),3DCNN模型[2]的初步設(shè)計如下:已知路網(wǎng)中有80個交叉口,有51個交通燈。輸入路網(wǎng)的三維車輛密度矩陣,先經(jīng)過三層卷積層后將第三層平均分成51份后進行扁平化處理,再經(jīng)過一層全連接層后輸出102個Q值,每個交叉口的交通燈對應(yīng)兩個動作值0或1,選擇Q值較大的動作值,完成對相應(yīng)交叉口的動作決策。

(4)采用深度強化學(xué)習(xí)算法模型。在本課題的算法中,將控制問題建模為強化學(xué)習(xí)問題,如果把由交通信號控制系統(tǒng)當成一個智能體(Agent),將與交通信號所影響的路網(wǎng)和車輛當成“環(huán)境”,通過如下方式就可以構(gòu)造深度強化學(xué)習(xí)交通信號控制系統(tǒng)進行配時優(yōu)化。首先從環(huán)境里獲取觀測狀態(tài)(例如:路網(wǎng)中車輛密度),傳遞給智能體,智能體中采用的深度強化學(xué)習(xí)算法選擇動作來執(zhí)行(例如:當前相位保持綠燈或者切換成紅燈),并對執(zhí)行效果進行回饋(例如:采用車輛平均行駛時長作為回報函數(shù)),系統(tǒng)根據(jù)回報結(jié)果,調(diào)整系統(tǒng)的參數(shù)。這樣就形成一個循環(huán)的過程,就能實現(xiàn)不斷地學(xué)習(xí)與改進。

2 結(jié)果討論

通過對車輛滯留時間、路網(wǎng)車輛數(shù)量的仿真,將我們提出的基于3D卷積深度強化學(xué)習(xí)的交通燈配時優(yōu)化的方法與基于2D卷積的深度強化學(xué)習(xí)的交通燈配時優(yōu)化的方法進行比較,分析本文提出的表現(xiàn)。

首先,我們對通過仿真器實驗得出的結(jié)果進行了驗證,證明我們的智能體確實學(xué)到了有效地減少車輛滯留時間、減少路網(wǎng)中車輛數(shù)量并緩解交通壓力的良好行動策略(即交通信號控制策略),并且我們的算法在做出控制決策時是穩(wěn)定的,即不會使結(jié)果數(shù)據(jù)在好的和壞的行動策略之間搖擺,甚至轉(zhuǎn)向不良行為政策。

本次實驗是在不同流量下進行的結(jié)果對比,在80個結(jié)點的路網(wǎng)以及表1中的3個流量等級下,對于本文提出方法的結(jié)果進行分析,一級流量下的路網(wǎng)擁擠度較低,發(fā)現(xiàn)在擁擠度較低的路網(wǎng)中本文提出的方法的車輛平均滯留時間比基于2DCNN減少了0.3%。在路網(wǎng)車輛數(shù)量上比2DCNN減少了11.6%,從中我們發(fā)現(xiàn)在路網(wǎng)車輛用極度較低的情況下,本文提出的方法在路網(wǎng)車輛數(shù)量上前期展現(xiàn)出了巨大的優(yōu)勢。雖然隨著路網(wǎng)車輛擁擠度逐漸上升,本文提出的方法的效果有所下降,但是,還是保有明顯的優(yōu)勢。

3 結(jié)束語

本文采用深度學(xué)習(xí)提取城市路網(wǎng)空間和時間上的特征,通過與強化學(xué)習(xí)相結(jié)合,一同實現(xiàn)對城市路網(wǎng)交叉口交通燈的控制決策。通過引入聚類對路網(wǎng)進行預(yù)處理,既能實現(xiàn)對感受野的劃分保證感受野之間存在聯(lián)系,又能實現(xiàn)在聚類的基礎(chǔ)上對路網(wǎng)規(guī)范化實現(xiàn)對卷積神經(jīng)網(wǎng)絡(luò)的輸入。因為3D卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)在空間和時間上信息提取特征的優(yōu)越性能,我們利用3D卷積神經(jīng)網(wǎng)絡(luò)提取路網(wǎng)擁擠度特征和時間序列特征并作出動作決策。我們通過實驗結(jié)果可以看到,我們提出的方法對比前人提出基于2DCNN的控制策略有所提升。

猜你喜歡
深度模型
一半模型
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
深度觀察
深度觀察
深度觀察
深度觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 日本高清在线看免费观看| 欧美色香蕉| 久久久久88色偷偷| 伊人成色综合网| 亚洲天堂网在线视频| 无码专区国产精品一区| h视频在线观看网站| 中文字幕亚洲乱码熟女1区2区| 99激情网| 国产在线精品99一区不卡| 国产啪在线91| 在线观看av永久| 天天爽免费视频| 欧美高清三区| AV在线天堂进入| 无码在线激情片| 亚洲无码视频一区二区三区 | 久久国产精品国产自线拍| 久久人人97超碰人人澡爱香蕉| 免费观看成人久久网免费观看| 亚洲成人精品久久| 久久99热66这里只有精品一| 国内老司机精品视频在线播出| 在线毛片网站| 波多野结衣一二三| 天天操精品| 一级毛片免费观看不卡视频| 特级毛片免费视频| 久久久久国产精品熟女影院| a天堂视频在线| 色九九视频| 国产农村精品一级毛片视频| 欧美精品高清| 激情综合婷婷丁香五月尤物| 四虎免费视频网站| 激情影院内射美女| 欧美黄色网站在线看| 九色视频线上播放| 在线观看国产一区二区三区99| 久久久久久国产精品mv| 人妻精品久久久无码区色视| 91麻豆精品国产高清在线| 国产精品漂亮美女在线观看| 免费毛片a| 亚洲精品免费网站| 秋霞一区二区三区| 综合久久五月天| 色婷婷亚洲十月十月色天| 91探花在线观看国产最新| lhav亚洲精品| 国产精品久久久久无码网站| 美女亚洲一区| 九九久久99精品| 黄色a一级视频| 欧美在线视频不卡| 日韩一二三区视频精品| 国产噜噜噜视频在线观看 | 日韩国产黄色网站| 一区二区三区四区在线| 欧美中文字幕一区| 日韩欧美一区在线观看| 国产成人综合网| 手机在线免费毛片| 亚洲电影天堂在线国语对白| 成人午夜福利视频| 亚洲精品国产成人7777| 国产在线观看一区二区三区| 高清久久精品亚洲日韩Av| 成人毛片在线播放| 日韩a在线观看免费观看| 一本大道香蕉久中文在线播放| 在线观看欧美国产| 国内精品自在自线视频香蕉| 天堂成人av| 伊伊人成亚洲综合人网7777| 孕妇高潮太爽了在线观看免费| 亚洲AV人人澡人人双人| 欧美无专区| 亚洲欧美天堂网| 这里只有精品免费视频| 国产福利免费视频| 女人18毛片久久|