999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

采用多智能體強化學習的交通信號優化控制

2012-07-04 09:43:20炯,金
制造業自動化 2012年17期
關鍵詞:方向智能

宋 炯,金 釗

(1.云南交通職業技術學院,昆明 650101;2.云南大學,昆明 650091)

0 引言

實現智能交通信號控制是一種減少交通擁堵和提高交通效率的低成本方法[1]。因為交通流量具有隨時變化和隨機性的特點,尤其是在多十字路口的城市交通環境,因此流量建模仍然是非常困難的。一個預設的交通控制模型是不可能符合所有的交通情況。所以有更多研究關注機器學習的實時交通流量控制[2~4]。在所有機器學習的方法中,強化學習受到更多的關注,因為其自主學習的能力, 使得能夠智能感知不同的條件和自我自適應調整控制策略,以符合交通條件。

雖然在參考文獻[2]中提出了自適應減少時間延遲的交通信號控制的Q學習方法,但只考慮了一個十字路口的情況。A.Salkham[3]提供了一個強化學習交通控制優化框架,但對硬件基礎設施依賴較大。Li T[4]等學者提出了一種自適應動態規劃方案實施多十字路口的交通信號智能控制,但針對相互作用和相互影響的多交叉路口的情況卻沒有進一步探討。在參考文獻[5~7]中,可以看到到一些類似的研究。這些研究表明使用自主學習的強化學習解決隨時變化和隨機性交通流量問題,一直是智能交通信號控制研究的重點之一[8]。雖然這些問題都受到關注,但都沒有進一步詳細討論和研究。

圖1 由六個十字路口的城市交通網絡構建的仿真環境

在本文中,作者提出了一種多智能體強化學習的多十字路口的交通信號控制模型。

首先,作者定義多十字路口的交通信號控制問題的多智能體的強化學習模型,其中包括狀態空間、目標狀態、行動和培訓的事件,完整描述在強化學習語言的問題。然后,從中找出多路口交通信號控制的最優政策的多智能體強化學習算法。交通信號控制策略的最優政策是讓所有的車輛可以在最短的時間內,離開多路口的城市交通網絡。最后,在仿真環境中,作者通過比較常規定時控制與多智能體增強學習自適應控制下所有車輛離開多路口的城市交通網絡的時間,來進行驗證。

1 強化學習模型的多路口交通信號控制問題

首先,作者對多路口的交通信號控制問題的多智能體強化學習模型進行描述。

在作者的模型中,一個城市的交通網絡是由多個十字路口構成,例如,圖1顯示由6個十字路口組成的交通網絡,同時它也是作者實驗的仿真環境。當然,可以由更多的十字路口組成擴大的交通網絡。

交通信號控制的目標是使這些車輛安全,快速地離開由十字路口組成的交通網絡。很明顯在十字路口的車輛是隨時變化和隨機的。預設的控制模型是不可能的適應所有的交通流量,這也是作者采取多智能體強化學習方法的原因,它可以根據實時交通流量自主學習的最優政策。

在交通信號控制中,一個相位是信號燈不中斷照明的間隔時間,舉個例子,一個紅色信號燈照明時間間隔或綠色信號燈照明時間間隔都是相位。通過在一個合理的時間間隔,使車輛在較短的時間內交叉十字路口切換不同的相位是交通信號控制的主要目標。例如,當車輛在西向東方向比車輛在南向北方向的流量多,東向西方向的綠色信號燈相位應該是比紅色信號燈相位長。

通常的相位是最大的時間間隔是的間隔時間最短的相位的整數倍,我們記為“MinPT”。例如,如果MinPT = 60秒,那么相位時間間隔應該60秒,120秒,180秒,以此類推。

根據交通信號控制問題的描述,車輛數量和所有路口的組合稱為一個狀態,反映了交通流量的信號控制??刂颇繕耸窃谳^短時間內使所有的車輛離開城市交通網絡,當在交通網絡中的每一個十字路口的汽車數量趨于零時,就達到了理想的目標狀態。完成每個階段后最短相位時間間隔、通過智能控制達到紅綠燈最短相位。

當一個方向設置為綠色信號燈時,然后另一個方向必須設置為紅色信號燈,因為只有一個方向的車輛可以通過一次。因此,每個階段最短的時間間隔后的行動只是設置一個方向的綠色信號燈,因為另一個方向必須是紅信號燈。整個訓練集可以描述為:后完成每個階段最短的時間間隔,允許或不允許車輛通行狀態,控制代理選擇隨機一個方向綠色信號燈(另一個方向是紅色信號燈),然后選擇下一步的操作,直到所有車輛都離開交通網絡(實現目標狀態)。這個過程被稱為一個訓練集。圖2顯示兩個十字路口的交通流量的狀態和行為。

圖2 交通控制問題的狀態和行為

2 多十字路口的交通信號控制最優策略的多智能體強化學習算法

作者使用最廣泛使用的強化學習方法:Q-leaming[9]來完成該算法算,以實現多十字路口的交通信號控制最優策略。通過算法l的程序實現交通信號控制的最優策略。

算法1 多智能體強化學習實現交通信號控制問題的最優策略。

Create null list: trajectory

Create null list: State-List

Create null set: State-Cluster

For each s,a initialize the table entry Q(s,a) to zero

Observe the current state s

Add s into trajectory Repeat

Select an action a and execute it

Receive immediate reward r

Observe the current state s'

Add s' into trajectory

Let State-List ← the reverse of trajectory

Update the table entry fors,a) as follows:

For each list cur_list in State-Cluster do

Let i ← 2

While i < the length of cur_list

Let spre← cur_list [i-1]

圖3 兩個十字路口交通網絡信號控制的最優策略

Let snow← cur_list [i]

Let a*← the action agent takes when it move from snowto spre

Let i ← i+1

End while

End for

s←s'

Until all table entry are convergent

圖3給出兩個十字路口的交通網絡中的最優策略。從圖3可以很明顯的看到,在南北方向綠色信號的時間超過了在東西方向的綠色信號時間,因為在南北方向的汽車數量大于東西方向的汽車數量。算法1通過智能控制來調節控制策略,以應對實時的交通狀態實現自適應的控制。

3 實驗

在交通狀況仿真環境下通過30次不同的交通狀況,我們分別采用傳統的定時控制和基于多智能體強化學習的自適應控制,比較所有車輛離開當地城市交通網絡的時間。實驗結果如圖4所示。

通過圖4顯示出來的比較結果看到:基于多智能體強化學習的自適應控制策略與采用傳統定時策略的控制方法相比,所有車輛離開交通網絡的時間可以減少20~30%。結果顯示作者的控制算法可以顯著減少所有車輛離開當地城市交通網絡的時間。

圖4 傳統定時控制與多智能體強化學習的自適應控制對比實驗

4 結論

在這項研究工作中,作者提出了一個多智能體強化學習的交通信號控制方法。作者定義了多智能體強化學習模型的交通信號控制問題,并提出實現最優策略的算法。通過仿真環境下交通信號控制效果的和實驗結果,可以清楚的說明作者的方法。采用多智能體強化學習的交通信號優化控制的方法可以大大減少所有車輛離開城市交通網絡的時間。

隨著日益膨脹的城市交通流量和十字交叉路口,空間及狀態因素將變得非常巨大,今后的研究應解決如何加速學習以應對這一趨勢。

[1] A.L.C.Bazzan, Opportunities for multi-agent systems and multi-agent reinforcement learning in traffic control,Autonomous agent multi-agent systems, 18, 342-375, 2009.

[2] Lu Shou feng, Liu Ximin, Dai Shiqiang.Q-learning for adaptive traff i c signal control based on delay minimization strategy.International Conference on Networking, Sensing and Control.In Proceedings of ICNSC'2008.pp.687-691

[3] A.Salkham, R.Cunningham, A.Garg, and V.Cahill, A Collaborative Reinforcement Learning Approach to Urban Traffic Control Optimization, In: The 2008 International Conference on Web Intelligence and Intelligent Agent Technology, Vol.2, 560-566, 2008.

[4] Li T, Zhao D B, Yi J Q.Adaptive dynamic programming for multi-crossroads traffic signal intelligent control.In:Proceedings of the 11th IEEE International Conference on Intelligent Transportation Systems.Beijing, China: IEEE,2008.286-291.

[5] Cai C.An approximate dynamic programming strategy for responsive traffic signal control.In: Proceedings of IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning.Honolulu,USA: IEEE,2007.303-310.

[6] A.L.C.Bazzan, D.Oliveira , B.C.Silva, Learning in groups of traffic signals, Engineering Applications of Artificial Intelligence, Vol.23, No.4, 560-568, 2010.

[7] G.Balan, S.Luke, History-based traff i c control, Proceedings of the fifth international joint conference on Autonomous agents and multiagent systems, Hakodate, Japan, 973-980,2006.

[8] T.L.Thorpe, C.W.Anderson, Traffic Light Control Using SARSA with Three State Representations[Z], Technical report, IBM Corporation, Boulder, 1996.

[9] C.J.Watkins, Q-Learning, Machine Learning,Vol.8, 279-292,1992.

猜你喜歡
方向智能
2022年組稿方向
計算機應用(2022年2期)2022-03-01 12:33:42
2022年組稿方向
計算機應用(2022年1期)2022-02-26 06:57:42
2021年組稿方向
計算機應用(2021年4期)2021-04-20 14:06:36
2021年組稿方向
計算機應用(2021年3期)2021-03-18 13:44:48
2021年組稿方向
計算機應用(2021年1期)2021-01-21 03:22:38
智能制造 反思與期望
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
主站蜘蛛池模板: 天天色综网| 88av在线播放| 天天色综网| 97成人在线视频| 99免费在线观看视频| 久久黄色毛片| 精品夜恋影院亚洲欧洲| 日韩精品一区二区三区swag| 亚洲性日韩精品一区二区| 日韩精品毛片| 国产在线精品香蕉麻豆| 蝌蚪国产精品视频第一页| 国产成人91精品免费网址在线 | 18禁不卡免费网站| 中文字幕调教一区二区视频| 中文字幕第1页在线播| lhav亚洲精品| 国产精品成人久久| 中文字幕66页| 欧美日韩第三页| 91九色国产porny| 欧美国产日产一区二区| 日本a级免费| 试看120秒男女啪啪免费| 丁香亚洲综合五月天婷婷| 亚洲另类国产欧美一区二区| 国产美女精品在线| 午夜国产不卡在线观看视频| 超碰91免费人妻| 国产亚洲精品va在线| 精品1区2区3区| 国产精品蜜芽在线观看| 日韩不卡高清视频| 一级一级特黄女人精品毛片| 国产91透明丝袜美腿在线| 国产日韩欧美精品区性色| 久久99国产精品成人欧美| 小13箩利洗澡无码视频免费网站| 日韩a级片视频| 久久久久青草大香线综合精品| 精品人妻AV区| 国产91无码福利在线| 香蕉久久永久视频| 四虎亚洲国产成人久久精品| 欧美亚洲香蕉| 国产一区免费在线观看| 欧美中文字幕一区二区三区| 国产在线八区| 免费人成视网站在线不卡| jizz亚洲高清在线观看| 她的性爱视频| 国产精品嫩草影院av | 日本黄网在线观看| 中文字幕亚洲精品2页| 亚洲AV色香蕉一区二区| 国产视频a| 国产成人1024精品下载| 国产精品尤物在线| 毛片卡一卡二| 女人18一级毛片免费观看| 国产成人AV男人的天堂| 亚洲国产成人综合精品2020| 欧洲高清无码在线| 国产亚洲精品91| 免费不卡视频| 日韩欧美高清视频| 欧美 亚洲 日韩 国产| 国产在线一区视频| 国产三区二区| AV不卡无码免费一区二区三区| 一区二区三区国产| 欧美日韩国产成人高清视频| 视频二区中文无码| 毛片一级在线| 国产成人精品综合| 国产精品视频观看裸模| 玖玖精品视频在线观看| 国产麻豆91网在线看| 国产精品丝袜视频| 欧美午夜理伦三级在线观看| 日本人又色又爽的视频| 国产成人亚洲日韩欧美电影|