張立立,王 力,張玲玉
(1.北京聯合大學城市軌道交通與物流學院,北京 100101;2.北方工業大學城市道路交通智能控制技術北京重點實驗室,北京 100144)
以傳統城市道路交通控制理論為基礎,結合現代控制、智能控制、人工智能等理論的模型與算法在交通控制領域實現了長足的發展和應用,并由此形成了許多細分研究領域和分支。現代控制理論假設受控對象的數學模型已知,基于現代控制理論的交通控制方法大多稱為基于模型的交通控制(model based traffic control,MBTC)[1-2]理論與方法。進入21世紀初期,交通信息化的推進和檢測技術的發展使得交通檢測數據的種類、精度都得到極大提升,同時道路交通出行需求的爆發式增長使得傳統交通控制方法已捉襟見肘,為此研究人員開始思考基于數據驅動[3]的交通控制(data driven based traffic control,DDBTC)理論與方法,即考慮在難以準確建模受控系統時,僅利用系統的輸入輸出數據實現控制與決策;近幾年,人工智能理論與方法的突破和大規模云計算與邊緣計算技術的演進,推動了以人工智能方法為核心的新型智能控制的發展,部分學者提出了基于人工智能的交通控制(artificial intelligent based traffic control,AIBTC)理論與方法。下面從三個方面系統回顧和分析城市交通控制方法的研究,包括基于模型的交通控制,基于數據驅動的交通控制和基于人工智能的交通控制。
(1)基于模型的交通控制
傳統的交通信號控制大多都能歸為基于模型的交通控制,這里只簡單回顧采用現代控制理論思想與方法的研究。Chang等[4-5]建立了不同相位控制的交叉口離散優化模型,并采用極小值原理對交叉口最佳周期和各相位最佳綠信比進行求解;Liu等[6]認為過飽和交通狀態的信號優化問題可以以交通的到達率和駛離率作為效率評價指標,并以駛離交通量大為目標建立動態線性規劃模型,通過優化求解該模型可得到信號控制最優方法;何忠賀等[7-8]將切換服務系統應用到交叉口信號控制中,設計了“帶有服務時間上限的固定相序切換”服務策略,并進行了切換服務系統周期穩定性的研究;何忠賀等[9]通過構建交通網絡正系統引入穩態控制和部分變量穩定控制;張玲玉等[10-11]以存儲轉發模型為基礎,利用線性二次型調節器(LQR)實現交叉口控制;向偉銘等[12]通過將過飽和狀態下排隊車輛消散問題抽象為一類離散事件切換系統的指數穩定性問題,將排隊溢出問題視為該類系統的有界性問題,建立了信號交叉口的離散時間切換系統模型,并采用Lyapunov函數方法分析了信號交叉口的穩定性和有界性,同時給出了排隊消散的控制策略。
(2)基于數據驅動的交通控制
數據驅動控制的定義是:“控制器設計不包含受控過程數學模型信息,僅利用受控系統的在線和離線I/O數據以及經過數據處理而得到的知識來設計控制器,并在一定的假設條件下,有收斂性、穩定性保障和魯棒性結論的控制理論與方法”。Hou等[13]最早提出數據驅動控制并將其應用于交叉口信號控制。郝建根等[14-15]將結構已知的數據驅動方法應用于過飽和單交叉口、交通干線、快速路出入口的控制,提出了面向不同對象的排隊長度均衡控制的方法;趙歡[16]設計了針對兩相位、三相位單信號交叉口綠燈時間的無模型自適應控制算法;齊馳等[17]引入近似動態規劃(ADP)方法,實時動態調整各相位綠燈時間,達到排隊長度均衡的控制目標,該算法具有自學習和自適應的特性,不依賴于系統模型;李永強等[18]考慮到排隊消散時間以及放行相序對優化結果的影響,非飽和情況下的數據驅動交通響應綠波協調信號控制。
(3)基于人工智能的交通控制
20世紀80年代,以神經網絡,模糊控制、專家系統等為代表的作為理論與技術創新應用的重要領域,城市道路交通長期得到國內外學者的關注,其中城市道路交通控制作為保障居民出行安全、出行效率和出行舒適度的主要措施更是成為該領域研究的重點。中國城市道路交通控制的研究與實踐在近百年的發展歷程可分為4個階段,分別稱為交通控制1.0(機械化)、交通控制2.0(電氣化)、交通控制3.0(信息化)和交通控制4.0(智能化),如圖1所示(主要列舉了4個發展階段,交通控制的對象、目標、方法、執行器、檢測和評估的演進情況)。

圖1 中國城市道路交通控制的發展階段Fig.1 The development stage of urban road traffic control in China
交通控制1.0被稱為機械化時代,以上海出現的第一個人工切換紅綠燈為代表,是中國城市道路交通控制的初始階段[19]。交通控制2.0和交通控制3.0則是經歷最長也是對改善城市交通貢獻最大的階段,以20世紀80年代SCOOT[20]和SCATS[21]系統進入中國為標志,推動了中國城市交通控制信息化的進程,同時也促進了國家相關部門和中國學者在交通信號控制系統的研究和研發領域的投入。2000年以后,尤其是近幾年中國城市居民交通出行需求的成倍增長,且呈現出具有中國地域特點的混合交通流特性。交通需求的多樣性、交通流復雜特性、城市發展不均衡性以及被控對象的不確定性等,對城市交通控制的理論、控制策略和控制手段都提出了新的要求,特別是在大數據、云計算、邊緣計算、人工智能、物聯網、車聯網等技術快速發展的今天,中國城市交通控制進入了以智能化為核心的交通控制4.0時代,其更強調在未來城市交通背景下信息、計算和控制的深度融合。
如圖2所示,回顧從交通控制1.0到交通控制3.0可以清晰地發現,不變的是技術的演進、檢測數據類型、被控對象、控制目標和執行單元,變化的是理論方法;而從交通控制3.0到交通控制4.0變化最為明顯的是被控對象、控制目標、理論方法和執行單元。其中,被控對象從交通流變為人、車與路的協同,控制目標由交通安全與交通效率增加為交通安全、效率與出行者舒適度,執行單元從信號控制器變為信號控制器、交通標志、智能車輛等,這些都表明城市道路交通控制關注的主體已經從交通流轉變為交通參與者,這不但契合了當前新技術的演進和越來越豐富的應用場景,這符合是中國一直倡導的“以人為本”的理念。

圖2 城市道路交通控制的變革示意圖Fig.2 The schematic diagram of urban road traffic control reform
在對與城市道路交通控制有關的中外研究進行概述的基礎上,對傳統交通控制存在的問題和未來研究中的重點和應著力解決的關鍵問題進行了展望。
傳統智能控制理論與方法逐漸成熟,得到交通控制領域學者的關注并逐漸推廣到交通控制建模與優化中,形成了以傳統智能控制為基礎的交通控制研究方向。這里主要回顧近年來以強化學習為代表的新型人工智能算法在交通控制中應用的研究交通控制問題已被證明是一種非常適合于強化學習方法的實驗方案[22]。強化學習可以通過在線學習不斷提高算法的性能,并隨時適應交通需求的變化,其在交通控制中具有較大的優勢,但在研究和實踐中還存在著許多挑戰。例如,缺乏訓練數據和制定化的交通控制策略。目前,利用強化學習實現交通控制的研究主要集中在單交叉口信號控制。其中,多數是基于單智能體來實現單交叉口控制,即單智能體強化學習(SARL),雖然這類方法應用在大規模路網控制時可能存在不足,但它并沒有阻礙大規模路網控制。它對獨立交叉口或小規模道路網絡控制的貢獻,已在許多已發表的文章中進行了描述[23-28]。盡管強化學習在單交叉口控制中具有很強的適用性,但考慮到城市交通流的波動性和非線性,許多進一步的研究指向了深度強化學習[29-30]。其特點是通過深度學習實現感知,利用強化學習完成決策,與城市交叉口的感知和控制相匹配。深度強化學習由Google提出并應用于Alpha-go算法時受到了極大關注[31]。目前,深度Q學習及其擴展算法在交通控制中得到了廣泛的應用。它們大多將城市交叉口描述為可觀測的馬爾可夫過程,然后利用對車輛位置、速度和加速度的識別,構造Q表,實現控制決策與優化[32-36]。
由于交通需求具有多維度、復雜性和時變性等特點,因此準確辨識交通需求是實施有效的交通控制策略的前提。目前,中外學者針對城市道路交叉口交通狀態辨識的研究主要面向過飽和狀態識別,并集中在以下兩類。
1.2.1 利用檢測數據與交通波理論估計排隊長度,進而判別交通狀態
Liu等[37]利用上下游部署線圈檢測器數據估計排隊長度進而識別交叉口的過飽和狀態,錢喆等[38]在其基礎上完善了判別方法;Ban等[39]通過移動檢測數據測量旅行時間估計出排隊長度并設計了交叉口過飽和狀態,而Li等[40]則是從移動檢測的軌跡數據設計辨識方法;Antoniou等[41]、Wang等[42]分別從多源動態數據入手分析交叉口過飽和狀態;Wu等[43]利用RFID數據估計排隊長度得到過飽和狀態,而唐少虎等[44]則以視頻數據得到交叉口狀態判別結果。
1.2.2 采用飽和度參數交通參數判別交通狀態
Gazis[45]最早給出交叉口過飽和定義并提出了基于飽和度判別的方法;Dion等[46]提出基于延誤時間比較的交叉口交通狀態判別方法;聶建強等[47]利用戰略檢測器與戰術檢測器的時間占率,提出一種相位交通狀態判別模型;陳兆盟等[48]將車頭時距的方差與時間占有率作為參數結合周期排隊車輛的消散提出一種結合信號優化的交通狀態判別方法;吳志勇等[49]從深度學習角度出發,提出一種離散化交通狀態判別方法。筆者團隊在前期工作中也提出過以飽和度為基礎的交叉口交通狀態精細化判別方法[50]和基于綜合投影的交叉口交通狀態判別方法[51]。
以交通工程和計算機技術為起源的城市道路交通仿真技術自20世紀50年代以來,已經取得了突飛猛進的發展。目前已經成為城市交通規劃設計、交通系統實驗分析、交通控制算法研發、交通流理論研究、車路協同、公交優先、自動駕駛等諸多領域的重要研究和驗證手段。中國在該領域的應用和研究稍晚,始于20世紀80年代,尤以城市交通信號控制仿真研究主要為引進和使用國外商業化交通仿真軟件[52-54]。
經過幾十年的發展,目前中國城市道路交通控制仿真方向的研究集中在兩個方向。
1.3.1 離線仿真
傳統的交通仿真并非專為交通控制研發,期初主要是用于交通規劃、交通工程、交通流理論等的研究。近年來,部分微觀仿真軟件通過升級的形式增加了對交通控制的支持,以采用PARAMICS[55]、VISSIM[56]、SUMO[57]等為基礎進行二次開發實現信號控制算法較多,如劉暢[58]利用COM接口技術,設計了VisVAP-VISSIM-MATLAB結合的感應控制仿真平臺,對單交叉口實現了對定時控制和感應控制的仿真;韋欽平[59]以單路口為研究對象,以VISSIM-Excel VBA-Matlab仿真平臺為基礎,通過VISSIM-Excel VBA接口和Excel VBA-Matlab接口構建了實時交通控制平臺;盧守峰等[60]提出了利用Excel VBA作為主控程序將VISSIM與Matlab進行集成構建交通控制仿真平臺的方法。
1.3.2 在線仿真
智能交通背景下,由于各種先進的信息技術的引入,使得實時的在線交通仿真成為可能。在線仿真的運行機制是在計算機內的仿真系統與實際的交通管理系統同步,運行過程中仿真系統不斷接受最新采集的交通檢測信息,調整計算機內部的仿真系統使其盡可能準確地反映當時的真實道路交通情況,然后在對未來一定時間內動態交通需求預測的基礎上,快速測試不同的交通管理方案,并給出性能最好的作為實施方案[61-62]。目前,在線仿真的研究多集中在硬件在環交通控制仿真方向。柳祖鵬等[63-64]以上海寶康GBS2000信號控制機與VISSIM交通仿真軟件結合實現了硬件在環仿真平臺研究;于泉等[65]提出研究交通控制硬件在環實時一體化仿真平臺的設計方案;余貴珍等[66]建立基于交通微觀仿真軟件的城市多路口交通信號控制仿真場景,并與外部的信號控制器建立硬件在環系統,實現仿真場景與交通信號控制器的實時信息交互,形成符合實際交通控制情景的仿真環境;Li等[67]基于NTCIP標準設計了硬件在環實時交通控制仿真平臺;周斌[68]利用TransModeler深度二次開發技術,搭建了車聯網交通控制實時仿真平臺,實現了基于車路協同的交通信號控制進行研究、開發、驗證的整個閉環流程。
傳統交通信號控制體系的形成與當時技術形態密不可分,包括電子計算機、控制器等的周期性運行,其目標為保障車輛通行安全[69],其所形成了以周期、綠信比、相位差的時間參數和相位、相序的空間參數為特征的交通控制理論。尤其是在歐美國家所制定的標準體系,如NEMA-TS2[70]等,已將其作為標準化定義在交通控制軟硬件邏輯設計中。雖然中國也制定了包括GB 25280—2016[71]等國家標準,但是目前行業內的遵從度并不高。交通信號控制理論自建立至今,基礎體系變化不大,主要創新集中在優化算法或控制方法上。然而,傳統交通信號控制理論體系未能匹配上人工智能在該領域的發展要求,其中最為關鍵的傳統交通控制理論中的相位相序的不變性成為最大的瓶頸。可以說人工智能算法或其應用領域的局限性與傳統交通信號控制的局限性的碰撞,在備受束縛的交通信號控制體系中,無法發揮其真正的能力。
傳統交通檢測數據(流量、占有率、排隊長度等)由于檢測粒度粗、統計特性強,只能在單一方面刻畫交叉口的交通需求,無法全面表征交叉口的交通需求特征,其主要因為目前的數據多為加工后數據(第二、三手數據),已經在本質上忽略了原始數據的豐富性和擴展性。交叉口交通需求的辨識應滿足兩個條件:①當前交通需求應包含控制策略做出最優決策所需的全部信息,其為做出最優決策的基礎;②沒有或僅存在少量冗余、非必須的信息,其主要影響智能算法的學習、訓練和計算的時間。
傳統交通仿真系統基于靜態、后驗證性的設計理念,無法應用于需要實時性演化驗證的在線交通信號控制中。傳統仿真軟件如PARAMICS、VISSIM等仿真不夠真實,主要原因是參數標定、模型標定帶來的誤差過大且無法根本消除。由于仿真軟件產生的歷史時期和當時技術條件的限制,無法獲得實時、高質量的檢測數據,因此需要研究和設計跟馳模型、交通流模型等,模型的假設和約束進一步削弱了仿真的真實性,但其確實促進了城市交通領域研究的進步,成為交通理論研究中重要的驗證工具。未來需要利用實時檢測數據和歷史檢測數據自動標定參數,設計無模型的仿真驅動內核,才可能從根本上解決目前交通仿真的困境。同時,構建與真實交通相仿的體系[72],研發基于平行系統理念[73-74]的在線交通仿真用于仿真系統與實際的交通管理系統同步,通過仿真推演實現交通控制的預測性優化和實時在線評價。
傳統交通信號控制器的研發和設計基于傳統的交通信號控制理論,目標定位于執行器,其并未考慮人工智能等先進算法應用時所需的計算能力、存儲能力和網絡能力等,因此限制了其在交通控制領域的實際應用。同時,面向未來的城市交通中物聯網、人聯網、車聯網等場景在算力、仿真、存儲、網絡、優化等方面的需求,交通信號控制器將以全新的形態成為邊緣計算、數據匯聚、網絡結合的城市關鍵節點。
智能控制一個典型的特點是至少是人工智能與控制論的交集[75-77]。由此可見,如SCOOT、SCATS等國外較為先進的交通控制系統也不能歸為智能交通控制系統,主要是因為傳統交通控制系統設計中缺乏對人工智能引入和支撐。目前,以互聯網企業為首推動的各類交通大腦也不宜歸為智能交通控制系統,原因是其缺乏對控制論理解和應用。智能交通控制系統對信息、計算和控制提出的要求正好契合了信息物理系統(CPS)[78-98]的特點,研究以CPS為總體架構,以車路協同、人工智能、云邊協同為技術支撐的智能交通控制系統將能夠適應更多的未來交通場景下交通需求的變化。
城市道路交通信號控制是保障居民交通安全、通行效率和出行舒適度的重要措施,即便在車路協同和自動駕駛技術普及的未來也將如此。從中國交通控制發展歷程入手,圍繞城市道路交通回顧了交通信號控制、交通需求辨識和交通控制仿真的國內外研究情況,同時針對傳統交通控制存在的問題和未來車路協同、人工智能等技術的演進對該領域理論與技術的發展進行了探討,以期對交通控制的研究提供新思路。