梁家泰
山東科技大學,山東 泰安 271019
自20世紀90年代開始,有關無人駕駛車輛在高速公路或者野外條件下行駛的決策方法研究,主要包含符合交通規則要求的多準則決策方法、利用多源信息進行規劃的神經網絡決策模型、通過計算機仿真建模的駕駛員決策方法,以及進行最優化節點選擇的貝葉斯決策方法[1]。但是由于城區環境比較復雜,人類駕駛員在駕駛時要做出行駛、變道、跟車、超車等基本行為,同時還要受到交通信號燈、行人及非機動車等影響。無人駕駛車輛需要從外界獲取的各項信息自然也非常多,如何利用上述行為決策方法提取有用信息來輔助其決策,依然是目前研究的熱點。
無人駕駛車輛是一種機器人,其運行依靠一套設定的固定程序。無人駕駛車輛的運行指的就是其運動路徑的規劃。目前關于機器人運動規劃的研究集中在:將不同空間位置估值并帶入設定的函數中使得系統的性能可以獲得最優解辦法;基于預測控制理論,利用系統中接收器實時感知數據進行實時的規劃優化,最終生成無人駕駛車輛的行駛路徑;模仿自然界自然選擇過程及其進化趨勢進行路徑規劃算法。雖然上述3種算法均在無人駕駛車輛的決策中起到了一定的作用,但是這3種方法存在著求解過程不穩定、運算時間長、表達不盡準確、計算效率低下等問題,不能夠很好地滿足在實際環境中的無人駕駛車輛運行要求。
隨著我國城鎮化速度加快,城區中居民人數在逐年增長,而且居民人均車輛保有量也在逐漸增加,很多城市頗受巨大的交通壓力困擾,所以實行了限牌限號的車輛分流措施來緩解城市通行壓力。同時,在城市交通中車流復雜,混有不同的交通工具,其中私家車占比較高,部分地區的電動車和自行車的使用率也很高,增加了無人車行駛難度[2]。此外,現實通行環境的交通標示不明顯,無人駕駛車輛從外界接受的信息中很大一部分就來自這些交通標示,因此現實的情況會使得無人駕駛車輛的決策系統不能夠精確地運行,會威脅到其行車安全。
在城市道路中,駕駛員首先要有非常明確的行駛路線規劃,且駕駛員需要對行駛路線非常熟悉,能夠牢記一路上的所有障礙物并及時做出冷靜而正確的判斷。此外,在行駛過程中,駕駛員還要嚴格根據道路交通法規和交通信號指示規范行車,與其他車輛要保持安全的跟車距離并實時調整自身的行車速度和行駛道路。無人駕駛車輛需具備較高的行車技能。
無人駕駛車輛在道路上行駛時,應具有一定的基本性能,主要包括能夠根據用戶需求進行合理規劃行車路線的自主能力、能夠實時根據外部環境進行決策改變的能力、擁有遵守交通法規和交通信號燈安全行駛的能力。此外在設計系統中還應添加無人駕駛車輛的最大和最小行駛速度的設置,根據行程經過的路段特點設置不同的最大、最小速度,確保其不會造成交通堵塞等[3]。
有限狀態機方法就是將整個的行駛決策過程分解為多個有限狀態,整個系統信息的輸入、輸出都是單獨進行的,然后通過狀態的轉移進行信息傳遞。因此其要素是狀態、事件、轉移、動作,其中最主要的就是狀態的分解,主要有根據子狀態進行的單向串聯結構、根據子狀態的輸入和輸出不同節點進行并聯處理的結構以及最重要的混聯結構。混聯結構是將單向串聯結構和并聯處理的結構混合使用,是在實際應用中使用最多的結構。
隨著近年來信息技術和人工智能的大力發展推廣,模擬人類駕駛員行為的學習算法也逐漸被運用到無人駕駛車輛的行為決策中。具有代表性的就是深度學習方法,無人車上的相機將其捕獲的圖像傳遞給神經網絡進行分析決策后,系統發出相應的決策指令,指揮車輛進行加速、轉彎、停車、避讓危險等動作。實驗證明目前的神經網絡技術已經能夠讓無人駕駛車輛完整地學習駕駛任務,而不用再拆分出細微的操作指令而影響其決策效率[4]。
對于無人駕駛車輛行為決策系統研究水平的衡量標準主要包括車輛的實用性、具體功能的多樣性、復雜場景適應程度以及相關決策處理的正確性等。首先,車輛的實用性是最基礎的衡量標準,這是由理論設計到實際行車效果的最直接體現,主要是根據有限狀態機法中基于學習算法的決策算法來實現的,其中最典型的就是特斯拉公司進行的自動駕駛測試,其在車道偏離警告及自動轉向、變化車道等功能上體現了良好的使用價值。其次,在功能的多樣性和復雜程度上,目前無人駕駛車輛不僅可以處理簡單的降速、減速、跟車、停車等基礎行為,還能夠通過自身系統來執行路口讓行、自動停車、泊車等由多個連續性基礎操作組合的指令。同時在對復雜場景的適應性上,目前的無人駕駛車輛基于有限狀態機決策機制可以還原諸多場景的優點,可以模擬城市真實行車環境,并且可以對同一車輛在不同的道路環境、天氣狀況、人流分布特點的情形下完成正確的行車過程,做出正確的反應,能夠滿足雨、雪、霧、夜晚、山區等各種特殊情況下的駕駛任務[5]。此外在決策處理上由于采用的學習算法和規則算法已經非常成熟,其能夠通過其不斷地學習,掌握精確地處理問題的能力。需要指出的是,對于目前的學習算法而言,其仍然需要基于更多的實驗數據進行完善。
從目前的實際運用來看,基于學習算法和規則算法的行為決策系統各有優勢,基于學習算法的行為決策系統的優點在于能夠根據不同的場景特征和決策依據進行系統的自我決策優化,通過對數據的處理就能夠完善其模型。而基于規則算法的行為決策系統的優勢在于其能夠提供理論清晰、邏輯嚴密、穩定性強的建模系統,因此其注重的是對于規則的掌握運用,對于處理器的性能要求不是很高,能夠拓寬其場景應用范圍。但是值得注意的是這兩種算法依然存在一些缺陷。首先有限狀態機的狀態劃分需要有明確的界限,而在行車過程中經常遇到需要駕駛員做出判斷的兩可情形,這種現象的出現會對無人駕駛系統的穩定性和連貫性產生負面影響。其次學習算法需要大量的訓練結果和樣本數量,因此學習模型的復雜程度、樣本數量、質量,對場景信息提煉的精準度都會影響學習算法的精準性和穩定性。
從目前的發展趨勢來看,將來無人駕駛車輛行為決策系統的發展仍然圍繞基于規則和基于學習算法兩大方向,但二者不盡相同。對于規則算法而言,其將被運用到場景的整體建模上來,將復雜的場景進行分模塊化的處理,掌握大的建模方向[6],具體而言就是主要解決諸如遇到“灰色地帶”問題時基于規則算法給出更為合理的處理方式。對于學習算法而言,其將被主要運用于簡單的、基礎的指令上來,將分區的模塊化的部分進行細化,組成無人駕駛車輛實際運行中承載各項系統的“螺絲釘”。此外,目前的研究主要關注車輛行駛安全和運行效率的問題,在今后的發展過程中,還應該逐漸關注不同類型車輛的設計特性以及乘車人的使用舒適性問題。
目前無人駕駛車輛在城市環境中行駛的決策研究依然存在著很多實際問題,通過基于有限狀態機及基于學習算法的行為決策能夠很好地幫助無人駕駛車輛進行決策,使其在城市道路中達到較為穩定安全的行駛狀態。將來的研究應該聚焦規則算法和學習算法及乘員的舒適性等問題。