淺析無人駕駛中的決策技術

2020-10-27 09:36:29印徐偉屹

中國科技縱橫 2020年10期

印徐偉屹

摘要：無人駕駛技術對于發展新興技術、改善交通狀況、建設智能城市等有著深遠的意義。在技術上無人駕駛可以分為感知、決策、執行三大模塊。本文重點介紹無人駕駛中的決策技術，包括兩種典型技術路線的基本原理、典型應用和優缺點分析，并在最后對無人駕駛決策技術的發展提出建議。

關鍵詞：無人駕駛;決策系統;自動狀態機;深度學習

中圖分類號：TP391.41 文獻標識碼：A 文章編號：1671-2064（2020）10-0092-02

0引言

隨著科技的發展和社會的進步，汽車已經成為了人們日常生活的必需品。我國作為汽車消費大國，對于無人駕駛汽車的需求也是十分明顯的：首先，無人駕駛汽車應用能夠降低交通事故發生的概率，保證了人們的安全;其次，無人駕駛汽車對于殘疾人來說，也能夠大大降低出行的難度，在一定程度上能夠進一步刺激汽車市場，推動汽車行業向未來大步前進;再次，無人駕駛汽車往往與新能源、清潔能源等概念緊密聯系，發展無人駕駛汽車也能夠為我國的環境保護和能源保護作出貢獻;最后，無人駕駛汽車的發展與通信技術的發展是密不可分的，發展無人駕駛汽車在客觀上也能夠不斷推動通信技術的發展。

無人駕駛技術是一項多個學科高度融合、高度交叉的新興技術，其發展需要多種技術的共同支持，因此當我們在做相關研究時，應當采用模塊化的思想進行學習和探究，適當地對無人駕駛技術進行解構和分類。

1無人駕駛技術分析

無人駕駛目前尚處于高速發展的階段，因此不同研究團體的實現方式、技術構成各有不同，但總體上看，可以將無人駕駛的技術實現分為三個部分：感知、決策和控制[1]。

1.1感知模塊

感知模塊指的是無人駕駛汽車需要對周圍的環境進行信息采集并匯總給決策模塊。就像人類需要對周圍的事物進行識別和判斷一樣，無人駕駛汽車也需要對自己所處的位置和周圍的事物進行識別和判斷。因此，無人駕駛的感知模塊可以總結為兩個任務：識別與定位[2]。識別任務指的是無人駕駛汽車需要對周圍的障礙物（除去汽車以外的所有物體）進行識別，定位任務指的是無人駕駛汽車需要確定自身相對于周邊環境的位置[3]。隨后，感知系統將獲取的信息輸入到決策模塊中。

1.2執行模塊

執行模塊指的是在決策模塊給出決策信息后，根據決策信息對無人駕駛汽車的各個部件實施物理控制，包括剎車、加速、轉向等。隨著自動控制技術的發展，無人駕駛的執行模塊已經非常成熟。因此，無人駕駛汽車技術的關鍵在于如何根據已有信息作出合理、快速、安全的決策。

1.3決策模塊

決策模塊的任務是根據無人駕駛汽車感知模塊獲得的信息進行指令的下達。在實際的運行過程中，一方面無人駕駛汽車需要主動地作出任務規劃和動作指令，另一方面也要時刻對突發情況保持關注和給出反饋。同時我們還要考慮到指令本身是有層次的，既有路徑規劃這樣的宏觀任務，也有緊急制動這樣的具體任務。因此，如何用數學語言去系統性地描述一個有著多輸入、多輸出的決策系統就成為了當前制約無人駕駛系統的重大技術難關。

總的來看，目前決策系統的主要發展方向有兩個：（1）以自動狀態機為首的基于規則的決策系統;（2）以深度學習為首的基于學習的決策系統[4]，下文中將進行重點介紹。

2無人駕駛中的決策技術分析

2.1基于規則的決策技術

在實際的運行中，無人駕駛汽車經常需要作出運動狀態的改變，而狀態改變的依據是對周圍環境的綜合判斷。為了讓無人駕駛汽車的運行在我們的掌控之中，開發人員需要提前對無人駕駛汽車的運動狀態進行預設（例如加速、減速、轉彎、緊急制動等）并在狀態的切換之間設置判斷條件。因此有限狀態機被廣泛應用于無人駕駛決策系統。

2.1.1有限狀態機

有限狀態機（Finite-state machine，FSM），又稱有限狀態自動機，簡稱狀態機，是表示有限個狀態以及在這些狀態之間的轉移和動作等行為的數學模型。在數學上有限狀態機是一個離散系統，描述了一個對象在其生命周期內的可能行為/狀態序列，有限狀態機有四個基本要素：現態、次態、條件與動作。在沒有任何的輸入或輸入不滿足條件時，狀態機保持現態并執行現態的動作;當外部輸入滿足一定的條件時，狀態機跳到下一個狀態（即次態）并執行次態的動作。這種數學模型的邏輯清晰、實用性強，例如汽車在路口時，我們可以將輸入設置為紅綠燈，當輸入為紅時汽車保持不動，當輸入為綠時汽車進入行駛狀態。

2.1.2有限狀態機分類

從結構上可以將有限狀態機分為串聯式、并聯式和混連式三種體系架構[5]。

串聯式結構是最為簡單的結構。不同的狀態之間像電路一樣單線鏈接，依次執行，一般不構成環路，比較典型的應用是麻省理工大學的“塔羅斯”無人駕駛汽車。串聯式結構簡單，因此解決復雜問題時有天然的劣勢。

并聯式結構類似于電路的并聯結構，各個子狀態的輸入和輸出呈現的是多節點的鏈接結構，即根據輸入的信息可以同時進入不同的子狀態。這種結構對于復雜問題的處理有著比較強的能力，但缺點在于當面對過于復雜的任務時，如果子狀態過多就會導致算法機構龐大，并且可能會導致邏輯沖突。比較典型的代表是國防科學技術大學研發的紅旗CA7460、梅賽德斯奔馳公司研發的Bertha無人車。

為了優化自動狀態機，人們提出了混聯式的結構，即子狀態中既有串聯連接，又存在并聯連接，這種結構雖然在設計的時候難度更大，但在實際執行時能夠結合串聯式與并聯式的優點，因此在大型決策任務中被廣泛采用。例如卡耐基梅隆大學與福特公司研發的BOSS無人車、弗吉尼亞理工大學研發的Odin無人車、中國科學技術大學研發的智能駕駛Ⅱ號等。

2.2基于學習的決策技術

2.2.1深度學習與神經網絡

近些年來，隨著機器學習理論和計算機硬件技術的發展，基于大數據的深度學習方法在計算機視覺、人工智能、自然語言處理等多個領域大放異彩，其中又以神經網絡表現最為突出，其基本思想是通過分析大量的樣本來學習人的行為。而在無人駕駛領域，許多研究人員也在試圖使用神經網絡來賦予汽車學習的能力。

神經網絡的出色之處在于能夠通過大量的計算來擬合“輸入”與“輸出”之間的映射關系，模擬了人腦對畫面信息的加工處理，即便這種映射是存在誤差的，但在工業上是能夠滿足要求的，自然也可以應用于決策系統。在圖像識別任務中，研究人員構建的是從圖像到目標類的映射，而在決策任務中，研究人員構建的是輸入信息到車輛操作的映射。顯然，這種從輸入端（實時圖像）到輸出端（實時決策）的映射本質上是通過高明的算法讓計算機去完成復雜的、計算量巨大的函數擬合任務，也能夠大大降低決策系統的工程實現難度。

2.2.2典型應用

NVIDIA公司研發的無人車輛駕駛系統就是典型的卷積神經網絡的應用，其輸入為每秒30幀的圖像，輸出則是轉向盤轉角，在訓練階段，NVIDIA要求駕駛者駕駛車輛并記錄在駕駛過程中攝像頭拍到的數據和駕駛者對轉向盤的操作（轉角），以此來構造訓練集，隨后將該訓練集交給一個9層的卷積網絡進行訓練、調整超參數。

百度一直將無人駕駛作為自己的重要研究項目，為了實現車輛的橫向（左右）與縱向（前后）控制，他們使用了LSTM網絡和卷積神經網絡進行實時控制判斷。橫向控制任務的處理思路與NVIDIA類似，使用了單幅圖像作為輸入，曲率作為卷積神經網絡的輸出;在縱向控制任務中，百度將該問題處理為時空序列預測問題，輸入數據為最近的5幀圖像，輸出為縱向的控制信號（油門、剎車）。

Mobileye在無人駕駛中引入了增強學習，更加強調了人工智能系統與外界的交互、學習和進化。增強學習的基本思路是對整個系統的行為給出及時更新的評價，對有利于任務的完成和目標實現的行為給出高評價，對不利于任務完成、違反規定、造成負面影響的行為給出低評價，這樣就在數學上實現了對決策系統的反饋，或者說就讓計算機有了“摸著石頭過河”的依據。有了科學的評價，計算機就可以通過大量計算和模擬來實現對整個決策系統的優化[6]。

3針對無人駕駛決策系統的發展建議

不難總結，基于狀態機的方法是符合人類邏輯的、規則的方法，解釋性強，適合進行決策行為的描述;基于學習的方法更加依賴于大數據和計算機強大的計算能力，在“端對端”問題上表現非常出色，適合進行具體動作的指令[7]。綜上，對于無人駕駛的決策系統筆者提出如下建議：

（1）決策系統由上至下分為“任務”“行為”“動作”三個層次，在任務層次決策系統需要確定無人駕駛汽車的路徑規劃等抽象任務;行為層次負責無人駕駛系統的宏觀行為，例如跟車、右轉、停泊等;動作層次負責無人駕駛汽車的具體行為。

（2）基于規則的算法將更多地應用于構建決策系統的上層架構，充分發揮以狀態機為首的規則算法的模塊化處理與邏輯性強的優勢，避免狀態機進行過于細化的、具體的決策。

（3）端到端的學習方法在具體行為決策上有著天然的優勢，因此更有利于在動作層次中發揮優勢，充分發揮場景便利的優勢，能夠將各種情況納入考慮范圍內。更為重要的是底層行為層次相比于較高的層次而言，擁有更多的數據量以供學習。

（4）跳出無人駕駛汽車這個概念本身，5G時代是萬物互聯的時代，因此在將來無人駕駛汽車不再是一個單獨的個體，而是納入整個交通信息網的一個組成單元。也就是說決策系統除去任務層次，可能還會有更高的城市系統的層次。

4結語

無人駕駛是信息時代多種高精尖技術綜合作用下的產物，與人工智能技術、信息技術、機電一體化技術、通信技術等聯系密切，深度耦合，而決策系統則是無人駕駛三大模塊中最為復雜和迷人的系統，吸引著無數科學家、工程師。筆者相信隨著5G時代的到來，無人駕駛汽車必然能夠迎來重大的技術突破，搭載有效可靠的決策系統，實現真正的智能交通。

參考文獻

[1] 周丁濤.淺析無人駕駛中的感知技術[J].科技傳播，2018，10（23）：157-159.

[2] 馬飛躍，王曉年.無人駕駛汽車環境感知與導航定位技術應用綜述[J].汽車電器，2015（2）：1-5.

[3] 王俊.無人駕駛車輛環境感知系統關鍵技術研究[D].北京：中國科學技術大學，2016.

[4] 熊璐，康宇宸，張培志，等.無人駕駛車輛行為決策系統研究[J].汽車技術，2018（8）：1-9.

[5] 王奕康.無人駕駛汽車技術及其發展探究[J].中國新通信，2018，20（6）：176-177.

[6] 肖已達.面向城區綜合環境的無人駕駛車輛平臺及關鍵技術研究[D].上海：上海交通大學，2013.

[7] 王欽普，趙佳，趙浩.無人駕駛汽車發展面臨的挑戰與建議[J].客車技術與研究，2016（6）：2-6.