李文禮,李 超,李中峰,易 帆,李 安
(1.重慶理工大學 汽車零部件先進制造技術教育部重點實驗室,重慶 400054;2.重慶長安汽車股份有限公司,重慶 400020)
自動駕駛汽車仿真測試需對場景進行精準的形式化描述[1],學者們對測試場景和評價方法進行了大量研究。
在測試場景生成方面,主要包括組合方法、隨機采樣法、聚類、優化搜索、重要性采樣及深度強化學習等。王榮等[2]基于標準法規,通過挑選與組合基本場景要素,生成多維度測試內容,并組合測試環境得到測試場景,但不依據數據直接對場景進行組合,生成的測試場景與實際出入較大;劉康[3]基于PICT 對換道參數進行組合,得到換道邏輯場景參數,但該方法可能得到大量不合理、同質化場景;M.SHAHIN等[4]通過聚類算法將十字路口交通事故數據聚類,得到非嚴重與嚴重事故兩類測試場景;C.E.TUNCALI等[5]定義TTC與相對速度之和這一目標函數,優化搜索模型得到目標函數值,但僅用TTC等指標不能完全反映真實場景的高維復雜特性;周文帥等[6]在蒙特卡洛隨機采樣的基礎上,通過描述模型中的參數分布進行重要性采樣,在隨機采樣的基礎上有效提高了高風險場景的覆蓋度,但采樣過程往往無法創造新場景;李江坤等[7]提出了基于場景動力學和深度強化學習的邊緣場景生成方法,在場景的覆蓋度、可重復測試等方面具有良好性能,但易生成同質化場景,無法提高場景多樣性。
在評價方面,目前主流的評價集結模型包括模糊綜合評價、灰色關聯法、逼近理想解排序法(TOPSIS)、加權算術評價法、耦合聚類法及反向傳播神經網絡法等。王成壯[8]通過層次分析法(AHP)與專家打分的模糊綜合分析相結合,對控制算法進行了安全性評價,但主觀性較強;魏子茹等[9]利用CRITIC權重法與灰色關聯度模型相結合評價場景;戴劍勇等[10]利用PPR計算網絡中心指標權重,結合TOPSIS方法對高速公路交通事故風險因素重要度進行了排序;ZHAO Yanan等[11]將屬性指標設定為車輛完成任務的成本函數,將熵權法與加權平均算法相結合,對車輛的任務完成度進行評價;朱冰等[12]通過耦合聚類得到場景危險率參數來評價自動駕駛的安全性,但缺乏通用性;陳君毅等[13]利用客觀指標作為輸入,主觀評價結果作為輸出建立了BP神經網絡評價模型,但模型非公式化結果,不同對象評價結果的差異緣由無法得知,且主觀性較強。
綜上,筆者以研究自動駕駛汽車在匝道匯入過程中的安全性為目標,通過采集匝道車輛匯入行駛數據,在固定功能場景的前提下篩選出匝道匯入交互邏輯動態場景要素,利用聚類得到兩類典型測試場景用于自動駕駛汽車仿真中行駛參數設置,以模擬真實道路行駛狀態;同時,提出了一種客觀評價模型,將灰色關聯度模型與核密度估計模型相融合,通過擬合估計匯入車輛真實指標數據,確定匝道匯入安全性指標最優閾值。該閾值在灰色關聯評價模型中取代傳統的專家意見,能更準確地評價仿真車輛的匝道匯入安全性;最后利用模糊綜合分析主觀評價模型驗證此模型的準確性及有效性。
數據采集設備為“DJI Mini 2”無人機,工作頻率為5.725~5.850 GHz,錄像分辨率為4k/24 fps,單次飛行時間為30 min,視頻格式為MP4。采集地點為重慶華陶立交匝道,拍攝區域覆蓋合流區,如圖1。

圖1 無人機采集示意Fig.1 UAV acquisition diagram
采集時間避開高峰段,分布在10:00—17:00,共采集7次,將采集的視頻通過軟件進行自動標注,標注范圍為橫坐標位于25~325 m,交互區域為100~260 m。整理得到507條有效匯入軌跡數據,累計2.592×105幀。原始數據存在較大波動,為便于研究對原始數據進行3-σ原則異常值剔除和Savitzky-Golay濾波。由此得到平滑后的數據,具體包括:追蹤編號ID、時間t、位置坐標(x,y)、前車編號ID、車道ID等如表1。

表1 部分駕駛數據Table 1 Partial driving data
在測試場景生成中,為保證環境信息與道路信息的不變,同時引入自車及前車的速度、自車交互區域(交互區域)、匯入車道及駛離車道等邏輯場景要素進行場景聚類。參照SHRP2[14]篩選危險工況的方法,從采集數據中得到匯入工況片段289例。
針對得到的289例有效匝道匯入工況,因類例數較少,選擇系統聚類生成測試場景。筆者的聚類要素中的環境信息與道路信息已固定,只聚類自車信息、周車信息、交通信息等。因碰撞時間(time-to-collision,tTTC)等指標為評價指標,為不影響最優閾值提取,統計時不考慮在內。最終得到12類匯入(場景)要素,用編碼1~5代替各要素變量,如表2。

表2 各要素變量數量表Table 2 Quantity table of each factor variable
步驟1用絕對值距離計算多名義尺度、二值名義尺度的變量間距,并對連續變量(速度、距離)做歸一化處理,保證多名義尺度、二值名義尺度及連續變量的變量間距都為1。
步驟2計算樣本間距離選擇閔可夫斯基距離,如式(1):
(1)
式中:xij為樣本i的j個數據;xi′j為將xij標準化處理以后的標準值;p為樣本數量;q為參量,q=1時,dii′(q)為絕對值距離,m。
步驟3計算類之間的距離通常使用類平均法,如式(2):
(2)

聚類時應當排除某一要素中單個變量占95%以上的場景要素[15],如車輛類型中轎車占98%則直接作為聚類結果,聚類過程形成的樹狀圖見圖2,圖中縱軸表樣本間的距離(無綱量),橫軸表示樣本編號。

圖2 各案例聚類Fig.2 Cluster diagram of each case
不一致系數可以用來確定分類個數,計算發現最后一次不一致系數增幅最大,故選擇聚類個數為2類。將聚類結果中的名義變量在每類中的占比與此類變量在總體變量中所占比例比較,比例較高的作為聚類結果,連續變量取當前類所有值的平均值,最終得到典型的匝道匯入場景,如表3。將其結果用于后文自動駕駛車輛測試場景的搭建和車輛測試參數的設定。
確定測試場景及車輛測試參數后,需建立自動駕駛汽車安全性評價體系,對其匝道匯入過程的安全性進行評價。其原理為通過評價目標或對象的性能參數和實際表現等,建立一維或多維指標體系,通過多種賦權方法對指標體系賦權,并利用定性或者定量評價模型劃分等級或得出精確數值,來反映評價目標或對象的性能優劣。

表3 聚類分析典型匝道匯入場景Table 3 Cluster analysis of typical ramp merging scenarios
基于此,筆者利用重要性分析得到匯入過程與駕駛安全相關性高的指標體系,通過AHP和CRITIC主客觀結合賦權法對指標體系進行賦權,結合核密度估計模型與灰色關聯理論模型,得到基于駕駛數據驅動的客觀評價模型。
評價指標體系指通過車輛的行駛參數得到不同指標并用來評價車輛不同性能。在篩選過程中,盡可能選擇信息量大、與測試場景關聯性高的指標,這樣可以更準確有效地反映車輛在測試場景中性能,具體表現為車輛決策后發生改變的量化數據,如碰撞時間(tTTC)、后侵入時間(tPET)及車頭時距(tTHW)等。同時匝道匯入過程中,過高或過低的通過性都容易引起碰撞事故,故筆者以匯入安全性為目標,以安全性指標和通過性指標為主,將自動駕駛汽車匝道匯入安全性評價作為目標層,將行駛安全性、通過高效性作為總指標層,并通過重要性分析得到指標層的具體指標,如圖3。

圖3 評價指標體系Fig.3 Evaluation index system
利用客觀CRITIC法確定對應指標權重,用層次分析法(AHP)確定總指標層權重。使用這樣的賦權方法一方面能避免賦權的主觀性,另一方面又能考慮會對指標權重產生影響的數據波動性與數據間相關關系,使所求指標權重更加準確客觀。
灰色系統指人們通過信息不能充分認知的的系統,自動駕駛車輛的評價指標繁雜,無法面面俱到,與灰色系統十分類似,故灰色關聯理論被廣泛應用在車輛的評價之中。其結果由事物間的關聯程度或影響程度——灰色關聯度來決定,當輸入序列曲線與參考序列曲線相似程度越近時,其灰色關聯度也就越大,反之則越小,具體計算步驟如下:
步驟1確定參考序列R0,即指標最優閾值,由核密度估計模型給出。
步驟2確定評價指標的比較序列矩陣,假設同一輛車在同一場景下進行了m次實驗,共有n個評價指標,比較序列矩陣為(Rij)m×n。Rij表示在i次實驗時輸出的指標數據j。
步驟3當存在R1j與R2j分別在最優值兩端時,存在正向指標R2j>R1j時其關聯系數反而小的情況,故因將比較序列正向化,保證所有值在最優值的一側,負向指標亦如此,如式(3)、式(4):
(3)
(4)

步驟4使用均值法對各指標值進行無量綱處理,如式(5)、式(6):
(5)
(6)

步驟5計算關聯系數ξi(j),如式(7):
ξi(j)=[miniminj|X0(j)-Xi(j)|+ρ·maximaxj|X0(j)-Xi(j)|]/[|X0(j)-Xi(j)|+ρ·maximaxj|X0(j)-Xi(j)|]
(7)
式中:ρ為分辨系數,一般取0.5。
步驟6計算總指標得分,根據筆者構建的評價體系為多層評價體系,將關聯度與指標層權重wj和總指標層進行累計加權平均,得到目標層得分S,如式(8):
(8)
灰色關聯評價模型結果的準確性與最優閾值(參考序列)高度相關,但由于最優閾值往往由專家給出,與具體場景值的契合度較小且主觀性較強。核密度估計模型為非參數估計模型,不需要有關數據的先驗基礎知識,它以數據特征為依據,能有效描述復雜指標的數據分布情況。筆者引入非參數估計模型中的核密度估計模型(KDE),對采集數據中的指標數據進行擬合估計,得到最優閾值以提高灰色關聯度模型的客觀性。帶寬是KDE模型的核心,其值決定了核密度估計模型的擬合質量,通過Silverman經驗法和最小化AMISE法則得到平均積分平方誤差最小化的最優帶寬,其中核函數為高斯核函數,如式(9):
(9)

以聚類結果的目標車工況數據作為核密度估計模型的輸入,利用最優寬帶的核密度估計模型對各評價指標在不同場景下時序值進行密度擬合,其核密度估計如圖4(a)~圖4(f)。核密度最大處表示數據熱點,并作為指標的最優閾值[16]。如出現偏峰,取左右側各85%分位值所在區間的平均值為最優閾值,得到的各指標最優閾值結果見表4。

圖4 不同場景下各指標核密度估計Fig.4 Kernel density estimation of each indicator in different scenarios

表4 核密度估計結果Table 4 Kernel density estimation results
考慮實車測試的成本高、實驗重復性差,筆者選用PreScan和MATLAB的聯合仿真搭建兩類典型匝道合流場景。為了達到接近真實測試目的,根據聚類結果選取轎車模型,并加載車輛動力學模型、駕駛員模型及雷達傳感器模型,保證車輛模型可靠性。利用TIFF格式地圖用RoadRunner進行1∶1精確地圖復現,設置路面附著系數為0.7,天氣晴朗,可視度高,無其它因素干擾等,保證實際道路信息與仿真場景信息的一致性。根據聚類結果設置車輛相關行駛參數,保證交互中干擾車運動狀態的統一性。最后對仿真被測車輛加入兩種不同的自動駕駛控制算法來驗證評價模型的有效性。
按聚類結果設置仿真車輛參數,直行車輛速度包含初始車速、交互車速及最終車速,起始位置由前車間距得到,保持第3車道行駛。交互車速位于交互區域,交互區域由每類車輛匯入橫坐標平均值得到,場景1為x=135.73 m,場景2為x=207.12 m。場景2的后車間距為35.13 m,相關車速均由后車車速平均值得到,保證仿真中的所有主路車行駛狀態符合實際駕駛規律。匯入車輛僅按照聚類結果設置初始車速、匯入車道。車輛行駛區間起始位置為x=25 m,結束位置為x=325 m,與采集數據一致。
觀察自動駕駛算法在匯入過程的交互行為,仿真片段如圖5。

圖5 聚類仿真片段Fig.5 Clustering simulation fragment
場景1仿真片段中,目標車從第4車道駛入匝道,主車道前方有車后方無車,算法在導流線一結束便開始匯入動作,但由于匯入車的減速運動導致后續速度下降較快,場景2仿真片段中目標車從第5車道駛入匝道,主車道前后方均有車,算法在第4、5車道即將消失的末端才開始匯入動作,兩車在測試過程中都未發生碰撞,且能在較短時間內通過雷達識別到前方車輛,并通過算法進行判斷是否制動。
通過仿真輸出的測試數據計算得到各指標的值,其中計算方法與駕駛數據一致,如表5。

表5 場景仿真結果Table 5 Scenario simulation results
觀察仿真測試結果,在測試場景方面,車輛一和車輛二的行駛路徑與聚類結果中車輛的關鍵途徑點一致。場景1中,匯入車輛左側前方有車后方無車,匯入時間較小,但由于直行車的減速運動,匯入安全性較低,通行效率更高。場景2中,匯入車輛左側前方有車后方有車,造成匯入時間較大,通過高效性較差。在安全匯入不考慮后車追尾情況下,由于場景2匯入過程存在判斷延遲,其整體安全性反而更高。
在不同車輛方面,車輛一的tTTC、tPET及tTHW均小于采集數據,安全性較差,說明在車速較高距離較近時未進行大幅度制動措施。車輛二的tTTC在兩個場景中皆為4 s以上,tTTC也皆大于車輛一,正向碰撞安全性較車輛一更好,tPET與采集數據接近,側向碰撞安全性表現優秀。但通過高效性方面車輛一的效率好于車輛二,同時也反映出車輛一整體偏向激進型,車輛二偏向保守性,整體來說,兩車都符合安全性與高效性要求,且符合采集數據的分布特點。
以仿真輸出的值為被測對象,參照文獻[9]中層次分析法及CRITIC法的計算得到總指標層和各指標的權重,如表6。

表6 車輛指標的權重Table 6 Weight of vehicle indicators
利用基于核密度估計的灰色關聯理論評價模型,以相同場景不同車輛為關聯矩陣,并對正負向指標按式(3)~式(8)計算得到各指標分值及車輛綜合得分,如表7。

表7 車輛綜合得分及總指標得分Table 7 Vehicle comprehensive score and total index score
為驗證評價模型的有效性,利用模糊綜合分析評價模型對比驗證,通過邀請有駕駛經驗的駕駛員共50人,觀察仿真車輛數據并按照評價標準對兩個場景車輛表現進行打分,統計出各分數等級的人數,考慮成本,僅對車輛一場景1進行評分,如表8。

表8 場景1中車輛一專家評分統計Table 8 Statistical table of expert rating for vehicle 1 in scenario 1
參照文獻[9]計算得到模糊綜合評價結果。其與灰色關聯理論結果比較,如表9。

表9 不同模型評價結果Table 9 Evaluation results of different models
觀察評價結果,從相同模型下不同車輛評價結果、相同車輛下不同模型評價結果兩方面分析,來驗證基于核密度估計的灰色關聯理論評價模型可靠性,得到以下結論:
1)分析對比表5仿真數據與表7灰色關聯模型結果可知:在安全性方面,兩個場景中車輛一的tTTC、tPET及tTHW皆明顯低于車輛二,正向碰撞和側向碰撞安全都較差;在灰色關聯模型量化評價結果中,車輛二在場景1的安全性得分高于車輛一27.97%,且場景2的安全性高24.10%,與測試數據量化分析結果規律一致。在高效性方面,場景中的兩車在通過時間、換道時間差異極大,灰色關聯模型中場景2兩車差異達到23.81%,場景1僅差11.11%,說明基于核密度估計的灰色關聯模型評價結果與測試數據量化分析結果的規律一致性較高,且評價模型的評分波動區間也符合數據分布的特點,能準確評價車輛的表現。
2)分析對比不同模型評價結果的一致性可知:車輛一場景1中兩模型安全方面得分一致性達91.47%,高效方面得分一致性達89.49%,綜合分一致性達98.01%。其中綜合性的得分一致性明顯高于安全性和高效性,主要是由于層次分析法得到的權重所導致。總指標層的得分一致性在90%左右,說明指標層權重法較合理。總體來說基于核密度估計的客觀灰色關聯理論模型與主觀評價模糊綜合分析法具有較高一致性。
針對高速匝道匯入場景,利用采集的駕駛數據求出安全性評價指標的客觀值,提出基于核密度估計的灰色關聯理論模型,其主要結論如下:
1)考慮了匝道匯入車輛的各行駛要素,利用聚類分析實現測試場景生成及測試數據生成,避免了測試用例在場景中的行駛參數由主觀設定;在后續的仿真測試中,搭建了精度較高的典型高速匝道匯入測試場景,保證了測試仿真與匝道匯入場景的一致性,進一步提高了測試評價結果的準確度。
2)在評價模型中考慮到了主觀評價對模型結果的影響,以核密度估計得到的最優閾值作為評價模型的輸入,代替了專家意見值,客觀模型與主觀模型結果相似度為98.01%,評價結果較準確、客觀性強,適用于自動駕駛車輛仿真測試中的安全性評價。