劉明春 付皓 黃菊花 史鴻楓
(南昌大學,南昌330031)
主題詞:自動駕駛車輛 駕駛行為分析 車輛控制 神經網絡
自動駕駛汽車的安全性和乘坐舒適性與其彎道轉向控制密切相關。熟練駕駛員的操縱行為是保證車輛安全性和舒適性的重要因素,也是自動駕駛車輛“擬人化”控制的重要學習對象。因此,基于“人-車”系統數據的分析和學習是評價和提高自動駕駛車輛性能的重要途徑。
人-車系統主要分為駕駛員操縱行為與車輛動態響應。駕駛員操縱行為包括對踏板與轉向盤的操作[1],通過這些操作數據可以分析駕駛員的行為特性[2-4]。另外,駕駛員還存在一些不良習慣[5],如東張西望等[6]。車輛動態響應主要指車輛動力學特性,包括燃油經濟性[7]、操縱穩定性[8-9]、安全性[10]、乘坐舒適性[11]等。
車輛控制經歷了從經典控制理論到智能控制的過渡。經典控制理論所采用的傳遞函數法是較早的車輛控制算法,郭孔輝基于傳遞函數提出了預瞄-跟隨理論[12],實現了車輛控制[13],該算法簡單易行,但控制效果有待提高。PID 算法常應用于路徑跟隨控制[14],通過計算系統實際值與期望值的誤差進行反饋校正。模型預測控制算法基于現代控制理論將人-車-路閉環系統表示為狀態空間[15],以已知模型、當前狀態量和未來控制量預測未來輸出。上述方法都需要事先得到預期軌跡。在智能控制理論中被廣泛應用于車輛控制的算法有模糊控制算法[16]和神經網絡算法[17],前者需要得到預期軌跡,而后者需要大量數據來提高其有效性。
本文基于對熟練駕駛員操縱數據的分析提出一種針對彎道的轉向控制方法。首先,在PreScan+Simulink環境中建立車-路模型[18],采集多位熟練駕駛員在虛擬場景下的轉向盤角度、軌跡、橫擺角速度與質心側偏角。然后,通過對比駕駛員數據和期望數據,對駕駛員數據進行分析和評價,篩選出訓練樣本,以道路曲率、車速、車輛橫擺角速度為輸入,以轉向盤轉角為輸出,建立基于BP 神經網絡的彎道轉向控制器。最后,對該控制器進行仿真和實車測試,以驗證其有效性。
本文的模擬駕駛平臺軟硬件構架如圖1所示:在PreScan 軟件中建立場景模型與傳感器模型;羅技G29操縱裝置提供轉向盤和油門踏板、制動踏板、離合器踏板,駕駛員操縱該裝置實現車輛的轉向、驅動和制動控制,其數據通過電信號傳輸至執行機構;在MATLAB/Simulink 中建立車輛動力學模型作為控制對象,Simulink 中的羅技G29 信號接收模塊將電信號轉化為Simulink信號輸入;由PC端獲取PreScan軟件輸出的3D場景作為駕駛員視角,同時獲取MATLAB/Simulink反饋的信息進行數據監控和采集。控制器整體框架如圖2所示。

圖1 模擬駕駛平臺軟硬件構架

圖2 控制器設計框架

本文采用3自由度車輛模型作為控制對象,模型的輸入為轉向盤轉角和速度,輸出為車輛動力學參數。3自由度車輛模型如圖3所示。

圖3 3自由度車輛動力學模型
根據牛頓第二定律,建立如下方程:

式中,m為車輛的整備質量;?分別為車輛在x軸方向的速度和加速度?分別為車輛在y軸方向的速度和加速度;Iz為車輛繞z軸的轉動慣量;a、b分別為車輛質心到前、后軸的距離;φ為車輛橫擺角;δf為前輪轉角;Flf、Flr分別為地面對前、后輪胎的縱向作用力;Fcf、Fcr分別為地面對前、后輪胎的側向作用力。
根據線性的輪胎理論模型[19],Flf、Flr、Fcf、Fcr的表達式分別為:
式中,Cxf、Cxr分別為前、后輪胎的縱向剛度;Cyf、Cyr分別為前、后輪胎的側偏剛度;sf、sr分別為前、后輪胎在地面上的滑移率;αf、αr分別為前、后輪胎的側偏角。
基于前輪轉角較小情況,并考慮車身坐標系與慣性坐標系之間的轉換關系,整理得到3自由度車輛動力學系統方程為:

2.3.1 場景設計與數據采集
在設計的模擬駕駛平臺中,PreScan軟件提供場景、道路和車輛信息,羅技G29裝置模擬真實駕駛員的操縱行為,MATLAB/Simulink軟件采集并存儲駕駛員的操縱數據和車輛狀態數據。
為了提高模型的有效性,本文設定了11 個彎道場景,其中10個作為訓練場景,1個作為測試場景。同時,按照城市道路規劃規范[20],對這些彎道場景進行速度限制。訓練場景設計參數如表1所示。

表1 訓練場景設計參數
每個訓練場景有2 條道路,分別為左轉向與右轉向,除方向外其他設定完全相同。規定道路曲率圓的圓心在駕駛員左側時曲率為正,反之為負。
邀請8 位熟悉操縱平臺特性的熟練駕駛員在10 個場景共計20 條道路進行一次有效駕駛(順利從起點行駛至終點),保證每位駕駛員起始位置和終點位置相同,且駕駛過程中速度保持不變。采集駕駛員數據、車輛數據與道路數據,包括轉向盤轉角、車速、橫擺角速度、質心側偏角以及道路曲率,采樣周期為20 ms。
2.3.2 數據處理與分析
為了保證車輛彎道轉向過程中的安全性、穩定性和舒適性,選取駕駛員車道保持能力、駕駛員轉向平穩性以及車輛穩定性作為控制效果的評價指標。
2.3.2.1 駕駛員車道保持能力
本文用車輛質心與中心線的橫向距離來描述駕駛員的車道保持能力:假定期望軌跡為車道中心線,將實際軌跡與期望軌跡進行相似性比較,將該指標進行量化處理,本文采用基于歐式距離的相似度算法對期望軌跡和實際軌跡進行比較[17]。具體方法如圖4所示,在每個場景的道路邊界均勻選取n個點(P1,…,Pi-1,Pi,Pi+1,…,Pn),每相鄰2 個點的距離為1 m,用來確定車輛在道路上的位置。在大地坐標系內,駕駛軌跡和期望軌跡在Pi處對應的軌跡上的點分別為Di和Qi,Di和Qi對應的瞬時轉向盤轉角為δdriver和δexp。根據2 條軌跡在每個選取點對應的位置,計算2個點間的歐氏距離:

圖4 車輛位置計算

式中,||Di-Qi||為Di和Qi的二范數歐氏距離。
則2條軌跡的累計距離偏差、平均距離偏差可分別表示為:

道路曲率為1/35 m-1的彎道常見于城市環島,選用該曲率的訓練場景進行說明。在該訓練場景的左轉向道路中,期望軌跡和8 位駕駛員的實際駕駛軌跡如圖5所示,其中前、后各有60 m的速度控制直道和30 m的方向回正直道,直道不參與計算過程。

圖5 駕駛軌跡與期望軌跡
計算各駕駛員的駕駛軌跡與期望軌跡的平均距離偏差,該指標反映了駕駛員駕駛過程中車輛與車道中心線的偏離程度,其結果如表2所示。

表2 軌跡平均距離偏差 m
2.3.2.2 駕駛員轉向平穩性
駕駛員的轉向平穩性為駕駛員操作轉向盤的穩定性,表現為駕駛員控制轉向盤的振蕩程度。為了將該指標量化,引入變異系數cv[21]:

式中,σ、分別為所測量的轉向盤轉角的標準差和均值。
變異系數體現了轉向盤轉角的離散化程度,變異系數越大,離散化程度越大。采集到的8位駕駛員的轉向盤轉角如圖6所示。

圖6 駕駛員轉向盤轉角
在計算變異系數時,需要剔除前、后2 段直線道路的數據,計算得到8位駕駛員的轉向盤轉角變異系數如表3所示。

表3 轉向盤轉角變異系數
2.3.2.3 車輛穩定性
車輛的穩定性主要體現在車輛的橫擺角速度和質心側偏角上。一方面可直接通過其數值評價車輛的穩定性,另一方面,可將二者的實際值與期望值進行對比分析來評價車輛的穩定性。
基于二自由度車輛模型計算出期望橫擺角速度,其表達式為[22]:

式中,ωdes=Gωzss·δ為穩態轉向下的橫擺角速度;ωd=0.85μg/x?為橫擺角速度上限;Gωzss為橫擺角速度的穩態增益;δ為轉向盤轉角;μ為道路附著系數;g為重力加速度。
同樣可得期望質心側偏角,其表達式為[22]:

式中,βdes=Gβzss·δ為穩態轉向下的質心側偏角;βd=arctan(0.02μg)為質心側偏角的上限;Gβzss為期望質心側偏角增益。
根據式(11)和式(12)計算該場景下的期望橫擺角速度和期望質心側偏角,得到橫擺角速度、質心側偏角的期望值與8位駕駛員的測量值如圖7、圖8所示。

圖7 橫擺角速度期望值與實際值

圖8 質心側偏角期望值與實際值
擬合優度作為一種用于非線性回歸方程擬合程度判定的指標,常用于曲線擬合。本文引入度量擬合優度的統計量可決系數R2[23],將期望值作為擬合后的曲線,進行擬合優度分析。可決系數的計算公式為:

式中,yij為編號為j的駕駛員數據的實測值;為期望值;為編號為j的駕駛員數據的平均值;n為每個駕駛員數據的總數量。
可決系數體現了車輛的穩定性指標與期望值的擬合程度,R2越接近1,表明擬合度越高。
分別計算8 位駕駛員的駕駛員數據與期望數據的可決系數,橫擺角速度和質心側偏角的擬合優度分析結果分別如表4、表5所示。

表4 橫擺角速度擬合優度

表5 質心側偏角擬合優度
2.3.3 評價模型
為了對駕駛員數據進行評價,建立如表6所示的駕駛員轉向行為評價體系。

表6 駕駛員轉向行為評價體系
選用層次分析法計算指標權重,參考國內外駕駛行為評價研究及成果,綜合運用各項研究中的專家經驗和數據,基于各項評價指標的相對重要性,以主觀判斷法對各項指標進行評判[24],得到一級指標和車輛穩定性的判斷矩陣分別如表7、表8所示。

表7 一級指標判斷矩陣

表8 車輛的穩定性判斷矩陣
計算各判斷矩陣的行指標乘積:

計算各行的歸一化權重作為判斷矩陣各指標權重:

最后得到權重分配結果如圖9所示。

圖9 權重分配結果
采用模糊評價法進行打分[25]:設置評價集為V={優秀,良好,中等,合格,差},其分值為v={100,90,80,70,60}。選取18 名從事自動駕駛行業的人員,并參考各項指標的平均值對各項指標進行評價。根據評價結果及其權重分配計算得到駕駛員轉向行為評分結果如表9所示。

表9 駕駛員轉向行為評分 分
用相同的評價系統評價8 位駕駛員的所有駕駛行為,得到160組駕駛數據的評分如表10所示。

表10 駕駛員轉向行為評分
為提升神經網絡的訓練速度和控制器的有效性,剔除得分75 分以下的駕駛員數據,其余數據作為訓練樣本。
本文設計一種基于BP神經網絡的自動駕駛彎道轉向控制器,控制流程如圖10所示。

圖10 橫向控制流程
設計BP 神經網絡為3 層結構,輸入節點分別為車速、道路曲率、橫擺角速度,輸出節點為轉向盤轉角。采用試湊法確定隱藏層單元數[26],最后確定神經網絡構造為3-8-1,如圖11所示。

圖11 神經網絡基本結構
神經網絡隱藏層與輸出層的激活函數采用sigmoid函數,正向傳播過程為:

神經網絡的反向傳播使用萊文伯格-馬夸特(Lev?enberg-Marquard,LM)算法來修正模型的權值和閾值[27]:

式中,w(k)和b(k)分別為為第k次迭代的權值和閾值所組成的向量;J為雅克比矩陣;I為單位矩陣;μ為學習率;e為輸出誤差矩陣。
測試道路選用江西省上饒市的一處高速匝道入口,在PreScan軟件中建立1∶1的道路模型,測試道路如圖12所示。

圖12 測試道路
設定車輛行駛速度為40 km/h,且駕駛員參考車道中心線駕駛車輛,仿真測試結果如圖13所示。
結合圖13a中數據和2.3.2.1節中計算公式,計算得到駕駛員、控制器控制下軌跡和期望軌跡的平均距離偏差分別為0.832 1 m、0.418 7 m。由圖13b 可知,控制器能夠模擬駕駛員的轉向行為。結合圖13c和圖13d中數據和2.3.2.3 節中計算公式,分別計算駕駛員數據、自動駕駛控制結果、期望值之間可決系數,結果如表11所示。綜合以上仿真結果分析,可以得出該控制器能夠有效模擬熟練駕駛員的轉向行為,且能夠保證自動駕駛車輛的安全性和穩定性。

圖13 仿真測試結果

表11 仿真測試車輛響應擬合優度
測試平臺為某自動駕駛車輛,如圖14所示,該車配備了1個前視攝像頭和6個毫米波雷達,傳感器的檢測距離如圖15所示。本文利用前視攝像頭檢測車道線并通過內置算法計算車道線的曲率。

圖14 測試車輛

圖15 車載傳感器配置
測試車輛的整車通訊架構如圖16所示。以MicroAutoBox硬件作為控制器,車輛傳感器向控制器提供交通信息。主機車輛的速度和加速度通過CAN總線提供。控制器基于所提出的控制算法計算期望加速度,并將其作用于測試車。主計算機中可直觀地顯示主機車輛的控制信息和運動狀態。

圖16 實車驗證方案
本次測試選用園區內的一條有車道線的彎道作為測試場景,速度設定為20 km/h。車輛狀態可通過車身CAN總線獲取,前車運動狀態通過毫米波雷達獲取,道路信息通過前視攝像頭獲取。測試結果如圖17所示。

圖17 實車驗證結果
結合圖17b數據和2.3.2.1節計算公式,得到駕駛員和控制器控制下軌跡的平均距離偏差為0.127 2 m。圖17c表明,控制器可模擬駕駛員的轉向行為。結合圖17d和圖17e數據和2.3.2.3節計算公式,分別計算駕駛員數據、自動駕駛控制結果、期望值間的可決系數,結果如表12所示。綜合分析可得,彎道轉向控制器在實車應用中可模擬熟練駕駛員轉向行為,且能保證安全性和穩定性。

表12 實車驗證車輛響應擬合優度
本文提出了一種基于駕駛員操縱數據分析和學習的自動駕駛車輛彎道轉向控制器,用于模擬熟練駕駛員在彎道上的駕駛行為。基于3自由度車輛模型搭建人-車-路模擬駕駛平臺,采集多位熟練駕駛員的操縱數據,并進行離散分析和相似分析,建立模糊綜合評價系統對駕駛員轉向行為進行評分,篩選出訓練樣本,基于LMBP神經網絡建立彎道轉向控制器,控制器以車速、道路曲率、橫擺角速度為輸入,以轉向盤轉角為輸出。仿真測試和實車驗證結果表明,該控制器能夠模擬熟練駕駛員的彎道駕駛特性,并能保證行駛安全性和穩定性。