






摘要:為提高車輛控制策略中駕駛風(fēng)格信息的利用率、燃油經(jīng)濟性及行車安全性,在大量車輛行駛數(shù)據(jù)的基礎(chǔ)上,應(yīng)用K-Means算法提取車輛行駛典型工況,采用高斯混合模型(Gaussian mixture model,GMM)對駕駛風(fēng)格進行識別,利用輪廓系數(shù)評價基于典型工況GMM算法和普通GMM算法的識別效果。結(jié)果表明:采用K-Means算法,以車速均值、車速標(biāo)準(zhǔn)差、怠速占比3個參數(shù)可有效提取擁堵、市區(qū)、高速3種工況;設(shè)計的基于典型工況的GMM算法可以將駕駛風(fēng)格區(qū)分為穩(wěn)健型、普通型、激進型3類,不同駕駛風(fēng)格的區(qū)分度較好,識別效果優(yōu)于普通GMM算法。
關(guān)鍵詞:駕駛風(fēng)格;K-Means;GMM;工況提取
中圖分類號:U471.1文獻標(biāo)志碼:A文章編號:1673-6397(2024)03-0094-04
引用格式:郭智剛,閆立冰,張紅倩,等. 基于典型工況和GMM算法的駕駛風(fēng)格辨識[J].內(nèi)燃機與動力裝置,2024,41(3):94-97.
GUO Zhigang, YAN Libing, ZHANG Hongqian, et al. Driving style identification based on typical working conditions and GMM algorithm[J].Internal Combustion Engine amp; Powerplant, 2024,41(3):94-97.
收稿日期:2023-10-06
第一作者簡介:郭智剛(1997—),男,山東濰坊人,工學(xué)碩士,工程師,主要研究方向為內(nèi)燃機開發(fā)、機器學(xué)習(xí),E-mail:2601046208@qq.com。
DOI:10.19471/j.cnki.1673-6397.2024.03.015
0" 引言
駕駛風(fēng)格是指駕駛員在車輛行駛過程中操縱車輛的駕駛行為習(xí)慣。研究駕駛風(fēng)格對提高車輛燃油經(jīng)濟性以及行車安全具有重要作用:一方面,利用經(jīng)辨識的駕駛風(fēng)格動態(tài)調(diào)整車輛控制參數(shù),可優(yōu)化車輛各系統(tǒng)之間的協(xié)調(diào)[1-2],對用戶的不良駕駛習(xí)慣進行識別并提醒;另一方面,利用駕駛風(fēng)格以及行車數(shù)據(jù),可根據(jù)不同駕駛風(fēng)格分析燃油消耗情況,提出減少燃油消耗的駕駛建議。眾多學(xué)者對駕駛風(fēng)格的辨識與應(yīng)用進行了相關(guān)研究:Sun等[3]使用粒子群優(yōu)化聚類的方法對駕駛風(fēng)格進行分類;黃晶等[4]基于駕駛風(fēng)格對換道軌跡進行規(guī)劃,更好地滿足了個性化換道需求;Constantinescu等[5]提出使用主成分結(jié)合分層聚類的方法對駕駛風(fēng)格進行分類;Meiring等[6]對駕駛風(fēng)格進行系統(tǒng)地分類,并且介紹了可以應(yīng)用于駕駛風(fēng)格辨識的機器學(xué)習(xí)算法。但上述研究中并沒有針對典型工況特征下的駕駛風(fēng)格進行有效分析。
駕駛風(fēng)格辨識的難點是難以預(yù)先獲取標(biāo)簽,通常采用無監(jiān)督機器學(xué)習(xí)方法進行分類和識別駕駛風(fēng)格[7]。本文在大量車輛行駛數(shù)據(jù)的基礎(chǔ)上,應(yīng)用K均值(K-Means)算法分析提取典型工況,采用高斯混合模型(Gaussian mixture model,GMM)方法識別駕駛風(fēng)格,利用輪廓系數(shù)評價識別效果,以期快速準(zhǔn)確識別駕駛風(fēng)格。
1" 數(shù)據(jù)預(yù)處理
本文中選擇用于提取典型工況和評價駕駛風(fēng)格的參數(shù)為轉(zhuǎn)速、車速、加速度,各參數(shù)均通過電子控制單元(electronic control unit,ECU)采集,部分樣本數(shù)據(jù)如表1所示。
相較于原始數(shù)據(jù),平均值、標(biāo)準(zhǔn)差等更能反映數(shù)據(jù)分布情況,更適用于典型工況的提取與駕駛風(fēng)格的辨識,因此,以10 s為一個周期統(tǒng)計計算車速均值、車速標(biāo)準(zhǔn)差、加速度均值、加速度標(biāo)準(zhǔn)差。為更精確的提取典型工況,引入怠速占比,其含義為發(fā)動機轉(zhuǎn)速處于怠速附近(怠速轉(zhuǎn)速為600~800 r/min)的樣本數(shù)與總樣本數(shù)的比。
2" 基于K-Means的典型工況提取
典型工況是指汽車日常經(jīng)過的駕駛場景,像市區(qū)場景、高速場景。根據(jù)經(jīng)驗將典型工況劃分為3類:擁堵工況、市區(qū)工況、高速工況。擁堵工況中由于車速低,駕駛員的駕駛風(fēng)格更易反映在對發(fā)動機的需求參數(shù)上,例如激進型駕駛者通常在擁堵工況中有頻繁的較大幅度的踏板變化或者是加速度變化,而高速工況激進型駕駛者與穩(wěn)健性駕駛者各自的駕駛風(fēng)格在發(fā)動機參數(shù)上體現(xiàn)不明顯,即擁堵工況擁有更明顯風(fēng)格參數(shù)特征。根據(jù)工況劃分駕駛數(shù)據(jù),提取擁堵路況數(shù)據(jù),基于擁堵路況數(shù)據(jù)進行駕駛風(fēng)格辨識。鑒于加速度均值與加速度標(biāo)準(zhǔn)差兩個指標(biāo)能更多反映駕駛習(xí)慣,而怠速占比能夠直接反映擁堵工況與高速工況的差距,更適用于典型工況的提取,因此以車速均值、車速標(biāo)準(zhǔn)差、怠速占比3個參數(shù)提取典型工況,以加速度均值、加速度標(biāo)準(zhǔn)差、車速均值、車速標(biāo)準(zhǔn)差4個參數(shù)識別駕駛風(fēng)格。
K-Means算法原理簡單、易于實現(xiàn),應(yīng)用較廣泛。K-Means算法采用距離作為相似性的評價指標(biāo),數(shù)據(jù)對象間的距離與相似度成反比,距離越小,相似度越大[9]。運行前,K-Means算法需預(yù)先規(guī)定聚類簇數(shù),初始化相應(yīng)聚類簇數(shù)的中心點;按照各樣本與聚類中心的歐式距離,把樣本劃分為相應(yīng)的簇中;根據(jù)簇中所有樣本點與聚類中心的歐式距離,不斷計算新的聚類中心,當(dāng)聚類中心不再變化或者目標(biāo)函數(shù)收斂時聚類結(jié)束,得到最終結(jié)果[10]。
本文中按照經(jīng)驗將初始聚類簇數(shù)設(shè)為3,利用K-Means進行聚類,提取典型工況,結(jié)果如圖1所示。
由圖1可知:所有樣本聚類為3簇,各簇界限較為明顯,且符合本文中對典型工況的定義,如擁堵工況特點是車速均值較小、車速標(biāo)準(zhǔn)差較大,怠速占比高,而高速工況特點是車速均值較大、車速標(biāo)準(zhǔn)差小,怠速占比小,為后續(xù)的駕駛風(fēng)格辨識提供了包含特征更明顯的數(shù)據(jù)。
3" 基于GMM模型的駕駛風(fēng)格辨識
3.1" GMM模型
GMM是無監(jiān)督機器學(xué)習(xí)算法的一種,是一種基于概率聚類的模型,它未將每個樣本點置于明確簇中,而給出了該樣本點在各簇中的概率或可能性。GMM算法是多個高斯分布函數(shù)的線性組合,對于n維樣本空間中服從高斯分布的向量x, 其概率密度函數(shù)[11]為:
p(x)=12πn2Σ12exp-12x-μTΣ-1x-μ,
式中:μ為n維均值向量,Σ為n×n的協(xié)標(biāo)準(zhǔn)差矩陣。定義高斯分布的概率密度函數(shù)為: p(x|μ,Σ),由此高斯混合分布為
pm(x)=∑ki=1αi·p(x|μ,Σ),
式中:i為該混合分布的混合元素,i=1,2,…,k,每個混合元素對應(yīng)一個高斯分布;αi為混合系數(shù),∑ki=1αi=1,αigt;0。
將K-means聚類結(jié)果中的擁堵工況數(shù)據(jù)點作為GMM參數(shù)的輸入樣本,再進行駕駛風(fēng)格辨識,即將樣本點按一定概率分配到模型的各個混合分量,根據(jù)樣本點在各混合分量中的概率分布,選出各聚類簇中概率較大的數(shù)據(jù)點作為最終聚類結(jié)果。
GMM的求解需借助于最大期望算法(expectation maximization algorithm,EM)。EM算法使用兩個步驟交替計算:第一步是E(期望)步,利用當(dāng)前參數(shù)的估計值計算對數(shù)似然的期望值;第二步是M(最大化)步,尋找能使E步產(chǎn)生的似然期望最大化的參數(shù)值。新得到的參數(shù)值重新輸入E步,重復(fù)迭代,直至收斂至局部最優(yōu)解或達到最大迭代次數(shù)。GMM算法求解過程如圖2所示。
3.2" 結(jié)果分析
本文中駕駛風(fēng)格可以理解為駕駛員對整車驅(qū)動力及其變化激烈程度的需求情況[12],綜合相關(guān)文獻,本文中將駕駛風(fēng)格分為:穩(wěn)健型、普通型以及激進型等3種。3種駕駛風(fēng)格特點鮮明,相關(guān)特點如表2所示。
根據(jù)典型工況結(jié)果,按圖2所示流程識別駕駛風(fēng)格,不同駕駛風(fēng)格特征參數(shù)對比如表3所示。
由表3可知:不同駕駛風(fēng)格之間的參數(shù)區(qū)分度明顯,特別是激進型駕駛風(fēng)格的加速度均值及標(biāo)準(zhǔn)差明顯高于其他2種風(fēng)格,且符合各駕駛風(fēng)格的定義,能夠區(qū)分駕駛風(fēng)格。
采用非監(jiān)督學(xué)習(xí)中的衡量系數(shù)——輪廓系數(shù)進一步評價駕駛風(fēng)格分類結(jié)果[13]。
單樣本輪廓系數(shù)
si=bi-aimaxai,bi ,
式中:ai為當(dāng)前樣本與同類別樣本的平均距離,bi表示當(dāng)前樣本與距離最近的不同類別的樣本平均距離。
樣本集合的輪廓系數(shù)
s=1n∑ni=1si,
式中n為樣本數(shù)量。
輪廓系數(shù)越高則同類樣本距離越近,且不同類別樣本距離越遠(yuǎn)。
經(jīng)計算,普通GMM算法和基于典型工況GMM算法的輪廓系數(shù)分別為0.449、0.531,基于典型工況GMM算法進行駕駛風(fēng)格識別,效果更好。
綜上,設(shè)計的基于典型工況的GMM算法可以將駕駛風(fēng)格區(qū)分為3類,并且不同駕駛風(fēng)格具有較好區(qū)分度,符合各種駕駛風(fēng)格的特點,且分類效果優(yōu)于普通GMM算法。
4" 結(jié)論
1)利用K-Means算法提取典型工況,采用GMM方法對駕駛風(fēng)格進行識別。結(jié)果表明,設(shè)計的基于典型工況的GMM算法可以將駕駛風(fēng)格區(qū)分為3類,并且不同駕駛風(fēng)格具有較好區(qū)分度。
2)普通GMM算法和基于典型工況GMM算法的輪廓系數(shù)分別為0.449、0.531,基于典型工況GMM算法進行駕駛風(fēng)格識別,效果更好。
參考文獻:
[1]" 孫冬鳴,周培棟,宋雪松,等.引入駕駛風(fēng)格系數(shù)的跟車控制優(yōu)化策略[J].汽車與新動力,2023,6(3):7-11.
[2]" 秦大同,詹森,曾育平,等.基于駕駛風(fēng)格識別的混合動力汽車能量管理策略[J].機械工程學(xué)報,2016,52(8):162-169.
[3]" SUN B, DENG W, WU J, et al. Research on the classification and identification for personalized driving styles[C]// Proceedings of World Congress Experience. Detroit, USA: SAE International,2018.
[4]" 黃晶,薊仲勛,彭曉燕,等.考慮駕駛?cè)孙L(fēng)格的換道軌跡規(guī)劃與控制[J].中國公路學(xué)報,2019,32(6):226-239.
[5]" CONSTANTINESCU Z, MARINOIU C, VLADOIU M. Driving style analysis using data mining techniques[J].International Journal of Computers Communications amp; Control,2010 (5):654-663.
[6]" MEIRING G A, MYBURGH H C.A review of intelligent driving style analysis systems and related artificial intelligence algorithms[J].Sensors,2015,15(12):30653-30682.
[7]" 劉通,付銳,張名芳,等.融合K-means與高斯混合模型的駕駛風(fēng)格聚類研究[J].中國安全科學(xué)學(xué)報,2019,29(12):40-45.
[8]" 紀(jì)少波,張珂,李倫,等.基于純電動汽車高頻數(shù)據(jù)的駕駛風(fēng)格分類方法[J].同濟大學(xué)學(xué)報(自然科學(xué)版),2022,50 (2):273-282.
[9]" 李經(jīng)緯,趙治國,沈沛鴻,等.駕駛風(fēng)格K-means聚類與識別方法研究[J].汽車技術(shù),2018(12):8-12.
[10]" 楊玉鳳,曲大義,蘭添賀,等.基于深度學(xué)習(xí)的駕駛傾向類分類及辨識方法[J].廣西大學(xué)學(xué)報(自然科學(xué)版),2024,49(2):324-335.
[11]" 侯海晶,金立生,關(guān)志偉,等.駕駛風(fēng)格對駕駛行為的影響[J].中國公路學(xué)報,2018,31(4):18-27.
[12]" 葛慧敏,黃嘉慧,臧文凱,等.考慮駕駛?cè)伺c環(huán)境交互的駕駛風(fēng)格識別模型研究[J].重慶理工大學(xué)學(xué)報(自然科學(xué)),2023,37(8):177-184.
[13]" 朱連江,馬炳先,趙學(xué)泉.基于輪廓系數(shù)的聚類有效性分析[J].計算機應(yīng)用,2010,30(增刊2):139-141.
Driving style identification based on typical working conditions and
GMM algorithm
GUO Zhigang, YAN Libing, ZHANG Hongqian, SHEN Zong
Weichai Power Co., Ltd., Weifang 261061,China
Abstract:To improve the utilization rate of driving style information in vehicle control strategies, fuel economy, and driving safety,K-Means algorithm is applied to extract typical driving conditions based on a large amount of vehicle driving data.Gaussian mixture model (GMM) is used to recognize driving style, and contour coefficients are used to evaluate the recognition effect of GMM algorithm based on typical driving conditions and ordinary GMM algorithm. The results show that using the K-Means algorithm, three parameters including mean vehicle speed, standard deviation of vehicle speed, and idle ratio can effectively extract three typical working conditions: congestion condition, urban area condition, and high-speed condition. The GMM algorithm designed based on typical working conditions can distinguish driving styles into three categories: robust, normal, and aggressive. The differentiation of different driving styles is good, and the recognition effect is better than that of ordinary GMM algorithms.
Keywords:driving style; K-Means;GMM; condition extraction(責(zé)任編輯:臧發(fā)業(yè))