陶紅興,莫凌飛,嚴如強
(東南大學儀器科學與工程學院,南京 210096)
汽車發展至今,已經有較為成熟的生產技術,但其排放出的尾氣給人們的生活,生產都帶來了負面影響,因此,電動汽車的發展也被推上日程[1]。從目前的開發進度來看,電動汽車技術已經得到了長足的發展,有望在未來大量生產,或將取代傳統內燃機汽車成為人們日常生活中交通的首選[2]。而隨著電動汽車數目的增多,電動汽車的駕駛行為分析也就顯得尤為重要,準確的駕駛行為辨識結果可以有效的監督駕駛員的行為規范,以此增加電動汽車駕駛過程中的安全性。
近年來,許多研究人員希望能夠對車輛駕駛狀態進行準確的辨識。研究一般分為兩個方向:基于駕駛員的駕駛行為分析,或是基于車輛的駕駛行為分析。ChiyomiMiyajima,Yoshihiro Nishiwaki 和 Koji Ozawa 針對不同駕駛員的油門剎車踏板的操縱情況進行建模,并提出了一種混合高斯算法,并得到大概80%的準確率[3]。同時一些學者希望通過智能手機的傳感信號來對駕駛行為進行識別,李偉健[4]等人就通過手機中的加速度傳感器的變化程度識別車輛是否發生事故[5]。雖然兩種研究方向都能夠對駕駛行為進行分類,但是精度不高,本文希望能夠基于信息融合的方法將兩種信息結合起來,以提高對駕駛行為辨識的精度。
本文的目的在于提高識別電動汽車駕駛行為的正確率,主要工作有:①通過加速度傳感器獲得駕駛過程中的加速度數據,并通過MMA(多尺度多重分形)算法對加速度信息進行處理,提取特征值。MMA算法是一種時域信號處理方法,可以反映出加速度信號的波動情況。②通過CAN分析儀對電動汽車的OBD信息進行采集,并采用其中的速度、功率、電流等一些能夠反映電動汽車駕駛行為特性的信息進行特征提取。③采用隨機森林的方法對提取的特征進行有效的分類。本文中,主要對駕駛行為分為以下7個類別:加速、減速、左轉彎、右轉彎、左變道、右變道、正常駕駛。④提出一種信息融合方法以提高分類準確性。
MMA(Multiscale Multifractal Analysis)算法是一種處理時域信號的方法。實際上是標準多重分析算法加入了尺度因素[6]。通過MMA算法分析可以分析得到信號的波動特性以及其穩定性。該算法得到的結果是Hurst表面h(q,s),用于描述Hurst指數在不同參數q(波動階數)和參數s(尺度)情況下波動情況的變化幅度[7]。但是實際上該方法一直沒有用于特征提取,本文采用該方法,選擇其Hurst指數序列作為提取的特征。其方法步驟如下所示:
①求“輪廓信號”:
(1)
②將序列Y分為Ns≡int(N/s)個連續、不重疊,且長度為s的等長子區間Vj(j=1,2,…,Ns)。實際上序列不一定完全被s整除,最后序列可能會剩余一些尾部的數據,為了充分利用數據,從Y序列的兩端(首尾兩端)分別切割,得到2Ns個區間。
③用最小二乘估計算法計算每個子區間的趨勢,然后可以計算得到方差:
對于子區間v=1,…,Ns:
(2)
對于子區間ν=Ns+1,…,2Ns,
(3)
yv(i)是每個子區間的擬合多項式:
yv(i)=aj0+aj1i+…+ajm-1im-1+ajmim,m=1,2,…
(4)
這里m是擬合多項式的回歸階數。
④計算每個區間的q階波動函數:
(5)
F(q,s)曲線可以反映出波動水平的大小,其中,q表示波動階數,q為正值時,表示對數據大的波動進行分析,而q為負值時,表示對數據的小的波動進行分析。通常q取值范圍為[-5,5]。
尺度值s的選擇是至關重要的,MMA中采用一個移動擬合窗口,將窗口中準連續變化的s值代入到F(q,s)的運算中。假設一個擬合窗口Ri(i=1,2,…,n),而hRi對應著在Ri中計算得到的h值。然后可以計算得到每個擬合窗口的h值,h(s)={hR1,hR2,…,hRn},對于固定的q值,可以得到相對一定范圍s,準連續變化的h(q)的值。對于不同的q值重復以上操作,就可以得到廣義的Hurst表面[8]。h(q,s)可以通過如下公式得到:
(6)
這里F(q,s)Ri和sRi表示Ri窗口下的值。
并且所得到的Hurst指數還具有一定的物理意義:h∈(0,0.5)說明該時域信號具有一定的反持續性,h=0.5表示該信號是不相關的噪聲,h∈(0.5,1)表示信號是持續性的,h=1.5說明該物體在做布朗運動,h>2則說明是黑噪聲[9]。
通過MMA算法可以得到信號細致的波動情況,可以反映出不同信號的差異性。將h(q,s)值按q和s從小到大的順序排列,得到一組序列,該序列可作為一個樣本的特征序列(每個h作為一個特征值)。本文采用該方法對加速度信息進行特征提取。
隨機森林是一種基于決策樹的集成方法,可以用于分類,回歸和其他集成學習。隨機森林的最小決策單元是隨機決策樹[10],它通過在訓練期間構建出多個決策樹,并以此得到多個輸出分類結果的模式,最終由多個決策樹進行綜合投票決定輸出結果。
形成隨機森林基本分類器的基本步驟如下:
①通過自助(bootstrap)重采樣技術,從原始訓練樣本集N中有放回的重復抽取k個樣本生成新的訓練樣本集合。
②隨機選取屬性集合,最終形成新的樣本集合。每個決策樹都會得到一個結果。
③隨機森林實際上就是基于多數分類投票,通過對每個決策樹的分類結果投票得到最終的分類結果[11]。
駕駛行為分析過程中,由于運行情況眾多,監測量與駕駛行為之間是一種非線性映射。而且,采用單一的特征參數已經不能滿足對精度的需求。解決的方案就是采用信息融合技術對多種信息進行融合,即從多個方面對駕駛行為進行描述,可以得到更多有用的信息,實現更準確的駕駛行為辨識。
信息融合方法一般分為3大類:數據層融合、特征層融合和決策層融合[12]。本文采用的是決策層融合,如圖1所示。

圖1 決策層融合結構
本文中,選取隨機森林作為分類器,隨機森林算法是通過對多個決策樹進行統計得票得到最終的結果,這里將每個樣本的準確度h(p|x)作為置信度,隨機森林算法實際上是有多個決策樹構成,對于每個樣本不同的決策樹有不同判定結果,這里的準確度是指這些決策樹的分類的準確度。同時對于兩個信息來源的分類器可以得到其準確率W作為分類器的權重,將兩者的乘積作為加權投票的權重。本文中的融合算法如圖2所示。

圖2 融合算法結構
本文中用于識別電動汽車駕駛狀態的數據主要來源于兩個方面:一是外加三軸加速度計,通過該模塊能夠收集到電動汽車在運行狀態下的X、Y和Z軸方向上的加速度信息,反映電動汽車在各個方向上的運動變化情況。二是OBD信息,通過CAN分析儀,對電動汽車OBD接口上傳出來的OBD信息進行解析以此得到電動汽車內部的信息:車速,電機功率,電流,加速踏板和減速踏板的相關信息。
圖3(左)是本文用于采集加速度信息的arduino加速度模塊,本實驗中,將其水平固定于汽車上,可以得到較為真實的三軸加速度信息,其中X軸正方向為電動汽車前進方向,Y軸正方向為電動汽車的左側,Z軸的正方形為電動汽車的垂直上方。而CAN分析儀則通過OBD接頭連接CAN分析儀和OBD接口,解析CAN報文得到OBD信息,兩者通過USB與上位機通訊,在本次實驗中上位機采用Labview進行設計。

圖3 三軸加速度計采集模塊和CAN分析儀
實驗主要包含三部分內容:一是基于加速度信息的電動汽車駕駛行為辨識;二是基于OBD信息的電動汽車駕駛行為辨識;三是基于加速度和OBD信息融合的電動汽車駕駛行為辨識。
實驗過程中統一取5 s作為數據采集的時間窗口,每種駕駛行為各測得50組樣本,每組數據樣本1 500點,其中30組樣本用于訓練,20組樣本用于測試,最終實驗步驟如下:①單獨使用加速度信息作為信息來源,采用MMA算法提取特征后,由隨機森林分類器得到分類結果。②單獨使用OBD信息作為信息來源,提取特征值后,由隨機森林分類器得到分類結果。③采用信息融合技術,將兩種信息綜合起來,由隨機森林分類器得到分類結果。
在本文中,首先對電動汽車駕駛過程中的加速度信息進行處理和分類,通過隨機森林算法得到它對駕駛狀態的識別能力。在本次實驗中,將駕駛行為分為加速,減速,左轉彎,右轉彎,左變道,右變道和正常行駛七大類。其中,加速,左轉,左變道和正常行駛的加速度信息如下:
由圖4可以看出在加速過程中,X軸加速度先由0加速到一個穩定值,具有較為明顯的變化。

圖4 加速時三軸加速度
由圖5可以看出在左轉彎過程中,Y軸加速度從0增加到一個穩定值后減少為0,具有較為明顯的變化。

圖5 左轉彎時三軸加速度
由圖6可以看出左變道過程中,Y軸加速度從0增加到一個值后減少到一個負值后歸0,具有較為明顯的變化。

圖6 左變道時三軸加速度圖
由圖7顯示了正常駕駛過程中,三軸加速度的加速度值的變化并沒有較為明顯的變化。

圖7 正常駕駛時三軸加速度
從上圖可以看出,電動汽車的7種駕駛狀態在X和Y軸上加速度變化較為明顯。因此,本文中采用MMA算法對原始的X和Y軸加速度信號進行處理后,得到加速度信號的波動情況,通過該算法可以得到h(q,s)圖,如下所示。

圖8 加速時X軸h(q,s)

圖9 加速時Y軸h(q,s)

圖10 左轉彎時X軸h(q,s)

圖11 左轉彎時Y軸h(q,s)

圖12 左變道時X軸h(q,s)

圖13 左變道時Y軸h(q,s)
由于7種駕駛狀態在X軸和Y軸上信號的區分度較為明顯,這里展示了在加速、左轉彎和左變道情況下X和Y軸加速度數據經MMA算法得到的h(q,s)圖像:
在處于加速狀態下,X軸的加速度變化較為明顯,圖像中有一較大的變化。而Y軸則相對平穩。
在處于左轉彎和左變道情況下,X軸的變化較小,而從圖中可以看出,兩者通過Y軸加速度信息得到的圖像也有較大不同,與左轉彎相比,左變道的圖像變化要多一個波峰,這與實際情況也相符。
由上圖可以得出結論,通過MMA算法得到的h(q,s)能有效的區分出不同狀態的駕駛行為,可以作為有效的特征提取方法。這里將h(q,s)按照q,s從小到大的順序排列,得到一個Hurst指數序列,以此作為所需要的特征向量,用于隨機森林分類器的訓練和測試。
最終得到的分類結果如表1所示。

表1 基于MMA算法的加速度信息識別結果(基于隨機森林)
從表1的結果可以看出通過MMA方法對加速度信號進行特征提取,并通過隨機森林(RF)分類的方法可以對電動汽車的駕駛狀態進行較為有效的識別。但是精度并不能達到預期的標準。
電動汽車的OBD信息中包含了電動汽車的車速、電動機轉速、輸出電流、電機控制器溫度、總電壓、電池點量等相關信息,從中選取車速、電動機轉速和輸出電流作為信息來源。其中,加速,左轉,左變道和正常行駛情況下三者的變化曲線如圖所示。
圖14可以看出,在加速過程中,速度、電動機轉速和輸出電流有著明顯的增加的過程。

圖14 加速時OBD信息

圖15 左轉彎時OBD信息
圖15可以看出,在左轉彎的過程中,速度上無明顯變化,而電動機轉速有較為明顯的減少增加的過程。輸出電流與Y軸加速度相似,有著先增加后減少的過程。
圖16可以看出,在變道過程中,速度無明顯變化,電動機轉速有明顯的減少后有稍許增加,而輸出電流與Y軸加速度特征相似,先增加到一個值后減少到一個值,最后回復到穩定值。

圖16 左變道時OBD信息

圖17 正常時OBD信息
圖17可以看出,在正常形勢狀態,速度,電機轉速和輸出電流均沒有明顯變化。
綜上所述,速度、電機轉速和輸出電流對于不同的駕駛行為有較強的區分能力,在這里,提取三者的均值、方差、最大值和最小值作為信號的特征,將其作為輸入,輸入到隨機森林分類器當中。得到的分類結果如下。

表2 基于ODB信息的識別結果(基于隨機森林)
從上面兩個實驗可以看出,加速度信息和OBD信息都可以對駕駛行為進行簡單的分類,但是其識別精度遠遠沒有達到我們所期望的高度,因此,在這里,將兩種信息源進行融合,以達到補充信息的效果。通過特征融合的方法得到的分類結果如表3所示。

表3 基于信息融合方法的識別結果(基于隨機森林)
從5.2的實驗結果可以看出,通過三軸加速度信息可以粗略的將電動汽車的駕駛行為辨識出來,但是其精度遠遠沒有達到預期的目標,因為一些駕駛行為是一個綜合的過程,轉彎的過程同樣也伴隨著減速,而每次駕駛行為的操作也不盡相同,而這需要大量樣本數。從5.3實驗的實驗結果可以看出,OBD信息中的速度、電機轉速和輸出電流對與不同駕駛行為也具有不錯的辨識度。而通過5.4的實驗結果可以看出,通過融合算法,將加速度信息和OBD信息融合可以有效的提高電動汽車的駕駛行為辨識度。
本文提出了一套基于信息融合的駕駛狀態識別的方法,以期望能達到準確識別駕駛狀態的目的。首次將MMA算法應用于加速度信號的特征提取,同時,通過信息融合的方法將加速度信息和OBD信息結合起來,達到提高分類精度的目的。但是還有一些方面需要提高:①本文中選取5 s作為一個固定時間窗口,這不一定是最為合適的,還需要大量的實驗來選取最好的時間窗。②后續的工作中可以設計出一套完善的系統,在分類結束后返回客戶端顯示。
[1] 張文亮,武斌,李武峰,等. 我國純電動汽車的發展方向及能源供給模式的探討[J]. 電網技術,2009,33(4):1-5.
[2] 賀克斌,郝吉明,傅立新,等. 我國汽車排氣污染現狀與發展[J]. 環境科學,1996(4):80-83.
[3] Miyajima C,Nishiwaki Y,Ozawa K,et al. Driver Modeling Based on Driving Behavior and Its Evaluation in Driver Identification[J]. Proceedings of the IEEE,2007,95(2):427-437.
[4] 李偉健,林亞平,葉松濤. 智能手機碰撞檢測及在汽車事故自救中的應用[J]. 計算機工程,2011,37(9):245-247.
[5] 周后飛,劉華平,石紅星. 智能手機車輛異常駕駛行為檢測方法[J]. 智能系統學報,2016,11(3):410-417.
[6] Kokosinska D,Gieraltowski J J. The Analysis of Human Heart Rate for Healthy and Ill Patients Using the Recently Published Method Multiscale Multifractal Analysis[C]//Computing in Cardiology Conference. IEEE,2014:425-428.
[7] Gieraltowski J,Hoyer D,Schneider U,et al. Assessment of Fetal Development Using Multiscale Multifractal Analysis of Heart Rate Variability[J]. ,2013:93-96.
[8] Wang J,Shang P,Cui X. Multiscalemultifractal Analysis of Traffic Signals to Uncover Richer Structures[J]. Physical Review E Statistical Nonlinear and Soft Matter Physics,2014,89(3):032916.
[10] ZHUANG Jinfa,LUO Jian. Fault Diagnosis Method Based on Modified Random Forests[J]. Computer Integrated Manufacturing Systems,2009(4):777-785.
[11] Cutler D R,Edwards TC Jr,Beard K H,et al. Random Forests for Classification in Ecology[J]. Ecology,2007,88(11):2783-92.
[12] 沈靜華,裴東興,張瑜. 基于多傳感器數據融合的準靜態校準數據處理方法[J]. 傳感技術學報,2017,30(7):1040-1043.