翟克寧 張靜晨 劉永剛
(1.東風柳州汽車有限公司乘用車技術中心,柳州 545005;2.重慶大學,機械傳動國家重點實驗室,重慶 400044)
主題詞:純電動汽車 擋位決策 動態規劃 長短時記憶網絡
近年來,為提高純電動汽車在低速工況下的動力性和高速工況下的經濟性,汽車廠商開始關注純電動汽車兩擋變速器技術研究,但是如果換擋規律標定不合理,就會導致兩擋變速器的換擋性能不如固定速比減速器[1]。盡管兩擋變速器僅有2個擋位,但駕駛意圖、駕駛風格和行駛環境都會對最佳換擋規律產生影響,實際換擋規律標定工作復雜且工作量大[2]。
針對車輛建模及換擋規律優化問題,眾多學者提出了基于動態規劃[3-4]、極小值原理[5-6]等方法優化循環工況下的換擋規律,同時將駕駛意圖[7-8]、駕駛風格[9]和道路坡度[10-11]作為優化或修正換擋規律的影響因素,進而提出具有更多參數的換擋規律[12]。但是相較于智能擋位決策技術,制定靜態換擋規律并實時應用時,最多只能考慮4個參數[13]。此外,駕駛風格在線識別需要利用一段時間內的行駛數據[14],對運算速度要求較高,而且基于駕駛風格的換擋規律閾值設定強烈依賴專家經驗。
因此,本文提出一種基于數據挖掘的靜態換擋規律提取方法和基于知識的智能擋位決策方法。以某純電動汽車兩擋變速器為研究對象,首先,建立純電動汽車動力學模型和擋位優化模型,基于動態規劃(Dynamic Programming,DP)算法優化得到最優擋位時序數據,構建初始擋位知識庫,基于支持向量機(Support Vector Machine,SVM)算法從擋位知識庫中提取靜態兩參數換擋規律。然后,采集駕駛員手動換擋數據,上傳至云端并補充至擋位知識庫,建立基于長短時記憶網絡(Long Short-Term Memory,LSTM)的擋位決策模型,通過空中下載(Over-The-Air,OTA)技術更新到實車上。最后,通過仿真驗證LSTM 經濟性擋位決策的準確率和耗電量,并與靜態兩參數換擋規律和其他智能擋位決策方法進行對比。
搭載兩擋變速器的純電動汽車動力學模型是最佳擋位數據優化的基礎,同時作為仿真模型對所提出的靜態兩參數換擋規律和智能擋位決策方法進行驗證。
車輛行駛方程為:
式中,Tm(k)為電機輸出扭矩,制動時超出最大電機負扭矩的部分由制動系統提供;i(k)為傳動比;v(k)為縱向車速;a(k)為縱向加速度;ηt為傳動系統效率;r為車輪半徑;m為汽車質量;g為重力加速度;f為滾動阻力系數;CD為空氣阻力系數;A為迎風面積;δ為質量換算系數。
驅動電機輸出轉速表達式為:
驅動電機輸出功率表達式為:
式中,ηc(k)為電機發電時電池和電機的總效率;ηd(k)為電機耗電時電池和電機的總效率。
通過試驗測得的電池與電機總效率MAP 如圖1所示。

圖1 電機與電池總效率MAP
電池耗電量表達式為:
式中,E為電池開路電壓;R為電池內阻;Qb為電池總容量。
由于仿真時電池荷電狀態(State Of Charge,SOC)在60%~70%范圍內變化,電池開路電壓和內阻幾乎不變,可以認為E和R為定值。
模型參數如表1所示。

表1 模型參數
為了制定最佳兩參數換擋規律,利用DP 算法建模優化獲取不同工況下的最佳擋位數據。
首先將循環工況按時間離散為N個區段,每段時間間隔為1 s。設定由第k階段的電池耗電量ΔSsoc(k)和后備功率倒數的等效能耗Et(k)構成系統的狀態變量x(k),設定第k階段的擋位N(k)為系統的控制量u(k),則系統的狀態轉移方程可以表示為:
后備功率倒數等效能耗表達式為:
式中,Psb(k)為后備功率,為電機能夠輸出的最大功率與需求功率之差。
ΔSsoc(k)和Et(k)均越小越好,因此對兩者進行加權,并對換擋次數進行懲罰,構建目標函數。當0≤k≤N-1時,目標函數表達式為:
式中,S(k)為擋位是否改變的邏輯判斷值,擋位改變時取1,擋位不變時取0;λ為經濟性加權系數;c為懲罰因子。
該變速器僅有2 個擋位,因此應對控制量進行約束:
在擋位優化過程中,為了保證車輛平穩運行,還應該對電機輸出轉速和轉矩進行約束:
式中,nmmin、nmmax分別為電機轉速的最小值和最大值;Tmmin、Tmmax分別為電機當前轉速下的最小扭矩和最大扭矩。
優化過程所采用的循環工況設定為新歐洲駕駛循環(New European Driving Cycle,NEDC)工況和全球統一輕型車輛測試循環(Worldwide Light-duty Test Cycle,WLTC)工況的組合工況,然后基于DP算法對優化問題進行求解。DP算法求解過程分為2個步驟:逆向求解,從第N階段至起始階段逐個計算對應的控制變量以及目標函數的最優解;正向尋優,根據計算過程中保存的最優解提取最優擋位序列。
將經濟性加權系數λ在0~1.0 范圍內每間隔0.1 取一個值,基于DP算法進行優化,得到11組優化結果,如表2所示。

表2 不同經濟性加權系數優化結果
其中,當λ為0.9 和1.0 時耗電量相同,均達到了最佳經濟性,但是λ=0.9 時后備功率更大,因此設定λ=0.9時為最佳經濟性換擋,詳細結果如圖2所示。

圖2 動態規劃優化結果仿真曲線
由圖2 可以看出,DP 算法優化結果的耗電量為5.532 9 kW·h。該車型原裝固定速比減速器在相同循環工況下的耗電量為5.787 6 kW·h,搭載兩擋變速器并進行DP算法優化后耗電量降低了4.6%。
利用優化后的擋位數據構建初始擋位知識庫,其中部分數據如圖3所示。所建立的知識庫保存了車速、油門踏板開度、制動主油壓、電機轉速、SOC、經濟性加權系數及對應的擋位信息,為后續基于數據挖掘提取兩參數換擋規律和訓練基于知識的智能擋位決策模型奠定基礎。

圖3 初始擋位知識庫部分數據
為了驗證基于知識的智能擋位決策方法的優勢,利用相同知識庫中的數據集通過數據挖掘制定傳統靜態兩參數換擋規律。首先將擋位數據按照不同經濟性加權系數劃分為多個數據集,然后以油門踏板開度和車速為特征,基于SVM 算法針對每個數據集制定不同的兩參數換擋規律。
如圖4 所示,當特征為2 維時,SVM 算法可以找到一條最優分割線將數據分為兩類,同時使得每一類的支持向量與分割線幾何間隔最大。其中,支持向量為平面內每一類距離分割線最近的點,也就是每一類的分類邊界,這些點可以用于擬合升擋線和降擋線。

圖4 SVM原理示意
需要尋求的最優分割線表達式為:
式中,w為分割線的法向量;b為分割線的偏移量。
第j個樣本與分割線之間的函數間隔為:
式中,yj為第j個樣本的標簽;xj為第j個樣本的特征。
樣本中支持向量與分割線的幾何間隔為:
式中,xsv為支持向量,其與分割線之間的函數間隔為-1時,代表1 擋支持向量,函數間隔為1 時,代表2 擋支持向量。
在1擋支持向量和2擋支持向量之間仍存在難以分類的點,在目標函數中引入懲罰項及松弛變量可以解決此問題。最終,建立求解最優分割線與支持向量的優化問題模型,表達式為:
式中,C為懲罰因子;ξj為松弛變量;n為樣本容量。
由式(13)可知,引入懲罰項及松弛變量后可以允許某些點與分割線的函數間隔小于1,即允許某些點存在于支持向量與分割線之間,容許程度由懲罰因子調整。
上述優化問題通過拉格朗日乘子法變換為對偶問題,然后使用序列最小優化求解器進行求解,最終計算可得支持向量。將1 擋數據的部分支持向量插值得到降擋線,將2 擋數據的部分支持向量插值得到升擋線,構成該條件下的靜態兩參數換擋規律。其中,從經濟性加權系數為0.9 對應的DP 優化結果中提取的兩參數換擋規律如圖5所示。

圖5 λ=0.9時的兩參數換擋規律
以最佳經濟性換擋為例,將λ=0.9時基于SVM提取的兩參數換擋規律代入仿真模型中,在NEDC 與WLTC組合工況下進行仿真,仿真結果如圖6所示。

圖6 兩參數換擋規律仿真結果
從圖6 中可以看出,耗電量為5.696 kW·h,由于驅動電機有很長一段時間工作在7 000 r/min 以上的低效率區間,導致耗電量相較于DP 算法原始優化結果增加了3%。此外,換擋次數明顯增多。這種現象產生的原因是靜態兩參數換擋規律存在升擋線和降擋線,位于升、降擋線之間的點應該選取哪個擋位還取決于上一時刻的車速與油門踏板開度,難以做到最優決策。
通過SVM算法從初始擋位知識庫中提取的靜態兩參數換擋規律難以達到DP 算法優化結果的性能。此外,由于制定換擋規律使用的數據為離線優化數據,不包含駕駛員實際手動換擋的數據,難以反映駕駛員的實際駕駛風格。因此,可以在變速器換擋手柄上增加“強制1擋”和“強制2擋”的選項,采集實際駕駛員選擇“強制1擋”或“強制2擋”時的行駛數據,將數據補充至擋位知識庫,構建該駕駛員的專屬擋位知識庫。然后設計基于知識的智能擋位決策方法,通過智能擋位決策技術根據當前行駛信息直接計算出目標擋位。最后通過OTA技術將智能擋位決策模塊下載到實車上進行更新。受目前條件限制,本文將DP 算法優化結果假設為駕駛員專屬擋位知識庫,用于驗證基于知識的智能擋位決策方法的有效性。
以當前行駛信息為輸入,基于知識計算目標擋位,這屬于多維特征分類問題,可通過監督學習算法實現。LSTM 是一種基于深度神經網絡的監督學習算法,適用于具有強時序特征的擋位決策過程。LSTM記憶單元包括5個部分:用于保存長期狀態的單元狀態ct、用于描述當前輸入的單元狀態,以及遺忘門ft、輸入門it和輸出門ot。門是一層全連接層,其輸入是一個向量,輸出是一個0~1范圍內的實數向量,在訓練期間將更新門的權重向量和偏置項。
選擇時間窗為5 s,即LSTM 的特征輸入為5 s 內的車速、油門踏板開度、電機轉速、制動主油壓和SOC,輸出為當前時刻的目標擋位。為了驗證LSTM 模型在數據覆蓋不全面的情況下目標擋位的預測準確率,隨機選出85%的樣本數據訓練LSTM 網絡,然后用全部樣本數據進行驗證。預測準確率如圖7所示。

圖7 LSTM目標擋位預測準確率
兩擋變速器目標擋位預測問題是典型的二分類問題,為了驗證LSTM 的優越性,采用常用監督學習算法對相同訓練集進行訓練,包括邏輯回歸(Logistic Regression,LR)、K最鄰近(K-Nearest Neighbor,KNN)算法、SVM 和隨機森林(Random Forest,RF),然后采用相同測試集驗證,結果如表3所示。

表3 不同方法的目標擋位預測準確率 %
從表3 中可以看出,基于LSTM 的擋位決策模型預測準確率最高。由于LSTM的特征輸入為時序數據,能夠考慮時序特征和歷史特征,其余監督學習算法的特征輸入均為當前時刻數據,所以LSTM算法的預測準確率更高。
由于基于知識的LSTM 擋位決策可以直接根據車輛狀態計算目標擋位,不存在升、降擋線邏輯判斷產生的問題,只要保證LSTM 網絡的預測準確率,就能獲得與訓練數據集相同的經濟性和動力性。將LSTM 擋位決策模塊代入仿真模型中,以最佳經濟性換擋為例,對λ=0.9 時在NEDC 與WLTC 組合工況下進行仿真,結果如圖8所示。
對比圖8與圖2可以看出,由于LSTM算法預測準確率較高,擋位決策錯誤時僅可能導致提前換擋或延遲換擋1~2 s,因此循環工況下的仿真結果與DP算法優化結果非常接近。LSTM 擋位決策的耗電量為5.536 kW·h,相較于DP算法優化結果僅增加了0.056%。

對比圖8 與圖6 可以看出,在不考慮駕駛風格的情況下,相較于基于SVM提取的兩參數換擋規律,智能擋位決策方法的耗電量降低了2.88%,換擋次數也明顯減少,市郊工況下驅動電機基本不會工作在7 000 r/min以上的低效率區間。原裝固定速比減速器與兩擋變速器3種換擋規律的耗電量對比結果如表4所示。

表4 耗電量對比結果 kW·h
綜上所述,本文提出的基于知識的LSTM擋位決策模型具有更高的目標擋位預測準確率,且相較于基于SVM的傳統靜態兩參數換擋規律經濟性更佳。在未來的產品開發中,通過DP 算法優化訓練獲得足夠多的工況數據集,且包含實際駕駛員手動換擋的數據,即可獲得擋位決策精度高且更符合駕駛員風格的LSTM 擋位模型,通過OTA技術在線升級換擋規律,將會顯著提升純電動汽車兩擋變速器智能化水平。
本文首先建立了純電動汽車動力學模型,采用DP算法優化得到最優擋位時序數據,構建擋位知識庫,基于SVM提取不同條件下的靜態兩參數換擋規律。然后建立基于LSTM的擋位決策模型,該模型可通過OTA技術更新到實車上,實現基于知識的智能擋位決策。最后,通過對比仿真驗證了LSTM擋位決策的準確率和耗電量。可得到以下結論:
a.基于DP算法優化的純電動汽車兩擋變速器最佳經濟性換擋,相較于固定速比減速器耗電量降低約4.6%。
b.相較于基于其他常見監督學習算法的智能擋位決策,LSTM算法具有更高的擋位決策準確率。
c.基于知識的智能擋位決策相較于傳統兩參數換擋規律在換擋性能方面具有明顯提升。
d.基于知識的智能擋位決策可通過OTA 技術在線升級,實現符合駕駛員風格的擋位決策,有效提升純電動汽車兩擋變速器的智能化水平。