李軍求,劉吉威,朱超峰
(北京理工大學電動車輛實驗室,北京 100080)
混合動力車輛能量管理問題(EMP)有著高度非線性、非凸性等復雜特征,且對計算量以及時間成本有著嚴格要求,如何實時優(yōu)化發(fā)動機、動力電池與電機之間功率分配并能實時工程應用,一直是混合動力車輛節(jié)能控制研究重點。
在已有研究中,EMP通常可分為兩大類:基于規(guī)則的控制方法和基于優(yōu)化的控制方法[1-4]。基于規(guī)則的控制方法通常依據(jù)相關工程經(jīng)驗與試驗數(shù)據(jù)對門限值進行設定,進而完成模式劃分和電機轉矩分配,控制實時性好,在工業(yè)應用方面較為廣泛[5-7],如豐田-普銳斯和比亞迪-秦等均采用該方法[8]。基于優(yōu)化的控制方法,是指確定目標函數(shù)和約束條件之后,對制定的控制策略采用優(yōu)化算法搜索最優(yōu)或次優(yōu)解[9-11]。在線優(yōu)化控制研究中,等效燃油消耗最小策略(ECMS)計算速度快,實時性好。Rezaei等[12]提出了一種自適應等效燃油消耗最小策略(AECMS),通過對車速進行預測并在預測時域內實現(xiàn)最優(yōu)控制,使該方法便于實時應用。
近年來使用模型預測控制(MPC)來實現(xiàn)在線控制,基于訓練好的模型來進行未來狀態(tài)的預測,并將其應用于有限時域內目標泛函的滾動優(yōu)化[13-15]。張潔麗[16]選定了基于多步馬爾科夫模型的預測方法進行車速與加速度預測,并將模型預測控制與動態(tài)規(guī)劃相結合,進行了優(yōu)化求解以減小計算量。Sun等[17]提出了一種監(jiān)督型預測能量管理的方法,通過對模型進行簡化在上層策略中對SOC進行規(guī)劃,以保證控制結果的全局最優(yōu)性。上述基于MPC控制的能量管理,一方面能夠通過對未來工況的信息進行預測,從而解決工況局限性問題,另一方面能夠通過在控制時域內滾動優(yōu)化,來實現(xiàn)近似最優(yōu),是一種非常具有應用前景的控制方法[18]。
但是,針對混合動力分布式驅動重型車輛,如何解決其工況復雜、底盤動力部件多、構型與驅動模式存在多重組合、難以實現(xiàn)能量高效管理的問題,目前研究尚未深入,有待于進一步探索。
本文中針對混合動力分布式驅動重型車輛,基于實車試驗數(shù)據(jù)提出著眼全局工況的RULE_LSTM算法獲取能耗最優(yōu)時變構型;基于交通流與徑向基神經(jīng)網(wǎng)絡獲取長短尺度工況信息用于后續(xù)策略輸入,完成在線構型匹配與SOC參考軌跡規(guī)劃;分別從基于時變構型的控制變量優(yōu)化、成本函數(shù)與約束條件強化、SOC參考軌跡引導3方面優(yōu)化MPC算法實現(xiàn)引導型多APU預測能量管理策略研究。整體算法框架如圖1所示。

圖1 整體算法框架
本文對象是某五軸分布式驅動重型車輛,采用串聯(lián)混合動力模式,動力部件布置如圖2所示。該車使用動力鋰電池組作為驅動能源部件,雙發(fā)動機發(fā)電機組作為輔助動力單元(APU),經(jīng)由一體化電源平臺整合功率后通過電機控制器(MCU)控制10個輪邊永磁同步電機,實現(xiàn)分別獨立驅動。考慮到該車在不同工況下的功率需求不同,以及電機效率對總需求功率求解的影響,選擇單APU+三軸驅動(構型1)、單APU+四軸驅動(構型2)、雙APU+三軸驅動(構型3)作為待匹配底盤構型。

圖2 整車能源部件布置
1.2.1 整車動力學建模
考慮對象車輛行駛過程中的縱向動力學特性,忽略車輛的橫向動力學和垂向動力學特性,對路面滑移和車輛轉向特性需求不做考慮。車輛行駛過程受到滾動阻力、坡度阻力、空氣阻力和加速阻力,其動力學方程為

式中:F是車輛驅動力;m是整車質量;v是當前時刻車速;g是當前地區(qū)的重力加速度,取9.81 m/s2;Cr是道路滾動阻力系數(shù);θ是當前道路坡度角;φ=(Crcosθ+sinθ)是道路總阻力系數(shù);ρ是空氣密度常數(shù);A是車輛迎風面積;Cd是空氣阻力系數(shù);Rw是車輪滾動半徑;no是不考慮滑轉滑移的車輪理論轉速;To是車輪所需驅動轉矩。具體參數(shù)見表1。

表1 整車與動力系統(tǒng)參數(shù)
1.2.2 發(fā)動機發(fā)電機組建模
發(fā)動機的燃油消耗是整車主要的能耗損失,其特性也影響整車性能。根據(jù)臺架試驗得到發(fā)動機外特性曲線、最佳燃油消耗曲線(BSFC)和發(fā)動機在工作區(qū)域的燃油消耗率。發(fā)動機的油耗計算公式為

式中:me是發(fā)動機工作過程的燃油消耗量;ne是發(fā)動機轉速;Te是發(fā)動機轉矩;m?e(ne,Te)是燃油消耗率;ts是發(fā)動機工作起始時間;te是發(fā)動機工作停止時間。
該車發(fā)動機與發(fā)電機之間經(jīng)由緩振聯(lián)軸器連接,動力傳遞過程存在的機械損失可忽略,根據(jù)臺架試驗得到發(fā)電機的效率map圖,發(fā)電機模型可以簡化為

式中:ng是發(fā)電機輸入軸轉速;Tg是發(fā)電機輸入軸轉矩;Pg是發(fā)電機輸出到直流母線的電功率;ηg是發(fā)電機效率。
1.2.3 驅動電機模型
根據(jù)電機外特性和效率標定試驗得到的試驗數(shù)據(jù)繪制map圖,采用實驗模型,實時性強,滿足車輛建模需求,見式(4)。

式中:gi是輪邊減速器減速比;nm是驅動電機轉速;Tm是驅動電機轉矩;x是不同底盤構型使用的驅動電機數(shù)目;f(Tm,nm)是查表函數(shù);ηm是驅動電機效率;Pm是驅動電機輸入功率。
1.2.4 動力鋰電池組建模
根據(jù)小電流充放電試驗得到開路電壓隨SOC變化的SOC-OCV曲線,根據(jù)動力電池脈沖試驗得到電池組內阻隨SOC變化的SOC-R曲線。忽略車輛行駛過程中電池組內部溫度的影響,采用內阻模型對動力鋰電池組建模,見式(5)。

式中:Pb是電池組輸出功率;Ib是電池組充放電電流;vocv是插值得到的當前時刻開路電壓;r是插值得到的當前時刻電池組內阻;soc是當前時刻SOC值;soc0是上一時刻的SOC值;Q是電池組容量。
本文中研究車輛曾在不同地區(qū)進行跑車試驗,選擇包含多個典型試驗場景(城市、高速、顛簸道路爬坡)的工況作為能量管理策略驗證的輸入,跑車試驗圖片如圖3所示。離線重放CAN報文信息,經(jīng)由隆貝格觀測器完成道路坡度估計,得到多段相同路線下的全局工況信息,包含車速和道路總阻力系數(shù)φ=(Crcosθ+sinθ),作為后續(xù)算法的輸入,某段全局工況信息如圖4所示。

圖3 跑車試驗圖片

圖4 全局工況信息
為同時滿足底盤構型切換延遲時間和算法求解的計算負擔,選定300 s作為提取多段典型樣本工況的窗口尺度,對多段全局工況進行片段劃分。本文選擇平均車速、最高車速和平均道路總阻力系數(shù)作為樣本工況的特征:

采用動態(tài)規(guī)劃算法,對已提取的200段樣本工況信息以能耗最小為目標,對象車輛采用串聯(lián)構型,電池SOC設定為維持型,起始終值SOC差值較小,為簡化計算,忽略了電池的電能消耗,因此目標函數(shù)設定為燃油消耗成本。進行離線全局最優(yōu)底盤構型匹配。成本函數(shù)與約束條件如下:

式中:i=1,2;Jfuel(t)是采樣點瞬時燃油消耗成本;Ce是轉換系數(shù),將成本函數(shù)尺度轉換為價值(元);u(t)是控制變量,選取為發(fā)動機轉速、轉矩;ne_min、ne_max分別是發(fā)動機轉速約束上下限;Te_min、Te_max分別是發(fā)動機轉矩約束上下限;發(fā)電機轉速轉矩約束范圍ng_min、ng_max、Tg_min、Tg_max的取值和發(fā)動機相同;socmin、socmax是動力電池組行駛過程中荷電狀態(tài)(soc(t))的約束范圍,本文研究車輛采用串聯(lián)架構,電池SOC設置為維持型,波動上下限范圍狹小,設定為0.6和0.8;Ib_max是最大充放電電流。
以3段典型場景下樣本工況為例,對應的DP算法求解結果見表2。

表2 DP求解結果
表中“匹配構型”指不同工況下選擇的底盤構型。根據(jù)上述結果對200段工況片段添加標簽值,也就是最佳底盤構型。對樣本工況數(shù)據(jù)進行歸一化處理:

式中:x是待處理變量;xˉ是變量均值;std是標準差函數(shù)。
按70∶15∶15的比例劃分為訓練集、驗證集和測試集,作為LSTM網(wǎng)絡的輸入數(shù)據(jù)[19]。序列輸入層的維度是3,LSTM隱藏層的網(wǎng)格數(shù)是100,輸出層的維度是3,配置分類層,損失函數(shù)用交叉熵函數(shù)。損失函數(shù)和分類準確率如圖5所示。

圖5 訓練迭代結果
準確率最終迭代到97.07%,損失函數(shù)最終迭代到0.001 2。由未使用的30個樣本工況驗證網(wǎng)絡,并與DP求解的最優(yōu)底盤構型對比,識別準確率為100%。因此可以實現(xiàn)對輸入工況的正確選擇最優(yōu)構型。
車輛在行駛過程中缺乏全局工況先驗,需要進行工況信息預測。本文中采用多尺度工況信息預測,即從交通流獲取長尺度工況信息用以匹配能耗最優(yōu)底盤構型;同時采用RBF神經(jīng)網(wǎng)絡進行短尺度車速預測用以作為后續(xù)能量管理算法的輸入工況實現(xiàn)功率分配。
底盤構型切換需要長時間尺度工況信息,本文采用交通流仿真模擬智能交通系統(tǒng)技術系統(tǒng)(ITS)獲取長期工況信息。基于全局工況對應路線,經(jīng)由VISSIM軟件配置車道、車輛、車流量信息,同時配置沖突區(qū)域等路徑?jīng)Q策,相隔1 km設定記錄數(shù)據(jù)節(jié)點,最終得到包含平均車速和道路總阻力系數(shù)的全局平均工況,如圖6所示。

圖6 全局工況信息
由于LSTM擇優(yōu)網(wǎng)絡針對3類典型工況構建,在工況切換下存在構型識別精度低的問題,因此本文結合LSTM和規(guī)則判斷完成長尺度工況預測點更新和構型判斷,算法偽代碼見表3。

表3 RULE_LSTM算法偽代碼
以全局工況信息為例,采用動態(tài)規(guī)劃算法按照固定300 s尺度對工況進行離線能耗最優(yōu)構型驗證,其與LSTM算法與RULE_LSTM算法識別的底盤構型結果(以車速信息為例)如圖7所示。

圖7 不同算法底盤構型擇優(yōu)結果
相比于LSTM神經(jīng)網(wǎng)絡,在1 500-1 800 s的工況切換階段,采用RULE_LSTM算法構型選擇結果動態(tài)規(guī)劃標注構型相同;在4 200-4 500 s工況切換階段,RULE_LSTM算法的構型選擇與動態(tài)規(guī)劃標注構型有差異。RULE_LSTM算法在全局工況下,構型識別準確率為95%,相比于LSTM神經(jīng)網(wǎng)絡全局85%的構型擇優(yōu)準確率,提高了11.76%,驗證了其在構型選擇上(尤其是工況切換階段)提高準確率的可行性。
LSTM網(wǎng)絡與RULE_LSTM算法更新的節(jié)點和對應構型見表4。

表4 交通流信息更新節(jié)點對比
RULE_LSTM算法構型的更新節(jié)點為22個,比固定LSTM多兩個,但底盤構型切換4次,相比固定LSTM(切換6次),構型切換頻繁程度降低了33.3%,實現(xiàn)以算法預測更新、節(jié)點頻繁程度作為代價,減少了底盤構型頻繁切換帶來的動態(tài)燃油消耗和機械壽命損失。
由RULE_LSTM算法求取的最優(yōu)構型,與長尺度工況信息一起作為DP算法輸入,以能耗最優(yōu)為目標獲取的SOC參考軌跡,在后續(xù)能量管理算法中為SOC提供時變約束,完成引導。
由交通流獲取的長期工況信息,時域跨度大,信息更迭慢,難以作為能量管理策略實時輸入工況,因此本文采用RBF神經(jīng)網(wǎng)絡來進行短尺度車速信息進行預測[20],如圖8所示。

圖8 徑向基神經(jīng)網(wǎng)絡預測車速示意圖
網(wǎng)絡訓練與驗證的輸入信息比原始工況信息(等時域歷史車速序列)增加了由主成分分析選取的工況特征:平均車速、最大車速、平均加速度、最大加速度。選取某600 s高速工況片段作為網(wǎng)絡驗證輸入,選擇不同尺度的預測時域Hp=5,10,15 s,預測結果如圖9所示。

圖9 車速預測結果
采用均方根誤差(RSME)反映車速預測值的偏離程度,作為不同預測時域下車速預測的準確性評價指標:

式中:k是輸入工況長度;RMSE是整段工況的均方根誤差;RMSE(i)是工況內每個采樣點(1 s)的均方根誤差;Hp是預測時域;Vpre(i+j)是i時刻、時間向后j的預測車速;Vtrue(i+j)是i時刻、時間向后j的真實車速。不同預測時域對應的均方根誤差如表5所示。

表5 不同預測時域均方根誤差
兼顧MPC算法對預測時域長度的要求以及短期車速預測的精度,選擇10 s作為預測時域,與無特征預測模型的均方根誤差對比見表6。

表6 不同網(wǎng)絡車速預測均方根誤差
可見增加主成分分析得到的工況特征訓練出的徑向基神經(jīng)網(wǎng)絡,均方根誤差降低了6.28%,更適合作為短時間尺度工況預測模型。
為解決對象車輛底盤部件多、能量管理難的問題,本文中采用MPC算法,從控制變量優(yōu)化、成本函數(shù)與約束條件優(yōu)化、電池SOC參考軌跡引導3方面完成改進,最終提高燃油經(jīng)濟性。
算法采用能耗最優(yōu)時變構型,依據(jù)構型對控制變量降維,實現(xiàn)計算簡化。當采用單APU構型時,控制變量為發(fā)動機轉速和轉矩;當采用雙APU構型時,引入發(fā)動機最佳燃油消耗曲線預設區(qū)間,控制變量選擇為兩發(fā)動機轉速。具體公式如下。

式中:i=1,2;u(t)是控制變量;N(t)、k(t)是不同底盤構型中發(fā)動機和電機工作點序號;x(t)是狀態(tài)變量,選擇電池SOC;d(t)是系統(tǒng)擾動變量,選擇車速、加速度和道路總阻力系數(shù);y(t)是求解輸出變量,包含成本、電池功率、發(fā)電機功率、雙發(fā)動機轉速與轉矩。
能量管理問題求解過程需要定義成本函數(shù)Jfuel(t),考慮到底盤構型切換與行駛過程中的發(fā)動機轉速變化會帶來額外的動態(tài)燃油消耗,本文成本函數(shù)包含3部分,分別是發(fā)動機靜態(tài)油耗成本、動態(tài)消耗(底盤構型切換和行駛過程中的發(fā)動機轉速變化會帶來額外的動態(tài)燃油消耗)和SOC溢出懲罰消耗(SOC超過閾值所致),成本統(tǒng)一尺度為價格(元),具體計算公式如下。

式中:Jall是工況全程燃油消耗;Jfuel(t)是采樣點瞬時燃油消耗;O(u(t))是發(fā)動機動態(tài)燃油消耗,與發(fā)動機轉速變化?(ne(t))和時變懲罰函數(shù)δ(ne(t))相關;P(x(t))是SOC溢出懲罰;Cb是轉換系數(shù)。
能量管理算法求解過程需要滿足預設約束條件,本文研究的車輛采用串聯(lián)式構型,動力電池為維持型,求解過程的約束條件為

式中:i=1,2;ne_min、ne_max是發(fā)動機轉速約束上下限;?ne_min、?ne_max是發(fā)動機轉速變化率約束上下限;Te_min、Te_max是發(fā)動機轉矩約束上下限;發(fā)電機轉速轉矩約束范圍ng_min、ng_max、Tg_min、Tg_max取值和發(fā)動機相同;socmin、socmax是動力電池組行駛過程中荷電狀態(tài)(soc(t))的約束范圍,本文對象車輛采用串聯(lián)架構,電池SOC設置為維持型,波動上下限范圍狹小,設定為[0.6,0.8];socT_min、socT_max分別是動力電池組終止時刻荷電狀態(tài)(soc(T))的約束范圍,設定為交通流獲取的長期工況經(jīng)由DP算法求得的SOC參考軌跡;Ib_max是最大充放電電流。
求解配置方面,為了平衡收斂情況與計算時長,將狀態(tài)量網(wǎng)格數(shù)目設定為40,控制量網(wǎng)格數(shù)目設定為60,為了防止約束沖淡,將懲罰系數(shù)設定為104。
4.4.1 采用SOC參考軌跡結果對比
算法輸入工況為第3節(jié)中構建的多尺度工況,在相同輸入工況下,采用相同成本函數(shù)與約束條件(增加轉速變化率約束)、時變能耗最優(yōu)構型時,采用固定終值SOC約束、SOC參考軌跡引導、動態(tài)規(guī)劃算法的SOC軌跡對比如圖10所示。

圖10 不同算法SOC軌跡比較
采用固定終值SOC約束區(qū)間時,受到預測時域限制,SOC軌跡更穩(wěn)定,終值為0.696。采用SOC參考軌跡引導時,SOC變化趨勢更趨向DP算法,SOC變化大,但終值為0.682,在理想約束范圍內。同時一定程度解除了預測時域的限制,需求功率變化劇烈時電池功率強跟隨進行功率補充,符合串聯(lián)構型的布置理念,彌補APU動態(tài)響應延遲的缺點,采用局部SOC下降作為代價實現(xiàn)功率更優(yōu)分配,優(yōu)于SOC固定約束區(qū)間。
SOC固定約束區(qū)間和SOC參考軌跡時變的成本對比如圖11所示。

圖11 不同算法成本比較
采用SOC固定區(qū)間約束時,全局成本為428.166 1元;用SOC參考軌跡時變區(qū)間約束時全局成本為419.359 8元,全局成本降低了2.06%。
4.4.2 有無轉速變化率約束結果對比
相同輸入工況下,采用相同成本函數(shù)、時變最優(yōu)構型及采用SOC參考軌跡時,是否增加發(fā)動機轉速變化率約束的成本對比如圖12所示。無轉速變化率約束下對象車輛全局成本為436.595 7元,增加轉速變化率約束后的成本為419.359 8元,全局成本降低了3.95%。

圖12 轉速變化率約束成本對比
增加轉速變化率約束后的發(fā)動機工作點分布對比如圖13所示。可知約束條件變更前后發(fā)動機工作點都位于最佳燃油經(jīng)濟曲線附近。增加轉速變化率約束,發(fā)動機輸出功率需求較低時,轉速轉矩變化小,符合約束條件要求,工作點分布變化較小;發(fā)動機輸出功率需求較高時,轉速轉矩變化大,受到約束條件鉗制,發(fā)動機工作點在1 600-2 200 r/min段增加,2 200-2 800 r/min段減少,發(fā)動機短期內工作點跨轉速區(qū)間的大范圍階躍跳變減少,轉速變化在合理變化范圍內,工作點集中于燃油消耗較低區(qū)域的BSFC曲線附近,有助于改善燃油經(jīng)濟性。

圖13 發(fā)動機工作點分布對比
4.4.3 不同構型結果對比
相同輸入工況下采用相同成本函數(shù)、約束條件和SOC參考軌跡時,采用不同底盤構型對應的成本對比如圖14所示。采用能耗最優(yōu)時變底盤構型成本為419.359 8元,采用固定底盤構型1、2、3的成本分別為462.910 7、469.063 0、426.850 3元,即采用控制變量優(yōu)化后全局成本相對固定構型分別降低了9.41%、10.60%、1.75%。

圖14 不同底盤構型成本對比
需求功率變化時,采用時變能耗最優(yōu)底盤構型可以避免電池組輸出功率激烈波動造成的壽命損失。圖15顯示了不同底盤構型下的電池組功率輸出。采用時變構型時,電池組功率絕對值均值較采用固定構型分別降低了69.85%、69.42%、34.12%,方差分別降低了84.02%、83.96%、37.99%。可知相比于固定底盤構型,采用時變構型時電池組功率波動頻率較緩,振幅更小。

圖15 不同底盤構型全局電池組功率對比
4.4.4 算法有效性分析
為驗證本文提出算法的有效性,在相同輸入工況下,選取動態(tài)規(guī)劃算法作為最優(yōu)上限對標基準、基于規(guī)則控制的功率分級算法作為橫向對比驗證的下限基準。三者的SOC對比結果見圖16。可知3類算法的SOC終值都收斂到預設區(qū)間,DP算法著眼于全局工況,動力電池組的充放電程度更深,更多地承擔功率的補充和吸收;規(guī)則分級算法缺少預測模型,SOC波動小,電池充放電程度較淺,發(fā)動機發(fā)電機組承擔主要輸出功率,保障SOC穩(wěn)定。本文策略更加接近于動態(tài)規(guī)劃SOC變化趨勢,優(yōu)于規(guī)則分級策略。

圖16 3類算法SOC變化趨勢對比
三者成本對比見圖17,可知DP算法全局成本為415.549 5元,基于規(guī)則分級策略全局成本為438.946 2元,本文提出策略全局成本為419.359 8元,比規(guī)則功率分級策略成本降低了4.46%,但比動態(tài)規(guī)劃最優(yōu)上限成本高3.810 3元。可知該算法更加貼近全局最優(yōu)的上限基準,有效提高了對象車輛燃油經(jīng)濟性。

圖17 3類算法全局成本對比
本文針對混合動力分布式驅動重型車輛底盤部件多、能量高效管理難的問題,基于多尺度工況信息預測完成時變能耗最優(yōu)構型匹配,并針對MPC算法完成優(yōu)化,實現(xiàn)燃油經(jīng)濟性的提高。
(1)根據(jù)實車試驗數(shù)據(jù)提出RULE_LSTM算法用于在線能耗最優(yōu)構型匹配,全局工況下構型準確率為95%,較LSTM神經(jīng)網(wǎng)絡提高11.76%,構型切換頻繁程度降低了33.3%。
(2)基于交通流信息更新長尺度工況,完成能耗最優(yōu)構型匹配及SOC參考軌跡規(guī)劃;短尺度工況預測結合原始工況信息與提取特征,采用10 s預測時域的RBF神經(jīng)網(wǎng)絡完成預測,供給MPC算法輸入工況序列。
(3)算法接收短尺度工況序列、時變最優(yōu)匹配構型與SOC參考軌跡,分別從時變構型優(yōu)化、成本函數(shù)及約束條件、SOC參考軌跡引導3方面對算法進行優(yōu)化,實現(xiàn)引導型多APU預測能量管理算法開發(fā)。仿真結果顯示,較優(yōu)化前全局成本分別降低了10.60%、3.95%、2.06%,比規(guī)則分級策略降低了4.46%。