隨著經(jīng)濟(jì)水平和科技實(shí)力的不斷提升,汽車消費(fèi)市場逐漸擴(kuò)大,但面對(duì)全球范圍日益嚴(yán)峻的能源形勢和環(huán)保壓力,發(fā)展新能源汽車已成為社會(huì)可持續(xù)發(fā)展的重要戰(zhàn)略及市場新的增長點(diǎn)。其中,油電混合動(dòng)力汽車作為新能源車的一種,其技術(shù)相對(duì)成熟,且市場發(fā)展前景良好,成為傳統(tǒng)車向新能源汽車過渡的最好方式。一般來說,混合動(dòng)力汽車是具有2種或2種以上能量源來驅(qū)動(dòng)的汽車,現(xiàn)階段研究的多為由發(fā)動(dòng)機(jī)、電機(jī)、電池組構(gòu)成的HEV,分為串聯(lián)式、并聯(lián)式和混聯(lián)式。針對(duì)目前混合動(dòng)力汽車能量管理控制策略,一般分為兩大類:基于規(guī)則的控制策略和基于優(yōu)化的控制策略。本文針對(duì)混合動(dòng)力汽車能量管理控制方法進(jìn)行相關(guān)研究。
基于規(guī)則的控制策略包括基于門限值規(guī)則的控制策略和基于模糊規(guī)則的控制策略。其中基于門限值規(guī)則的控制策略,主要依據(jù)工程經(jīng)驗(yàn)和相關(guān)動(dòng)力部件的效率特性進(jìn)行設(shè)計(jì)。以當(dāng)前的車速、需求轉(zhuǎn)矩、SOC等為控制參量,通過一系列門限值將整車劃分成不同的工作模式,當(dāng)車輛運(yùn)行狀態(tài)滿足門限的切換條件時(shí),進(jìn)行模式的切換。該控制策略操作簡單,易于實(shí)現(xiàn),且計(jì)算量小,實(shí)時(shí)性好,但其燃油經(jīng)濟(jì)性較差,無法實(shí)現(xiàn)工況的自適應(yīng)[1]。
基于模糊規(guī)則的控制策略是在固定門限控制的基礎(chǔ)上,將預(yù)定義的控制規(guī)則通過輸入模糊化-模糊決策-輸出逆模糊化來達(dá)到優(yōu)化目的,具有較強(qiáng)的自適應(yīng)性和魯棒性。
由于基于規(guī)則的控制策略會(huì)陷入局部最優(yōu)解,得到的燃油經(jīng)濟(jì)性較差,因而提出基于優(yōu)化的控制策略,其中動(dòng)態(tài)規(guī)劃在能量管理方面可實(shí)現(xiàn)全局最優(yōu),是目前在控制理論中所能達(dá)到的車輛經(jīng)濟(jì)性最優(yōu)解。
基于優(yōu)化方法的控制策略包括實(shí)時(shí)優(yōu)化和全局優(yōu)化,其中實(shí)時(shí)優(yōu)化算法包含等效油耗最小原理(ECMS)、龐特里亞金最小值原理(PMP)、模型預(yù)測控制(MPC)等[1],通常結(jié)合一些智能算法,如遺傳算法(Genetic Algorithm,GA)、粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)、模擬退火 (Simulated Annealing,SA)等,實(shí)現(xiàn)能量管理系統(tǒng)的瞬時(shí)最優(yōu)。全局優(yōu)化算法主要包括動(dòng)態(tài)規(guī)劃(Dynamic Programming,DP)[2]、隨機(jī)動(dòng)態(tài)動(dòng)態(tài)規(guī)劃(Stochastic Dynamic Programming,SDP)。
基于實(shí)時(shí)優(yōu)化,針對(duì)能量管理系統(tǒng)(EMS),提出一種簡單、易優(yōu)化的數(shù)學(xué)表示法,得到使用遺傳算法進(jìn)行優(yōu)化的能量管理實(shí)時(shí)優(yōu)化系統(tǒng)[3]?;旌蟿?dòng)力系統(tǒng)中的第i裝置的功率Pi是負(fù)載功率P0的一部分,該部分的大小由系數(shù)γ決定。假設(shè)γ是負(fù)載功率的連續(xù)函數(shù),策略中的變量只有函數(shù)系數(shù)(即A,B,C,D)。將4個(gè)系數(shù)的常數(shù)值進(jìn)行優(yōu)化,取值范圍為[-1.2 1.2],其中A和C的值詳細(xì)說明可能由電池提供的負(fù)載功率的最大部分;B和C的值詳細(xì)說明負(fù)載功率γ函數(shù)的值達(dá)到A和C指定的最大值。使用GA作為優(yōu)化方法進(jìn)行EMS優(yōu)化,包括以下6個(gè)步驟[3]:
1)染色體編碼:函數(shù)參數(shù)取決于系數(shù)A、B、C和D,它們均經(jīng)過GA優(yōu)化。
2)進(jìn)行理論驅(qū)動(dòng)周期:分析不同SOC下的電力情況,然后將每個(gè)GA生成期間的解決方案與理論驅(qū)動(dòng)循環(huán)期間的能量消耗進(jìn)行比較。
3)選擇:最佳適應(yīng)個(gè)體具有重現(xiàn)Qmax的最高概率,最不適應(yīng)的個(gè)體具有重現(xiàn)Qmin的最低概率。
4)執(zhí)行交叉操作,重復(fù)m次。
5)進(jìn)行突變:防止GA局部的過多堆積。
6)進(jìn)行全局優(yōu)化:由GA執(zhí)行的代數(shù)取決于處理器的計(jì)算能力和TR的值,為了確保代數(shù)足以找到近似解,針對(duì)使用相同算法的NEDC全局優(yōu)化8次。
基于全局優(yōu)化控制策略,針對(duì)插電式混合動(dòng)力汽車,基于駕駛模式識(shí)別和動(dòng)態(tài)規(guī)劃,提出自適應(yīng)能量控制策略,瞬時(shí)成本函數(shù)包含電池能量損耗、燃料能量損失,基于貝爾曼最優(yōu)原理將兩點(diǎn)邊界問題分解為最小化序列問題,建立基于規(guī)則的多模式切換策略,具體步驟包括[3]:
1)從DP提取控制規(guī)則;
2)確定控制規(guī)則中的閾值;
3)DPR技術(shù)的建立;
4)將實(shí)際駕駛情景分類進(jìn)行驅(qū)動(dòng)模式的切換。
動(dòng)態(tài)規(guī)劃方法本質(zhì)上是一種非線性規(guī)劃方法,其核心是貝爾曼的最優(yōu)原理,雖然基于動(dòng)態(tài)規(guī)劃的能量管理控制策略得到的是理論上的最優(yōu)解,但是需要已知工況信息,無法實(shí)現(xiàn)在線控制。同時(shí)隨著狀態(tài)變量和控制變量維數(shù)的增加,傳統(tǒng)的動(dòng)態(tài)規(guī)劃后向求解的計(jì)算量和存儲(chǔ)量顯著增加,往往導(dǎo)致“維數(shù)災(zāi)”現(xiàn)象的發(fā)生。因此,基于自適應(yīng)動(dòng)態(tài)規(guī)劃(Approximate Dynamic programming,ADP)[4]的能量管理控制策略應(yīng)景而生。自適應(yīng)動(dòng)態(tài)規(guī)劃由3個(gè)部分組成,各個(gè)部分均可用神經(jīng)網(wǎng)絡(luò)來代替。其中,執(zhí)行網(wǎng)(Action network)用來近似最優(yōu)控制律,評(píng)價(jià)網(wǎng)(Critic network)用來近似最優(yōu)性能指標(biāo)函數(shù)。當(dāng)非線性系統(tǒng)未知時(shí),一般采用模型網(wǎng)(Model network)來近似非線性系統(tǒng)。常見的結(jié)構(gòu)是啟發(fā)式動(dòng)態(tài)規(guī)劃(HDP),其結(jié)構(gòu)如圖1所示:

圖1 HDP結(jié)構(gòu)示意圖[4]
在理論層面上,自適應(yīng)動(dòng)態(tài)規(guī)劃在非線性離散系統(tǒng)的軌跡跟蹤、最優(yōu)控制等問題上取得了一定的成果。針對(duì)非線性系統(tǒng)最優(yōu)控制問題[5],提出一種多步啟發(fā)式動(dòng)態(tài)規(guī)劃(MsHDP)和開發(fā)評(píng)價(jià)-決策神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其中評(píng)價(jià)網(wǎng)以最小二乘法計(jì)算神經(jīng)網(wǎng)絡(luò)的權(quán)值向量,決策網(wǎng)采用最速梯度下降法來更新神經(jīng)網(wǎng)絡(luò)的權(quán)值向量,將多步啟發(fā)式動(dòng)態(tài)規(guī)劃方法簡化為線性二次調(diào)節(jié)(LQR)問題。在二次啟發(fā)式動(dòng)態(tài)規(guī)劃(DHP)結(jié)構(gòu)的基礎(chǔ)上,提出一種全局二次式啟發(fā)動(dòng)態(tài)規(guī)劃,以處理離散時(shí)間非線性系統(tǒng)的近似最優(yōu)跟蹤控制。全局二次式啟發(fā)動(dòng)態(tài)規(guī)劃算法構(gòu)建3個(gè)神經(jīng)網(wǎng)絡(luò)分別計(jì)算系統(tǒng)動(dòng)力學(xué)誤差、成本函數(shù)及其梯度、每次迭代中的控制策略。其中,在當(dāng)前時(shí)刻調(diào)整評(píng)價(jià)網(wǎng)1的權(quán)值向量,評(píng)價(jià)網(wǎng)2僅用于計(jì)算下一時(shí)刻的近似成本函數(shù)。
在實(shí)際應(yīng)用層面,自適應(yīng)動(dòng)態(tài)規(guī)劃算法已在交通運(yùn)輸、電力系統(tǒng)、工業(yè)生產(chǎn)等方面展開應(yīng)用。
正是在以上自適應(yīng)動(dòng)態(tài)規(guī)劃算法理論研究的基礎(chǔ)上,基于自適應(yīng)動(dòng)態(tài)規(guī)劃的混合動(dòng)力汽車能量管理方法得以發(fā)展。由于汽車動(dòng)力系統(tǒng)已知,即非線性系統(tǒng)已知,則不需要用神經(jīng)網(wǎng)絡(luò)來近似非線性系統(tǒng),可以采用無模型網(wǎng)[6]的自適應(yīng)動(dòng)態(tài)方法進(jìn)行能量管理控制。將神經(jīng)網(wǎng)絡(luò)應(yīng)用于混合動(dòng)力汽車能量控制,提出一種基于長度比的神經(jīng)網(wǎng)絡(luò)能量管理策略,用于插電式混合動(dòng)力城市公交的在線控制。
目前各企業(yè)針對(duì)混合動(dòng)力汽車能量控制策略,在應(yīng)用層面上多采用基于規(guī)則的控制策略,近幾年隨著動(dòng)態(tài)規(guī)劃和自適應(yīng)動(dòng)態(tài)算法的發(fā)展,部分公司已經(jīng)針對(duì)基于動(dòng)態(tài)規(guī)劃、自適應(yīng)動(dòng)態(tài)規(guī)劃的能量控制策略進(jìn)行研究,實(shí)現(xiàn)油電配比的最優(yōu)控制及在線優(yōu)化控制,以使混合動(dòng)力汽車滿足動(dòng)力性要求的前提下,達(dá)到最佳燃油經(jīng)濟(jì)性。