胡 松,王賀春,王銀燕,張金羽,楊福源
(1. 清華大學 汽車安全與節能國家重點實驗室,北京 100084; 2. 哈爾濱工程大學 動力與能源工程學院,黑龍江 哈爾濱 150001)
節能和減排是當代發動機領域面臨的兩大挑 戰[1-3].為了實現發動機的節能減排,許多先進的技術被提出并應用在發動機領域,導致先進發動機通常以復雜的控制策略和大量的控制變量為特征[4].隨著當代發動機電子控制單元(ECU)計算能力的快速增加,實現復雜的控制和算法成為可能.柴油機排放特性與缸內燃燒過程十分相關[5-6],通過對EGR率、噴油壓力、噴油始點、噴油次數、噴油量和進氣壓力等柴油機運行參數進行協同控制,可以實現排放和燃油消耗率的優化控制,而建立實時預測模型實現對排放和燃油消耗率在線優化控制是實現節能減排的重要前提.多次噴射發動機因其可兼顧排放和油耗特性,已成為未來發展的必然趨勢,因而很多學者將精力投入到多次噴射發動機實時預測模型的研究中[7-8].
發動機實時預測模型可分為發動機零維(0-D)物理模型和直接模型,其中0-D物理模型具有良好的預測能力,物理含義豐富且建模所需數據較少.常見的用于0-D物理模型的燃燒建模方法主要有基于燃燒規則的方法、基于現象學的方法和累積燃油質量方法,其中累積燃油質量方法最適合用于多次噴射發動機燃燒建模[7-10].在基于累積燃油質量方法的發動機0-D物理模型理論框架及其校準方法研究中,Finesso等[7-9]和Catania等[10]已成功將其應用在多種型號的多次噴射發動機,但模型中待校準參數和發動機運行參數間映射關系辨識方法仍不明確.
對于參數間映射關系的辨識,比較傳統的方法有響應面、Map圖插值和經驗公式(EF)等,普遍應用于發動機仿真、優化和控制領域[11-12].但是隨著越來越多的新技術被應用在發動機上,發動機系統已成為多輸入、多輸出的復雜系統,輸入參數對輸出參數的影響機理較為復雜,使得響應面和Map圖插值方法難以實現[13].EF方法通常需要選擇或提出合適的函數結構和形式才能實現較高精度的辨識[13].由于選擇或提出合適的函數結構和形式比較困難,且具有很大的人為偶然性和隨機性,因而此方法比較耗費人力.但因其對數據量要求很少,計算耗時極短,滿足實時性要求,仍常見于一些研究中[9].
近些年支持向量機、遺傳算法和人工神經網絡(ANN)等人工智能算法在各個研究領域都發展十分迅速,其中ANN具有高效、強適應性及高穩定性,已成為相對較為強大的候選算法之一[14].但是ANN對數據量要求較多,且對數據誤差比較敏感.盡管ANN已經在發動機領域得到了廣泛的應用,但是當ANN用于面向控制的發動機模型,尤其是物理模型中的參數間映射關系辨識時,辨識效果和所建立的模型在穩態工況、瞬態工況的預測精度和計算耗時等性能指標是否滿足實時性控制要求方面仍有待驗證.此外,對EF和ANN兩種方法在發動機預測模型參數映射關系辨識的應用也鮮見報道.
筆者基于前期關于多次噴射柴油機實時預測模型的研究基礎,分別采用EF和ANN兩種方法辨識輸入/輸出參數之間的映射關系,最終建立基于EF和基于ANN的多次噴射柴油機實時仿真模型,并在穩態和瞬態工況對兩種模型進行預測性能對比,在快速原型設備上進行計算耗時對比.
研究對象為菲亞特汽車公司(FIAT)生產的四沖程、水冷、高壓共軌、多次噴射3.0L歐Ⅵ柴油機,配有VGT和高壓EGR系統,其主要技術參數如表1所示,所采用的主要測試儀器及測試方法參見文獻[4],主要測試儀器的技術參數如表2所示.試驗臺架布置及詳細描述參見文獻[4].研究共進行了410個重載車用發動機瞬態測試循環(WHTC)范圍內穩態測試工況點試驗,包括3部分:試驗1為整個柴油機Map圖工況,包含了基本運行參數,共123個測試點;試驗2為幾個主要特定工況點下的EGR掃描(EGR-sweep)試驗測試,共162個測試點;試驗3為幾個主要的特定工況點下進行主噴定時/噴油壓力掃描(SOImain/pf—sweep)試驗測試,共125個測試點.穩態測試工況點分布參見文獻[4].

表1 歐Ⅵ柴油機主要技術參數 Tab.1 Main specifications of Euro Ⅵ diesel engine

表2 測試儀器主要技術參數 Tab.2 Main technical specifications of test instruments
筆者采用的多次噴射柴油機燃燒過程仿真模型框架[4]主要包括缸內放熱率qch、傳熱損失Qht、燃油蒸發吸熱qf,evap、最高燃燒壓力(PFP)、燃燒指數(MFB50)和平均有效壓力(BMEP)的仿真模型建模方法.模型的具體理論依據、搭建過程及模型框架參見文獻[4,15],筆者只對模型中變量進行簡要描述.
Qht,glob為燃燒過程總的傳熱損失,KP為預噴燃燒對應的燃燒參數,τP、τM分別為預噴和主噴滯燃期,K1,M和K2,M為主噴燃燒對應的燃燒參數,pIVC為進氣閥關閉(IVC)時的缸內壓力,pint為進氣歧管壓力,Δpint為pIVC和pint之間的壓差,從IVC到SOC以及膨脹沖程(從燃燒結束(EOC)到EVO),缸內壓力可以分別認為是具有不同多變指數的多變過程.m和m′分別為壓縮和膨脹過程對應的多變指數,PMEP為泵氣壓力損失,FMEP為摩擦損失,n為柴油機轉速,prail為共軌壓力,SOIP和SOIM分別為預噴和主噴對應的噴射角度(以下止點后作為參考點),qtot,P為預噴噴油量,qM為主噴噴油量,qtot為總噴油量,pint和Tint為進氣管空氣壓力和溫度,VEGR為EGR系統高壓廢氣閥開度,ρSOI,P和ρSOI,M分別為預噴和主噴對應的缸內氣體密度,TSOI,P和TSOI,M分別為預噴和主噴對應的缸內氣體溫度,ρSOC,P和ρSOC,M為預噴和主噴燃燒始點對應的缸內氣體密度,TSOC,P和TSOC,M為預噴和主噴燃燒始點對應的缸內氣體溫度,ρint為進氣密度.
表3為基于經驗公式各因變量參數的擬合精度.圖1為部分經驗公式的擬合結果,其中,RMSE為均方根誤差,RMSEr為相對均方根誤差.為了得到高精度的面向控制的柴油機預測模型, 柴油機模型中所有需要辨識的參數均應該采用數學方法直接或間接地與柴油機運行參數相關聯.胡松等[4]已將直接測量參數、衍生參數作為候選自變量,采用敏感度分析方法得出基于冪函數的經驗公式,并分析冪函數的固有缺陷和一些參數的固有特性,對部分經驗公式 進一步改善,最終得出基于經驗公式的參數間映射關系.基于相同的數據,筆者擬采用ANN算法實現參數間映射關系的辨識.

表3 基于經驗公式各因變量參數的擬合精度 Tab.3 Fitting precision of each dependent parameter in diesel engine model based EF-model

圖1 基于經驗公式的各因變量參數映射關系擬合結果 Fig.1 Fitting results of each parameter in diesel engine model based on EF
基于各因變量參數和對應的自變量參數集間的映射關系及其決定系數擬合精度R2[4],得出各個因變量對應的自變量集及基于EF的擬合精度.
獲得ANN模型包括參數選擇、訓練和測試共3個步驟.輸入/輸出數據通常會進行歸一化處理,使輸入/輸出數據轉化到一個特定的變化范圍;歸一化處理后的輸入/輸出數據再隨機分成訓練、測試和(或)驗證數據集.在ANN建立之前,首先需要確定輸入/輸出變量參數的選取、隱含層個數、隱含層節點數、激活函數和訓練算法[14]等參數.Lawrence等[16]研究發現,規模太小的ANN會導致欠擬合(underfitting),而規模太大的ANN卻會引起過擬合(overfitting).因而在數據給定的情況下,需確認一個合適規模的ANN.
確定了各個因變量參數的自變量集(表3),筆者將沿用得出的各個因變量參數的自變量集.為便于對比EF和ANN的性能,筆者采用和第3節相同的數據和自變量集.
前饋(BP)神經網絡是普遍應用的神經網絡,包含一個輸入層、若干隱含層和一個輸出層.誤差反饋訓練算法trainbr是人們熟知的BP訓練算法之一,此訓練算法可訓練得出相對精確的ANN[17-18],并且對于復雜非線性、數據規模小或者數據噪聲信號多的訓練數據[19],仍可訓練得出相對好的ANN,但存在訓練迭代次數較大的缺點.筆者選取的訓練用數據規模(410個工況點數據)比較小,并且神經網絡結構較為簡單,因而訓練迭代次數較大并不會導致訓練用時 過長而不可接受.故采用前饋ANN、BP訓練算法trainbr作為ANN的訓練算法.
對于很多ANN,為了提高訓練速度,輸入數據通常先采用歸一化函數進行處理,然后再傳遞給輸入 層[20].筆者采用mapminmax歸一化處理函數[20]將所有輸入數據變化范圍轉換至[-1,1]區間內.相似地,神經網絡的輸出也需要與輸入層歸一化函數對應的處理函數.輸出數據處理函數用于將提供的目標矩陣進行轉換,然后用于訓練神經網絡[20].
ANN的輸出由激勵函數調整,激勵函數有多種,其中logsig、tansig和purelin為發動機領域常見的3種激勵函數,而前兩種的應用更為普遍.Negnevitsky[21]研究發現,tansig相比logsig,其訓練速度更快.另外,tansig輸出數值在-1~1之間變化,而logsig輸出數值在0~1之間變化,因而tansig相比logsig在數據分析上具有優勢[14].激活函數采用tansig函數,定義為

單層隱含層足以用于仿真發動機模型中的變量關系,并且已經在文獻[22—24]中得到驗證.因而隱含層個數選為1.
訓練ANN過程中,將平均方差(MSE)作為損失函數,因為MSE具有良好的凸性、對稱性和可微性,并且還是優化過程中很好的衡量指標[25].ANN預測性能采用其輸出結果和試驗數據的回歸分析進行評估[18].筆者采用MSE和回歸分析的決定系數R2衡量ANN的性能.ANN的建立及訓練過程均在Matlab 2017b平臺上進行.
ANN預測性能受神經節點數影響較大.過多的隱含層節點數會導致過擬合現象,而過少的隱含層節點數會導致神經網絡結構過于簡單,不能較好地捕捉到復雜系統的特性,即欠擬合現象[16].因而隱含層節點數和ANN的預測性能之間存在折中關系.
所有穩態試驗數據(共410個數據點)均用于生成ANN模型.其中80%的數據作為訓練用數據,另外20%的數據作為測試數據,用于測試訓練好的ANN的預測性能.對于訓練用數據規模較小的情況,由于ANN的權值矩陣是隨機生成的,因而訓練結果存在一定的不確定性.可知,即使采用同樣的訓練數據訓練得出的ANN,其預測性能也會存在明顯不同.此外,對于每次訓練過程,訓練用數據和測試用數據是從所有試驗數據中隨機分配得出的,因而訓練用數據和測試用數據也會發生變化.訓練用數據和測試用數據的不同也會導致訓練得出的ANN預測性能存在明顯不同.只有當試驗數據規模足夠大時,訓練得出的ANN預測性能的不確定性會很小[26].
筆者對隱含層節點數Nh和ANN預測性能之間的trade-off關系進行研究,以在特定數據量的情況下獲取最合適的ANN結構,避免過擬合和欠擬合.對于每個因變量,分別計算得出100次重復訓練并測試的決定系數R2和MSE的平均值,筆者僅展示K1,M的trade-off分析結果及過程,如圖2所示.可知ANN的100次訓練平均誤差隨Nh的增加而減小,當Nh超過8之后,減小幅度較??;而測試誤差先隨Nh增加而減小,ANN處于欠擬合狀態,當超過6之后,測試誤差無明顯變化甚至出現惡化,ANN處于過擬合狀態.可知,對于K1,M,最佳Nh為6.同理,對于每個因變量,都存在一個最合適的Nh以使訓練得預測性能良好的ANN可能性最大,從而確定各個因變量最適合的Nh,最終確定的Nh及對應的100次訓練和測試精度(R2和MSE)平均值如表4所示.

表4 各因變量ANN隱含層節點數以及100次訓練和測試精度平均值 Tab.4 Neuron number and corresponding precisions’mean value of 100 training trails for each dependent parameter

圖2 K1,M ANN預測性能和隱含層節點數Nh的trade-off關系 Fig.2 Trade-off correlation between ANN predictive performance and hidden layer node number Nh for K1,M
由于ANN的訓練用數據規模較小,訓練得出的ANN精度存在一定隨機性.為了訓練得出一個預測性能相對較好的ANN,每個ANN均訓練并測試了100次,并且每次訓練均進行隨機設定權值矩陣初始值,隨機分配訓練和測試用數據.為了從100次訓練得出的ANN中自動篩選出預測性能較好的ANN,設計一個ANN自動篩選算法,如圖3所示.

圖3 重復100次訓練最優ANN自動篩選算法 Fig.3 Automatic algorithm for selecting the best trained ANN from 100 training trails
自動篩選算法中:i為訓練次數;N為最大訓練次數;ANNb為該算法篩選出的最優ANN訓練結果;ANN(i)為第i次訓練得出的ANN;R2(i,1)、R2(i,2) 和R2(i,3)分別為訓練、測試和整體數據(即訓練和測試數據的整體數據)的R2精度;MSE(i,1)、MSE(i,2)和MSE(i,3)分別為訓練、測試和整體數據的MSE精度;abs為絕對值函數.
最終,經過100次重復訓練,并從中篩選得出各個因變量參數的最優ANN模型,訓練值、測試值與試驗值對比如圖4所示,出于精簡目的,此處只展示τP、τM、KP、K1,M和K2,M的對比結果.

圖4 基于ANN的各因變量參數映射關系擬合結果 Fig.4 Fitting results of each parameter in diesel engine model based on ANN
對于各個因變量參數,其基于ANN的擬合精度和基于EF的擬合精度對比如表5所示.可知,ANN可以很好地擬合并預測各個因變量參數和對應自變量之間的關系,并且其擬合及預測精度均明顯高于EF.表明ANN具有較好擬合柴油機模型中變量間關系的能力.和EF相比,采用ANN不用考慮函數的形式和結構問題,并且預測精度更好.

表5 ANN和經驗公式擬合精度R2 Tab.5 Precision of ANN and empirical functions correlations
采用EF和ANN變量間映射關系,基于面向控制的多次噴射柴油機物理模型理論框架,分別建立基于EF的柴油機物理模型(EF模型)和基于ANN的柴油機物理模型(ANN模型),筆者將針對兩種模型的預測性能及計算耗時進行對比.
對所建立的EF模型和ANN模型,分別在穩態工況和WHTC瞬態工況的預測性能進行了驗證.圖5和圖6分別為EF模型和ANN模型在穩態工況和瞬態工況下的仿真結果.為便于直觀表示MFB50滯后于發火上止點的曲軸轉角位置,圖5和圖6中采用MFB 50-360表示.
由圖5和圖6可知,在穩態工況,對于MFB50、PFP和BMEP,基于EF模型的2R、RMSE和均方誤差MSE預測精度分別為[R2=0.975,RMSE=0.631,MSE=0.3980]、[R2=0.995,RMSE=1.820,MSE=3.3100]和[R2=0.999,RMSE=0.153,MSE=0.0233];基于ANN模型的預測精度分別為[R2=0.985,RMSE=0.483,MSE=0.2330]、[R2=0.995,RMSE=1.580,MSE=2.5000]和[R2=0.998,RMSE=0.170,MSE=0.0289].在瞬態工況,對于MFB50、PFP和BMEP,EF模型的RMSE預測精度分別為1.2°CA、1.05MPa和0.07MPa;ANN模型的預測精度分別為1.2°CA、1.38MPa和0.08MPa.ANN模型在穩態工況的預測精度高于EF模型,但是在瞬態工況,其預測精度(尤其是PFP)出現明顯惡化,低于EF模型.主要原因在于,模型中參數存在校準誤差和不確定性,ANN相比EF具有更強的非線性擬合能力,可以實現更好的非線性擬合,但是對參數誤差和不確定性更加敏感.對于模型參數來說,校準誤差和不確定性較高,因而EF更適合用于模型中參數間映射關系的辨識.

圖5 基于經驗公式和基于ANN的柴油機物理模型穩態工況仿真結果對比 Fig.5 Comparison of simulation results of empirical functions and ANN physics-based in diesel engine model under steady-state work conditions

圖6 基于經驗公式和基于ANN的柴油機物理模型在WHTC瞬態工況仿真結果 Fig.6 Simulation results of empirical function and ANN physics-based diesel engine models under WHTC transient-state work condition
對于面向控制的柴油機模型,除了模型預測性能外,計算耗時也是衡量模型性能的一個重要指標.將EF模型和ANN模型兩個模型分別載入ETAS ES910型快速原型及接口模塊中進行測試運行.ETAS ES910技術參數如下所述:主處理器型號為NXP PowerQUICCTM Ⅲ MPC8548,800MHz雙精度浮點型;RAM為512MByte DDR2-RAM (400MHz時頻);Flash為64MByte Flash;NVRAM為128kByte NVRAM.由測試可知,基于EF和基于ANN的柴油機物理模型計算耗時相當,均約為350μs,遠低于實際柴油機單個循環所需時間(約為20ms),能滿足燃燒過程實時控制的要求.
(1) 相比基于冪函數的經驗公式,ANN對柴油機物理模型中參數間的非線性映射關系辨識效果更好,但是對數據誤差的敏感度較低.
(2) 相比基于EF的柴油機物理模型,筆者建立的基于ANN的柴油機物理模型在穩態工況對MFB50、PFP和BMEP的預測精度更好;在WHTC瞬態工況,對MFB50、PFP和BMEP預測精度出現明顯惡化(尤其對于PFP),預測性能較差;主要因為參數本身具有較大的校準誤差和不確定性,而ANN模型,相比EF,對誤差和不確定性更加敏感,EF相比ANN更適合用于辨識柴油機物理模型參數間映射關系.
(3) 所建立的基于EF的柴油機物理模型和基于ANN的柴油機物理模型,其在ETAS ES910快速原型設備上測試的計算耗時相當,約為350μs,遠低于實際柴油機單個循環所需時間(約為20ms),二者均能滿足燃燒過程實時控制的要求.
致謝:
感謝FPT(FIAT Powertrain Technologies)為本研究提供的試驗數據.感謝Stefano d’Ambrosio教授和Roberto Finesso教授在本研究過程中給予的指導.