鄒 浪, 何 超*, 李加強, 王艷艷, 譚建偉
(1.西南林業大學機械與交通學院,昆明 650224; 2.西南林業大學云南省高校高原山區機動車環保與安全重點實驗室,昆明 650224; 3.北京理工大學機械與車輛學院,北京 100081)
近年來,機動車尾氣排放已成為大氣污染主要來源,尤其是大氣顆粒物的增加對人體健康影響顯著。研究表明,顆粒物粒徑與呼吸道和心血管疾病的增加以及死亡率之間存在關聯[1-2]。據報道,柴油車尾氣已成為碳質氣溶膠來源之一[3-5]。因此,減少大氣顆粒物的排放成為當前研究的熱點。
隨著柴油機排放法規發展到歐VI階段,在原來顆粒物質量排放測試的基礎上增加了顆粒物數量的測量[6]。然而,納米技術的進步使得試驗儀器能夠精確測量1~1 000 nm顆粒物粒徑及數量,從而降低偶然誤差和系統誤差帶來的影響。研究發現,機動車輛燃燒產生的顆粒對人體的危害主要來自細顆粒物和超細顆粒物[7-10],尤其是直徑小于100 nm的超細顆粒物對人和動物的危害比細顆粒物更加突出[11]。相比汽油車,柴油車具有使用壽命長久、燃油經濟性好、壓縮比高、低污染等優點,被作為動力裝置安裝在許多歐美轎車及重型車輛上。由此可見,改善柴油車的污染物排放對控制大氣污染起著重要的作用。
針對發動機轉速、空燃比、氣缸壓力、廢棄再循環(exhaust gas re-circulation,EGR)率等燃燒特性與納米級PM的研究已有大量報道[12-16]。因此,利用發動機燃燒產生的缸壓循環及空燃比等物理參數預測污染物的排放必不可少。Henningsson等[17]利用柴油機在不同速度、噴油定時及EGR率等條件下氣缸壓力對NOx和尾氣中的氧氣濃度λ進行了有效預測;Pu等[14]利用氣缸壓力作為神經網絡的輸入,預測了粒徑為15~1 000 nm的顆粒物分布;Weymann等[18]建立燃燒壓力軌跡的神經網絡模型,結果表明該模型的預測值與實際值的相關系數為0.992;余林嘯[19]研究不同海拔高度對柴油機的燃燒特性和排放特性的影響,結果表明隨著海拔的升高,柴油機缸內最高燃燒壓力逐漸減小,核模態和積聚模態顆粒物數量增加。
然而,在不同海拔、轉速及轉距情況下,利用柴油機燃燒產生的氣缸壓力預測納米級顆粒物(particulate matter,PM)在相關領域的文獻非常有限。由于實驗條件非常復雜,需要測試大量原始數據,導致模型的構建十分困難。基于此,運用機器學習領域的方法,采用主成分分析(principal component analysis, PCA)研究不同海拔下氣缸壓力的相關特征。隨后訓練神經網絡,以主成分訓練數據作為輸入,顆粒物排放的粒徑數量濃度作為輸出,從而比較不同主成分對于顆粒物濃度預測情況,選擇合適的主成分建立模型是研究的重點。
試驗用柴油機為錫柴CA6DF3,試驗發動機規格如表1所示, 燃料為0號柴油。

表1 試驗發動機參數
采用CW440D型電渦流測功機實時測量發動機的輸出轉矩和轉速。為了得到精確的燃燒特性參數,使用DEWETRON 5000型燃燒分析儀對角標儀與缸壓傳感器所測試的數據進行實時現場測量,按每0.2曲柄角間隔采集1個氣缸壓力數據。同時,使用低壓靜電沖擊式采樣器ELPI對不同粒徑的顆粒物數量濃度進行測量,第一級沖擊器中加入濾紙,使測量范圍擴展到7 nm粒徑,粒徑分布如表2所示。

表2 ELPI粒徑分級
試驗對280種工況進行測試,其中包括4種海拔(0、1 608、2 408、3 300 m),每種海拔下8種轉速(1 030、1 200、1 400、1 600、1 800、2 100、2 300 r/min及怠速700 r/min),以及每種轉速下10個不同的轉矩(怠速除外),相同海拔下轉速與轉矩的關系如圖1所示,其中轉矩為47~790 nm。每個工況點的轉矩和轉速保持一致,待發動機工作穩定后,再進行數據采集。經過多次測試,對每個工況隨機選取50個周期取平均值,收集大量氣缸壓力及不同粒徑的顆粒物濃度數據。

圖1 相同海拔下轉速與轉矩關系
主成分分析是一種大數據降維的方法[20],通過查找變量之間的聯系,使原始變量重新線性組合得到一組不相關的綜合指標,這為降低數據的維數提供了方法。因此,主城分分析在圖像識別、模型預測及計算機等領域運用廣泛。主成分分析原理公式如式(1)所示:
(1)
式(1)中:A∈RN是原始數據集,N為原始變量的維數,即不同海拔、轉速和轉矩條件下,N變量的氣缸壓力數據組合成原始數據集;X=[x1,x2,…,xL]為主成分組成的基向量矩陣;C=[c1,c2,…,cL]為是由L個系數組成的向量矩陣;e為誤差。
當L?N,使誤差e最小化時,可由式得到式(2),其中T為轉置。這表明C的每個分量即主成分系數能表示相對應原始數據的特征。
C=AXT或X=CTA
(2)
由于奇異值分解不僅是譜分析的推廣運用,還能消除干擾信號帶來的影響。因此,原始數據使用MATLAB svd函數進行奇異值分解,其原理如式(3)所示:
A=USVT
(3)
式(3)中:A為任意實維矩陣;U和V為正交矩陣;S為奇異值矩陣,奇異值按列從左到右逐漸減?。籙和V的列向量分別是左奇異向量和右奇異向量,其中U的列向量是奇異值從大到小依次對應的特征向量。若奇異值矩陣的某部分對角線元素遠遠大于其他奇異值之和,則這部分元素對應的特征向量代表原始數據的大部分信息。
對影響指標A=[a1,a2,…,an]進行主成分分析,其結果X=[X1,X2,…,Xn]作為神經網絡的輸入向量,得到對應的輸出結果y,如圖2所示。wij和wih分別為輸入層與隱含層、隱含層與輸出層的連接權值。通過設定期望誤差來評估實模型的精確程度,如果實際輸出與預測輸出之間的誤差大于期望誤差,則進行多次逆向傳播修正,直至小于期望誤差終止,最終建立神經網絡模型。

圖2 神經網絡結構原理
發動機燃燒過程集中在活塞上止點附近,這時氣缸壓力變化趨勢最能代表整個周期的燃燒特性。由此可見,選擇上止點-30~45 ℃曲柄角進行數據研究是降低實驗難度的可行方案[14]。每循環采樣1次,采樣間隔為0.2曲柄角,可獲得375個樣本點,最終對10 500個數據進行分析。
通過MATLAB奇異值分解并計算氣缸壓力的前10個主成分貢獻率如表3所示。圖3所示為X1、X4、X7、X10主成分的氣缸壓力變化曲線,其中橫坐標表示曲柄角,縱坐標表示數據預處理后的缸壓。由表3、圖3可知,第1主成分提取原始數據62.02%的特征信息,而主成分10主要捕捉活塞上止點附近壓力變化的頻率。圖4所示為不同海拔下X1、X4、X7、X10主成分的重構數據與原始數據的分布,表明主成分維數越高,奇異值分解重構數據與原始數據信息重合度越好,說明奇異值分解降低了原始數據特征信息的損失。這是由于PCA的本質是空間坐標的變換且數據結構保持不變,獲得的主成分集是原始變量的線性組合造成的結果。

表3 主成分貢獻率

圖3 部分主成分的缸壓變化曲線
對280組原始數據和重構數據進行均方根誤差(RMSE)檢驗,結果如圖5所示。在圖5中,第1主成分因貢獻率小于80%造成均方根誤差過大,導致信息提取過少,因此不能用于分析模型的訓練數據。圖3~圖5表明,前4個主成分代表缸內壓力總體變化趨勢,且隨著主成分貢獻率的增大,均方根誤差急劇減小,當達到一定程度后誤差緩慢降低。當達到10個主成分時,均方根誤差為0.014~0.082 MPa,信息提取效果較好。綜上所述,不同工況下氣缸壓力變化趨勢能由主成分系數表示。

圖4 主成分重構數據與原始數據的缸壓分布
3.2.1 神經網絡模型的設計
由于柴油機的顆粒物排放受負荷、溫度、轉速、噴油時間、火花正時、燃料及EGR率等物理參數的影響。因此建立氣缸壓力與顆粒物的排放模型屬于非線性映射。顯然,一個多層反向傳播的前饋神經網絡是非線性映射模型仿真的最佳選擇之一。鑒于原始數據涉及不同的量綱,為保證預測模型精確度,必須對數據進行標準化處理。
選擇單隱含層的神經網絡模型,輸入是經過前4、7、10個主成分分析的280組標準化數據,輸出為具有6個神經元的粒徑為7~990 nm顆粒物濃度(即第一組粒徑為7~29 nm;第二組粒徑為29~57 nm;第三組粒徑為57~101 nm;第四組粒徑為101~255 nm;第五組粒徑為255~990 nm,第六組粒徑為7~990 nm)。其中隨機產生238組數據用于神經網絡訓練,剩余42組數據用于神經網絡測試。主成分分析與神經網絡模型流程如圖6所示。

圖5 氣缸壓力均方根誤差曲線

圖6 主成分分析與神經網絡模型流程
由于神經網絡極易陷入局部最優化,而貝葉斯正則化反向傳播算法能使神經網絡模型具有最佳整體性能。因此,選擇MATLAB定義的貝葉斯函數(trainbr)對該模型進行訓練優化。最大訓練次數為1 000次,訓練目標為0.001,學習率設置為0.01。
3.2.2 模型預測結果分析
為研究不同工況下不同主成分的氣缸壓力與PM粒徑濃度模型的最佳結合點,需要對神經網絡模型進行反復測試和訓練。其中平均絕對誤差(MAE)和均方根誤差(RSME)越小,回歸系數R2越接近1,則表明該模型預測效果越好。
經過多次訓練后,X1~X4主成分預測PM粒徑數量濃度的神經網絡采取4個輸入層神經元,隱含層節點為5時,該模型能準確預測7~990 nm的顆粒物粒徑濃度,測試的R2達到0.85,整體性能R2達到0.81,如圖7所示,其中橫坐標從左到右依次表示為訓練目標、測試目標和全局輸出數據,縱坐標表示神經網絡對應的預測輸出。此外,X1~X7主成分選用7個輸入神經元,8個隱含層節點時模型預測穩定高效,測試的R2達到0.86,整體性能R2達到0.91,如圖8所示;X1~X10主成分采用10個輸入變量,9個隱含層神經元,測試的R2達到0.92,整體性能R2達到0.95,如圖9所示。

圖7 X1~X4回歸分析

圖8 X1~X7回歸分析
對X1~X4、X1~X7和X1~X10三個模型進行仿真測試,引入平均絕對誤差(MAE)和均方根誤差(RSME)對樣本預測值與實測值進行檢驗,得到結果如表4所示。由表4可知,模型的平均絕對誤差為90.74~2.284 29×103cm3,均方根誤差為1.612×104~9.769×104cm3,這表明柴油機燃燒產生的氣缸壓力能準確預測7~990 nm每組顆粒物的數量濃度分布。由表4可知,平均絕對誤差和均方根誤差隨著主成分貢獻率的增大而逐漸降低,表明主成分占比與模型的預測精度成正相關,這是由于新加入的主成分相比舊主成分對于原始數據的特征提取更全面,引起主成分與不同粒徑的顆粒物濃度的相關性增加的結果。其中7~990 nm PM數濃度在X1~X10模型的樣本預測值與試驗值如圖10所示。

圖9 X1~X10回歸分析圖
研究表明在不同行駛工況下,當主成分達到一定比例時,利用柴油機燃燒產生的氣缸壓力提取主成分來預測PM的排放是一種有效方法。此外,前10主成分的缸壓預測7~990 nm顆粒物的平均絕對誤差為90.74 cm3,均方根誤差為1.612×104cm3,回歸系數R2為0.95,表明在某些復雜實驗條件下測量顆粒物的粒徑濃度排放時,可以獨立測量氣缸壓力進行預測。

表4 每組粒徑濃度的試驗值和預測值的誤差

圖10 PM數濃度在X1~X10模型的試驗值與樣本預測值
通過主成分分析與神經網絡組合模型,得到以下結論。
(1)奇異值分解能有效減少原始數據信息的損失。
(2)在運用主成分方法分析氣缸壓力時,不同工況下的氣缸壓力變化能夠由主成分系數表示。
(3)利用主成分分析和神經網絡建模,當主成分達到一定比例時,實測數據與模型的預測值具有良好的一致性,其回歸系數R2達到0.95。證明主成分分析與神經網絡結合是一種降低數據維度和模型構造難度的可行方法之一。
(4)柴油機氣缸壓力與在7~990 nm顆粒物的數量濃度預測分布擬合效果較好,表明發動機燃燒產生缸壓力可以用來標定不同工況下車輛顆粒物的排放。