楊愛平 ,唐倩 ,撒利軍 ,劉達
(1.重慶大學 機械傳動國家重點實驗室,重慶 400044;2.長安汽車有限責任公司,重慶 400023)
車輛在行駛過程中會產生大量熱量,對于傳統內燃機汽車,熱量來自于動力總成中內燃機缸體內燃料的燃燒與零件的相對運動,而對于電驅動的新能源汽車,熱量則來自于車輛內鋰離子電池的產熱[1]。這些熱量若沒有及時被帶走,輕則造成車輛運行穩定性下降、燃油經濟性降低,重則導致動力總成過熱報廢。現代車輛冷卻系統多傾向于使用成熟的液冷散熱,但液冷散熱系統存在大量的冷卻管路,需要保證其具有良好的密封性。在汽車的生產過程中,冷卻系統的密封性檢測是在冷卻液加注之前進行的,具體方法是對冷卻系統進行氣體加壓處理,通過一個保壓過程進行密封性測試[2]。但這種方法工序復雜,并且測試要求的環境條件較高。隨著大數據科學的快速發展及汽車生產中全流程信息采集系統的廣泛應用,已經可以實現以低成本、大范圍、增量累計的方式獲取車輛生產過程中的有用信息[3],這為使用基于數據驅動的方法進行動力總成冷卻系統密封性預測奠定了基礎。相比于傳統基于模型的方法,數據驅動的方法可以在沒有系統先驗知識與準確數學模型的基礎上,通過生產與測試過程中產生的大量有用信息訓練AI模型,使其具備解決某一特定問題的能力[4]。基于數據的預測方法已經取得了十分廣泛的應用,胡杰等[5]基于車輛狀態參數、環境信息對電動車行駛里程進行了預測,Lin Xie等[6]基于天然氣、石油行業安全儀表的操作數據預測了儀表的故障率。在車輛生產過程中,獲取生產數據是比較容易的,并且這些數據中往往蘊含了大量與冷卻系統密封性有關的信息,因此使用基于數據的方法預測冷卻系統密封性是較為合適的。本文通過數據驅動的方法對動力總成密封性測試結果進行預測,具體選擇了二分類的邏輯回歸判別模型。方案基于大量的生產過程工藝數據樣本,訓練邏輯回歸模型,直至模型具備良好的輸出精度,最終實現對密封性測試結果的預測,本方案的具體流程如圖1所示。

圖1 方案流程圖
動力總成是車輛的核心部件,負責車輛動力的產生,決定了整車的動力性、經濟性與可靠性[7]。對于傳統內燃機車輛,動力總成包含發動機、變速器、進氣系統、排氣系統、冷卻系統、供油系統、發動機懸掛等,而對于電驅動的新能源汽車,動力總成則包含整車動力驅動控制單元、電動機及其逆變器、變速器、冷卻系統等。雖然傳統汽車與新能源汽車動力總成在結構上存在較大的區別,但均存在冷卻系統,冷卻系統的運轉情況將決定車輛行駛過程是否安全、穩定。傳統內燃機汽車的冷卻系統主要是為發動機缸體降溫,而新能源汽車冷卻系統則主要為電池系統降溫。車輛冷卻系統保證了動力總成在較高輸出功率的同時,又具有良好的經濟性與可靠性。
現代車輛動力總成主要采用閉式強制循環冷卻系統[8],一般由冷卻水泵、水熱交換器、散熱器、循環管路等部分組成,屬于典型的液冷散熱方式。此外,在純電驅動汽車的冷卻系統中,還會采用風冷、相變材料冷卻、熱管冷卻等冷卻方式,但由于液冷散熱效率高,其仍然為車輛動力總成主要冷卻方式。采用液體方式的冷卻系統中,由于冷卻管路中冷卻液存在較大壓力,因此普遍存在泄漏風險,是本文主要研究的問題。液冷系統冷卻液泄漏會造成車輛散熱效率下降,若冷卻液滴落在動力總成中某些控制電路中,則會造成更為嚴重的損失。
為了使汽車在生產過程中能及時檢測到冷卻系統是否存在泄漏隱患,本文通過數據驅動的方式對冷卻管路進行密封性預測,若預測模型判斷某一動力總成冷卻系統存在泄漏的風險,則將該動力總成下線檢查,將安全隱患排除在產品交付之前。
數據驅動的預測模型依賴于大量的數據來訓練模型,這些數據又分為訓練集與測試集,統稱為數據集。訓練集為訓練模型的樣本數據,測試集為模型訓練好后評價模型的樣本數據,由于測試集沒有參與模型訓練,因此基于其的評價結果會更加客觀。本文的數據集來源于動力總成制造過程中產生的生產數據,數據集中包含特征值與目標值,特征值為輸入模型的數據,目標值為模型輸出的數據,本文數據集中特征值為生產過程中冷卻管路各個螺栓的擰緊數據,目標值為對應動力總成冷卻系統管路密封性測試是否合格的布爾值,其中測試合格情況與布爾值的具體對應方式如表1所示,模型輸入輸出關系如圖2所示。

圖2 模型輸入輸出關系圖

表1 泄漏測試結果布爾值對應表
對于已經采集好的數據,還需進行預處理,包含缺失值處理、歸一化處理等。在使用機器學習等數據驅動的方法建模前,需要將訓練數據集中異常的缺失值(如Null)進行處理,本文采用的缺失值處理的方法為平均值插補,具體策略為若某一樣本的某一數據存在缺失且缺失數據量較少,則結合多個樣本得到這一項的平均值,以平均值插補替換缺失值,若缺失數據量太多,則舍棄該樣本。除平均值插補法外,還有固定值插補法、最鄰近插補法,但由于這類方法對樣本誤差的影響較大[9],故沒有采用。缺失值處理能使模型需求的每個輸入值都存在,保證了模型穩定性。
歸一化處理的目的是為了消除樣本之間的量綱影響,并加快模型訓練時的收斂速度,本文使用z分數(zscore)歸一化方法,該方法使所有處理后的數據樣本符合均值為0、標準差為1的標準正態分布,歸一化處理的數據的計算公式為

式中:x為原始數據;x*為歸一化處理的數據;μ是樣本均值;σ是樣本標準差。
邏輯回歸(Logistic Regression)是一種廣義的線性回歸模型(Generalized linear model),是一種常用的統計學方法。回歸一般指研究某一數學問題因變量與自變量之間的關系,而邏輯回歸往往是使用了Sigmoid函數的回歸模型。邏輯回歸在機器學習中屬于有監督學習,通過預測不同自變量發生某種情況的概率,從而求解某一分類或多分類問題的解,是一種經典的分類問題預測方法。由于本文研究的動力總成冷卻系統密封性檢測是否合格的問題屬于二分類問題,故使用二分類的邏輯回歸模型進行預測。
邏輯回歸的輸入函數h(X)為一線性函數,它將所有螺栓的擰緊數據包含進來,并使用權值系數將螺栓擰緊數據結合到一起,以便于后續的求解分析,輸入函數的具體形式為

式中:w0、w1、……、wn為各個權值系數;x0、x1、……、xn為具體的螺栓擰緊數據;b0、b1、……、bn為每一項的偏置系數;W為權值系數集合;X為各螺栓擰緊數據集合。
在定義好邏輯回歸輸入函數后,引入Sigmoid函數,其值域為[0,1]。Sigmoid函數的具體數學形式見式(3),對應的函數圖像如圖3所示。

圖3 Sigmoid函數圖像

由于本文需要預測的目標為動力總成冷卻系統泄漏檢測是否合格,具體的檢測結果只有合格與不合格之分,前文已經將測試結果與布爾值相對應,接下來應該使其與條件概率聯系起來,使模型輸出測試合格與不合格條件下的概率值。為獲得二項邏輯回歸的條件概率模型,需將邏輯回歸輸入函數h(X)代入Sigmoid函數σ(i)中,使函數h(X)的輸出映射到值域為[0,1]的區間中,式(4)、式(5)分別為泄漏測試合格(Y=1)與泄漏測試不合格(Y=0)條件下的條件概率分布函數。

在獲得條件概率分布函數后,需要將預測得到的條件概率劃分為具體的正例與反例以實現二分類,因此需要設定一個閾值s來區分正反例。本文設置的閾值s=0.5,當P(Y=1|X)>0.5時,劃分為正例,模型預測結果為動力總成冷卻系統密封性檢測合格,當P(Y=1|X)<0.5(即P(Y=0|X)>0.5)時,模型預測結果為動力總成冷卻系統密封性檢測不合格。
由于本文研究的是分類問題,因此通常使用混淆矩陣來評價模型預測能力。混淆矩陣是一種表示精度評價的標準格式,也稱為誤差矩陣,當問題被分為n類時,往往由n行n列的矩陣構成,二分類的混淆矩陣形式如表2所示。混淆矩陣中,TP(True Postive)表示真實結果與預測結果均為合格的樣本數;TN(True Negative)表示真實結果與預測結果均不合格的樣本數;FP(False Positive)屬于統計學第一類錯誤,表示將實際不合格的產品預測成合格產品;FN(False Negative)屬于統計學第二類錯誤,表示將實際合格的產品預測成不合格產品[10]。除混淆矩陣外,還有準確率(Accuracy)、精確率(Precision)、正類正確率(True Positive Rate,TPR)、負類正確率(True Negative Rate,TNR)等評價指標,其計算公式如表3所示。

表2 二分類的混淆矩陣形式

表3 評價指標計算公式
本文使用從某車企生產現場采集的218組動力總成歷史生產裝配數據用作訓練模型,每組數據為一臺動力總成的與密封性有關的螺栓擰緊力與擰緊轉矩及最終密封性測試結果。實驗平臺配置為處理器i5-9400f(2.90 GHz),內 存 為16 GB,顯 卡 為NVIDIA GTX1660。實驗使用Python編程語言并基于Pytorch機器學習庫構建了邏輯回歸模型。
首先將數據集進行缺失值處理與歸一化處理,保證數據完整且利于模型求解收斂。以7:3的比例將數據集劃分為訓練集與測試集,分別設置邏輯回歸模型超參數:學習率為0.01,分類閾值為0.5,正則化力度為0.01,迭代次數設置為200次,求解優化器選擇隨機梯度下 降(stochastic gradient descent,SGD)。進行求解運算,得到200次迭代過程中訓練集與測試集準確率變化曲線如圖4、圖5所示。
由圖4與圖5可知,測試集的準確率隨訓練次數的增加而增加,且與訓練集準確率增長趨勢較為一致,說明本文所選的螺栓擰緊數據與密封性之間存在較大的關聯性,間接證明了方法的有效性。在訓練次數到達100次時,模型開始學習到有價值信息并且開始收斂,在第100次到150次迭代過程中,訓練集與測試集準確率上升較快,150次迭代以后,訓練集準確率上升緩慢,測試集準確率不再明顯上升并開始在85%之間波動,表現出過擬合現象,故訓練停止。表4展示了動力總成密封性測試的部分實際測試結果與預測結果。

圖4 訓練集準確率

圖5 測試集準確率
從表4可以看出,邏輯回歸模型對于動力總成密封性的預測擁有較高的準確率,除2號樣本預測錯誤以外,其余樣本均預測正確。由于訓練集參加了模型的訓練過程,測試集的預測結果才能客觀體現模型的預測性能,為了驗證模型對于測試集整體的預測能力,給出了測試集樣本預測結果的混淆矩陣如表5所示,模型分類能力評價指標如表6所示。

表4 部分實際測試結果與預測結果

表6 模型分類能力評價指標%
從表5的混淆矩陣中可得,測試集共66個樣本,只有7個樣本預測錯誤,其中包括2個統計學第一類錯誤的樣本,5個第二類錯誤樣本,模型將預測錯誤的樣本數控制在了較低的水平。由于本文最主要的目的是將密封性有問題的動力總成檢測出來,因此負類正確率(TNR)指標尤為重要,模型基于測試集的負類正確率為88.23%,這表明10個問題樣本中會有接近9個被檢測出來。此外模型在其他指標上也表現出較高的性能,其中準確率(Accuracy)達到89.39%,精確率(Precision)為95.65%,正類正確率(TPR)為89.79%。以上數據表明,本文的邏輯回歸模型具有較高的預測能力,側面驗證了本方案的有效性。

表5 預測結果與真實結果的混淆矩陣
本文基于數據驅動的邏輯回歸算法建立了對動力總成冷卻系統密封性質量的分類判別模型。使用真實生產數據進行實驗,得到的預測模型顯示出較高的精度,其中最重要的TPR指標達到89.79%,表明不合格動力總成被檢測出來的概率較大,滿足了實際生產檢測需求。通過使用本文的預測模型,可以及時將生產過程中有問題的動力總成下線檢修,也可以對此后的人工密封性檢測結果提供參考,具有一定的工程意義。