劉 佳,馬志強,3,劉廣忱,高俊東,李宏勛
(1內蒙古工業大學數據科學與應用學院;2內蒙古工業大學大學電力學院;3大規模儲能技術教育部工程研究中心,內蒙古 呼和浩特 010080)
作為新能源汽車的關鍵部件,動力電池的循環壽命、技術水平和安全性直接決定了新能源汽車的續航效果、性能和安全性。隨著新能源汽車市場的不斷擴大,動力電池的需求量也在不斷上升。鋰電池作為目前主流的動力電池之一,存在安全性差、成本高、循環壽命短等缺點。精準預測動力電池的RUL,能夠提前規避因電池過度使用帶來的風險,在電池故障前發出警告,還能在退役電池的二次利用中為使用者提供決策依據,在安全可行的范圍內提升電池第二壽命的利用率,既能提升動力電池的安全性,還能在一定程度上降低使用成本,實現資源的循環利用。一般認為,當電池容量衰退到原始容量的70%時達到失效閾值,電池的RUL 代表當前狀態下電池容量衰退到失效閾值前的剩余循環次數。
現有的方法中,電池的RUL 預測主要分為基于模型的方法和數據驅動的方法[1]。基于模型的方法旨在建立一個描述電池退化行為的數學模型來預測未來的電池性能變化。Sadabadi等人[2]使用電化學模型提取電池容量衰退的相關特征,實現了不同操作條件下的電池RUL 預測,但該方法建模計算復雜度高且需要大量的專業知識作為支撐。Wang等人[3]使用粒子濾波(particle filtering,PF)和卡爾曼濾波(Kalman filtering,KF)算法表征電池的容量退化并預測電池的RUL,PF 在一定程度上解決了KF 只適用于線性高斯系統的問題,但同時又帶來粒子退化的問題。在1C 電流下,內阻與電容線性相關,基于這一關系,Guha 等人[4]提出了基于PF的內阻增長模型以更加準確地預測電池的RUL,但該方法只考慮了相同放電速率的情況,沒有考慮不同放電速率和溫度變化等其他因素的影響。Zhang等人[5]采用線性優化組合重采樣的方法以提高RUL預測精度,但依舊面臨著粒子退化和粒子多樣性缺陷問題。
基于數據驅動的方法只需要歷史數據而不需要充分了解電池內部機理及循環過程,相較于基于模型的方法來說更加靈活。王萍等人[6]基于高斯過程回歸(Gaussian process regression,GPR)和最小二乘支持向量機(least squares support vector machine,LS-SVM)實現了SOH和RUL聯合預測,但該方法對異常值較為敏感,電池容量回升現象及異常值均會對預測結果產生較大影響。廖力等人[7]通過對動力電池的多個健康因子進行相關性分析,提出了一種多健康特征融合及IGSA-SVR 的SOH和RUL 聯合預測方法,但該模型的網絡結構相對簡單,可能無法準確捕捉到一些復雜的非線性關系。隨著深度學習的發展,吳忠強等人[8]使用PFLSTM模型實現了電池的RUL預測,相較于其他模型,神經網絡模型通常具有更靈活的網絡結構和自適應學習的能力,能夠更好地處理復雜的非線性關系,但該方法忽略了LSTM 的長期依賴性問題。Chen 等人[9]為了減小電池容量再生期間的噪聲影響,使用去噪自編碼器(denoising auto-encoder,DAE)來處理電池原始數據,并使用Transformer捕獲時間信息和特征,在RUL 預測任務上取得了較好的效果,但DAE 在非線性噪聲和混合噪聲的處理上有一定的局限性,并沒有顯著地提升預測精度。Hong 等人[10]開發了第一個用于快速預測鋰離子電池剩余使用壽命的端到端的深度學習框架,通過考慮時序特征及多HIs的相關性,來尋找電池退化期間更顯著的特征,實現了更快、更準確的電池RUL預測,但該方法沒有考慮多HIs之間的耦合關系,同時引入多HIs進行預測時可能會引入冗余特征,導致模型精度下降。董淵昌等人[11]使用奇異值分解(singular value decomposition,SVD)對鋰電池容量的多個HI 進行了特征提取,再通過Spearman 相關性分析,挑選出與原始鋰電池容量數據相關性極高的7 個HI 通過堆疊自編碼器(stacked autoencoder,SAE)進行特征融合,最后使用GPR對該融合HI進行預測,有效提升了RUL預測的精度,該方法僅僅考慮了各HI 與電池容量數據的相關性,仍然忽略了多HIs 之間的耦合關系。由于鋰電池的容量衰退過程中所體現出的各種非線性特征以及容量回升現象,Liu 等人[12]通過經驗模態分解(empirical mode decomposition,EMD)方法,將原始電池容量數據自適應分解為一些固有模態函數(IMFs)和殘差,然后利用長短期記憶網絡(long short-term memory,LSTM)和GPR分別對IMFs 和殘差進行預測,因此捕獲到了容量的長期依賴性和容量再生現象的不確定性波動,但EMD 方法容易產生模態混淆的問題,即分解出的單個IMF可能同時包含了低頻和高頻的數據,不能有效地根據時間特征對不同頻段的數據進行有效分解。
綜合以上分析,為了降低動力電池RUL預測任務中噪聲和容量回升現象導致的非線性特征對RUL預測精度的影響,本工作提出了一種基于EEMD多尺度分解下門控循環單元網絡與時序卷積網絡集成的動力電池RUL預測方法,首先使用EEMD對原始數據進行分解,將噪聲和容量回升現象導致的非線性特征及原始容量數據的主要趨勢分解到對應的高頻分量和低頻分量,再使用GRU和TCN網絡分別對高頻分量和低頻分量進行預測,最后使用Attention對預測結果進行集成。在NASA數據集上進行了對比實驗、不同預測起點實驗及消融實驗,實驗結果表明該集成模型能夠有效降低動力電池RUL預測任務中噪聲和容量回升現象導致的非線性特征對RUL預測精度的影響,相較于典型單一模型和其他同類型模型具有更高的準確性和穩定性。
電池老化分為存儲老化和循環老化。存儲老化被定義為電池在空閑或存儲條件下,由于兩個電極的自放電引起的容量衰減的不可逆變化,電池容量衰減到失效閾值所經過的時間,稱為擱置壽命或貯存壽命。循環老化被定義為電池充放電過程中,使用模式、溫度條件和電流作用引起的容量衰減變化,電池容量衰減到失效閾值之前能反復充放電的次數稱為循環壽命。為了更加清晰地定義動力電池的RUL,首先引入動力電池的健康狀態(state of health,SOH)定義。
動力電池的SOH 用于描述電池長期的健康狀態,通常由隨電池老化而改變的電池參數表征,主流方法是使用容量定義動力電池的SOH。計算公式(1)如下。
其中,C(0) 表示動力電池的初始容量,Cmax(n)表示動力電池在循環n時的最大容量。隨著電池循環次數的增加,電池的SOH 值呈下降趨勢,表明電池性能退化,當電池滿充狀態的容量下降到標稱容量的70%時,認為動力電池壽命終止。
動力電池的RUL 通常定義為在達到失效閾值之前剩余的循環次數,即動力電池的循環壽命。計算公式(2)如下。
其中,NRUL為電池的RUL,即電池在達到失效閾值之前剩余的充放電次數,NEOL為電池容量由初始狀態退化到失效閾值時電池經歷的循環次數(即SOH 下降到70%時動力電池的循環次數),NECL為電池當前狀態下已經歷的循環次數。
為了分離原始信號中混淆的多個固有模態數據,獲取相對平滑的模態特征,并最小化數據重構過程的噪聲影響,從而降低噪聲和容量回升現象導致的非線性特征對動力電池RUL預測精度的影響,本工作提出一種多尺度分解下GRU-TCN 集成的動力電池RUL預測模型,如圖1所示。該模型主要包括三個模塊:數據分解模塊、時序預測模塊、數據重構模塊。

圖1 動力電池RUL預測架構圖Fig.1 Power battery RUL predictive architecture diagram
1.2.1 數據分解模塊
為了減少分解過程中噪聲對原始數據的影響,且考慮到原始數據的非線性特征,使用具有一定抗噪性、能夠自適應分解非線性信號的EEMD[13-14]方法對原始信號進行分解。經過分解后,原始信號被分解為不同的固有模態函數,從而將包含原始信號主要部分的低頻分量與包含高頻噪聲的高頻分量分解,使各個分量具有相對平滑的特性,能夠提高時序預測的準確性。在數據分解模塊中,將電池原始容量序列X作為EEMD分解的輸入,輸出高頻分量XH1、XH2、XH3及低頻分量XL作為時序預測模塊的輸入。
1.2.2 時序預測模塊
分別使用TCN[15]和GRU[16]預測低頻分量和高頻分量。低頻分量包含了原始數據的長期變化趨勢,因此選擇具有更大感受野的TCN 對低頻分量進行預測,相對于卷積神經網絡[17](convolutional neural network,CNN),TCN引入了循環結構和殘差鏈接,能夠更好地處理原始數據的動態模式,并且具有更大的感受野,使得信息可以在網絡中傳播更長的時間跨度,從而更好地捕捉序列數據中的長期依賴關系。 相對循環神經網絡[18](recurrent neural network,RNN),TCN的梯度消失和梯度爆炸的問題較小。高頻分量的數據波動性較大,因此選擇能夠捕捉短期波動的GRU 對高頻分量進行預測,能夠更好地捕捉數據中的瞬時變化和短期趨勢,提高預測的準確性。相對于RNN,GRU 能夠更有效地傳遞梯度,避免梯度消失或梯度爆炸的問題,而相對于LSTM,GRU具有較小的參數和計算量,在相同的訓練時間內,GRU 通常能夠達到相近或者更好的性能。在時序預測模塊中,將低頻分量XL作為TCN 模型的輸入,輸出其預測結果為YL,將高頻分量XH1、XH2、XH3 作為GRU 模型的輸入,輸出其預測結果為YH1、YH2、YH3,時序預測模塊的輸出結果將作為數據重構模塊的輸入。
1.2.3 數據重構模塊
目前主流的EEMD數據分量重構方法是將各分量預測結果直接疊加得到最終的預測結果。但是在該方法的重構過程中,各個不同頻率的分量之間可能相互影響、互相干擾,導致重構結果與原始信號不完全匹配,并且直接疊加重構會進一步放大EEMD分解過程中引入的誤差,影響最終的預測結果。因此,本工作使用注意力機制[19]對預測結果進行加權平均集成(weighted average)。在數據重構模塊的權重推理過程即Attention 的訓練過程中,使用[XH1,XH2,XH3,XL]作為輸入,通過線性變換計算查詢(Query)、鍵(Key)和值(Value),由鍵、值相乘得出注意力分數,使用softmax 對其進行歸一化并以最小化損失函數為目標不斷優化線性變換的參數、更新注意力分數,最終推理出注意力權重矩陣W。在數據重構時,將時序預測模塊的預測分量矩陣[YH1,YH2,YH3,YL]作為Attention 的輸入,與注意力權重矩陣W相乘得到動力電池容量衰退狀態預測序列Y,由此得出NEOL,再由RUL 計算公式NRUL=NEOL-NECL即可得出動力電池RUL預測結果。
本實驗采用NASA 鋰電池數據集[20],選用B0005、B0006、B0007 號電池的歷史容量數據作為研究對象,每個電池各包括168次充放電循環的歷史容量數據,B0005、B0006、B0007 號電池的歷史容量衰退曲線如圖2所示,圖中箭頭所指為噪聲及容量回升現象導致的非線性特征。測試電池額定容量為2.0 Ah,以額定容量的70%看作鋰電池的失效閾值,即1.4 Ah,由于在原始數據集中B0007號電池容量沒有下降到1.4 Ah以下,為了便于驗證,將B0007 號鋰電池的失效閾值設置為71%,即1.42 Ah。在本實驗中,時序預測模塊和數據重構模塊均使用前T個循環周期的數據進行模型訓練,使用第T個循環周期之后的數據對模型進行驗證。

圖2 NASA鋰電池容量衰退曲線Fig.2 NASA lithium battery capacity decline curve
為了定量評估本模型的性能,本工作選取以下三個評價指標對模型進行評估。
(1) 平 均 絕 對 誤 差(mean absolute error,MAE),范圍[0,+∞),當預測值與真實值完全吻合時等于0,即完美模型;誤差越大,該值越大。公式(3)如下所示:
(2)均方根誤差(root mean square error,RMSE),范圍[0,+∞),當預測值與真實值完全吻合時等于0,即完美模型;誤差越大,該值越大。公式(4)如下所示:
(3)絕對誤差(absolute error,AE),范圍[0,+∞),當預測值與真實值完全吻合時等于0,即完美模型;誤差越大,該值越大。公式(5)如下所示:
其中,i表示第i次放電循環,n表示預測放電循環總數,y?i表示電池容量預測值,yi表示電池容量真實值,TRUL表示真實狀態下動力電池的RUL值,T?RUL表示預測的動力電池RUL值。
以B0005 號電池為例,使用EEMD 對其原始容量衰退曲線進行分解,分解出4 個信號分量IMFs,按照各信號分量的頻率由高到低排序,如圖3 所示,IMF1 至IMF3 的信號頻率較高,曲線波動性較大,視為高頻分量,IMF4 曲線平緩,具有原始數據的主要趨勢,視為低頻分量。由分解結果做出以下假設:動力電池容量衰退過程中由噪聲和容量回升現象導致的非線性特征被分解到高頻分量,而原始容量數據的主要趨勢被分解到低頻分量,且低頻分量中不再有噪聲及容量回升現象導致的非線性特征,有利于提升動力電池容量衰退狀態和RUL預測的準確性。此假設也在2.3節實驗結果對比分析中得到了驗證。

圖3 B0005號電池容量衰退曲線分解結果Fig.3 B0005 battery capacity decline curve decomposition results
為了測試提出的集成模型是否能夠有效提升動力電池RUL 預測任務中動力電池容量衰退狀態和RUL預測的精度,進行了一系列對比實驗,在預測起點為80 的條件下,分別與3 種典型單一模型、4 種基于EEMD 的組合模型及1 種基于EEMD 的集成模型進行對比。本工作提出的集成模型是指在使用GRU和TCN分別預測EEMD分解所得的高頻分量和低頻分量的基礎上,不采用當前主流的疊加重構的方法對數據進行重構,而是通過加權平均集成的方法對GRU 和TCN 模型的預測結果進行重構,使用Attention 對各分量的權重進行推理,并對GRU 和TCN 模型的預測結果進行加權求和。為了驗證該集成方法對提升模型性能的有效性,實驗在同等條件下對比了疊加重構和堆疊集成(Stacking)的數據重構方法。其中,疊加重構是指將時序預測模塊的預測結果按列相加實現數據重構,不涉及模型訓練及推理。堆疊集成采用GRU 對預測結果進行集成,其訓練集是時序預測模塊訓練過程中各分量的預測結果及對應的原始數據,測試集是時序預測模塊測試中各分量的預測結果及對應的原始數據。各模型對電池容量衰退狀態的擬合情況如圖4所示,各模型的評價指標值如表1所示。

表1 對比實驗評價指標Table 1 Compare experimental evaluation indexes

圖4 對比實驗結果Fig.4 Comparative experimental results
由圖4 可得,在同等條件下,相較于單一模型,EEMD組合模型的預測曲線在噪聲和容量回升部分更好地擬合了實際容量衰退曲線,這是由于EEMD方法能夠分解原始容量數據中混淆的多個固有模態數據,由噪聲和容量回升現象導致的非線性特征被分解到高頻分量,原始容量數據的主要趨勢被分解到低頻分量,且低頻分量中不再有噪聲及容量回升現象導致的非線性特征,因此,此類基于多尺度分解的模型能夠降低各模態之間的相互干擾,使得時序預測模型的輸入數據相對平滑,提升模型預測精度。相較于其他同類型模型,本工作提出的集成模型對電池容量衰退的總體趨勢及由噪聲和容量回升現象導致的非線性特征的擬合具有更樂觀的表現,這是由于EEMD方法對原始容量數據進行分解時引入了噪聲,疊加重構會進一步放大噪聲,而堆疊集成使用時序預測模塊訓練階段的預測結果進行集成模型訓練,也會引入噪聲,本工作選擇加權平均集成方法對預測結果進行數據重構,可以減少噪聲的影響及不同頻率分量之間的相互干擾。
由表1中數據可知,首先,用于對比的典型單一模型和其他同類型模型中最大MAE 和RMSE 分別為0.0128、0.0113 和0.0222、0.0178,本工作提出的集成模型最大MAE 和RMSE 分別為0.0052和0.0074。同等條件下,本工作提出的集成模型的MAE 和RMSE 均為最低值,這是由于分解后的分量相對平滑,使用GRU和TCN分別對高頻分量和低頻分量進行預測,能夠很好地預測各個分量的特征變化。其次,本工作提出的集成模型的AE 值最低,平均不超過一個循環周期,且在不同電池數據下本工作提出的集成模型AE 值波動最小,而同樣的分解和預測條件下,使用疊加重構的EEMDGRU-TCN 模型最大AE 值和最小AE 值分別為9 和0,使用堆疊集成進行數據重構的EEMD-GRUTCN-Stacking 模型最大AE 值和最小AE 值分別為15和7,這是由于使用Attention對預測結果進行加權求和,能夠重點關注對電池容量衰退狀態影響較大的分量,充分學習各分量與電池容量衰退狀態之間的關系,避免了對分解噪聲的二次放大和各分量之間的相互干擾,因此提升了動力電池RUL 預測的精度和穩定性。綜合以上分析,本工作提出的集成模型能夠提升電池容量衰退狀態及RUL 的預測精度,并且相較于典型單一模型和其他同類型模型在動力電池RUL預測中具有更強的穩定性。
為了進一步測試工作文提出的集成模型的預測性能,將預測起點分別設置為70、80、90 和100進行RUL預測,其實驗結果評價指標如表2所示。

表2 不同起點對比實驗結果Table 2 The experimental results were compared with different starting points
由表2可得,當預測起點為80、90、100時都能得到較為準確的RUL結果。當預測起點為70時,由于僅有70 條訓練數據,模型未能充分學習和訓練,AE 值相對較高,最高為四個循環周期,MAE和RMSE 最高值分別為0.0112 和0.0145。而當預測起點為100時,由于數據量增加了,模型精度有了一定程度的提升,AE 值均為0,MAE 和RMSE最高值分別為0.0039 和0.0052。以上實驗結果表明,本工作所提出的集成模型在預測起點不同的情況下依舊可以有效預測出電池容量衰退狀態。
為了驗證本工作提出模型各模塊的必要性,在預測起點為80 的條件下,進行了消融實驗,消融實驗結果如表3所示。

表3 消融實驗結果Table 3 Ablation results
由表3 可得,當只使用GRU 對高頻分量預測時,模型性能較差,MAE 和RMSE 最大值分別為0.7542 和0.7549,而當只使用TCN 對低頻分量預測時,模型性能就有了較大提升,MAE和RMSE最大值分別為0.0088和0.0127,驗證了2.2節中所提出的假設:動力電池容量衰退過程中由噪聲和容量回升現象導致的非線性特征被分解到高頻分量,而原始容量數據的主要趨勢被分解到低頻分量,且低頻分量中不再有噪聲及容量回升現象導致的非線性特征,因此當只使用TCN對低頻分量進行預測時,預測精度顯著高于只使用GRU對高頻分量預測。當分別使用GRU和TCN對高頻分量及低頻分量進行預測,再對預測數據進行疊加重構時,MAE 和RMSE 最大值分別為0.0054 和0.0077,這是由于使用GRU和TCN模型對高頻分量和低頻分量進行預測時,能夠有效捕捉分解后數據的特征信息,證明本工作提出的數據分解模塊和時序預測模塊能夠有效提升模型性能。當使用加權平均集成替代疊加重構對預測結果進行集成后,MAE和RMSE最大值分別為0.0052和0.0074,證明本工作提出的數據重構方法相較于當前主流的疊加重構方法更有利于提升模型精度。以上消融實驗結果分析驗證了本工作提出模型中的數據分解模塊、時序預測模塊、數據重構模塊在動力電池的RUL預測任務中的必要性。
為了提升動力電池RUL 預測精度,本工作提出了一種多尺度分解下GRU-TCN集成的RUL預測方法,在EEMD 的基礎上,使用Attention 對GRU和TCN 模型的預測結果進行加權平均集成得到動力電池的容量衰退狀態,從而得出RUL。在NASA數據集下進行了對比試驗、消融實驗及不同預測起點實驗,得到了以下結論:
(1)使用EEMD能夠將動力電池容量衰退數據中由噪聲和容量回升現象導致的非線性特征和主要趨勢分解為不同分量,有效降低了電池容量回升現象導致的非線性特征對預測結果的影響;
(2)使用GRU和TCN 模型對不同的分量進行預測,能夠有效捕捉原始數據的總體退化趨勢和局部非線性特征,提升了電池容量衰退狀態的預測精度;
(3)使用Attention 集成兩種網絡的預測結果,能夠避免直接疊加重構對噪聲的放大及各分量間的干擾,得到更穩定的RUL預測結果;
(4)本工作提出的模型相較于典型單一模型和其他同類型模型,最大MAE 和RMSE 分別降低了0.0076、0.0047 和0.0148、0.0046,AE 均為最小值,并且在不同電池數據下AE 波動最小,證明本工作提出的模型能夠增加動力電池RUL 預測的準確性和穩定性,可有效應用于動力電池RUL預測。在后續的研究中,可以考慮在多特征分解的基礎上,分析多特征之間的耦合關系,進一步提升動力電池的RUL預測精度。