張之琦,郁亞娟,李 茜,胡宇辰,黃 凱
(1.北京理工大學材料學院,北京100081;2.北京林業大學環境科學與工程學院,北京100083)
通常當鋰離子電池的容量下降至其標稱容量的某個特定閾值之后就很可能會出現電池故障,對鋰離子電池剩余有效壽命進行預測有著重要意義。在電池剩余壽命的預測中,健康狀態(state of health,SOH)和剩余有效壽命(remaining useful life,RUL)是兩個重要的研究指標[1]。RUL 指的是在器件的生命周期中無法實現其基本功能的時間,通常定義為從當前時間到系統或者組件出現故障的時間。SOH 描述的是老化電池與新電池相比的物理健康狀況[2-6]。
目前針對鋰電池容量的研究方法主要分為兩種,一種是基于模型預測電池容量,一種是通過數據驅動實現預測[7],如圖1 所示。但是基于模型進行預測的問題在于這類模型對電池的老化過程很難建立復雜的數學模型來進行準確的模擬,所以在數據量充足的時候常常使用數據驅動的方法來進行電池容量的預測,這一類方法忽略了一定的電化學特性,僅基于電化學數據中提取出的特征來預測電池容量[8]。
近年來智能技術的發展,特別是機器學習研究的熱潮極大地推動了數據驅動的RUL 預測技術的發展,例如各種神經網 絡[9]、隨 機 森 林[10]、支 持 向 量 機(support vector machine,SVM)[11]和用于電池RUL 預測的相關向量機(relevance vector machine,RVM)[12]。然而很多機器學習算法在應用中都有著局限性:決策樹得到的最終結果很可能收斂于局部最優解;隨機森林改善了決策樹的一些不足,有著優于SVM 的訓練速度,但是偏倚增大,在解決回歸問題時表現欠佳;多層感知機的神經網絡消耗很多計算資源,同時在對參數進行優化后很容易導致過擬合;隱式馬爾科夫模型需要大量的數據訓練才能得到精確的模型;深度學習模型雖然有著更高的精度和魯棒性,但是模型復雜度更高,訓練時間更長,面對小樣本場景時表現不佳,在很多情況下并不適用;SVM 模型有著不錯的精確度以及抵抗噪聲的能力,在大規模的數據中也有著不錯的表現,但是SVM 模型中的參數需要經過交叉驗證,SVM 的核函數需要滿足Mercer 定理并且結果無法以概率的形式輸出[13]。研究者們一直致力于開發新的思路,SVM 是剩余壽命預測中研究最為廣泛的機器學習算法之一,與其有著相同廣義數學模型的RVM 因此受到了研究者的關注。

圖1 基于模型和基于數據的算法對比[8]
RVM 作為一種機器學習技術主要用來解決回歸和分類問題。RVM 雖然是一種和SVM 具有相同廣義數學模型的算法,但是它避開了SVM 算法的很多不足,解決問題的思路也和SVM 算法截然不同。RVM 是一種基于貝葉斯的稀疏核算法,與SVM 法最大的區別是提供了對輸出數據的概率解釋[14]。除此之外,RVM 避開了SVM 的很多先天缺陷,例如SVM 算法中所使用的核函數對應的核矩陣需要滿足Mercer條件,這使核函數的選擇變得苛刻,同時SVM 對于算法中的超參數需要進行交叉驗證,而這個過程非常消耗計算資源,嚴重影響模型的效率[15]。RVM 在回歸問題上還有著優良的控制“欠擬合”和“過度擬合”的能力[16]。這些優勢使得RVM在預測剩余有效壽命研究中受到關注,并且在理論和實驗上都證明了RVM 在訓練回歸模型的時候有著不錯的泛化性能[17]。
但是RVM 算法同樣存在一些先天缺陷,例如在訓練RVM 模型時使用的一些核函數有可能會使最終的輸出結果收斂于一個局部最優解而不是全局最優解,同時RVM 算法訓練的過程中需要進行矩陣之間的相乘和矩陣求逆的操作,這使得一些RVM 算法的時間復雜度達到了O(M3),空間復雜度來到了O(M2),其中M 表示首次需要進行訓練的樣本數量,這意味著RVM 模型在面對大樣本對象的時候表現不佳[18]。已有很多研究表明RVM 算法在長期預測應用中表現不理想,導致模型對于鋰離子電池RUL 的長期預測結果和實際偏差較大。基于單一RVM 算法的預測模型在在線實時預測系統中對鋰離子電池的RUL 判斷同樣表現堪憂。為了解決這些問題,近年來很多研究針對RVM 算法提出了解決方案,希望優化RVM 模型在RUL 預測中的表現[19]。
本文對近5 年來關于RVM 的出版材料進行了系統研究,以期提供RVM 算法在電池剩余壽命預測中的主要發展趨勢和潛在應用。
RVM 和SVM 有著相同的廣義數學模型:

式中:y(xi;ω)為一個未知的非線性數學模型;ε 為RVM 模型中常用的一個滿足高斯分布的噪聲,其均值為0 且方差為σ2。
模型中的非線性數學公式y(xi;ω)表示為:

式中:φ(xi)=[1, k(xi, x1),(xi, x2),…,k(xi, xN)]T;φ(xi)為每個訓練樣本經過核函數擴展之后的基函數;ωn為每個樣本所帶有的權重;ω={ω1,ω2,…,ωN}為一個包含權值的向量。
式(2)可以簡寫為:

式中:Φ 為一個N×N+1 的設計矩陣。
整合式(3)得到:

假設模型的殘差符合高斯分布,同時為了書寫簡便令β-1=σ2,之后得到:

通過最大化式(5),求偏導即可求得ω 和β-1,但是如此求得的模型很容易出現過擬合的缺陷,所以需要先給ω 定義一個先驗分布來解決過擬合的問題[20]。 ω 先驗分布可以表達為:

參數ω 的后驗分布可以表示為:


結合貝葉斯統計學中的邊緣似然函數(marginal likelihood function)就能寫出目標的概率分布:

式(12)中mTΦ(x)表示高斯分布的均值,σ2(x)表示高斯分布的均方差,之后求得N[t|mTΦ(x),σ2(x)]的極大值就能得到其中的超參數α*和用來表示噪聲方差的β*。如此就能得到概率分布模型的表達式。目前RVM 的最大期望(expectation maximization,EM)迭代方法也得到了廣泛的應用,其原理如圖2 所示[18]。

圖2 RVM的EM迭代流程
本文中將RVM 預測的優化分為以下四個部分。
為了提升RVM 在RUL 預測中的表現,很多研究嘗試在RVM 模型中使用多個核函數優化模型,但引入多個核函數必然導致需要擬合的參數增加,無疑會增大訓練的時間和復雜程度。針對RVM 核函數的研究重心是希望解決單核RVM 算法中存在的缺陷,利用優化方法尋求最佳核函數的組成以獲得更為準確的預測結果。優化核函數的簡化方案如圖3 所示。
王春雷等[21]將核函數進行組合來優化模型,使用高斯核函數和多項式核函數構成的組合核函數代替原有的單一核函數來提高模型的泛化性能。研究結果表明,使用組合核函數的RVM 模型和使用單一核函數的方法相比,雖然效率略有降低但是準確性得到了提高。通過人工試值來調整核函數的關系仍舊具有很大的主觀性而且不全面,Yang 等[22]使用離散粒子群優化(discrete particle swarm optimization,DPSO)的策略來計算RVM 核函數最優組合,結果表明自選擇核函數的RVM 模型的訓練結果優于之前的RVM 模型。

圖3 使用RVM 進行預測的簡化流程
類似的,在Zhang 等[23]的研究中使用粒子群優化(particle swarm optimization, PSO)法實現了對核函數的組合優化。Chen 等[24]通過杜鵑算法智能地實現對RVM 中每個核函數的參數確定以得到對RUL 問題求解的最佳組合。與RVM 核杜鵑算法相結合的CS-HKRVM 算法使用混合核的策略,由于泛化能力和學習能力的提升,在數據測試中已經被證明優于單核RVM 模型。在劉月峰等[25]的研究中,果蠅優化算法(fruit fly optimization algorithm,FOA)被用來尋找組合核函數之間的組合方程系數。值得注意的是該研究為了減少模型中需要同時擬合的參數數量,首先訓練單核RVM 來確定較好的超參數,在保持超參數不變的基礎上組合多個核函數。結果表明基于FOA 群智能優化的RVM 有著比單核RVM 模型更好的預測精度。
數據模型混合方法不僅可以反映電池的退化機理,而且可以從數據集中獲得電池健康狀態的信息和演化規律,一定程度上解決了數據模型忽略物理特征和物理模型過于復雜的缺點[26]。
Wang 等[6]設計了基于RVM 和三參數容量退化模型相結合的預測方法,來進行對鋰離子電池剩余壽命的預測,實驗結果很好地表征了周期和容量之間的下降趨勢。
卡爾曼濾波器(Kalman filter,KF)是一種數據融合的算法,該算法中只需獲得上一刻的系統的估計值和現在的觀測值就能得到現在系統狀態的估計值,所以不需要記錄觀測或者估計的歷史信息。在很多研究中卡爾曼濾波器用來實現物理模型與RVM 方法的結合,其中RVM 的預測分布作為卡爾曼濾波器中的觀測值,與模型的預測分布進行結合,實現數據驅動方法和物理模型方法的融合。其基本流程如圖4 所示,雖然已經得到應用的卡爾曼濾波器種類很多,但基本原理類似。

圖4 RVM結合卡爾曼濾波器建立融合模型的簡化流程
Yuchen 等[19]結合了RVM 算法和卡爾曼濾波器算法,實現了將鋰離子電池RUL 的長期預測變成一些較為精確的短期預測。利用RVM 算法進行精確的短期預測后,利用卡爾曼濾波器將每一次的RVM 短期預測結果優化后用于更新數據集,進行重新訓練得到新的相關向量和系數矩陣,更新后能夠得到較為穩定的對下一個周期的容量的預測結果。在Zheng等[27]的研究中提出了一個類似的結合算法,不同的是該研究針對RVM 迭代計算中的累積誤差,采用加權函數來調整誤差對于預測結果的干擾,并根據預測過程的變化,開發了一種自適應協方差更新方案。
劉貴行等[28]利用差分進化算法和粒子群優化算法來優化RVM 中的參數,最后利用KF 結合物理模型對RVM 模型的預測結果進行降噪以此來削弱噪聲的影響,同時將優化后的預測結果作為在線樣本添加到訓練集中,對提出的模型重新訓練,以此來動態調整系數矩陣和相關向量以執行下一次迭代預測。
除了經典的KF 模型以外,一種用于非線性系統的無跡卡爾曼濾波器(unscented Kalman filter,UKF)也被用來和RVM 模型進行結合。其中的RVR 模型為UKF 提供殘差的未來演變,利用UKF 來實現預測過程中對電池模型參數的連續更新。經過實驗驗證,得到了優于單一RVR 和UKF 模型的結果[8]。
除卡爾曼濾波器之外,粒子濾波器(Particle filter,PF)也被用來建立融合模型。粒子濾波器是一種使用重采樣算法和一組加權粒子來近似概率密度函數(probability density function,PDF)的計算模型[29]。在這類模型中RVM 常被用來從先前的電池退化數據,查找代表性的訓練向量,然后通過擬合提取的訓練向量來識別開發的容量損失模型。圖5 是這類預測模型的基本流程圖,雖然各項研究之間有所差異,但基本思路一致。

圖5 結合RVM進行預測的簡化流程
2007 年RVM 首次被用來預測電池壽命所采用的方法就是與PF 模型進行結合,在之后的一年Saha 等人的研究中再次提出了將RVM 和PF 結合的模型。研究中使用了Rao-Blackwellized PF(RBPF)框架來減少預測結果的不確定性。簡單的將PF 和RVM 模型結合會因為RVM 模型使用EIS 數據的離線性,導致模型不能通過在線數據更新模型參數[30]。
使用RVM 和PF 模型并且同時利用Monte Carlo(MC)模擬和Kullback - Leibler(KL) 發散的verification and validation(V&V)方法來校準PF 的粒子數和模型噪聲,來提高模型預測的準確性,并實現通過在線數據更新模型的參數,得到了不錯的模擬結果[31]。
利用RVM 實現對電池剩余有效壽命的預測,這種基于數據的預測方法與監測的數據有很大的關系,模型要求有大量的實驗數據才能實現穩定的建模,選擇合適的健康指標能夠提高模型的精確度以及減少訓練的消耗。
Zhou 等[7]從鋰離子電池的工作參數中提取了一種新的健康指標(HI)。研究中使用的HI 由電池的放電電壓形成,這些電壓的數據易于通過在線方式獲取,解決了之前訓練數據離線性的問題。經過處理的HI 數據利用RVM 模型實現對電池RUL 的預測。得到的結果表明優化的RVM 在RUL 預測中會得到更為準確的結果。
為了減少初始訓練數據中的噪音造成的影響,Zhang 等[23]使用經驗模態分解方法(empirical mode decomposition, EMD)和多核相關向量機(multi-kernel RVM,MKRVM)結合的電池容量預測方法。EMD 去噪方法用于處理測得的容量數據,以產生無噪聲的容量數據。基于去噪后的容量數據,構建了使用MKRVM 的電池容量預測模型。
Zhang 等[32]從電池充電和放電過程的充電電壓、電流和溫度曲線中提取特征來表征電池的老化過程,通過這些健康特征(health feature,HF)建立的模型取得了不錯的結果。于是有研究通過灰色有理分析從充電電壓、電流和溫度曲線中的14 個HF 中提取出和電池老化相關的5 個高相關性的HF。將這些經過處理的HF 數據作為RVM 模型的輸入,驗證了經過HF 萃取的特征作為健康指標有不錯的預測結果[33]。
Widodo 等[17]使用樣本熵處理放電電壓的信息并將得到的數據作為建立模型的參數,利用樣本熵功能和估算的SOH來評估電池的退化率,較為準確地實現了對于電池退化狀態的描述,同時反映電池的健康狀態。
傳統的檢測方法都是基于一些集總的性能指標,類似于容量、電阻和電壓等,而這些指標都是很多物理參數的復雜函數。雖然基于這些集總參數的方法很容易實現,但是精確度有限。所以開發基于物理化學參數的診斷方法在一些情況下變得很有意義,Zhou 等[34]通過將EIS 與機器學習方法相結合,實現了RVM 無模型物理級電池診斷方法,向物理級電池診斷邁進了一步。為了解決傳統性能指標預測不準確的問題,Zhang 等[35]選擇了5 個間接指標作為訓練模型的健康指標,使用歸一化的方法解決多參數的維度問題,同時在模型中使用動態參數,結合粒子群優化得到最終的模型,經過驗證得到了令人滿意的結果。
Zhao 等[36]使用了RVM 和灰色預測模型(gray forecast model,GM)來預測電池的健康狀態,根據預測結果更新訓練數據集,然后更新RVM 和GM。RVM 和GM 不斷地相互校正彼此的預測結果,結果表明這個過程減少了預測的累積誤差并提高了電池SOH 的預測精度。Liu 等[18]在RVM 模型上應用增量學習的策略,提出了增量優化相關向量機(incremental optimized RVM,IP-RVM)算法。該方法相比于離線的RVM,提高了預測的準確性,與再訓練RVM 預測的精度接近但是時間消耗明顯減少。在此之后,范興明等[37]利用增量學習的策略建立了實時處理數據的RVM 模型。
RVM 算法作為機器學習中一個用于分類和回歸問題的算法,在電池壽命的預測中受到了越來越多的關注,但是RVM 模型在應用的時候仍然面臨著很多有待解決的問題。建議RVM 在未來電池壽命預測中的重點研究方向為:
(1)重點關注RVM 算法和其他算法的結合,特別是與基于模型預測電池壽命的方法相結合,充分利用RVM 在壽命預測中泛化性能好以及模型稀疏的優點,并通過結合其他算法解決RVM 在長期預測中的問題。
(2)追蹤RUL 預測中對于新健康指標的研究,并將這些指標應用于RVM 模型,解決目前常用指標離線性的缺陷。
(3)注重實際使用中不確定性問題的處理,改進RVM 算法提高預測的精度。