張 偉,王憲勇,3,崔秀艷,何 旭
(1.中國科學院沈陽自動化研究所機器人學國家重點實驗室,遼寧沈陽 110016;2.中國科學院機器人與智能制造創新研究院,遼寧沈陽 110169;3.沈陽理工大學自動化與電氣工程學院,遼寧沈陽 110159;4.河北軟件職業技術學院,河北保定 071000)
現如今,對未知空間領域的積極探索,極大地促進了科學技術的高速發展,航天器便是應時代發展的產物。航天技術的發展與進步,是社會和諧、國家安全、人民幸福的有力保障。為保證一系列探月活動等深空任務的高效開展,衛星的可靠性,即器件的穩定性、使用壽命等問題成為重中之重,是航天器運行的基本保障,更是開展探月活動的基石。
2013年7月至2014年5月,由于各種故障的出現,俄羅斯“質子-M”火箭七次發射失敗、2015年4月,美國太空探索技術公司完成了五次空間站貨運任務后,第六次將“龍”號宇宙飛船火箭發射到國際空間站時,火箭第一級垂直降落嘗試失敗。高成本、任務重已然成為衛星的標簽,為確保衛星安全的運行在其軌道上,需要對其執行任務期間的工作狀態進行分析和研究,通過數據信息預測其剩余壽命,以最大可能性減少或避免由時間積累導致的設備老化故障而造成的損失,十分有必要。
電源系統是航天器的核心部件之一,電源系統的研發、維護管理技術的不斷進步是經國大業。鋰電池——航天器上易損壞、易損耗的關鍵部件,其眾多優點中的存儲能量多、質量輕、使用壽命長等特點,符合航天技術進步的需求。航天技術的日益發展與完善,電源技術更隨之不斷完善,鋰離子電池日趨取代了傳統鎳鎘蓄電池在人造衛星中的地位,其質量輕、體積小,減輕衛星固有質量,有效載荷得到顯著提高,因此,鋰電池成為人造衛星核心儲能設備,是航天事業發展的必然選擇。文獻[1]統計了527次國外航天器發生故障的原因,電源系統發生的故障占總比的14%,位居可能發生的故障因素的第二位。鋰電池作為能源系統的主要儲能設備及能源供應,研究影響其性能退化的因素以及預測其剩余使用壽命,對提高衛星使用的可靠性起到至關重要的作用。壽命預測技術不僅保證了系統的安全性[2]和可靠性[3-5],又能最大化的利用資源,避免了資源浪費。隨著人工智能技術與大數據的不斷應用和發展,數據挖掘算法、遞歸濾波算法、粒子濾波算法等以及深度學習網絡模型都被應用于衛星的壽命預測研究中。
1)數據挖掘算法,可以僅通過電池在使用階段各個時刻的表征數據來建立回歸模型,而不需要分析復雜多變的化學反應來建立機理模型[6],使得電池的健康管理變得更為簡單、便捷。Anton[7]等人應用支持向量回歸機(Support Vector Regression,SVR)分析鋰電池的電流與溫度、電池的荷電狀態與電壓的關系,建立了基于數據驅動(data-driven model)來分析電池使用情況的模型,從而估計電池的損耗情況。
2)遞歸濾波算法(Recursive filter algorithm),直接使用電池在使用階段各個時刻的表征數據來分析、估計與預測電池的故障,因此被廣泛應用于鋰電池健康管理中。同類別的卡爾曼濾波算法(Kalman Filter)也毫無疑問的被一些研究者應用于電池健康狀態診斷的研究中。因此,Andre[8]等人建立了無跡卡爾曼濾波器(Unscented Kalman Filter,UKF)與卡爾曼雙濾波器模型估計電池的剩余容量與荷電狀態,通過剩余容量值與荷電狀態來估計電池的剩余使用時長。
3)粒子濾波(Particle Filter,PE),貝葉斯濾波方法中最簡單的一種,通過粒子定位,可以反應被測量的密度信息。Li等人應用粒子濾波估計出鋰電池容量值隨時間衰退的趨勢,根據此趨勢建立方程,得出相關關系的表達,估計出電池在任意時刻的容量信息,從而得出電池當前的使用情況,但是并未提及如何進行鋰電池剩余使用時間預估計的方法。
衛星上的鋰電池[9]隨著充放電次數的不斷增加,電池電壓從滿電壓放電到閾值電壓的時間會逐漸縮短[10],按照等電壓記錄時間會得到一組組序列數據。LSTM網絡因其獨特的結構被頻繁用于序列數據的分析與預測,被廣泛的應用在語音識別、語言建模、機器翻譯等。鋰電池放電的特性也符合序列數據的特性,本文將采集的電池放電時間信息結合LSTM網絡算法,進行衛星電源系統的壽命預測[11]。
LSTM是循環神經網絡的最知名和成功的擴展。由于循環神經網絡有梯度消失和梯度爆炸的問題,學習能力有限,在實際的任務中往往達不到預期的效果,長短時記憶網絡可以對有價值的信息進行長期記憶,從而減小循環神經網絡的信息難度,因此在語音識別、圖像描述文本生成等問題中有著廣泛的應用。如圖1為長短時記憶網絡模型內部結構示意圖。

圖1 長短時記憶網絡內部結構
與傳統的循環神經網絡相比,長短時記憶網絡仍然是基于xt和ht-1來計算ht,內部的結構進行了優化設計來緩解誤差的無限累計,加入了輸入門it、遺忘門ft以及輸出門ot三個門和一個內部記憶單元ct輸入門控制當前時刻新狀態更新到細胞中的程度;遺忘門控制上一時刻細胞單元中的信息被遺忘掉的程度;輸出門決定當前細胞輸出有多大程度上取決于當前的記憶單元。通過“門”來對數據流進行控制,來增加或去除信息到細胞狀態的能力,計算過程如式(1)至式(6)。
it=σ(wixt+uiht-1+bi)
(1)
ft=σ(wfxt+ufht-1+bf)
(2)
ot=σ(woxt+uoht-1+bo)
(3)

(4)

(5)
ht=ot⊙tanh(ct)
(6)
在LSTM細胞中,如圖1所示,第一步會經過“遺忘門”,該門會讀取細胞上一時刻的輸出ht-1和當前時刻的輸入xt。數據經過sigmoid函數輸出一個在0和1之間的數值,更新上一時刻細胞狀態ct-1,‘1’表示“完全保留”,‘0’表示“完全舍棄”。更新后的數據與輸入層的數據結合,得到當前細胞狀態ct,作為下一時刻更新細胞狀態的輸入數據。然后對信息就行篩選,決定什么信息將被更新到細胞狀態中,統稱為“輸入層”,一部分為sigmoid層,決定什么信息將要更新,另一部分為tanh層,根據輸入產生一個候選向量。接著將細胞狀態由舊狀態ct-1更新到新狀態ct。將舊狀態ct-1與ft相乘,對信息進行篩選,并加上更新的新信息,得到新的狀態ct。最后,根據當前的細胞狀態產生一個輸出值,作為下一個細胞的輸入值。
本論文采用兩種規范化數據的方法,分別為基于最小-最大規范化、Z-score規范化,對比不同規范化對數據預測的影響。
如圖2所示為長短時記憶網絡的基本架構。

圖2 長短時記憶網絡架構
為使算法預測的準去性較高,在正式預測前需要對算法的層數及細胞的長度進行選取,在相同層數不同細胞長度及相同細胞長度不同層數的長短時記憶網絡模型中進行訓練和測試分別得到如圖3、圖4所示的測試圖片。
圖3中,從左至右從上至下分別是細胞長度為16、32、64、128的長短時記憶網絡,從圖中可以看出隨著層數的增加預測的精度在不斷提高,在16層和32層時可能由于模型過于簡單,存在欠擬合問題使其預測精度不高,在64和128個細胞長度的長短時記憶網絡預測的效果較好。考慮效率等問題,選取64個細胞長度的網絡模型

圖3 不同細胞長度的算法訓練對比圖
圖4中,從左至右從上至下分別是網絡層數為1、2、3和4的網絡模型,從圖中可以看出使用1層的網絡模型預測效果最好,2層和3層的網絡模型預測數據出現波動情況,4層的網絡模型甚至無法進行數據預測。故本文選取1層的LSTM網絡模型。

圖4 不同層數的算法訓練對比圖
衛星在長期運行過程中不可避免地會逐漸老化,如果運行的條件復雜,運行環境惡劣,則會加速其老化的過程。設備的剩余壽命減少,安全隱患風險逐漸增大,甚至導致突發性的惡劣事件。
在影響衛星壽命的諸多因素中,可控因素只有衛星本身。通常會研究鋰電池和動量輪近而來研究衛星的剩余壽命。美國國家航空航天局(NASA)公布的衛星電池測量數據集(共對4塊電池進行了相同的實驗,分別為電池5、電池6、電池7和電池18)如圖5所示為電池5的放電曲線,從中可以看出隨著充放電次數的增加電池有效使用時間逐漸減少。

圖5 放電曲線
為使用長短時記憶網絡,需要對此數據進行預處理,對數據進行特征提取,選取電壓相同時間點,記錄下電池此時已使用的時間,每組數據選取170個特征數據一共130組數據作為長短時記憶網絡的輸入數據來進行網絡的訓練,其中70%的數據作為訓練數據集,30%的數據作為測試數據集。處理后的訓練數據集如圖6所示。

圖6 電池放電時間曲線
圖6中每條數據之間相差20次充放電次數,圖中曲線可以明顯的看出電池使用時間在逐漸減少。
從圖6中可以看出數據量級跨度比較大,包含十、百、千,為提高數據預測的精度,需要對數據進行無量綱處理。本文采用Z-score數據規范化方法,Z-score規范化公式為

(7)


圖7 數據無量綱化
網絡的總體架構選取如表1所示,網絡訓練前采用Z-score規范化方法對數據進行無量綱操作,提高訓練精度。網絡的輸入為130組數據,每組包含170個數據,共22100個數據。70%為訓練數據集,30%為測試數據集。經過訓練,網絡預測準確率達到98%以上,如圖8所示為網絡的預測曲線,數據分析如表2所示,預測誤差穩定在0.03左右。

表1 網絡架構設定

圖8 預測曲線

表2 數據分析
本文基于LSTM網絡提出一種衛星壽命預測方法,通過對網絡的細胞長度及層數進行研究,選取了合適的細胞長度及層數,采用NASA公布的衛星電池數據集作為網絡的數據集,并對數據集無量綱化處理提高預測的準確率。對訓練好的網絡進行測試,測試結果準確,表明了使用該方法進行衛星壽命預測的有效性。