鳳建廣,鄭紫霞,龍東騰,周波,陸明泉,鄭恒
(1.清華大學 電子工程系,北京 100084; 2.中國衛星導航系統管理辦公室,北京 100032;3.中國航天標準化研究所,北京 100071)
星載原子鐘是導航衛星最關鍵的載荷之一,其決定導航系統導航定位、測速及授時精度,是一個國家能否具備獨立發展衛星導航系統能力的核心標志之一[1-4]。開展星載原子鐘在軌剩余壽命預測,對于及時掌握原子鐘性能和運行狀況、及時制定備份鐘切換等有效在軌管理措施,以及確保衛星導航系統提供高可用性連續性完好性的服務,具有重要意義。
目前,針對航天器及單機產品壽命預測常用方法主要包括三大類:基于概率統計的方法、失效物理方法及數據驅動方法。其中,基于概率統計的方法是一種傳統的壽命預測方法,需要大量樣本以獲得失效經驗概率模型,在航天領域的應用具有一定的局限性;失效物理方法適應了航天領域樣本量少的情況,主要依靠地面試驗建立部件的失效機理模型,一般應用于航天器部件的設計階段;數據驅動方法是一種較為普遍的現代故障預測方法,主要依靠關鍵數據和數據處理方法,完全不用考慮對象的模型特征,避免了前2種故障預測方法在模型建立和知識獲取方面的困難,在航天器全壽命周期,特別是總裝、測試、試驗和在軌故障預測中具有廣闊的應用前景。
針對星載原子鐘的健康評估與壽命預測,目前常見的方法有概率統計方法、故障樹分析方法、安全查表方法等[5]。其中,概率統計方法主要是假設星載原子鐘的健康狀態或壽命服從某一種分布,通過收集大量的樣本數據,進而推測出當前星載原子鐘的健康狀態或壽命水平,該方法較為成熟,在工程中應用最廣,但極其依賴樣本數據,對于航天小子樣產品適用性不強,另外對于耗損類的失效并不適用;故障樹分析方法屬于失效物理方法中的一種,應用較為廣泛,主要通過計算底事件的失效概率,推導出頂事件發生故障的概率,該方法對經驗數據依賴較強,且不能對頂事件的故障概率實現動態變化預測,預測精確度不高;安全查表方法類似于常用的閾值判別法,主要是結合在線監測數據和閾值,給出定性的判別結果,該方法直觀、易操作,但不能做定量的判斷。
本文結合星載原子鐘在軌失效特性分析,通過概率統計與數據驅動相結合的方式,融合利用星載原子鐘質量問題數據、可靠性/壽命試驗數據及在軌遙測數據等多源數據,研究提出了一種星載原子鐘在軌剩余壽命預測方法。該方法綜合考慮了星載原子鐘電路部分的隨機失效及物理部分的耗損失效,針對不同失效類型用不同方法開展預測。其中,針對隨機失效的概率統計方法,利用貝葉斯定理融合了研制階段、地面試驗階段、在軌運行階段及同類產品的相似數據,擴大了樣本量,提高了預測準確度;而針對耗損失效的數據驅動方法,可以更好地捕捉退化數據特征,提高預測精度。
星載原子鐘一般由物理部分和電路部分2部分組成。星載原子鐘在運行過程中,不可避免受到太空復雜環境、元器件老化和供電設備故障等因素影響而發生異常[6-7]。通過以往的工程經驗,星載原子鐘的故障主要是物理器件故障[8],是隨著運行時間延長由于耗損而導致的部件失效和性能下降,如氫源損耗、真空度下降、銣泡故障[9-10]等。而電路部分主要受空間環境影響較大,主要故障模式為無功率輸出或電壓波動[11],故障表現為隨機。
基于上述分析,星載原子鐘故障可分為隨機型和耗損型2類。針對隨機型故障,基于星載原子鐘質量問題數據、地面可靠性試驗失效數據及同類產品數據,利用概率統計方法評估其可靠壽命;針對耗損型故障,提取反映星載原子鐘損耗特性的關鍵參數(如電離泡光強、二次諧波幅度),利用機器學習的方法建立退化壽命評估模型,并根據監測到的特征參數值,預測其在軌退化壽命;最終,綜合退化壽命與可靠壽命,評估得出星載原子鐘在軌剩余壽命。基于多源數據融合的星載原子鐘在軌剩余壽命預測思路如圖1所示。

圖1 星載原子鐘在軌剩余壽命預測思路Fig.1 On-orbit residual life prediction of satellite atomic clock
銣原子鐘、氫原子鐘、銫原子鐘雖然工作機理不同,但基本結構都包括物理和電路2部分,對應的失效類型均可以歸納為耗損失效和隨機失效2類,故本文方法對上述3類星載原子鐘具有普適性。
采集星載原子鐘壽命周期內多源多維數據,作為在軌剩余壽命預測的數據輸入,包括質量問題數據(本產品及同類產品地面研制/在軌運行階段質量問題)、可靠性/壽命試驗數據、在軌遙測數據及性能評估數據。以氫原子鐘為例,數據采集類型及示例如表1所示。

表1 星載原子鐘在軌剩余壽命預測數據類型及示例Table1 Data types and examples for on-orbit residual life prediction of satellite atomic clock
2.2.1 考慮隨機失效的星載原子鐘可靠壽命預測
利用概率統計的方法,開展基于隨機失效的星載原子鐘可靠壽命預測。為擴大樣本量,本文融合利用了產品質量問題(本產品及同類產品地面研制/在軌運行階段)數據及地面試驗數據,具體過程如下。
1)質量問題數據與地面可靠性/壽命試驗數據融合。利用貝葉斯方法實現質量問題數據與地面可靠性/壽命試驗數據的融合,具體流程如下[12]:
①可靠性/壽命試驗數據融合。
a)數據。試驗樣本數、累計試驗時間T、失效數r、失效時間。
b)驗前信息轉換。將驗前信息轉換為先驗信息,選定r0=1,等效試驗時間按照式(1)計算:

式中:(t0,1)為驗前信息;λ0為經驗失效率。
式(1)將驗前信息按置信度0.6進行壓縮。

若驗前信息的比值r0/t0在統計顯著性檢驗計算的區間內,則接受相容性假設,可以用驗后信息進行計算;若不在該區間內,則拒絕接受相容性假設,舍棄驗前信息,僅應用現場試驗信息進行計算。
d)驗后信息計算。綜合試驗信息(T,r)和驗前信息(t0,r0),驗后信息按照式(2)和式(3)計算:

②質量問題數據融合。
a)數據。質量問題數r′、累計在軌運行時間T′、失效時間。
b)融合過程。以上述融合可靠性/壽命試驗數據后的(T1,r1)為先驗信息,重復上述相容性分析,若相容性假設合理,則驗后信息按照式(4)和式(5)計算:

2)可靠壽命預測。利用威布爾分布開展氫原子鐘在軌可靠壽命預測。假設試驗產品數n,失效數r,相應的失效時間:t1,t2,…,tr,無失效產品的試驗或在軌運行時間tr+1,tr+2,…,tn。 基于威布爾的可靠度及壽命計算式如下:

式中:尺度參數η計算為

形狀參數m計算如下:
1)對于失效數r≥3的情況,按照求解式(9)計算:

2)對于失效數r<3的情況,根據工程經驗確定形狀參數m,通常取2~3。
在給定可靠度后,利用式(7)反算得到當前可靠度下的可靠壽命。
2.2.2 考慮耗損失效的星載原子鐘退化壽命預測
利用機器學習方法,開展基于耗損失效的星載原子鐘退化壽命預測,具體過程如圖2所示。

圖2 星載原子鐘退化壽命預測思路Fig.2 Degradation life prediction of satellite atomic clock
1)特征參數選擇。依據工程經驗,選取表征星載原子鐘性能的特征參數,以氫原子鐘為例,主要的特征參數有二次諧波幅度、二極管電壓、電離泡光強、高壓源電流、晶振壓控電壓及微波腔部溫度。
2)數據特征提取。利用深度置信網絡(deep belief network,DBN)對數據特征進行提取,數據特征提煉了原始數據中的信息,比原始數據更具有價值。DBN模型是由多層受限制玻爾茲曼機(restricted Boltzmann machine,RBM)與頂層Softmax分類器[13]構成。DBN的結構示意如圖3[14]所示。

圖3 DBN結構[14]Fig.3 DBN structure[14]
DBN是一種經典的機器學習[15]方法,由多個RBM堆疊而成,RBM由可見層和隱含層構成,可見層神經元和隱含層神經元之間相互連接,同一層的神經元之間相互獨立。可見層和隱含層神經元狀態由{0,1}代表激活和未激活狀態。RBM通過可見層和隱含層之間各神經元的連接權值來實現對隱含層的構建。數據由最底層RBM的可見層輸入,依照上述RBM訓練的過程自下而上完成DBN中所有RBM的無監督學習,最頂層的RBM輸出即輸入數據的提取特征。
3)故障模式映射。通過神經網絡模型訓練感知數據特征變化與氫原子鐘故障模式之間的關聯關系,將數據特征信息映射到故障模式空間。
4)剩余壽命預測。基于實時傳感器獲得的實時數據特征,通過數據特征與故障模式之間映射關系,計算獲得當前狀態下氫原子鐘發生各類故障模式的置信水平,從而預測氫原子鐘在軌退化壽命。
2.2.3 綜合壽命預測
運用蒙特卡羅仿真綜合退化壽命與可靠壽命,評估得出含置信度的產品在軌剩余壽命。流程如圖4所示。

圖4 星載原子鐘剩余壽命評估流程Fig.4 Process of assessing residual life of satellite atomic clock
利用仿真的方法綜合考慮隨機失效和耗損失效,對星載原子鐘的剩余壽命進行評估。基本思想是:針對隨機失效模型獲得的可靠度函數,利用蒙特卡羅仿真產生的隨機數,作為單機的可靠度,通過反算獲得單機隨機失效時間,與計算獲得的耗損失效時間進行比對,取其最小值作為星載原子鐘的在軌剩余壽命時間。
本節以北斗系統某星某氫原子鐘的一次實際故障為例,基于故障前2個月時間內的在軌遙測數據,利用DBN開展故障預測與退化壽命評估,從而與實際故障情況相比對,以驗證本文方法的有效性。由于本產品之前未發生過隨機失效,在此不對隨機失效進行驗證。
1)數據采集及預處理
采集故障前一段時間內氫原子鐘特征參數遙測值,包括二次諧波幅度、二極管電壓、電離泡光強、高壓源電流、晶振壓控電壓、微波腔中部溫度。各參數變化趨勢如圖5所示。

圖5 特征參數趨勢分析Fig.5 Trend analysis of characteristic parameters
在故障發生前,遙測參數發生2次明顯跳變,2次跳變情況如表2所示。可知,在2次數據異常表現中,二次諧波幅度、二極管電壓、電離泡光強、高壓源電流、晶振壓控電壓、微波腔中部溫度都發生了跳變。

表2 特征參數變化情況Table2 Changes of characteristic parameters
通過分析得知,2次異常值出現的時間點上多個遙測參數同時發生跳變,不可認為是單個遙測參數的遙測誤差導致而將數據剔除,因此在數據預處理過程中予以保留。
2)數據特征提取
利用DBN進行遙測參數的數據特征提取。通過分析6個遙測參數與時間序列的相關性(見圖5)發現,二次諧波幅度和電離泡光強2個參數隨時間退化趨勢較為明顯,其他4類參數遙測隨時間的變化趨勢基本平穩,未呈現出退化規律性。
故本文選取二次諧波幅度和電離泡光強2個參數開展數據特征提取。
①搭建數據特征提取網絡結構。基于DBN的氫原子鐘遙測數據特征提取網絡結構如圖6所示。

圖6 氫原子鐘遙測數據特征提取網絡結構Fig.6 Network structure for feature extraction of hydrogen clock telemetry data
②基于故障數據進行網絡權重優化。最頂層RBM輸出經過Softmax分類器,依據故障期間氫原子鐘的遙測數據,形成數據特征分類標簽,該標簽與原始數據標簽對比并計算形成建模誤差,通過誤差反向傳播算法對DBN中的RBM連接權值進行有監督的優化。
③故障預測/壽命評估模型。通過利用DBN獲得基于二次諧波幅度和電離泡光強的數據特征后,在該數據特征的基礎上進行決策分析和故障預測,利用神經網絡算法建立數據特征與本次某衛星發生的故障模式之間的關聯模型。
④故障分析。針對提取的數據特征,開展故障前一段時間內數據特征變化趨勢分析,如圖7所示。設定數據特征“0”表示健康,“1”表示故障,由數據特征變化趨勢可以看出,通過二次諧波幅度和電離泡光強提取的數據特征2019-02-07前一直穩定在“0”左右,表示此時氫原子鐘狀態健康,到2019-02-08前后開始產生波動,并于2020-02-09穩定處于0.53,并一直延續至故障實際發生之前,當故障發生后,數據特征在0.94~0.99范圍內波動。
通過分析可看出,基于二次諧波幅度和電離泡光強提取的數據特征能夠正確反映氫原子鐘健康狀態及退化趨勢,提前發現隱含在遙測參數內的故障征兆。
本文提出了一種星載原子鐘在軌剩余壽命預測方法,經上述方法分析、案例驗證,得出如下結論:
1)區別考慮了星載原子鐘在軌隨機失效及耗損失效的特性,針對不同失效特性,利用不同數據,采取不同途徑實現相關的壽命預測,較傳統概率統計等方法更具有針對性。
2)融合利用了星載原子鐘壽命周期內產生的多源多維數據,不僅考慮了當前在軌表現(在軌數據),同時結合了歷史故障信息(質量問題數據、試驗數據),預測結果更為可信。
3)傳統的閾值判別方法只能對參數進行最直觀的觀測,而本文中參數直到故障發生前都沒有超出閾值,而是在故障發生時刻突然跳變,因此閾值判別并不能捕捉參數的退化特點,大多時候都不能實現提前的故障預測。本文利用DBN開展了星載原子鐘特征參數的數據特征提取,并對故障前2個月的數據特征進行了變化趨勢分析,預測結果與實際情況一致,一定程度上驗證了本文方法可以實現故障的提前預測,為工程風險防控提供有效的決策支持。