仇存凱,張曉慧,樊 弢,吳鵬飛,朱紫涵
(1.上海航天控制技術研究所·上?!?01109;2.上海慣性工程技術研究中心·上海·201109)
1553B通信具有可靠性高、實時性強、易于擴展等優點,現已廣泛應用于航天數據傳輸系統。但是,由于太空中各種不穩定因素的存在,如單粒子翻轉等,若不對空間站推進1553B通信系統進行冗余設計,系統存在單點失效的可能,導致推進系統與外界通信異常,進而影響空間站正常運行。為避免單點失效對空間站造成的不良影響,利用冗余技術安全可靠、容錯性能好的特點,對1553B通信系統中重要的電子元器件進行雙余度冗余設計,以保證系統可靠性。
目前,可靠性分析研究方法主要包含威布爾模型法、貝葉斯網絡法以及馬爾可夫鏈法等。其中,威布爾模型法基于系統樣本數據進行分析計算;貝葉斯網絡法側重于事件靜態概率分析;馬爾可夫鏈法則根據系統狀態轉移關系分析其動態可靠性。鑒于空間站推進1553B通信系統屬于單件小批量產品,本文采用馬爾可夫鏈法建立可靠性模型,分析1553B通信系統的動態可靠性,并引入可靠度以及平均無故障時間作為可靠性定量指標。
由于本文設計方案對空間站推進1553B通信系統中包含數據隔離芯片在內的遠程終端及其處理器均進行了雙余度冗余,系統狀態組合隨之增加,這將導致系統可靠度求解過程變得復雜。因此,本文將1553B通信系統故障樹中的動態子樹與靜態子樹進行分離,采用馬爾可夫鏈求解動態子樹,并在此基礎上求解整個系統故障樹,以簡化求解過程,提高計算效率。
定義{(),≥0}為系統在時刻所處狀態,其取值范圍為可數狀態集合={1,2,…,},其中(屬于非零自然數)為系統狀態總數,()在集合上隨機取值。對于任意時刻(屬于自然數),有0≤<<…<<+1,若+1時刻系統所處狀態概率滿足式(1),則將式(1)描述的隨機取值過程稱為馬爾可夫鏈。
{(+1)=+1|()=,(-1)=-1},…,
()=}
={(+1)=+1|()=}
(1)
式中,為系統在時刻所處的狀態,∈。
在任意≥0時刻,經過任意Δ>0時間,若系統狀態轉移概率滿足式(2),則稱滿足式(2)的馬爾可夫鏈為齊次馬爾可夫鏈。
{(+Δ)=|()=}=(Δ)
(2)
式中,為系統在時刻處于狀態條件下在+Δ時刻處于狀態的概率;(Δ)為系統在任意時刻經過一定時間增量Δ由狀態轉變成狀態的概率;,為系統所處狀態,,∈。
齊次馬爾可夫鏈具備以下式(3)所示性質。

(3)
基于空間站高可靠性要求,本文方案采用雙余度冗余技術對推進1553B通信系統進行冗余,以保證空間站長期穩定地在軌運行。
1553B通信系統設計架構如圖1所示,其中數據收發裝置(遠程終端和數據隔離芯片)為熱備,處理器為冷備。具體工作原理如下:上位機根據通信狀態自主選擇總線1或總線2進行通信,選擇總線1時,發出中斷1至處理器;選擇總線2時,發出中斷2至處理器。當班處理器(當前處于熱機狀態的處理器,當處理器1通路故障時,由處理器1切換至處理器2)根據中斷置出片選(片選1對應中斷1、片選2對應中斷2),選通數據隔離芯片1或數據隔離芯片2,進而控制遠程終端1或遠程終端2,從而實現與上位機之間的通信。

圖1 1553B通信系統架構Fig.1 Architecture of 1553B communication system
根據1553B通信系統工作原理,分析可能產生通信系統故障的原因,其中可能失效的部件主要包含遠程終端、數據隔離芯片以及處理器,并由此構建圖2所示動態故障樹。

圖2 1553B通信系統動態故障樹Fig.2 Dynamic fault tree of 1553B communication system
圖2中:HSP為熱備件門;CSP為冷備件門;為頂層事件;、、、為中間事件;、、、、、為底層(基本)事件。
各事件代號表示的具體含義見表1。

表1 1553B通信系統故障含義Tab.1 Failure meaning of 1553B communication system
將圖2動態故障樹分解為動態子樹及靜態子樹,動態子樹包含事件、事件;靜態子樹包含事件、事件以及以、為基本事件的頂層事件靜態故障樹,具體如圖3 (a)~(e)所示。其中,HSP為熱備門,CSP為冷備門。

(a) 頂層事件T靜態故障樹

(b) 事件A動態子樹

(c) 事件D動態子樹

(d) 事件B靜態子樹

(e) 事件C靜態子樹
由于主路/備路收發裝置由遠程終端和數據隔離芯片串聯構成,其中一個元器件失效即會導致整個收發裝置的失效,因此收發裝置的失效率由式(4)表示。
==+
(4)
式中,為遠程終端失效率;為數據隔離芯片失效率;為主路收發裝置失效率;為備路收發裝置失效率。
假定系統不可維修,采用馬爾可夫鏈分別建立事件、事件可靠性分析模型,對故障樹進行求解。其中事件馬爾可夫狀態轉移圖如圖4所示。

圖4 事件A馬爾可夫狀態轉移模型Fig.4 Markov state transition model of event A
圖4中:00定義為無故障狀態,其時刻概率表示為();01定義為主路收發裝置故障狀態,其時刻概率表示為();10定義為備路收發裝置故障狀態,其時刻概率表示為();11定義為主備路收發裝置故障狀態,其時刻概率表示為()。
根據圖4所示狀態轉移圖轉移規律,在經過時間Δ后,事件各狀態轉移表如表2所示,表中的數據為由當前狀態轉移至下一狀態的概率。

表2 事件A狀態轉移表Tab.2 State transition table of event A
由表2可得式(5)所示事件A狀態轉移方程組,≥0。

(5)
式中,為狀態轉移矩陣。
根據導數定義分別求解各狀態概率的導數
′()、′()、′()、′()

(6)
由上述方程組可得事件A馬爾可夫微分方程

(7)
式中,為事件狀態轉移速率矩陣;(0)、(1)、(2)、(3)分別為狀態、、、初始時刻概率。
對事件A馬爾可夫微分方程進行拉普拉斯變換得式(8)所示方程組。

(8)
將式(7)中初始條件(0)、(1)、(2)、(3)代入以上方程組,解得
在洛陽城里,從朝陽到夕陽,平時溫暖的風,漸漸有了寒意,平時那些充滿活力的翠綠葉子,也變成了經歷人間滄桑的枯黃葉子,以往繁華熱鬧的街道也變得冷清了,洛陽城里一切都變了。

(9)
對上述方程組進行拉普拉斯反變換得

(10)
由式(10)可得事件A發生的概率()
()=()=1-2e-+e-2
(11)
定義收發裝置的可靠度為(),則()表示為
()=()+()+() =2e--e-2
(12)
同理求解事件D動態子樹,繪制圖5所示事件D馬爾可夫狀態轉移模型。

圖5 事件D馬爾可夫狀態轉移模型Fig.5 Markov state transition model of event D
圖5中:00定義為無故障狀態;01定義為主路收發裝置故障狀態;11定義為主備路收發裝置故障狀態。
依據馬爾可夫鏈,分別計算處理器的事件D發生的概率()以及可靠度()

(13)
式中,λ為處理器失效率。
采用二元決策圖分析頂層事件T發生的概率,構建圖6所示二元決策圖對頂層事件T靜態故障樹進行分析求解。

圖6 頂層事件T靜態故障樹二元決策圖Fig.6 Binary decision diagram of top event T static fault tree
遍歷圖6所示二元決策圖,得出最小割集為{}、{},由此計算出頂層事件發生的概率()

=1-(1-())(1-())
=1-(2e--e-2)(e-+e-)
(14)
根據式(14)可得可靠度()
()=1-()
=(2e--e-2)(e-+e-)
(15)
為簡化計算,選取可靠性等級相同的電子元器件,令===,得
()=(1+)(2-e-2)e-3
(16)
由可靠度計算1553通信系統在雙余度冗余情況下的平均無故障時間



(17)


(18)
由式(18)可知,采用雙余度冗余設計方案,1553通信系統平均無故障時間增加1947倍。
依據1772-79,以選用可靠性等級為七級(=1×10h)的元器件為例,分別計算冗余和未冗余情況下1553通信系統的可靠度,并繪制可靠度隨時間變化曲線,如圖7所示。

圖7 1553B通信系統可靠度隨時間變化曲線Fig.7 Reliability curve of 1553B communication system over time
圖7顯示,15年(180個月)期間,未冗余情況下,1553通信系統的可靠度為0961866,發生故障的概率達38134;而在冗余情況下,1553通信系統的可靠度為0999262,發生故障的概率僅為00738,相比未冗余情況,系統可靠度增長389,故障概率則下降超98,極大提高了系統的可靠性。
1553通信系統是實現空間站推進系統與外界進行數據交換的關鍵部分,本文方案采用雙余度冗余技術,對推進1553通信系統各組成器件進行冗余設計,以保證系統可靠性。
本文通過建立1553通信系統故障樹,并將故障樹分解為動態子樹與靜態子樹,分析系統可靠性。其中對于動態子樹,本文引入馬爾可夫鏈建立1553通信系統可靠性模型,繪制系統狀態轉移圖,分別對系統中冷、熱備份模塊動態子樹進行可靠度計算,并在此基礎上采用二元決策圖求解整個系統故障樹可靠度。
根據本文計算結果可以得出,隨著雙余度冗余技術的應用,1553通信系統平均無故障時間大幅增加,故障發生概率大幅降低,系統可靠性顯著改善,由此驗證了雙余度冗余設計方案對1553通信系統可靠性提升的有效性。