楊婷
(北京經濟管理職業學院 信息學院, 北京 100102)
核島三廢處理系統工藝復雜, 控制設備多,為了保證三廢處理系統在核電站的整個生命周期內安全可靠、穩定運行,就需要對原有的繼電器控制的三廢處理系統進行改造。從嶺澳二期開始,核島三廢處理系統的控制系統已經開始采用數字化控制系統(Digital Control System,DCS)的設計替代原有的繼電器控制,采用數字化的設計方法,也由此會帶來數字化系統的可靠性研究問題。
基于核島三廢處理(KSN)系統,本研究給出了KSN系統的總體架構,并分析了KSN系統的功能及信號流,在此基礎上,針對KSN系統的可靠性需求,運用故障樹(Fault Tree Analysis,FTA)建模方法分析其可靠性,最后,給出了一種建議改進方案供設計人員參考,從可靠性定量的角度分析并評估了系統設計。
定量可靠性評估技術需要明確兩點:一是需要確定待評價的量化指標;二是需要確定評價所用的建模方法,如可靠性框圖(Reliability Block Diagram,RBD)、故障樹(Fault Tree,FT)等。根據標準GB/T4083-2005中的要求[1],研究了典型核電廠數字化停堆系統的可靠性指標評估方法,通過運用故障樹(FTA)建模方法,對該系統建立故障樹模型,并將該方法應用于KSN三廢處理數字化控制系統的可靠性指標評價中,進而分析其是否滿足相應的可靠性指標要求。
核島三廢處理系統可以有效防止放射性廢物污染,是整個核電站系統非常重要的部分,它對于防止放射性廢物外泄,保障核電站安全運行和人員輻射防護安全起著很重要的作用。因此,作為核島三廢處理控制系統的設計和設備應該符合安全可靠、長期穩定運行的要求[2]。
KSN控制的核島三廢處理工藝系統包括[3-4]:棚回收系統(TEP),廢液處理系統(TEP),廢氣處理系統(TEG),固體廢物處理系統(TES)(核輔助廠房的廢物處理站部分)。KSN系統作為三廢處理系統的專用控制系統,主要完成如下功能:數據采集和處理、過程控制、運行監控、協助運行和報警處理。KSN系統的總體架構如圖1所示。

圖1 KSN系統總體架構圖
從該架構圖可知:信號從現場輸入,經過輸入模塊處理,通過控制網傳輸到現場控制層的2個冗余控制器A和B中,經處理后通過系統網傳遞到系統服務層的服務器A和服務器B,再經過管理網傳輸到監測控制層的操作員站,反向信號流與此類似。
本文以KSN系統的控制功能、監測功能為例,依據故障樹建模過程,建立并分析系統故障樹模型,并提出改進方案。
故障樹分析法,簡稱FTA(Fault Tree Analysis),早在六十年代初就由美國貝爾研究所首先用在民兵導彈的控制系統設計上,為預測導彈發射的隨機失效概率做出了貢獻。到六十年代中期,FTA從宇航領域進入核工業和其它領域。目前,工程技術人員仍傾向于采用FTA作為評價系統可靠性和安全性的手段[7],用FTA來預測和診斷故障,并分析系統的薄弱環節,指導運行和維修,實現系統設計的最優化[8]。
完整的故障樹建模過程包括如下5個步驟[5 ]。
(1) 明確系統定義:定義被分析系統功能、架構及其接口關系。
(2) 確定分析對象范圍:確定系統的范圍、組成及其他系統的分界線,確定系統分析的最基本的元部件。問題的邊界條件應定義清楚,否則在一個大系統中,故障樹不知應建到何處為止,為清楚限定故障樹的范圍,除對所討論的系統和其它系統的界面做出明確劃分外,還應給出必要假設,例如:假設導線不會故障,不考慮人為失誤等都是建樹時的一些邊界條件。
(3) 確定故障判據:根據系統實現功能及任務,確定各層次產品的故障判據,來分析判斷系統的運行狀態。故障事件應精確定義,指明故障是什么,在何種條件下發生,即確定故障判據。應將故障事件區分為“部件性故障”和“系統性故障”?!安考怨收稀笔侵冈摬考旧砜赡墚a生的故障,否則屬于“系統性故障”。
(4) 可靠性模型建立:結合系統分析范圍及故障判據,選用合適的可靠性建模方法來建立數學模型。建樹應逐級進行,首先將邏輯門的全部輸入事件都確定清楚后,方可去展開這些輸入事件,絕不允許“跳躍”,因為“跳躍”會造成遺漏。
(5) 可靠性指標分析及計算:根據可靠性模型及可靠性指標計算原理,得出系統可靠性指標計算結果,同時驗證系統是否滿足可靠性定量指標要求,如果不滿足,需要找出薄弱環節并提供改進建議[6],為設計人員后續設計改進提供參考。
本文以KSN系統的控制功能、監測功能為例,將FTA應用于KSN系統,針對KSN系統的功能及故障判據,建立FTA模型,以此來評價KSN系統的可靠性指標。
本文描述的KSN三廢處理數字化控制系統采用分層分布式結構。在KSN的系統需求規格說明書中要求,系統整體的平均故障間隔時間(Mean Time Between Failure,MTBF)要滿足10萬小時。從KSN的系統整體架構圖以及分層設計結構中可知,整個KSN系統劃分為3個功能層次:現場控制層、系統服務層和監測控制層。按照FTA建模過程,根據KSN系統功能,通過梳理信號流來確定故障判據,根據故障判據,建立相應層級的故障樹模型。KSN的故障判據分別從3個層次進行約束,以下給出建模過程。
(1)頂層故障判據:頂層故障判據也稱系統層故障判據,KSN的系統層由現場控制層、系統服務層和監測控制層組成,系統服務層和監測控制層有冗余處理,3個功能層只要有一層功能喪失,則整個系統失效。系統層故障樹模型如圖2所示。

圖2
(2) 第二層故障判據:KSN故障模型的第二層故障判據以現場控制層為例,現場控制層的故障判據確定如下:KSN每個控制站實現不同的功能,只要有一個控制站故障,則整個現場控制層就失效?,F場控制層故障樹模型如圖3所示。

圖3 現場控制層故障樹
系統服務層和監測控制層的分析與此類似,依據邏輯關系進行故障判據的確定,故障樹模型如圖4、圖5所示。

圖4 系統服務層故障樹

圖5 監測控制層故障樹
(3) 底層故障判據:底層故障判據是以板卡為最小基本單位,以現場控制層的控制站為例,經過功能分析,確定控制站的故障判據如下:單個控制站由冗余的MPU(Micro Processing Unit)板卡、冗余HNU(High Network Unit)板卡以及IO(Input/Output)板卡組成,其中,IO板卡沒有冗余處理,因此,從實現單個功能的角度出發,只要一個IO板卡故障,則整個控制站就失效;對于冗余MPU來說,只有兩個MPU同時故障,才會導致控制站失效;對于冗余HNU來說,只有兩個HNU同時故障,才會導致控制站失效??刂普竟收蠘淠P腿鐖D6所示。

圖6 控制站故障樹
在進行可靠性分析時,需對上述模型進行如下假設。
(1) 假設板卡及系統的故障率分布滿足標準指數分布
(2) 各板卡本身故障相互獨立
(3) 假設板卡及系統只有正常和故障兩種狀態
(4) 單個板卡的MTTR(平均故障維修時間)為4小時
根據以上建立的故障樹模型,計算系統的MTBF能否滿足要求的10萬小時。本文運用可靠性分析軟件Isograph 13.0版本,輸入底層事件樹的失效率,以現場控制站為例,分析了單控制站到現場控制站以及整個系統的各層次的MTBF及失效率,結果如表1所示。

表1 25 ℃失效率及MTBF計算結果
由表1可知,計算的結果無法滿足系統的10萬小時的要求。根據單點故障分析,需要改進設計或是重新確定系統的架構及故障判據,因此,提出以下兩種改進方案。
通過上述結果分析,控制站中存在單點故障以及薄弱環節,經分析其控制站的功能,得出8個控制站實現的功能均不相同,若考慮單個關鍵功能,現場控制站在上面的故障樹模型中,過于嚴苛,沒有考慮單個關鍵功能,因此,需要細化建模過程,從單個功能實現的角度分析,對現場控制層建模時,故障樹模型中只體現一個控制站。同理,主控制站中的I/O板卡,也應根據每個功能進行細化建模,因控制站的某個關鍵功能由一個AI/DI采集,一個DO/AO輸出,因此,控制站單個關鍵功能的可靠性框圖如圖7所示。

圖7 控制站單功能可靠性框圖
經分析計算,該方案已滿足系統可靠性要求,但通過Isograph軟件分析,在上述架構中,由于存在系統單點故障,從系統設計安全性可靠性角度,對上述影響系統可靠性的IO板卡還需做進一步優化設計,即考慮增加IO板卡冗余,以消除單點故障,經改進后,系統可靠性框圖結構如圖8所示。

圖8 冗余IO控制站單功能可靠性框圖
改進后,單控制站到現場控制站以及整個系統的各層次的MTBF及失效率的結果如表2所示。

表2 考慮IO冗余25 ℃失效率及MTBF計算結果
本研究以KSN系統的數字化控制系統為對象,研究了對數字化KSN系統應用故障樹分析的可行性及應用情況,并根據故障樹模型對KSN系統的可靠性進行定量分析,同時確定了系統的薄弱環節。根據可靠性分析結果及系統設計中的薄弱環節,給出了一種系統改進方案供設計人員參考,從可靠性定量角度分析并評估了系統設計。通過工程應用及實踐表明,在數字化儀控系統中開展故障樹分析,不僅可以評估系統的可靠性,同時,可以使設計人員加深對系統功能及運行機理的理解,以進一步分析系統設計中的薄弱環節。
本研究是基于系統級的可靠性而進行的定量分析及評估。為了更好地利用故障樹進行系統設計的改進及指導,后續還需進一步深入到板卡內部,研究其故障機理及功能邏輯。板卡級的故障樹分析過程還會涉及到軟件故障及軟件運行機理,需研究軟件可靠性增長方法、貝葉斯網絡決策模型等內容,以此來優化數字化系統的設計及分析。上述軟件故障及軟件可靠性建模方法的深化研究將是下一步工作的重點。