陳榮超,崔振武
(浙江浙能鎮海發電有限責任公司,浙江 寧波 315208)
隨著控制功能和范圍的擴大,火力發電廠分散控制系統 (Distributed Control System,DCS)系統的復雜性和故障的離散性增加,而其可靠性下降,DCS系統的某些故障引發、導致機組被迫停運的情況時有發生。DCS所處的地位決定了要求其保持安全、連續穩定、經濟低耗的可靠性。可靠性技術始于20世紀40年代,美國軍事工業、航天航天等一些技術密集型行業中對電子設備及其系統要進行可靠性分析。目前,此項研究課題在國內發電行業的應用中,有專家針對電力設備兼顧可靠性和經濟性的最優狀態維修策略進行了研究[1],也有研究人員根據現場經驗提出了許多針對DCS可靠性技術的改善措施[2,3],但對于火力發電廠DCS可靠性的專門研究還比較欠缺。
本文將立足于某火力發電廠6號機組DCS系統 (以下沒有特別注明的地方,提及的DCS系統都是指6號機組DCS系統)近年來的實際運行和維修情況,根據DCS設備的軟硬件特點,分析DCS系統硬件和軟件可靠性,依據軟件測試來度量軟件系統可靠性,并評估出DCS系統設備的可靠性特征量。
系統可分為可修復和不可修復系統,實際工程應用中,可修復系統可靠性模型復雜,分析較為困難,當系統滿足兩個條件 (一、系統運行條件是否恒定不變;二、系統是否具有“修故如新”的特性。)的情況下,可以將可修復系統假設為不可修復系統進行分析。火電廠DCS系統的運行條件有規范要求,并基本維持不變,系統中的設備故障后以更換為主,DCS系統具備“修故如新”的特點,因此本文中,可將火電廠DCS系統假設為不可修復系統來進行可靠性分析。
DCS系統可靠性分析通常將硬件可靠性和軟件可靠性分別討論。硬件可靠性技術主要包括部件、元件、產品或系統的可靠性研究,其理論和實用工具都已日趨成熟;軟件可靠性評估方法沒有硬件成熟,其不同的評估方法適用的局限性也較大。
6號機組DCS系統改造于2006年,圖1是改造結束后的DCS系統結構圖。該系統的物理分布主要有三層網絡,分別是冗余的監控網絡、系統網絡和控制站內的控制網絡;有17個控制站分別控制全廠的鍋爐、汽機、電氣等專業的設備;有主、備兩個服務器,互為冗余;人機接口設備中4臺操作員站用于運行人員操作,另有1臺工程師站用于軟件修改、信號強制等工作。

圖1 6號機組DCS系統結構Fig.1 No.6 unit DCS system structure
可靠性框圖是按單一和可視的方式表示系統中單元之間可靠性關系的一種方法,與單元的物理連接無關。根據DCS系統結構圖,可以得出以下DCS系統、子系統的可靠性框圖。圖2是DCS系統層次的可靠性框圖,是一個串—并聯系統可靠性框圖。圖中,A表示控制站的可靠度;B1,B2表示系統網絡1,2的可靠度;C1,C2表示服務器1,2的可靠度;D1,D2表示監控網絡1,2的可靠度;E表示人機接口設備的可靠度。

圖2 6號機組DCS系統可靠性框圖Fig.2 No.6 unit DCS reliability block diagram analysis
由圖2可得DCS系統硬件的系統總可靠度為

框圖中,A是各個控制站的串聯集合,根據17個控制站的串聯組合,可以得到控制站子系統層次的可靠度的算法公式

框圖中,E是人機接口設備的集合,包括4臺操作員站和1臺工程師站。在DCS系統正常運行時,工程師站設置為操作員口令,等同于操作員站,因此,人機接口站子系統可以看作是并聯組合,其算法公式可以表示為

對控制站可靠性的分析可分析到控制站單元層次的可靠性,每個控制站由I/O模塊、冗余控制網絡、冗余主控單元和冗余電源模塊組成,DCS系統控制站 (以10號站為例)的可靠性框圖如圖3。圖3中,R10pa,R10pb分別是電源模塊A,B的可靠度;R10ca,R10cb分別是主控制器A,B的可靠度;R10na,R10nb分別是串行網絡A,B的可靠度;R10mo是模塊的可靠度。因而可由圖3得到10號控制站的可靠度計算公式 (4),DCS系統各控制站結構相同,可通過式 (4)得出其他各控制站的可靠度。

圖3 6號機組DCS系統10號控制站可靠性框圖Fig.3 No.6 unit DCS No.10 control station reliable diagram

在計算DCS系統可靠度時,一種方法是可根據電子元器件的可靠度逐一向上計算模塊單元可靠度、子系統可靠度,直至計算出系統的可靠度。這種計算方法,需要知道模塊單元中電子元器件的排列結構和所有元器件的固有可靠度,計算過程繁瑣并且有些元器件的固有可靠度等數據作為設備使用單位無法得到,不適合單位對系統實際使用中的可靠度分析,使用部門通過分析設備發生的故障來分析可靠性,是一種合適的可靠性分析方法。系統的可靠性分析可以通過收集到的故障數據分析來進行。
大量統計資料證明,電子產品失效機理隨著時間的增長,失效率趨近于一個穩定值,見式(5)。在電廠MAXIMO缺陷管理系統中,可以查閱到DCS系統中發生的設備故障詳細情況以及故障發生的時間和原因等,通過收集2006年升級改造后一個大修周期內產生的與DCS系統有關的故障數據,可以得出DCS系統單元模塊的MTTF。在得到了單元、子系統的MTTF以后,就可以計算得出單元、子系統的故障率和可靠度。

以下將通過整理一個大修周期之內 (2006年12月11日至2010年9月21日)的故障數據得到的各控制站子系統、人機接口站子系統等的MTTF、故障率λ以及可靠度R(t)。在故障統計中發現,控制站16號、23號、25號站,工程師站,以及監控網1在大修周期內沒有故障發生,根據DCS系統硬件生產廠家的說明,將這部分沒有發生故障的設備的可靠性時間確定為100 000 h。根據式 (4)可以得出各控制站的可靠度,以10號控制站為例,式 (6)就是其可靠度計算公式

同理,可以得出人機接口、服務器、系統網、監控網等子系統的MTTF、故障率λ,以及可靠度R(t)的計算結果,見表1。

表1 6號機組DCS系統設備的MTTF、故障率λ,以及可靠度R(t)Tab.1 MTTF,failure rate,reliability of No.6 unit DCS equipment
由上可得DCS子系統硬件的可靠度RE(t),RH(t)

軟件可靠性較難用一個特征量來完全代表所有軟件,不同類型的軟件在不同的情況下可以采用不同的可靠性模型和可靠性特征量。有技術人員提出了基于缺陷度量的軟件可靠性度量方法[4]。有專家探討了軟件失效的機理并提出了基于三角形模糊數算術運算的軟件可靠性評估方法[5]。
軟件測試是根據軟件開發的要求和軟件內部結構而設計的測試用例,并利用這些測試用例去執行程序,以發現軟件錯誤的過程。在軟件的開發過程中,往往通過軟件測試來度量軟件的可靠性。在DCS軟件現場使用中,可以考慮先通過故障模式及影響分析確認DCS軟件的失效模式及其各故障的分類等級,再根據軟件測試中的可靠性度量方法來估計DCS軟件的可靠性。為了方便計算和比較,統計時間定為100天。從MAXIMO缺陷管理系統DCS軟件故障數據記錄中可以查到,DCS軟件運行100天之內,出現了各1次的邏輯程序故障 (C級故障)、內部計算出錯 (C級故障)、操作顯示故障 (D級故障)、報表數據統計錯誤 (E級故障)以及打印錯誤信息 (E級故障)等,以及多達7次的自動系統未達性能要求故障(E級故障),根據生產廠家提供的軟件測試估算公式,可以得到DCS軟件運行100天之后的可靠度估算值:

將t=2 400代入計算各式,可得以下DCS各子系統和整個系統的可靠度:

即DCS系統工作2 400 h(100天)后的可靠度為0.452,其中硬件可靠度為0.536 5,軟件可靠度為0.842 3。
由上文對火電廠DCS系統的可靠度探討可知火電廠DCS系統的故障率是比較高的,究其原因,主要有以下幾點:
(1)火電廠DCS系統實際運行環境和試驗時的條件差別甚大,存在諸多干擾源。
(2)生產廠家的提供的理論計算是在理想化情況下的計算結果,而且生產廠家的試驗只是涵蓋了部分DCS系統的軟硬件,不能完全仿真實際運行狀態。
(3)火電廠現場操作、維護人員工作失誤等影響了可靠性。
(4)火電廠DCS系統設備安裝過程不規范也會導致DCS設備可靠性的降低。
為了克服上述問題對火電廠DCS系統可靠性的影響,需要在DCS系統的可靠性技術措施上進行分析、研究。針對目前的DCS系統的特點,結合分析了DCS系統的故障,提出了幾項提高電廠DCS系統可靠性的技術措施并加以實施:
(1)部分控制站負荷率較高并達到45%及以上,而一般要求分散控制單元負荷率不超過40%。主控單元負荷率相對較高是誘發主控單元故障的重要原因,為此對部分負荷率較高的I/O站進行改進,盡量分散I/O模塊到其他站內,同時將部分性能計算方案的掃描周期由250 ms改為1 s,另對一些相對次要的控制算法的掃描周期由250 ms改為500 ms,將負荷率控制在30%以內。
(2)根據控制站控制網Profibus-DP協議的要求,總線的特性阻抗應該為110 Ω左右,如果總線連接出現“虛接”,則總線的特性阻抗將發生改變。當總線虛接阻抗過大時,終端匹配器會產生過匹配的現象,從而使終端匹配器失去匹配的作用,導致控制網離線故障的產生。造成DP總路“虛接”有多種原因,其中主要是安裝不夠緊固,垂直安裝的模塊底座受機械振動引起觸點松動和現場環境不佳 (如濕熱等)引起觸點氧化。在停機檢修時應緊固模塊底座,同時用萬用表測量一串底座DP鏈路的電阻值,確認是否小于2Ω。機組運行時如出現此現象,則可臨時并接底座上的DP通訊端子,能有效防止此類故障的發生。
通過采取技術措施,確實可以減少DCS系統設備故障,提高DCS系統可靠性。更適宜的方法是針對DCS系統設備進行RCM分析,執行RCM過程,通過確定重要功能設備或單元,進行故障模式及影響分析,應用邏輯決斷選擇維修類型并最終形成火電廠DCS系統的以可靠性為中心的維修決策,提高DCS系統可靠性。
[1]張宏,王健,文福拴,等.兼顧可靠性和經濟性的電力設備最優狀態維修策略[J].電力科學與工程,2006,(2):8-13.Zhang Hong,Wanf Jian,Wen Fushuan,et al.Optimal scheduling of condition-based maintenance for electric equipment considering reliability and economy[J].Electric Power Science and Engineering,2006,(2):8-13.
[2]孫立軍,丁偉玲.集散控制系統的可靠性分析[J].船電技術,2008,28(2):127-128.Sun Lijun,Ding Weiling.Analysis on reliability of distributed control system[J].Marine Electric and Electronic Engineering,2008,28(2):127-128.
[3]王建鋒,羅振新,薛鵬.影響DCS可靠性的因素分析[J].華東電力,2008,36(4):109-112.Wang Jianfeng,Luo Zhenxin,Xue Peng.Analysis of factors influencing DCS reliability[J].East China Eletric Power,2008,36(4):109-112.
[4]徐燕,鐘德明,付文佳.基于缺陷的軟件可靠性度量方法研究[J].測控技術,2009,29(3):67-70,73.Xu Yan,Zhong Deming,Fu Wenjia.Research on software reliability metric based on defect[J].Measurement& Control Technology,2009,29(3):67-70,73.
[5]石柱.控制軟件可靠性設計和評估方法[J].航天控制,2004,22(1):58-62.Shi Zhu.Control software reliablity design and assessment method[J].Aerospace Control,2004,22(1):58-62.