陳德林
(海南核電有限公司,海南昌江 572733)
昌江核電廠集散控制系統(tǒng)(DCS,Distributed Control System)采用的FOX-BORO 公司的I/A 系統(tǒng),為電廠過程控制層,其他控制系統(tǒng)通過網(wǎng)絡與DCS 進行信息傳送,并將其他系統(tǒng)控制、監(jiān)視參數(shù)通過DCS 傳送至主控室。汽輪機數(shù)字電液調(diào)節(jié)系統(tǒng)(DEH,Digital Electronic Hydraulic Control)采用艾默生公司的Ovation 系統(tǒng),主要用于汽輪機的控制、保護及監(jiān)測。DEH 與DCS 通信正常與否對汽輪機正常運行有直接影響,在機組安全穩(wěn)定運行過程中具有重要意義。
DEH 與DCS 之間的通信故障頻繁發(fā)生,直接影響操作員對汽輪機相關系統(tǒng)的監(jiān)視及控制,進而影響機組安全穩(wěn)定運行。為滿足操作員能實時、準確、可靠地對汽輪發(fā)電機的監(jiān)測、控制和操作,DEH 與DCS 之間存在大量的數(shù)據(jù)通信。因此,確保DEH 和DCS 之間網(wǎng)絡通信、數(shù)據(jù)收發(fā)暢通尤為重要?;诓穗姀SDEH 與DCS 系統(tǒng)之間存在的通信故障問題,研究如何準確定位DEH 與DCS 通信故障癥結(jié)及制定相應的處理方案。
DCS 通信部件主要包括FBM233(DCS 的通信卡件)和G427UC(DCS 通信控制器)。DCS 內(nèi)部通信采用容錯機制實現(xiàn),I/A Series 系統(tǒng)Mesh 網(wǎng)絡采用冗余機制,通過冗余線連接實現(xiàn)數(shù)據(jù)同步。當控制指令下達時,由服務器發(fā)給主控制站,主控制站通過冗余線將指令傳送給從控制站,主從控制站進行數(shù)據(jù)同步、同時分別輸出。接收第三方數(shù)據(jù)時,只有主站數(shù)據(jù)上傳進行運算,從站數(shù)據(jù)不上傳、不參與邏輯運算(僅作內(nèi)部主從站之間的數(shù)據(jù)同步、運算)。兩個控制站一個為主站時,另一個默認為從站。
DEH 通信部分主要包括DROP(DEH 的控制器,相當于DEH 的大腦)、ELC(以太網(wǎng)連接控制器,DEH 的通信卡,通過該卡件對通信數(shù)據(jù)進行解析及傳輸)。DEH 與DCS 通信建立是通過以太網(wǎng)連接實現(xiàn),DEH 與DCS 通信原理如圖1 所示。

圖1 DEH 與DCS 通信原理
根據(jù)TCP/IP 網(wǎng)絡協(xié)議,通過以太數(shù)據(jù)網(wǎng)實現(xiàn)DCS 側(cè)控制站與Ovation 系統(tǒng)服務端被控側(cè)之間的通信,兩者相互進行數(shù)據(jù)收發(fā)。由于DCS 側(cè)控制站與Ovation 系統(tǒng)服務端被控側(cè)都使用固定的端口號,因此每一個TCP 地址由一個IP 地址和一個端口號組成,確保數(shù)據(jù)傳送的正確性、可靠性、唯一性。
昌江核電廠1#、2#機組DEH 與DCS 通信故障頻繁發(fā)生,故障出現(xiàn)時主控畫面汽輪機相關的參數(shù)全部顯示為0 或是保持某一數(shù)值不變,嚴重影響操縱員對汽輪機實時狀態(tài)的監(jiān)視、控制,儀控人員經(jīng)常被主控On Call 去現(xiàn)場緊急處理通信故障問題。
收集某年5—10 月昌江核電廠1#、2#機組DEH 與DCS 通信故障總次數(shù)31 次,平均每月故障次數(shù)5.2 次。
為了找出通信故障根源所在,對收集數(shù)據(jù)采用分層法進一步分析。分別從電源波動、通信設備離線、控制器死機等方面進行分析。結(jié)果表明DEH 與DCS 之間通信故障主要出現(xiàn)在通信設備離線上,占比高達87.1%,因此認為DEH 與DCS 通信故障次數(shù)高的癥結(jié)在于通信設備離線。
針對DEH 與DCS 通信故障癥結(jié)在于通信設備離線,從人、機、料、法、環(huán)等方面進行剖析,采用頭腦風暴法,找到影響癥結(jié)的12 個末端因素,并繪制出因果分析圖,因果分析如圖2 所示。

圖2 因果分析
根據(jù)因果分析圖,通過現(xiàn)場測量、試驗、論證對比及調(diào)查分析等方式,針對影響通信設備離線的12 個末端因素進行逐條驗證和確認。
(1)安裝人員不按圖紙安裝。根據(jù)設計圖紙的安裝要求對現(xiàn)場DCS 機柜內(nèi)安裝情況進行檢查,發(fā)現(xiàn)柜內(nèi)的卡件、接線端口、布線要求等與設計圖紙一致,安裝正確。因此,判斷該因素為非要因。
(2)通信點名設置不正確。組織儀控人員對DCS 所有通信點名進行檢查,核實確認現(xiàn)場所有的通信點名不存在設置不正確的情況。因此,判斷該因素為非要因。
(3)FBM233 軟件版本低?,F(xiàn)場檢查,F(xiàn)BM233 當前軟件版本為1.32/0304 版本,而最新版本為1.36.4/0420 版本。對FBM233兩個軟件版本進行試驗發(fā)現(xiàn)最新版本軟件在通信性能優(yōu)勢更明顯、通信設備離線次數(shù)更少。試驗結(jié)果表明,軟件版本的高低對癥結(jié)影響大,因此,判斷該因素為要因。
(4)掃描周期設置錯誤。授權人員進入ICC 組態(tài)軟件中,檢查通信掃描周期的參數(shù)值為0.5 s,同步對比其他第三方通信正常的系統(tǒng)其掃描周期均為0.5 s、同時廠家答復掃描周期設置
(5)超時時間短。授權人員檢查通信故障系統(tǒng)超時時間參數(shù)(T0)設置為默認值0.5 s,并檢查其他三方通信正常的系統(tǒng)其超時時間參數(shù)值在2~3 s。因此懷疑通信設備離線與超時時間短有關。通過查閱資料、調(diào)研同行電廠、選取僅超時時間設置不同的通信設備進行試驗。試驗結(jié)果表明,超時時間設置長短對通信設備離線次數(shù)有影響,當超時時間設置越短時,通信設備離線次數(shù)越多。因此,判斷該因素為要因。
(6)FBM233 故障。通過總結(jié)已往通信故障現(xiàn)象、經(jīng)驗反饋,發(fā)現(xiàn)當FBM233 出現(xiàn)故障時通信故障次數(shù)明顯增多。FBM233是DCS 側(cè)通信卡件,冗余配置。根據(jù)現(xiàn)象猜想:FBM233 故障對通信設備離線有影響。通過試驗發(fā)現(xiàn)當其中一個FBM233 出現(xiàn)故障時,通信設備離線次數(shù)高達6.7 次/月,明顯高于兩個FBM233 無故障時的1.5 次/月。因此,判斷該因素為要因。
(7)FBM233 使用年限超期。經(jīng)檢查發(fā)現(xiàn)目前現(xiàn)場使用于DEH 與DCS 通信卡件FBM233 出廠時間分別2016 年10 月15日和2017 年01 月15 日,而該設備使用壽命一般為10 年,不存在FBM233 使用年限超期問題。因此,判斷該因素為非要因。
(8)FBM233 插針斷裂。對目前現(xiàn)場使用于DEH 與DCS 通信的兩塊FBM233 卡件進行檢查,經(jīng)工作負責人、監(jiān)護人、QC 人員三方共同確認。FBM233 插針未有斷裂現(xiàn)象,所有插針均完好無損。因此,判斷該因素為非要因。
(9)文件要求的FBM233 版本錯誤。FBM233 廠家(FOXBORO)提供的用戶指南中要求FBM233 版本為最新版本,滿足技術規(guī)格書要求。因此,判斷該因素為非要因。
(10)DCS 通信機柜圖紙錯誤。經(jīng)核實,DCS 通信機柜圖紙均為最新版本D 版。同時對比電廠RGL(棒控棒位系統(tǒng))、其他第三方與DCS 通信的DCS 機柜圖紙,未發(fā)現(xiàn)DEH 與DCS 通信機柜圖紙錯誤的情況,且其他第三方設備與DCS 通信未出現(xiàn)通信故障的情況。因此,判斷該因素為非要因。
(11)DCS 通信機柜溫度高。對現(xiàn)場DCS 通信機柜溫度實時測量,對一年內(nèi)通信機柜溫度測量數(shù)據(jù)進行統(tǒng)計分析。結(jié)果表明,DCS 通信機柜環(huán)境溫度平均值、最高值、最低值均在5~35 ℃,均滿足通信機柜所要求的溫度(正常溫度范圍內(nèi)(5~35 ℃)規(guī)定。因此,判斷該因素為非要因。
(12)DCS 通信機柜濕度高。對現(xiàn)場DCS 通信機柜濕度實時測量,對一年內(nèi)通信機柜濕度測量數(shù)據(jù)進行統(tǒng)計分析。結(jié)果表明,DCS 通信機柜環(huán)境濕度平均值、最高值、最低值均在45%~65%,均滿足通濕機柜所要求的濕度(正常濕度范圍內(nèi)(45%~65%)規(guī)定。因此,判斷該因素為非要因。
通過逐條要因驗證確認,最終確定影響DCS 與DEH 通信設備離線故障要因有3 個:①FBM233 軟件版本低;②超時時間短;③FBM233 故障報警。
(1)針對FBM233 軟件版本低:①先跟廠家溝通明確FBM233軟件對版本規(guī)定,做好版本升級前的工作準備;②現(xiàn)場實施FBM233 軟件升級操作;③確認已將FBM233 軟件升級到目標版本;③跟蹤觀察軟件升級后通信故障次數(shù)是否減少。
(2)針對超時時間短。根據(jù)要求:超時時間設置需兼顧靈敏度(指通信出現(xiàn)故障時,系統(tǒng)判斷故障的快速性、準確性、穩(wěn)定性)。①通過試驗發(fā)現(xiàn)靈敏度、超時時間、通信故障次數(shù)三者之間的內(nèi)在聯(lián)系;②綜合評估超時時間、靈敏度、通信故障次數(shù)三者關系,選擇最優(yōu)值超時時間數(shù)值;③現(xiàn)場實施超時時間參數(shù)修正;④跟蹤觀察超時時間參數(shù)修正后通信故障次數(shù)是否減少。
(3)針對FBM233 故障報警。通常消除FBM233 故障報警的方法有:①硬件重啟;②軟件重啟;③卡件更換。通過對三個要因的對策實施,昌江核電1#、2#機組DEH 與DCS 通信故障次數(shù)大幅度降低,達到≤1 次/月。提高設備運行的可靠性,避免操縱員監(jiān)視畫面頻繁出現(xiàn)故障報警,減輕操縱員的壓力,為機組安全穩(wěn)定運行提供有力支持。
為滿足操縱員能實時、準確、可靠地對汽輪發(fā)電機的監(jiān)測、控制和操作,保障DEH 與DCS 之間大量的數(shù)據(jù)通信,因此,確保DEH 和DCS 之間網(wǎng)絡通信、數(shù)據(jù)收發(fā)暢通,就顯得尤為重要?;诓穗婍椖?,就Ovation 汽輪機保護控制系統(tǒng)與DCS系統(tǒng)通信故障次數(shù)高問題開展研究,對影響通信故障因素進行要因驗證及確認,根據(jù)要因癥結(jié)制定處理方案。