周 策,溫 武
(山西電力科學研究院,山西 太原 030001)
隨著信息技術(shù)的發(fā)展,分散控制系統(tǒng)DCS(Distributed Control System)在火力發(fā)電廠的覆蓋越來越廣,自動化程度越來越高。但不管何種DCS系統(tǒng),在電廠的應用中都不同程度地存在死機現(xiàn)象。近年來,隨著接入DCS的系統(tǒng)增多,DCS的通訊量變大,網(wǎng)絡(luò)堵塞現(xiàn)象就變得十分頻繁,并使得各種人機界面的結(jié)點死機現(xiàn)象增多,嚴重時導致整個DCS系統(tǒng)癱瘓,對發(fā)電廠的安全運行造成很大的威脅。
山西平朔煤矸石電廠二期擴建工程(2×300 MW循環(huán)流化床直接空冷)機組的熱工自動化設(shè)備主要采用德國SIEMENS公司生產(chǎn)的SPPA-T3000分散控制系統(tǒng),其功能包括計算機監(jiān)視系統(tǒng)DAS(Date Acquisition System)、模擬量控制系統(tǒng)MCS(ModulatingControl System)、順序控制系統(tǒng)SCS(Sequence Control System)、鍋爐爐膛安全監(jiān)控系統(tǒng)FSSS(Furnace Safety Supervision System)、汽機保護系統(tǒng)TSI(Turbine Supervisory Instrumentation)、汽機電液控制系統(tǒng)DEH(Digital Electronic Hydraulic)、電氣自動化控制系統(tǒng)ECS(Electric Control System)和聯(lián)鎖保護等。熱工自動控制的范圍涵蓋鍋爐、汽機、發(fā)電機—變壓器組和廠用變。
西門子SPPA-T3000系統(tǒng)的總線為工業(yè)以太總線網(wǎng),采用虛擬環(huán)技術(shù),實現(xiàn)冗余容錯,其通訊速度為100 Mb/s。最大子站數(shù)量無限制,總長最大為150 km。通訊總線由若干個光纖交換機模塊OSM(Optical Switch Module) 組成。OSM模件為光纜總線接口總站,帶有自己的電源。通過OSM模件,SPPA-T3000系統(tǒng)的各成員以星型結(jié)構(gòu)連接在一起。每個OSM模件所連接的節(jié)點數(shù)量不超過6個。2臺機組公用系統(tǒng)另外設(shè)置與單元機組獨立的冗余高速數(shù)據(jù)通訊網(wǎng)絡(luò)[1]。
西門子SPPA-T3000分散控制系統(tǒng)現(xiàn)場級控制器采用西門子S417控制器,按系統(tǒng)劃分并兼顧DCS功能分布配置。處理器模件采用冗余配置,當正在工作的主處理器模件發(fā)生故障時,系統(tǒng)能自動無擾切換至與其冗余的從處理器模件。單元機組CPU處理器配置為鍋爐7對、汽機7對,電氣1對;公用CPU處理器配置為電氣公用系統(tǒng)及熱控公用1對、循環(huán)水泵房公用1對。人機接口配置用于過程監(jiān)視的人機接口站,每臺機組包括操作員站4套、工程師站1套、歷史數(shù)據(jù)站1套、大屏幕操作站2套。
數(shù)據(jù)通訊系統(tǒng)的通訊負荷率,在最繁忙的情況下,不超過40%。處理器內(nèi)部存貯器有50%存儲裕量,外部存貯器有60%外存裕量。控制器站的處理器在最大負荷下處理能力有50%裕量,操作員站在最大負荷下處理器處理能力有60%裕量。系統(tǒng)本地輸入輸出點數(shù)見表1。

表1 本地信號I/O點數(shù)量(機組DCS)
在山西平朔煤矸石電廠二期4號機組進行鍋爐冷態(tài)通風實驗時,當風煙系統(tǒng)的風機啟動后,畫面上風煙系統(tǒng)側(cè)所有測點均顯示為故障點,設(shè)備操作面板點擊后指令也無法發(fā)出,不能對設(shè)備進行操作。只能緊急就地停設(shè)備,終止實驗。開始時判斷是否因為風煙系統(tǒng)的控制器掉電或控制器邏輯未激活等原因?qū)е驴刂破鞴ぷ鞑徽#谑菣z查該控制器,發(fā)現(xiàn)控制器工作正常,又將該控制器的邏輯代碼進行了重新下載,下載后畫面顯示正常,可以對設(shè)備進行正常的操作。但重新進行實驗時,又發(fā)生了相同的問題。懷疑是否為控制器的硬件出現(xiàn)了問題,更換了S417處理器,但問題仍未得到解決。在處理過程中發(fā)現(xiàn),該控制器在較少設(shè)備啟動時通訊正常,而在較多設(shè)備啟動時會發(fā)生通訊故障,檢查系統(tǒng)診斷記錄文件,發(fā)現(xiàn)提示為通訊緩存溢出。顯示如下:
WARN[HMI-LISTENER-THREAD]com.pg.orion.simatic.SimaticComServer HMI Buffer Overflow
ERROR[HMI-LISTENER-THREAD]com.pg.orion.simatic.SimaticComServer Simatic HMI Communication suffer overflow
通過SPPA-T3000的診斷軟件,發(fā)現(xiàn)在啟動過程中,控制器的歸檔事件數(shù)及事件變化率都非常高,在風煙系統(tǒng)側(cè)設(shè)備還未啟動時,此控制器事件數(shù)就已達到了5 000件/min,大大超出了正常規(guī)定的單控制器2 500件/min左右的事件率,當設(shè)備啟動后,該控制器事件數(shù)最大達到了8 000件/min。導致服務器送畫面的進程緩沖溢出,造成了通訊堵塞,操作畫面死機。
分析認為可能是為該控制器分配的輸入、輸出點數(shù)太多的原因,于是將接入該控制器的部分遠程通訊采集的I/O點移至了其他控制器,但這樣處理后控制器的事件數(shù)沒有明顯的變化。
分析通訊緩存溢出的原因為相關(guān)進程內(nèi)部數(shù)據(jù)設(shè)置過小不能滿足實驗時設(shè)備啟動后的正常運行條件。相關(guān)進程發(fā)生數(shù)據(jù)溢出,最終導致該控制器與畫面的通訊中斷,操作畫面死機。分析原因后,進入服務器檢查發(fā)現(xiàn)服務器的各進程容量設(shè)置偏小。根據(jù)SPPA-T3000的系統(tǒng)配置要求將服務器各進程容量修改如下:
alarmcontainer(AC)修改為384 Mbytes;
archive container(ARC)修改為196 Mbytes;
simatic communication container(CC) 修 改 為384 Mbytes;
iotools container(IOTOOLS)修改為256 Mbytes;
report container(RC)修改為128 Mbytes。
本次修改未能根本解決操作畫面死機的問題,重新進行通風實驗后仍然出現(xiàn)通訊問題,事件率偏高。表明即使系統(tǒng)進程容量改大后,仍不能處理過大的系統(tǒng)事件數(shù)。
通過研究事件記錄發(fā)現(xiàn),這些以極高頻率發(fā)生的事件主要是由溫度、壓力、風量等模擬量信號的變化產(chǎn)生的,而在這些模擬量信號的邏輯圖中,幾乎所有輸入、輸出點的模擬信號監(jiān)視器功能塊的死區(qū)都沒有設(shè)置,在進行設(shè)置后,事件發(fā)生率有了不小的下降,但在操作高峰時仍會有通訊緩存溢出的情況。對記錄中頻繁變化的模擬量設(shè)置了濾波環(huán)節(jié),發(fā)現(xiàn)風煙側(cè)設(shè)備未啟時的事件率從5 100件/min降至2 500件/min。在邏輯中又對模擬量信號的掃描周期進一步優(yōu)化,具體設(shè)置如下:
溫度,400 ms改為1 200 ms;
壓力,100 ms改為400 ms;
風量,100 ms改為400 ms;
流量,100 ms改為400 ms。
又將邏輯中許多沒有歸檔必要的信號點的歸檔和報警功能取消,以減小由這些信號產(chǎn)生的事件數(shù)。
通過這些優(yōu)化,該控制器的事件率從2 500件/min降至1 100件/min,大大減小了該控制器與服務器間的通信負荷率,滿足了設(shè)備啟動、進行實驗時因事件數(shù)增加,所需的通信負荷率的余量,保證了系統(tǒng)的通信正常。鍋爐冷態(tài)通風實驗重新進行,風煙側(cè)設(shè)備再啟動后,通訊正常,整個實驗期間未出現(xiàn)問題。
a)模擬量的上下限、死區(qū)一定要設(shè)置,如果上下限都設(shè)為0,那么死區(qū)即使設(shè)了也不起作用,模擬量極細微的變化也會送畫面和控制器的通訊進程處理,嚴重消耗了通訊資源。死區(qū)設(shè)置可以按量程的百分之一來設(shè),部分重要測點如閉環(huán)調(diào)節(jié)信號等對調(diào)節(jié)品質(zhì)有較大影響,對信號實時性要求較高的點,可以單獨將死區(qū)設(shè)置的較小,使信號變化得靈敏一些。
b)軟件組態(tài)時模擬量采集塊的濾波功能要打開,這樣可以有效地減少干擾引起的模擬量波動變化,并且要檢查模擬量的屏蔽接地,防止外部干擾引起信號頻繁抖動。
c)對邏輯進行檢查,把一些不重要的邏輯點的歷史歸檔、報警取消。
以上措施,可以有效減小控制器的事件率,防止控制器的通信能力飽和,發(fā)生堵塞,引發(fā)控制系統(tǒng)的故障,甚至操作畫面死機。對其他使用西門子SPPA-T3000系統(tǒng)的電廠,也有很大的借鑒意義。經(jīng)過優(yōu)化后,山西平朔煤矸石電廠二期4號機組的整個DCS系統(tǒng)直到機組的168 h運行結(jié)束,都未再發(fā)生操作畫面死機和控制系統(tǒng)通信故障現(xiàn)象。整個調(diào)試期間,各系統(tǒng)控制器的事件數(shù)都維持在了較低的水平。
發(fā)電廠在DCS的使用過程中,一定要注意系統(tǒng)的負荷率,尤其是通訊負荷率問題。通訊負荷率在很大程度上已經(jīng)成為了DCS控制系統(tǒng)正常運行的瓶頸。在DCS控制系統(tǒng)的招標、設(shè)計、組態(tài)過程中,不能單純地計算輸入、輸出點數(shù),靠保證輸入、輸出點數(shù)的通道裕量來避免負荷率高的問題,還要考慮實際生產(chǎn)的動態(tài)過程中,可能產(chǎn)生大量通訊負荷率的因素。所以,在DCS控制系統(tǒng)進行設(shè)計、組態(tài)時,要建立科學合理的通訊負荷率估算和控制方法,在實際運行中,當發(fā)現(xiàn)通訊負荷率過高時,要及時對系統(tǒng)進行優(yōu)化,防止發(fā)生嚴重問題,影響安全生產(chǎn)。
[1] 張澎濤,周鵬,張秉權(quán),等.西門子SPPAT-3000 DCS系統(tǒng)的應用與優(yōu)化[J].內(nèi)蒙古電力技術(shù),2008(4):70-73.