何優琪,楚程媛
(陜西省電力有限公司漢中供電公司,陜西 漢中 723000)
不間斷電源(Uninterruptable Power Supply,UPS)是數據中心電力供應的保障,其自身的可靠性成為數據中心建設和運維專業關注的焦點[1-3]。近年來電力調度的重大事故幾乎與UPS有關。根據國家電網公司《安全事故調查規程》規定,機房不間斷電源系統、直流電源系統故障會造成自動化、信息或通信設備失電,并影響業務辦理,認定為8級設備事故。專業運維人員需將UPS運行可靠性放在首要位置,提高對UPS故障的響應速度,避免出現設備長時失電、數據中斷導致調度業務無法開展的情況。因此,文章提出縮短調度控制系統UPS故障響應時間、強化UPS設備精細化管理、提高自動化系統電源故障處理效率、確保安全可靠供電的目標,以強化公司優質服務水平。
電力調度部門是地區電力調度運行的指揮者。電力調度自動化系統可為電力調度部門提供技術支持。由于系統服務器、工作站交換機以及數據網系統等對交流供電提出了不停電和可靠性要求,系統配備了UPS[4,5]。UPS主要由環境動力監控系統和UPS異常狀態警報系統2個系統構成。環境動力監控系統涵蓋內容廣泛,包括設備、環境以及視頻等多維度監控,實時掌握電源狀態,利于運維人員及時發現異常數據。UPS異常狀態警報系統主要利用聲光進行操作,在異常狀態下聲光系統電路會被導通,燈光亮起,從而避免對系統造成嚴重損害,降低生產運行成本[6]。
陜西省電力有限公司漢中供電公司調度控制系統UPS自投入已運行長達9年,設備硬件老化,軟件系統內部存在缺陷,因此調控系統運維中UPS的重要性愈加凸顯,提高其故障響應速度和處理效率迫在眉睫。統計UPS故障及測試情況,它的自動化響應時間較長。因此,文章將積極探索縮短UPS故障響應時間的措施以改善現狀。
UPS主要由整流系統、儲能系統、變換系統和開關控制系統4部分組成。系統供電時,整流系統是一個將交流電轉化為直流電的裝置,經濾波穩壓后供給逆變器,然后給儲能系統充電,起到充電器的作用[7]。正常情況下,UPS由主市電經整流系統整流為直流,一方面為電池充電,另一方面為逆變器供電。逆變器將直流電逆變為穩定的交流電輸出給負載,當主市電停電或電源電壓波動超限后,由電池為逆變器繼續供電,保證輸出不中斷,并在主市電正常后返回主市電工作[8]。通過統計年度電力調度自動化系統UPS運行測試記錄得到電源故障響應各環節用時結果,調度控制系統UPS故障平均響應時間為73.25 min。結合調查統計分析結果發現,響應方案啟動用時占電源故障總響應時間的比例最大,平均用時較長,約為45.33 min。因此,文章將多措并舉,研究并解決響應方案啟動時間長的問題。
現狀調查及數據統計分析,結合電源設備現行情況和歷史運行UPS故障的響應速度,發現先前的運維條件與現在相差無幾,實現電源故障平均響應時間在30 min以內的目標。
為了更好地實現目標,結合影響UPS故障響應時間的因素,深入分析響應方案啟動時間長的原因,主要包括缺乏實時警報裝置、故障告警設置不合理以及環境動力監控系統功能不全等。
1.3.1 缺乏實時警報裝置
利用UPS定期維保,模擬主市電輸入進行現場測試,發現UPS設備故障經采集點傳送給環境動力監控系統檢測告警,再發送告警短信至值班手機。僅僅通過實時短信告警手段,對故障響應方案啟動的快速性影響較大。若電源故障發生在非值班巡視時段,極易忽略手機故障信息,造成故障響應時間長的問題。首先,評估分析缺乏實時警報裝置的對策方案,對比安裝電源實時警報裝置和增加告警值班接收手機2種方法,發現安裝警報裝置能有效解決重要故障實時告警問題。購買電磁繼電器和聲光報警較為便捷,可作為實時告警后備方式。此外,材料及設備安裝簡單,調試用時短,累計成本低,能顯著改善現狀。
1.3.2 監控系統故障告警設置不合理
現場檢查環境動力監控系統中,UPS告警正確參數設置為重要1級、一般2級、普通3級的告警短信時延分別為1 min、10 min、全屏蔽。梳理UPS故障437條遙信和遙測信號時發現,有4類重要告警發生在電源故障響應方案啟動環節。重要故障告警的準確設置是響應方案啟動速率的關鍵因素。告警方式和延遲時間設置不合理對目標值的實現影響較大,因此結合單獨劃歸電源故障類型,調整現有故障告警等級設置方案。針對設置不當的告警,基于現有環境動力監控系統進行調整,盡可能縮短維護周期,同時不需要外部技術支持。
確定設備安裝地點方案,將電源故障采集點信號接至電磁繼電器回路。安裝電源實時警報裝置作為值班手機發送告警的后備方式,且警報信號應24 h監控。計劃在UPS主機上加裝電磁繼電器回路,將其接至調度大樓15樓配電室,同時將聲光警報裝置安裝于調度大廳口。專業運維人員負責UPS故障信號接入、電源繼電器回路組建、聲光警報裝置定位安裝以及現場安全管理工作,并且模擬測試電源硬件故障、自動轉換開關電器(Automatic Transfer Switching Equipment,ATS)電源自動切換開關故障、市電輸入電源故障以及人員操作失誤等典型故障,測試不同電源故障情況下警報裝置的可靠性。截至2022年4月,公司已完成電源故障實時聲光警報的試驗,警報裝置發出警報的準確率為100%,滿足專業安全運維需求。
排查電源故障告警信號設置不合理參數,針對篩查的信號,完成故障告警的屬性配置,測試調整后檢查告警屬性是否合理并記錄。根據環境動力系統信號庫,電源故障信號包含UPS重要遙測、一般遙測、重要故障、重要狀態、一般故障以及一般狀態等告警等級。集中篩選電源故障中主要遙測遙信告警信號,針對故障特性進行告警屬性配置,包含告警內容、緊急度、告警類型、設備級別、短信報警發出及告警延時等。
檢測動力環境監控系統短信推送功能,逐級測試和檢查裝置的短信告警發送功能和級別。電源故障等重要信息要求能實時發送到運維值班手機、自動化班班長、自動化負責人、分管主任以及主任。通過反復測試,故障告警信號設置與測試信號相符,告警信息準確發送并符合參數值要求,方案實施應用有效。
安排專人梳理匯總環境動力系統監測的電源告警信號遙測信號234條和遙信信號178條,篩選重要告警信息。根據環境動力監控系統的遙測、遙信數據庫,完成向EMS系統信號轉發入庫和參數設置,同時在監控畫面上增加UPS輸入輸出電壓等狀態圖元,對重要信息設置閾值告警及事故推圖功能。針對逆變器故障、蓄電池故障、電源通信狀態、電源輸入電壓異常以及主市電輸入電源故障,遙測遙信信號將進行電源設備、環境動力系統和EMS系統聯合調試。
通過環境動力監控系統與EMS系統聯動測試,運維人員統計電源發生典型故障時通過向EMS轉發告警實現聲音推圖功能。結果顯示,故障報警發出平均時長明顯縮短,均低于5 min,為電源故障現場處理過程爭取了寶貴的時間。
在配置和使用UPS的過程中,一定避免只重投資不重管理,只重使用不重維護的錯誤觀念。要加強對UPS運行質量的重視,加強人員學習和培訓,配置必要的維護工具設備,使工作人員具備正確使用、維護及快速處理事故的能力。一是將UPS故障聲光警報裝置、環境動力轉發通道及告警推圖情況納入巡視目錄,將《調控中心運維值班巡視卡》納入地市公司電力調度控制中心工作規范,并嚴格按照標準考核。二是梳理修編漢中電網調度自動化系統UPS故障應急故障處置預案,完善電源故障應急處理手冊,修編《漢中電網調度重大事件應急匯報規定》《漢中電網調度自動化系統嚴重故障應急管理規定》,加強應急演練,提高對突發事件的響應和處置能力。三是編制調度自動化系統電源故障工作流程,依照《調度自動化系統故障缺陷管理標準》中缺陷等級分類,及時發現、辨識、推送和消除設備缺陷。遇到重大緊急缺陷時,必須發起檢修。因此,需編制緊急缺陷處置方案和現場“三措”的流程,逐級審核批準后執行。
檢查專業運維中日常電源巡檢維保記錄,嚴格執行周值班制。UPS設備軟硬件在工作日巡視1次,每周UPS電源室巡檢運維2 h。電源巡檢維保依據《電力調度自動化主站系統UPS電源及其配電系統技術規范》的標準要求,參照《漢中地調自動化UPS電源故障現場應急響應啟動方案》及時排查電源設備故障隱患。通過實行專業管理鞏固方案,進一步有效縮短了調度控制系統UPS故障平均響應時間。
UPS運維管理時不僅要考慮可靠性,而且要兼顧經濟性,因此有必要探索一種綜合可靠性與經濟性的方法。通過上述方案的實施,優化系統應用及警報裝置,經過6個月實踐運行發現,設計的系統均能在目標時間內啟動故障響應,縮短了UPS故障的專業響應時間,可為故障電源應急處置贏得寶貴時間。統計6個月UPS故障平均響應時間為25 min,已達到預期的目標。
社會效益方面,UPS的可靠運行為自動化系統、調度運行、監控值班以及機房監控等提供供電保障,確保電力生產工作有序開展,為地區電網的安全、經濟運行夯實基礎,樹立漢中供電公司良好的社會形象,為“構建和諧電力,服務和諧社會”做出貢獻。
經濟效益方面,方案實施雖未直接產生經濟效益,但隨著電源故障報警轉發至EMS系統聲音推圖功能的實現和聲光實時警報裝置的安裝,建立了冗余互備的電源故障快速響應系統,減少了工作人員的時間,降低了自動化系統的運維成本。
管理效益方面,專業運維人員積極探索處理疑難技術問題的方法,減少了繁雜的自動化設備維護工作的時間,節省了人力物力資源,提高了成員發現問題、分析問題和解決問題的能力。
綜上所述,為縮短運維人員對UPS故障響應的時間,避免出現設備長時間失電、數據中斷而無法開展調度業務,開展安裝電源實時警報裝置、調整現有故障報警等級及設置、故障報警轉發能量管理系統聲音推圖等技術改造。通過建立冗余互備的電源故障快速響應系統,提高了自動化系統電源故障處理效率,可為安全可靠供電提供專業支撐。