程江洲,朱 偲,付文龍,熊雙菊
(1. 三峽大學電氣與新能源學院,湖北宜昌 443002;2. 梯級水電站運行與控制湖北省重點實驗室,湖北宜昌 443002)
水力發電系統在運行過程中存在大量導致人員傷亡、環境損害以及財產和設備損失的危險事件[1-2],這些危險事件的發生可以被定義為水電站的運行風險[3]。風險評估根據這一定義,對各類已被識別的危險事件的發生概率以及發生后可能導致的后果進行評估與等級劃分,以便于了解設備與系統可能遭受的風險程度。這對于保證水電站工作人員的健康安全以及水力發電的穩定性有著重要意義。
風險評估方法雖然已被廣泛應用于各領域的安全管理問題[4-5],但水電站的風險評估卻仍處于發展階段。如Saedi等[6]提出了一種安全與風險評價的HIRATC模型,對41種危險事故進行了識別;Xu等[7]提出一種基于畢達哥拉斯模糊層次分析法的模型,評估了20種可能發生的危險事故;Tang 等[8]從可持續發展風險的角度將水電項目視為一個復雜系統,并對各個子系統的風險相關因素和數量維度進行了全面分析;Jiang 等[9]提出了一種新的全景模糊風險分析模型,可以準確評估徑流預報誤差引起的水電站近邊界運行風險;一種進線段的六級桿塔模型及對應架空線路模型,可以用于水電站雷電侵入的風險評估[10];一種梯級水電站建設施工導流風險分析方法,通過系統面臨的水文不確定性,構建風險分析模型[11]。
然而,水力發電系統的風險既有系統整體上的動態風險,也有系統局部的靜態風險。前者反映設備在異常運行狀態下,系統整體的實時風險狀況;后者代表導致系統風險增加的各類風險因素的具體狀況(如產生的原因、可能性、后果等);兩者分析的側重點雖然不同,但存在相互配合的關系。而上述方法大多專注于某些常見事故或局部問題的風險分析,忽略了系統整體上的動態風險評估與局部靜態風險分析之間的配合。但對于工作人員來說,系統整體上的動態風險評估便于管理人員明確風險動態,局部靜態風險分析便于檢修人員的檢修工作安排,兩者配合才能使風險評估達到最好的實用效果。考慮到上述問題,本文以水力發電系統的基礎設備為基本單元,從水電生產過程的角度進行分析,提出一種基于貝葉斯網絡的水力發電系統動態風險評估方法,并建立了水力發電系統的風險評估模型。該模型可以根據監測系統的輸入證據(故障數據)對水力發電系統進行動態的風險評估,并直觀地反映風險間的因果關系,為水電站的管理人員的風險決策以及檢修人員的檢修工作提供良好的幫助。
如圖1所示,基于貝葉斯網絡[12]的風險評估方法包括風險構造、方法設計和模型制定3部分,主要靠4個步驟實現:
(1)明確風險構造。根據ISO 13824關于風險評估的一般原則,風險的定義如下:

(2)計算失效概率。對于擁有大量歷史數據的設備(部件),使用數據分析獲得失效概率;對于缺乏數據的設備(部件)采用模糊理論知識獲取失效概率。
(3)計算失效后果。根據專家評估結果獲取設備(部件)失效后產生的后果(經濟損失Ei、社會損失Si、環境損失Ci)。
(4)制定貝葉斯網絡模型和風險等級表。通過專家經驗、機器學習和故障樹(FTA)轉化等方法明確設備(部件)失效原因之間的因果關系,并結合失效概率、失效后果制定貝葉斯網絡和風險等級表,輔助工作人員進行風險決策。

圖1 風險評估的框架結構
2.1 貝葉斯網絡運用水力發電系統現有數據大多復雜且分散,并涵蓋來自不同領域(水力、電氣、機械等)的知識以及大量不確定性信息,這導致了風險評估的難度。而貝葉斯網絡作為概率論與圖論的有效結合,為解決這一復雜問題提供了有力的工具。貝葉斯網絡用于水力發電系統主要有以下優點:(a)可以將復雜的水力發電系統分解為較小的子單元,便于專家進行單獨分析;(b)使用圖像性的結果直接反映故障之間的因果關系以及風險狀況,便于工作人員理解;(c)根據不斷更新的證據,可以對系統風險狀況進行實時評估。
制定貝葉斯網絡的關鍵在于貝葉斯網絡結構、先驗概率以及推理方法這3 個方面,具體方法如下。
(1)貝葉斯網絡結構。貝葉斯網絡(BN)結構的制定包括節點的選取以及節點間有向弧(因果關系)的確定。根據提出的風險框架,將BN節點分為以下三類:①系統節點:用于封裝各設備的風險評估模型,并明確各設備之間的技術聯系;②風險節點:顯示風險事故的具體原因以及失效概率;③效用節點:反映風險事故可能造成的后果。
具體節點的選擇以及有向弧的確定根據專家經驗與故障樹進行轉化。
(2)先驗概率確定。失效概率可以明確各類設備的故障原因對水力發電系統停運的風險貢獻,這對檢修人員進行設備檢修是有益的。因此,本文采用設備失效概率作為BN節點的先驗概率,其具體的獲取方法在2.2節中進行介紹。
(3)貝葉斯風險推理。貝葉斯網絡一般使用條件概率表(CPT)進行推理,但對于復雜的水力發電系統,CPT 的制定十分困難。且由于設備故障次數、使用壽命的不同,所制定的CPT 即使運用在同類型設備的風險推理中,也往往不夠精確。因此,本文選用狄利克雷模型[13]進行風險推理,其使用不斷更新的證據來計算后驗概率的方式,可以彌補復雜系統BN模型的CPT難以制定的問題。狄利克雷模型的表達如下:

它表現為一個不斷收斂的區間[P1,P2],其中:

式中:N為樣本數據;nj為反映故障的數據;s為收斂的速度,一般取值1或2。隨著證據nj的不斷加入,區間[P1,P2]的范圍將不斷收斂,直至趨近于某一個值為止。這里使用區間中心點(P1+P2)/2作為最終的收斂值。
2.2 失效概率計算水力發電系統作為一種水力、機械與電氣相互合作的復雜系統,許多設備(部件)很難獲取詳細的統計數據,而傳統的專家評估方式又顯得不夠精準。因此,本文采用模糊綜合評價法[14]來獲取失效概率。具體方法如下:
(1)獲取失效概率的評估語言。評估的語言包括:“非常高(VH)”、“高(H)”、“較高(RH)”、“中等(M)”、“較低(RL)”、“低(L)”、“很低(VL)”。
(2)模糊數轉化。自然語言向數學語言的轉化需要通過模糊隸屬函數,本文使用梯形模糊隸屬函數來定義專家語言與模糊函數之間的映射關系。圖2給出了7種語言所對應的模糊隸屬函數,式(4)給出了對應的表達式。

圖2 模糊隸屬函數

評估語言來自于不同的專家,為平衡其中的差異性,使用層次分析法(AHP)[15]進行加權處理。加權后的結果為:

式中:uz( x )為加權后的隸屬函數;ωj為專家j的權重;uij為第j個專家給定的第i個模糊語言所對應的隸屬函數。
(3)概率計算。模糊數到失效概率的轉換分為兩部分:模糊數到模糊概率的轉換以及模糊概率到失效概率的轉換。本文采用最大、最小設置法[16]獲取模糊概率。首先,定義最大、最小模糊集為:

然后,根據圖3所示的方法獲取左、右有效分數為:

式中:PR( Z )為右有效分數;PL( Z )為左有效分數。
根據式(8)、式(9),可得模糊概率為:

通過Onisawa公式[14]進行失效概率轉化:

最后,為明確失效概率所對應的風險等級,使用表1對其進行等級劃分。

表1 失效概率等級劃分

圖3 最大、最小設置法
2.3 失效后果計算在一般的風險評估方法中,經濟后果常采用具體的費用進行衡量。但由于地區經濟、文化和政策的不同,同一風險在不同地區的經濟后果往往存在巨大差異。因此,本文定義相對損失Li作為經濟后果,即風險造成的總損失與總資本的比值:

式中:Li為風險的相對損失,Ti為總資本,T為總損失。在某些情況下,相對損失Li可能大于1,因此規定當損失率大于1時相對損失為1。
同時,為了明確損失率的大小,定義了對數損失:

表2為經濟后果的等級劃分。環境后果的計算與經濟后果類似,但由于環境后果很難使用明確的數值進行表示,所以直接使用專家評估的方法(2.2節中進行了具體介紹),通過專家評估語言獲得環境后果的損失率,并通過式(14)轉化為相應的對數損失。

表2 相對損失與對數損失

表3 社會后果等級劃分
在水力發電系統的日常管理中,考慮操作和維護人員面臨的風險是重要的。因此,采用IRPA(個體在一年內暴露危險情況下的死亡概率)作為社會后果。假設工作人員每天進行巡檢工作的時間為T 小時,則工作人員每天承受風險的概率為Pr=T/24,而設備故障的概率為Ps,故障導致死亡、重傷、輕傷的加權為0.63、0.33、0.04[16],則工作人員一年內可能死亡的IRPA值為:

參考ISO2394標準對社會后果等級進行了劃分,如表3所示。
2.4 風險等級表制定制定風險等級表作為一種通用的風險分析方法,對明確系統基礎設施的脆弱性分布以及危害對系統產生的影響有著重要的意義。根據風險定義,將水力發電系統的風險劃分為5 個等級。如圖4 所示,不同風險所表達的意義如下。1 級:不需要監視;2 級:需要定期監視和維護;3 級:需要采取措施降低風險;4 級:需要實時維護,以防事故的發生;5 級:事故已經發生,應盡快進行搶修。

圖4 風險評估
3.1 關鍵部件選擇水力發電系統生產單元的部件繁多,風險評估模型的建立不可能涵蓋所有的部件。因此,選擇水電生產過程的7個主要部件進行分析,包括壓力管道、水輪機、發電機、電力傳輸系統、尾水管、冷卻系統和控制系統。
3.2 關鍵部件風險分析模型構建根據2.1節所介紹的貝葉斯網絡建模方法構建關鍵設備的風險分析模型。圖5為建立的電力傳輸系統風險分析模型,具體介紹如下。

表4 設備失效原因描述
貝葉斯網絡結構制定。根據多位專家的聯合分析,主要考慮了變壓器、傳輸設備與斷路器的失效問題,并對引起3種部件失效的具體原因進行分析,其中變壓器失效的原因(X1-X6),傳輸設備失效的原因(X7-X9)、斷路器失效的原因(X10-X12),如表4所示。
失效概率與后果計算。采用2.2與2.3節中介紹的方法對失效概率與失效后果進行計算。通過電子郵件的方式獲得了4位專家的評估結果,表5顯示了計算結果。以X1為例進行解釋,專家對X1的失效概率評估為RL、RL、M、M,使用式(5)對評估語言對應的隸屬函數進行聚合:

專家權重通過層次分析法獲得,4位專家的權重分布為:

然后,使用式(8)—(11)可得,左、右有效分數為:PL=0.6183, PR=0.6183;模糊概率PM=0.3984;則失效概率P=0.002291。
失效后果計算。專家對X1的經濟后果評估為L、L、L、M,所代表的對數損失率中心值分別為1.5、1.5、1.5、2.5,通過加權獲得最終的經濟后果為1.628,對環境后果的評估為0。圖5中使用期望效用Ei=0.002291×1.628=3.73×10-3對經濟后果以及環境后果Ei=0進行表示。對社會后果的計算,我們假設巡檢人員每天巡檢的時間為半個小時,則工作人員承受風險的概率為Pr=1/48,而設備發生風險的概率為Ps=0.002291,通過式(14)計算社會后果為:Si=0.63×1/48×0.002291=3.0×10-5。

圖5 電力傳輸系統風險評估模型

表5 設備失效概率與失效后果
3.3 水力發電系統風險分析框架根據3.2 節介紹的子模型建立過程,本文分別對壓力管道、水輪機、發電機、電力傳輸系統、尾水管、冷卻系統和控制系統這7個子模型進行了建模。子模型的優點在于便于檢修人員明確風險來源,但卻無法清晰表示系統整體的實時風險。為此,我們將7個建成的子模型進行集成,建立了水力發電系統風險評估模型。如圖6所示,圓角矩形代表了7個子模型(類似圖5)集成所形成的系統節點,系統節點之間的箭頭表示7個主要部件間的技術聯系。其中,各主要設備的風險狀況通過風險節點(帶橢圓標志的矩形)顯示,如電力傳輸系統的失效概率為0.028,這個概率是圖5中所有部件失效概率的總和(失效概率的累加);各設備停運產生的經濟損失、社會損失與環境損失由效用節點(帶六角形標志的矩形)表示,如發電機此時可能的經濟損失、社會損失與環境損失分別為0.045,0.0019,0.0039,這表示此時設備損失的期望效用的總和(類似于圖5中所有經濟損失、社會損失與環境損失各自的累加)。這樣,根據整個風險框架對于設備失效概率以及各類損失的表達,管理人員便可以在宏觀上明確系統所受到的風險狀況,并根據具體情況來制定相應的風險決策。

圖6 水力發電系統風險評估模型
4.1 靜態風險分析當水力發電系統處于穩定運行狀態(無故障)時,明確其各部件可能的風險狀況,有助于檢修人員制定合理的檢修計劃。根據圖6 模型的計算結果,制定了水力發電系統各主要設備的風險等級表。由表6 可知,設備C2、C3與C4的失效概率(0.012、0.015、0.028)遠大其他設備,且其風險發生后造成的經濟后果和環境后果較大。因此,在制定整個系統的檢修計劃時,設備C2、C3與C4的巡檢應該更為頻繁;同時,設備C2、C3與C4發生風險后所產生的社會后果極大,在巡檢過程中應當增加保護措施。C1(壓力管道)、C2(水輪機)、C3(發電機)、C4(電力傳輸系統)、C5(尾水管)、C6(冷卻系統)與C7(控制系統)。

表6 主要部件的風險等級分布
4.2 動態風險評估為驗證模型的實用價值,采用模擬故障數據對水力發電系統進行動態風險評估。(1)模擬數據生成。水力發電系統的風險一般來自于設備部件的異常狀態(如定子溫度過高、軸承振動超標等),而這些異常狀態的感知一般依賴于設備的狀態監測系統。模型的動態風險評估建立在這樣的基礎上,假設傳感器采集到的設備部件的任一異常狀態信號(溫度、振動、壓力等)都為一次微小的風險貢獻,并定義產生風險貢獻時的傳感器數據為1,未產生風險貢獻時的傳感器數據為0,將這些數據輸入到狄利克雷模型中便可以進行模型的動態風險推理。考慮到水力發電系統的風險通常具有很強的不確定性,采用隨機數模擬的方式代替狀態監測系統所采集的數據(0代表正常、1代表風險貢獻),并假設模型每5分鐘接收一次在線監測系統的數據。
(2)失效概率更新。采用2.1節中介紹風險推理方法對失效概率進行實時更新。圖7為1周內采集的2016組數據的失效概率收斂過程。由圖可知,隨著證據(數據)的不斷輸入,失效概率的取值范圍[P1,P2]不斷收斂。在初始情況下,失效概率的取值范圍為[0,1];當100組數據輸入后,失效概率的取值范圍縮小為[0.03,0.04],并在800 組和1800 組數據輸入后,失效概率區間縮小為[0.0312,0.0325]和[0.0267,0.0272];最終,概率收斂到0.0263左右。這表明,設備失效概率會隨著故障數據的加入不斷更新。如果設備在運行過程中即將發生故障,在故障發生的前期,由在線監測系統采集的故障信號將不斷輸入,導致設備失效概率快速穩定到某一區間。
(3)動態風險評估。根據失效概率的更新結果,對水力發電系統的風險狀況進行動態評估。圖8為沒有采取任何檢修或維護的情況下,各主要部件的風險更新狀況。

圖7 失效概率收斂過程

圖8 不確定性因素下的風險評估
由圖可知,在風險更新的前期(4個月以及4個月之前),各主要部件的風險概率大多控制在0.05以下,且增長緩慢。但由于檢修或維護的不當,故障數據不斷輸入,風險的概率開始迅速增加,其中C4(電力傳輸系統)的風險情況最為嚴重,12個月內的風險概率累積到0.2459。表7為各部件12個月的風險累積狀況。因此,在風險更新的過程中,提醒工作人員采用合適的檢修或維護工作尤為重要。為此,根據表1中對設備失效概率的風險等級劃分,本文對各風險狀況下的預警做出了如下安排:
1級(<0.0003),應將風險保持在當前的水平;2級(0.0003~0.003),需要監視以避免風險升級;3級(0.003~0.03),需要根據風險損失采取一些控制措施;4級(0.03~0.3),應采取一些的有效控制措施;5級(0.3~1)。立即解決風險。

表7 主要部件的風險累積狀況
4.3 模型驗證為保證模型的準確性,使用受試者工作曲線(ROC)曲線對模型進行驗證。ROC 是一種被廣泛用于各類診斷性實驗的有效工具[17],在使用過程中通常采用ROC 的曲線下面積(AUC)來衡量測試結果的準確性。只有當AUC值達到0.7 ~0.9時,診斷結果才能被認定具有較高的準確性。圖9為發電機的ROC 曲線驗證圖,其AUC 值達到0.8375,證明了模型的準確性。

圖9 發電機的ROC曲線
考慮水力發電系統的復雜性以及水電生產過程中大量的不確定因素,本文提出了一種基于貝葉斯網絡的水力發電系統動態風險評估方法,該方法有以下優點:
(1)BN 構建水力發電系統的風險評估模型,圖像的形式可以清晰地反映風險的具體原因以及風險產生的后果,并使得模型可以根據水電站的具體情況進行擴展,更具有普遍適用性;
(2)模糊綜合評價法獲取設備失效概率,解決了傳統專家評估不夠精準的問題;
(3)制定風險等級表,可以明確水力發電系統的靜態風險狀況,有助于工作人員合理地規避風險;
(4)建立Dirichlet模型代替傳統的條件概率表,避免了復雜BN模型制定條件概率困難的問題,且根據在線監測系統的監測數據進行風險的實時更新,更具有實用價值。