黃宗碧
(深圳市瑞德森工業自動化設備有限公司,廣東省深圳市 518000)
智慧型電廠已經逐漸成為電力企業新時期的發展目標,水電企業更因為我國優越的自然條件及開發政策正加速成長為新興智能技術的應用前沿。而智能技術的應用又促使水電狀態監測涵蓋的內容和范圍得到了極大的擴展,技術和應用水平得到了顯著提升。當前的水電狀態監測已經不僅僅指主機或機組狀態監測,而是涵蓋了一次(發、變、輸、配電)設備狀態、二次控制系統狀態、輔機設備狀態、水工建筑健康狀態、調度狀態、安全狀態、管理狀態等電廠全景運行狀態的高度綜合化的狀態“測—控—管”系統。它與監控系統相輔相成:監控系統直接服務于生產,而狀態監測系統則服務于檢修及管理,成為正常生產的保障基礎。在技術構成上,水電狀態監測系統也不再僅僅只是純粹測量系統的簡單技術集成,而是結合傳感、信號處理、數值分析、計量、最優規化、大數據、雲、可視化、超算、AI的綜合型科學應用,其中已經而且正在產生大量有價值的科學研究內容。水電狀態監測的涵蓋內容及支撐技術如圖1所示。
服務于智慧型水電廠建設的水電狀態監測,不僅是對國家智能社會發展政策的積極響應,而且符合現代信息化技術進步的發展趨勢,有利于充分挖掘企業各項資源的潛在價值,精確評估并改善電廠業務狀態,提升企業的實際運營效率、經濟效益以及社會效益。在這個大背景下,新的和人工智能技術相關的應用需求被大量提出。這些需求隨著智慧水電廠建設工作的迅速推進,已經在實際項目及多次水電學術交流會議中被反復提及,其中與智能化狀態監測相關的迫切技術需求可以歸納如下:
(1)狀態監測中智能化數據處理的需求。

圖1 水電狀態監測的涵蓋內容及支撐技術Figure 1 Coverage of hydropower status monitoring and supporting technologies
機組越來越多、設備越來越多、傳感器越來越多、數據越來越多的實際情況迫切要求更加智能化的數據處理方法投入應用。而智慧電廠建設的重要步驟之一就是建立一體化大數據平臺處理和分析電廠的各種數據。智能化平臺可依據電力企業特性,整理數據并進行深入計算,做出準確的決策支持信息。這個需求的實質是“標準”問題,如果我們可以不加區分地按統一標準處理狀態監測得到的大數據內容,并且此處理結果就可以真實反映系統狀態的話,智能算法就會是沒有必要的;但嚴酷的現實是,并沒有一個“統一標準”供大數據處理使用,目前唯有利用學習算法才能夠為每一種有監測價值的狀態建立其“針對性適用標準”!當然,此“自學習標準”可以進行嚴格的數學檢驗,并明示其可信度。
(2)狀態監測中智能化狀態管理的需求。
簡而言之,要完成對特定狀態的管理,區分其是好的狀態還是差的狀態,評價其優劣的絕對以及相對程度,其本質是:對其內在的故障必需有著足夠的認知水平。所以,這絕對不是一個單純的數學分析需求,而是真正意義上的“人工智能需求”。可以說,“故障認知”就是智慧化問題的核心所在。現階段的人工智能技術是通過將人類無法直接理解的高維數據降維到人類可以認知的低維度來實現的,其本質還是利用了人的智能,因而也就并沒有失控的風險。
(3)狀態監測中智能化站端設備的需求。
由于水電狀態監測的涵蓋內容越來越廣泛和深入,并且還在飛速發展之中,所以如果要求各種站端設備在投入之初,就完全考慮到后期將要提升的應用需求,顯然是不現實的。因此,智能化的站端設備及開放式狀態監測系統就自然成為了新形勢下的必然需求。通過對站端設備加以智能化改造,將提升其準確性、互聯性、可靠性、和安全性,使其具備在運行過程中擴展性能、提升精度、按樣本學習進步的能力,從而使得狀態監測系統獲得開放式監測的能力——即監測、分析未出現過的新狀態的能力。智能化站端設備還包括智能傳感器和巡檢機器人,以便從多種途徑靈活解決“測不準難題”。
(4)狀態監測中智能化系統互聯的需求。
水電狀態監測所涵蓋的各個自動化系統已經迫切地需要以數據共享的方式互聯起來,從而充分發揮智能電廠的效益優勢。更進一步,還需要這個互聯系統可以為流域綜合控制,甚至跨流域綜合控制提供必需的信息支撐。但這其中,數據的統一規范問題,成為阻礙不同自動化系統簡單互聯的癥結所在。只有通過智能算法協調不同數據源的置信度,即通過一種更為“柔性”的智能互聯方式,才能從根本上解決數據互聯失配的難題。
(5)狀態監測中智能化系統安全的需求。
信息安全目前已經成為了一項基本制度。水電狀態監測系統在進步到復雜的多系統、多區域互聯后,也必然面對這一需求。一個智能化狀態監測系統的信息安全,如果繼續依賴人工考評的方式加以保障,顯然是不合適的。因此,將物理安全、網絡安全、主機安全、應用安全、數據安全以及制度安全的運行數據加以智能統計、分析與管理的需求也已經提到了日程之上。
智能化水電狀態監測相關的需求及核心問題匯總如圖2所示。
這些需求一方面為智能化狀態監測系統的發展設置了較高的技術門檻(客觀)和認識門檻(主觀),另一方面也總結了有關“智能化狀態監測”的可行性(技術準備)、實施性(實例)、計劃性(目標)、發展性(遠景)及安全性(穩定)等全部現實性問題。可喜的是,在人工智能技術飛速進步的現狀下,這些需求可以得到良好滿足,并產生出足夠好的應用效果。這其中的關鍵就是自2016年以來智能學習算法的進步。《Scientific American》雜志稱:“這種基于試錯學習的強化算法可以應用于極大量的有足夠標記數據的問題,無論是金融市場、醫療診斷、機器人技術還是戰爭。一個新時代已經開始,在就業模式、全民監督以及日益嚴重的政治和經濟不平等發展等領域將產生未知但可能具有重大意義的中長期后果。”[1]同樣,試錯學習的思想在水電狀態監測中也很有實用價值和應用先例。

圖2 智能化狀態監測需求及核心問題Figure 2 Intelligent status monitoring requirements and core question
例如:采用學習算法可以將四川某水電機組的振動狀態數據加以統計分類,并以直觀的色彩展現出來(見圖3),紅色代表振動最嚴重的狀態,黃色次之,淺綠色代表振動最輕微的狀態。這種可視化的分析成果一目了然,對于機組優化運行、合理調度及檢修安排都有顯而易見的重要意義。

圖3 機組振動狀態學習分類圖Figure 3 Vibration state learning classification diagram of the unit
學習算法還廣泛適用于缺乏具體知識以及對數據規律認識不明確的情況。例如:對于上述機組,如果我們已經掌握了它在何種振動水平下處于危險狀態的相關“知識”,自然很容易直接由人對其做出“絕對評價”。但這種“知識”實際上很難把握。那么,退而求其次,如果已知振動發生變化的相關“規律”,還可以由軟件自動跟蹤振動的相對變化,從而做出“相對評價”。但這個“規律”并不簡單,不能明確用數學形式表達出來,因而軟件的算法無從編制。對于這種既缺乏知識又欠缺規律的應用難題,學習算法提供了一種高效的通用求解方法——將數據分類,然后進行類比評價。這樣,即使我們并不掌握絕對報警值該定在哪里,也不清楚振動增加百分之多少就有危險,還是可以有把握地評價出機組的振動狀態的優劣、安全與否以及發展趨勢。

圖4 學習算法的適用范圍Figure 4 Scope of application of learning algorithm
另外,還有一項重要的人工智能核心技術在協助學習算法的快速發展,這就是概率評價技術。其核心在于普遍使用概率的思想來解決此前無論被認為是“確定性”“偶然性”“隨機性”還是“模糊性”的所有問題,從而第一次對不同類問題給出了通用型的數學解。
最著名的例子是:2018年12月,AlphaZero首次采用同一套基于獲勝概率的學習算法程序(見圖5),同時實現了圍棋、國際象棋、日本將棋的求解,都達到了戰勝人類最高水平棋手的極佳效果。[2]其思想的美妙之處在于,當問題的難度大于計算機的求解能力時(圍棋的情況就是如此),概率評價依然可以可靠地選擇出可解集合中的最優解,而不會陷入“死機”或出錯。

圖5 AlphaZero著點獲勝概率圖Figure 5 AlphaZero step winning probability diagram
因此,概率評價技術特別適用于水電狀態監測這類對象范圍寬泛、規律復雜、運行條件多變的情況。概率的大小既可以看作為確定或不確定、相信或懷疑的感覺的量度,這些感覺可由某些斷言或推測在人類心理中引起;也可以客觀解釋為把每一個數值概率陳述看作為一種相對頻率的陳述——某一種類事件在一偶發事件序列內以這種頻率發生。同理,在狀態監測中,概率實際上并不僅僅只是一個關于下一個狀態的預言,而是對設備“偶發”狀態這種“客觀自然規律”的本質描述。
類似“放電故障”等“隨機出現”的狀態,或偶發狀態。它們的數學特征是一種特殊的不可計算性,一切已知的理性預測方法用于這些事件必定失敗。可以說,并沒有一種科學方法能夠預測這類隨機狀態。然而,絕妙的正是這種不可計算性反而正是一種強大可靠的自然規律:“隨機狀態”的估計和評價可以通過概率的計算來實現,即,因為個體的“不可計算性”從而達到群體的“可計算性”。或者表述為:只要“隨機狀態”出現得足夠多,就可以達到概率計算的可應用性,這在數學領域早已經成為共識。現在,這種基于隨機統計和大數據量計算的特性使得“概率評估”與學習算法結合后十分切合狀態監測應用。
還需要特別強調,在狀態監測學習算法中使用的概率與日常中使用的概率是不同的,它并不寬泛地包含那種任意的不確切性;相反,它表明隨機狀態的這種數學特征是“確切的”。基于概率評估的學習算法在狀態監測樣本的自動學習與評估、大數據降維輔助故障認知、開放式狀態監測以及復雜監測系統互聯等方面均具有跨越式的應用效果。限于篇幅,下面將重點就前兩點簡要進行介紹。
一臺具體設備的故障概率可以用公式描述為:

其中:Nφe(t)為故障狀態的計數,Nφ(t)為全狀態的計數;它們均為相關于統計時間的函數。
數值化之后,故障率則可以描述為:

其中:NDe為故障數據的個數,ND為全部數據的個數。
容易看出:Re≠re,它們并不嚴格相等。所以,如果期望狀態監測系統能夠真實反映設備的真實狀態,就必須強調:
(1)數據的獲取方式在時間上是均勻的,不能帶偏好性選擇,即,并沒有特別重視某一類數據的高密度采集。這就是故障記錄系統和狀態監測系統的本質區別,故障記錄系統被設計為具備最極端的偏好性以便減少篩選數據的工作量。
(2)數據的總量必須達到統計意義上的“足夠多”。即,滿足“大數定律”。
在這兩個充分必要條件下,有:

從式(3)可以看出,期望的故障率越低,所需要用于分析的數據總量就越高;同時,“故障數據”卻會比較少——遠遠少于數據總量!這就是基于故障診斷路線建立狀態監測系統的數學障礙:無論學習算法還是概率描述方法,都需要大量的有效數據——顯然,不可能通過1000個數據分析出萬分之一的故障率。
因此,智能學習狀態監測樣本的基本方法,有別于歷史上重點基于故障數據的思路,而必須轉變為重點基于健康數據的學習方法——通過自動學習建立設備健康樣本,并據此建立設備健康評估標準,從而徹底解決評估標準欠缺和設計標準落后于應用的實際問題。
目前水電機組往往采用現場試驗和簡單限值比較的方式進行狀態評估和監測預警。這種方法受到工況(水情)變化、機組結構、測量設備甚至人員等諸多因素的影響,缺少對機組早期潛在故障以及從未發生過的新故障的預警能力,也無法充分表征機組當前的實際健康狀態和運行服役能力。因此,可以采用的技術就是將這種定量評估轉變為數值概率評估[見式(1)],或者與某種數值概率描述相等價[見式(2)、式(3)],從而不歪曲數據內涵的實際狀態意義。通過把“隨機問題”的不可計算性轉變為根據歷史數據計算“經驗頻率”的確定算法,然后通過運行實踐來驗證和“試錯學習”——這就是基于概率評估的健康樣本學習算法,如圖6所示。

圖6 基于概率評估的健康樣本學習算法Figure 6 Alearning algorithm for health samples based probability evaluation
例如:我們可以通過監測某個設備的振動頻譜來建立其健康樣本。由于缺乏關于它的定性和定量的評價標準(現狀就是如此),那么就必須從反映振動水平的數據出發,將振動狀態用數據的數學指標(在此處是傅里葉變換計算)加以表述。在這一點做到之后,還必須加上邊界條件,比如設備的工況,它是滿負荷還是空載。由此,就可以在原則上統計出振動的所有頻譜系。誠然,由于問題的復雜程度,一開始確實不能嚴格確定出“健康的”振動頻率,但是總能夠輕易統計出那些具有最小的振幅和振動能量的振動頻率。如此,就已經實現了“健康樣本”的定量估計。在此基礎上,再加入人對于不同振動狀態的主觀理解(數學表述叫分類),就可以實現健康評估和趨勢預測。四川某水電機組“頻譜系”分析實測如圖7所示。
基于健康樣本的學習算法中有兩個要點是必不可少的:
(1)關于設備物理狀態的嚴格數學指標。
(2)邊界條件。
其中“邊界條件”就是所謂“偶然性”條件,也就是說是由設備所處的環境來確定的,因而導致了“隨機規律”的出現。
再舉一個復雜些的多模態數據的實例:機組甩負荷時的穩定性狀態是由多個軸位置傳感器共同監測的,并沒有哪一只傳感器的數據可以單獨判定穩定還是不穩定。此時,使用人可以理解的幾何圖像或參數,即可以建立健康樣本,據此樣本即可評價今后每次檢修后的穩定性狀態。圖8即是湖南某機組的甩負荷穩態樣本。這個例子深刻揭示了各個物理狀態空間的大小并不是確定性的(不一定是單值描述的),而是由實際各種物理量關聯關系的相互作用范圍決定的。而且,這一范圍有可能發生變化。所以,要真實監測復雜系統的狀態就必須認識到:不但數學指標的統計需要采用學習算法,“類別”評價標準的建立也必須采用學習算法,從數學上描述就是所謂合理的限值總是隨狀態而改變的。

圖8 甩負荷穩態樣本Figure 8 Steady-state sample of load rejection
通過前面的例子可知:通過多支或多種傳感器同時監測設備可能出現的復雜狀態,然后對多模態數據進行融合感知計算,將有助于對復雜狀態進行更準確地監測和評價。這已經成為從根本上解決“傳感器測不準問題”的最現實和合理的解決手段。由此,也就自然產生了故障診斷中,高維度數據需要智能降維,并輔助人類完成故障認知的問題。
如果我們利用數學向量工具分析某個具體的高維狀態數據空間,那么,具體設備所處的實際狀態可以表征為式(4),其中包括了正常狀態和故障狀態,即全部“物理狀態空間”:

其維度N通常是不能明確限定的,一般情況下N遠大于3,即,一種物理狀態通常需要3個以上的參數來刻畫和表達:

而用數據形式化描述的“數據狀態空間”可以表征為式(6):

其維度N則是能夠明確限定的,即,由一組確定的測量來刻畫和表達一種物理狀態。在傳統自動控制系統中N通常簡單取1;而在大數據應用系統中一般N也遠大于3,由此可知兩類系統對特定設備狀態的分辨能力是完全不同的:

同時,人類自身可以明確識別的“認知狀態空間”可以表征為式(8):

其維度N恒小于3,即,人總是用3維的體驗來認知某種物理狀態的,即便對于1維和2維的簡化情形,人依然是通過3維知識來把握的——只是令其中的某一個或兩個維度恒等于0而已(類似“思考”理想平面的方法):

如果我們細致分析上述三種狀態空間,就會發現:“物理狀態空間”無論如何,實質上是比“數據狀態空間”廣闊很多的;而“數據狀態空間”又比“認知狀態空間”廣闊很多。而且,它們彼此都是不重合的。

圖9 物理狀態空間、向量空間、認知相空間Figure 9 Physical state space,vector space,cognitive phase space
因而,需要利用特定的數學技巧來應用于這3個不同維度的空間,令其中共同表征的部分正好是物理狀態空間中令人感興趣的“特殊狀態集”。——首先,這個集合(這些物理量)能夠以合理的置信度(置信度是與每一個監測數據相對應的被信奈的程度指標,是一個極為重要的“潛在”監測指標)進行測量從而得到數據;并進一步,此集合還可以被人或學習算法所認知理解,即:

這個空間(集合),就是狀態監測算法的解空間(解集合)。當然,如果狀態監測系統的設計完全不符合自然規律的話,此集合也可能為“空”,即得不到任何有狀態評價意義的監測結果;如果部分違背自然規律的話,就會“漏檢”一部分實際上有價值的結果。
由上述各式可得:

即,狀態監測算法的解空間維度必定小于3維,所以必需對高維數據進行降維處理。這里所需要的數學工具此前已經具備了,是數學中的向量空間與物理學中的相空間(phase space)[6]分析。而所需要的認知工具,就是現在正在發展中的“AI認知/識別/匹配/分類”技術。
例如:對于水電機組的主軸穩定狀態監測,首先,由于其動力學涉及機械運動、電磁作用和水力作用,是一個經典的高維問題(精確數理方程并不能容易獲得和求解)。所以,必須通過融合感知計算,將6支或更多傳感器提供的多模態數據降維到3維空間。如此得到的空間軸姿態才具有人類認知意義上的“真實性”,否則將顯示出不可思議的扭轉與變形,導致失去“認知價值”(人無法看懂,故而無法評價)。其次,必須明確做出所認知狀態的運行條件的標識,因為如果這些狀態的邊界條件不清楚就完全不能確定“狀態譜系”。這樣處理之后就可以像圖10那樣通過3D軸姿態輔助認知水力不平衡狀態了。

圖10 3D軸姿態輔助認知水力不平衡Figure 10 3D axis attitude assisted cognition hydraulic imbalance
總而言之,必需用3維之內的數學參量描述具體設備的內在(動力學)特征,并明確其狀態邊界條件,然后才能得到有價值的“狀態譜系”。在水電狀態監測工作中必須注意:在十分小和十分大的尺度內的實驗經驗不可能再提供我們直觀的圖象,“認知”一個實際特定“狀態”對人而言已經變得十分困難。此時,純數學的表述更適合于界定各種邏輯互相關系,如可推演性、不相容性或相互依賴性,這就是人工智能取得認知方面進步的深層數學原因。
綜上所述,新興的人工智能技術在樣本學習、數據降維、開放性擴展、多系統互聯及系統安全性諸方面正好滿足了水電狀態監測的當前實際需求,并可以帶來傳統技術難以達到的跨越式效果。量子力學創始人之一,諾貝爾物理學獎獲得者尼爾斯·玻爾曾說:“知識和潛力的每一次增加,往往意味著更大的責任”[7],現在,則是“發電廠應面向未來,使現有的各種發電方式能夠更好地適應未來的智能社會以及能源革命和創新。”[5]對于水電狀態檢測工作而言,“由人工智能、深度學習等多種方式對大數據進行挖掘,也是新時代生態環境建設和經濟社會發展對電力企業的要求。”[5]這個充滿責任感、科技感、進步感的領域正以獨特的魅力以及機遇吸引著更多有識之士來共創新的應用、開拓更美好的前景!