趙春暉 胡赟昀 鄭嘉樂 陳軍豪
電力工業是我國國民經濟中的支柱型產業.隨著我國經濟的飛速發展,社會對電力的需求不斷提高.在我國的電源結構中,燃煤發電一直是主力電源,也是火電的主體[1].雖然受能源資源、環境保護、應對氣候變化等影響,我國核電、風電、太陽能得到快速發展,但由于煤電成本低、供電安全可靠、資源立足國內,以煤為主的能源結構仍將長期保持不變.國際能源署則預測,即使到2030 年,全球能源對化石燃料的依存度仍高達80%.隨著信息化和工業化的深度融合,應對互聯網、大數據、云計算等信息領域新技術發展,推進火電行業的智能轉型升級,是加快構建高效、清潔、低碳、可持續的電力工業體系的必然選擇.
近年來,為了實現可持續發展,火力發電行業積極開展結構調整,“上大壓小”,以大容量、高參數、低能耗的超臨界和超超臨界機組取代高能耗小火電機組,基本形成了以超超臨界機組為主體的電力能源結構.百萬千瓦超超臨界機組已經成為我國電力工業發展的代表性機組和主流方向.在工業和信息化部發布的《高端裝備制造業“十二五”發展規劃》中,百萬千瓦級超超臨界火電發電機組被列為近十年我國高端裝備制造業具有自主知識產權的12 項重大成果之首.與常規火力發電裝備相比較,百萬千瓦超超臨界機組具有許多特殊性,如單機容量大、熱力參數高、系統規模龐大、參數耦合嚴重、非線性程度高、參數波動要求嚴格、安全可靠性要求高等,機組出現性能退化甚至故障是不可避免的,運行過程一旦發生重大故障將造成機組非停[2].為提高百萬千瓦超超臨界機組的運行安全穩定性,需要開展裝備運行工況監控的深入研究,包括及時發現異常、識別故障并快速制定應對措施,從而消除安全隱患,降低發電裝備非停風險,最大限度保障現役百萬千瓦超超臨界機組的安全可靠運行,這對于減少電力生產事故、提高電能生產效率具有十分重要的意義[3].
燃煤發電裝備運行工況監控技術是了解和掌握燃煤發電裝備在使用過程中的狀態,確定其整體或局部是否正常,早期發現故障及其原因,并預報故障發展趨勢,給出故障處理對策與建議的技術.工況監控從廣義上來講,包括了狀態監測和故障診斷.狀態監測[4-6]是對裝備狀態異常的判別,是故障診斷的起點和基礎.狀態監測通過了解和掌握設備的運行狀態,包括采用各種檢測、測量、監視、分析和判別方法,結合系統的歷史和現狀,考慮環境因素,對裝備運行狀態進行評估,判斷其是否處于正常,是否為優,為裝備的故障分析、合理使用和安全工作提供信息和準備數據.故障診斷[4,7]根據狀態監測所獲得的信息,結合已知的結構特性和參數以及環境條件、該設備的運行歷史(包括運行記錄和曾發生過的故障及維修記錄等),對設備可能要發生的或已經發生的故障進行預報、分析和判斷,確定故障的性質、類別、程度、原因和部位,指出故障發生和發展的趨勢及其后果.研究燃煤發電裝備運行工況監控技術,包括狀態監測與故障診斷,是實現智能電廠的關鍵核心.
目前專門針對燃煤發電裝備的工況監控工作尚未形成系統的理論體系.在Web of Science 核心數據庫中,按照主題詞“Power plant monitoring” 檢索結果,關于發電過程監控的科學引文索引(Science citation index,SCI)科研文章數量正呈現逐年上升趨勢,目前保持在每年700 篇左右的數量,表明其研究正在引起科研工作者的重視,并逐漸成為人們關注的焦點.燃煤發電裝備運行過程本質上是典型的工業生產過程.因而,除自身獨有的特性以外,燃煤發電裝備生產過程也包含與其他工業生產過程類似的運行特性,例如設備耦合導致的非線性問題、大規模多設備問題、多閉環回路導致的動態性問題等.除此以外,燃煤發電裝備子系統眾多,每個子系統中包含多種設備,有些設備與其他工業生產過程中的設備也具有相似性,尤其是應用廣泛的旋轉機械設備.針對上述共性問題,有些研究雖未直接用于燃煤發電裝備,但已取得有效進展并在其他工業生產過程得以驗證.考慮到方法的通用性和研究對象的共性,這些前人研究方法或可應用于燃煤發電裝備的工況監控研究中.因此,本文在討論一些共性問題時,也加入了對其他工業生產過程研究方法的討論,希望為燃煤發電裝備工況監控研究帶來借鑒.
目前,從過程歷史數據中提取信息并據此進行建模監測的數據解析方法[8]已成為運行工況監控研究的一個熱點.概括來說,數據解析方法通過分析挖掘收集的發電過程數據,提取數據內部隱含的信息和特征,從而揭示發電過程的運行狀態并追溯故障原因.與專家經驗等定性知識相比,數據解析方法可以理解為一種特殊的基于知識的方法,其主要的不同在于這些知識是從大量的工業數據中提取得到的,無需系統的精確模型和先驗知識.隨著工業互聯網和物聯網技術的迅猛發展,工業智能化水平顯著提高,人們可以便利快捷地觀測、采集和存儲大量過程數據(如高頻的振動信號和低頻的傳感器測量信號、工藝數據和產品質量等數據),為深入的解析和過程理解提供了豐富的數據支持.工業大數據概念由此提出[9-11],引起了國內外學者的廣泛關注.而機器學習方法的發展也為數據驅動的發電裝備運行工況監控研究提供了理論指導[12].近年來,機器學習[13-16]的理論和方法體系正在不斷向深層次發展,深度學習[17-19]、零樣本學習[20]、集成學習[21-22]、監督與半監督學習[23]等為發電過程工況監控技術提供了豐富的分析手段.
本文從分析燃煤發電裝備的本質特性出發,揭示了其變負荷深度調峰導致的非平穩運行特性和全流程復雜耦合特性,在此基礎上總結了發電過程區別于一般連續過程的問題,指出了研究燃煤發電裝備工況監控算法的必要性.進而,基于這些特性,我們對面向發電裝備工況監控的數據驅動算法30 年來的發展進行了回顧和分析.從算法層面來講,我們把發電裝備工況監控算法的發展分為3 個階段:傳統工況監控算法階段、非平穩分析算法階段和多模式分析算法階段.其中,多模式研究包括時間分析框架和條件分析框架.在此基礎上,梳理了目前存在的問題,并進一步介紹了發電裝備工況監控領域未來可能的發展方向.
百萬千瓦超超臨界機組熱力系統規模龐大、設備多樣、參數眾多且相互影響,是個極其復雜的對象[24-25].超超臨界機組運行在高溫高壓的環境中,熱力系統是其能量轉換的主要場所.如圖1 所示,機組通過鍋爐燃燒將化學能轉變為熱能,蒸汽推動汽輪機轉動做功,將熱能轉變為機械能.由于運行環境惡劣且自身特性復雜,發電裝備熱力系統的狀態監測與故障診斷具有很高的難度.本節首先介紹百萬千瓦超超臨界機組熱力系統以變負荷非平穩為主的復雜特性,然后對發電裝備工況監控的難點問題展開分析.
平穩性指時間序列的均值和方差不隨時間變化[26],保持長期穩定.但是,發電過程運行狀態明顯不符合平穩性定義.受變負荷調峰等影響,發電運行狀態呈現明顯的非平穩特性.如圖2所示,負荷和其他參數都隨著時間非平穩波動.這種情況也稱為裝備的變工況.以磨煤機為例,每臺裝備配備了6臺磨煤機,由于負荷變化,以及裝備工作時6 臺磨煤機之間根據需要啟停切換,因此需要改變輸入的給煤量設定值.由于給煤量的變化,將會引發磨煤機運行工況的變化.根據裝備運行參數是否隨時間變化,非平穩變化涵蓋了穩態工況和非穩態工況.穩態工況[4]是指裝備運行過程中系統參數始終保持恒定不變或者變化率較小的穩定情況.非穩態工況[4]是指裝備運行過程中系統參數變化率較大的非穩定情況,即動態過渡工況.特別是近年來風電、光電等新能源并網造成的電網負荷波動、峰谷差加大以及用戶側需求的變化,導致裝備出現頻繁深度調峰等新常態,由此導致熱力系統很多參數都在隨時間發生變化,裝備往往無法處于穩態工況,具有明顯的變負荷非平穩運行特性.對于非平穩運行過程,正常過程狀態變化在某些特征參數上的反映與故障引起的變化非常相似,這些變化的重合給異常工況的及時檢測和故障原因的準確診斷帶來很大難度.因此,全工況下百萬千瓦超超臨界機組熱力系統的狀態監控與故障診斷要比單一穩態工況的狀態監控與故障診斷要求高、難度大,還存在很多問題和挑戰需要深入探討和研究.

圖2 百萬千瓦超超臨界機組非平穩運行軌跡示意圖Fig.2 Schematic of non-stationary operation trajectory of 1 000 MW ultra-supercritical unit
如圖3 所示,燃煤發電裝備發電的工藝過程生產流程長、系統規模龐大、設備結構復雜、空間分布廣.熱力系統囊括鍋爐、汽輪機2 大主機及3 大風機、磨煤機、給水泵、循環水泵、凝結水泵等輔助設備.設備之間的耦合性、系統的復雜性,以及高溫、高壓、高速旋轉的特殊工作環境,導致高故障率和故障后果的高危害性.這樣的復雜系統,可能發生的故障亦復雜多樣,且故障表征復雜耦合,故障產生的影響傳播后可能產生新的故障表征.此外,裝備頻繁深度調峰導致運行參數動態多變,裝備復合故障多發,故障因果不清、不確定性強.以圖4 中磨煤機和空預器設備故障為例,對應不同故障源,具有不同的故障表征.故障表征與故障源之間并非簡單的單一映射關系.相對于單一故障,復合故障則是更為復雜的多對多問題,即多個故障源對應多個故障表征.發電裝備全流程的特點、設備部件的復雜性、變量間的耦合性以及實際故障數據的稀疏性,使得故障的及時診斷和溯源面臨著嚴峻的挑戰.

圖3 百萬千瓦超超臨界機組全流程運行示意圖Fig.3 Schematic of the full-condition operation of 1 000 MW ultra-supercritical unit

圖4 磨煤機磨輥磨損與空預器磨損的故障表征示意圖Fig.4 Diagram of fault characterization of coal mill roller wear and air preheater wear
除了變工況非平穩特性以及全流程復雜耦合特性之外,發電裝備運行還具有工業過程的一些典型共性問題.總結如下:
1)非線性.雖然線性關系直觀明了,線性模型的構建也簡單易行,但是不可否認大部分過程變量之間的關系都是非線性的[27-29].譬如,凝汽器的尺寸和容量的關系,發電機的扭力、轉速和輸出功率的關系等.
2)非高斯性.工業過程受到操作點設定改變、工況變化等因素影響,其對應的數據往往不服從高斯分布[30-32].由圖2 所示,電廠數據受不同負荷影響,時間軸上不同時期的數據顯然不能用同一個高斯模型來表征和涵蓋.
3)時變性.即使工業過程不發生故障,它也會隨著時間的變化偏離預設值[33-35].這往往由外界環境變化和設備本身的自然變化導致,例如催化劑失活、設備老化、傳感器漂移以及預防性維護和清潔等.
4)動態性.動態特性是指工業過程數據具有的與時間相關聯的特性[36-38],即:實際過程變量前后的測量值往往相互關聯,體現出明顯的時序相關性,即過程動態特性.該特性受對象上施加的控制手段和作用影響,并與對象的內在機制關系緊密,包括過程所處的工況、物理化學反應機理以及外界噪聲、擾動等.發電裝備由于多系統耦合以及控制策略的使用,具有典型的動態性.
5)多源性.工業過程中產生的數據不僅數量龐大,而且來源豐富、類型多樣.傳感器的多樣性往往使得不同設備間數據的采樣頻率、存儲形式也各不相同,導致數據具有多源性.例如:除溫度、壓力等低頻的過程數據外,燃煤發電裝備中的旋轉設備還會產生大量高頻的振動信號.
如前文所述,燃煤發電裝備運行工況監控任務包括了狀態監測與故障診斷兩方面.工業大數據概念的提出,使得基于數據驅動的工況監控成為關注的熱點.但是,發電裝備的復雜特性導致發電裝備的工況監控任務存在以下一些難點:
1)隨著工業智能化進程不斷加快,對燃煤發電裝備運行過程實行智能化監控的要求也日益提高.發電裝備在運行過程中產生大量的過程歷史數據.如何分析挖掘過程數據,提取數據內隱含的信息和特征,實現智能化的發電裝備工況監控,是需要考慮的問題.
2)區別于一般連續過程,發電裝備運行過程具有顯著的變工況非平穩特性,穩態工況與過渡工況頻繁交替,給運行異常的及時檢測和故障診斷帶來了較大困難.如何精準描述變工況過程,建立非單一穩態工況下的監測或診斷模型是亟待解決的一個難題.
3)類似于其他工業過程,發電裝備運行過程具有一些典型的復雜特性,包括非線性、非高斯、時變性、動態性、數據多源性等,由此也帶來了工業過程工況監控的共性問題.如何將其他工業過程的工況監控方法移植應用到燃煤發電裝備過程中,也亟待研究.
綜上,深入分析百萬千瓦超超臨界機組熱力系統運行中的特點和問題,構建百萬千瓦超超臨界機組運行工況監控技術,有利于提高機組設備的透明化水平,保障機組的安全、可靠運行,對我國電力工業節能與低碳經濟目標的實現具有重要意義,必將推動智能電廠的進一步發展.
上一節主要介紹了燃煤發電裝備的生產過程及其特性,并圍繞著設備的復雜特性,凝練了燃煤發電裝備工況監控的難點問題.本節將主要介紹基于數據驅動的燃煤發電裝備工況監控理論和方法的基本發展歷程.首先,介紹傳統的基于數據驅動的燃煤發電裝備工況監控方法;其次,介紹復雜特性下的基于數據驅動的工況監控方法.其中,將重點介紹針對非平穩特性的工況監控方法,包括以協整分析(Cointegration analysis,CA)等為代表的典型非平穩信號分析方法、時間驅動的多模態分析方法以及最新興起的條件驅動的多模式分析方法.進而對變負荷非平穩運行狀態下燃煤發電裝備其他復雜特性進行深入解析,介紹現有的針對具體問題的工況監控研究工作.
鑒于目前專門針對百萬千瓦超超臨界機組的運維管理研究工作尚未形成系統的理論方法體系,下面將從已有的燃煤發電裝備工況監控的研究工作出發進行介紹.燃煤發電裝備的故障診斷是以檢測到的機組運行狀態信息為前提的.因此,一般所講的燃煤發電裝備工況監控技術,往往將狀態監測和故障診斷放到一起.國內外學者對燃煤發電裝備工況監控理論與方法進行了廣泛的研究.概括說來,燃煤發電裝備工況監控方法主要包括基于解析模型的方法[39-42]和數據驅動的方法[43-67].
其中,基于解析模型的方法通過建立燃煤發電裝備精確的數學模型和構造可觀測輸入輸出量殘差信號來反映裝備期望行為與實際運行模式之間的一致性,從而指示與判斷運行狀態的正常與否,進而診斷故障原因.基于解析模型的工況監控方法主要應用于線性時不變系統,但是大多數火電系統和設備都是非線性、時變的.此外,基于解析模型的診斷方法需要對診斷對象及故障機理有深刻的認識,然而對于燃煤發電裝備這樣的復雜非線性系統,其結構復雜、動態時變以及強耦合特性顯著,難以通過建立精確的解析模型實現工況監控.不同于基于解析模型的方法,數據驅動的方法通過對系統運行數據的分析處理,能夠在無需知道診斷對象的先驗知識和系統精確解析模型的情況下完成系統的工況監控.
近年來,隨著數據測量與存儲技術的飛速發展,人們可以方便快捷地獲取和處理裝備的低頻運行參數和產品質量數據(如溫度、壓力、流量、風量、功率、轉速、電流等),以及高頻運行信號(如汽輪機、風機等旋轉機械的振動),為數據驅動的工況監控技術奠定了基礎.數據驅動的燃煤發電裝備工況監控技術主要是通過分析挖掘收集的發電過程數據,提取數據內部隱含的信息和特征,從而揭示發電過程的運行狀態和追溯故障原因.目前數據驅動的傳統工況監控方法主要包括多元統計的方法和人工智能的方法.
由于具有強大的降維和數據處理能力,多元統計分析的方法[43-54]在燃煤發電裝備故障診斷研究領域得到廣泛關注.Ajami等[45]將主元分析(Principal component analysis,PCA)應用于電廠狀態監測,減少了由于機理模型的不確定性和操作條件變化導致的誤報警.文獻[46]針對燃煤發電裝備運行工況的連續性,提出了一種改進的多步向前滑窗PCA 方法,并將其應用于某600 MW火電機組雙背壓凝汽器運行狀態監測.Sun等[47]提出一種改進的用于鍋爐泄漏檢測的PCA 方法,解決常規PCA 方法用于狀態監測時誤報警率偏高的問題.此外,香港科技大學高福榮研究團隊[51-52]、東北大學王福利研究團隊[53]、清華大學周東華等[54]、浙江大學趙春暉等[55-57]等在數據驅動的狀態監測、故障診斷和故障緩變趨勢預測等研究方向提出了許多具有創新性的思想方法,取得了豐富的成果并應用到不同的領域.
人工智能的方法[55-65]主要通過模仿和實現人類(熟練操作人員、技術人員、專家)在燃煤發電裝備監控過程中的某些思維和行為,自動完成整個工況監控過程.Costa等[60]結合神經網絡和模糊邏輯,提出了一種兩階段診斷模型,首先使用神經網絡初步診斷故障的類型,然后利用模糊系統分析診斷結果的可靠性,給出具體的信任度.Rakhshani等[61]將數據挖掘與人工神經網絡用于熱電站鍋爐的狀態監測與故障診斷,首先利用數據挖掘方法將鍋爐多測點數據聚類為3 類:正常運行狀態族、直接故障狀態族、有故障先兆狀態族,然后采用兩類神經網絡進行訓練,完成故障的及時檢測并對故障進行診斷.我國學者主要采用神經網絡方法[66-67]對燃煤發電裝備進行工況監控的研究,取得了顯著的成果.與傳統信息處理方法相比,神經網絡方法具有強大的非線性表達能力和自適應學習能力,增大了對環境變化的適應能力,其在燃煤發電裝備工況監控領域的應用研究一直是一個熱點.但是神經網絡學習得到的信息以權值形式存儲,屬于不易理解的隱式知識,因而導致神經網絡方法的診斷過程難以解釋.此外,已有燃煤發電裝備熱力系統的故障診斷方法,主要針對某一穩定負荷工況下獲得的運行數據展開研究,僅有少數文獻通過建立不同工況下的多診斷模型實現了不同穩態工況下的故障診斷[67].
針對檢測出的異常狀態,除了診斷故障原因,還可以采用故障預測技術實現對故障的早期發現并預測其未來的發展趨勢,便于對燃煤發電裝備進行及時調整,避免惡性事故的發生.在燃煤發電裝備中,除了個別突變故障,大多數故障的發生是有一個漸進過程的.從設備正常運行到出現故障征兆再到發生故障災害是一個較慢的過程,如果在故障早期時發現,準確預測設備性能退化趨勢,可以減少事故發生的幾率,進一步提高系統運行的安全性、可靠性和有效性.評估與預測未來可能的失效與剩余使用壽命已成為國內外研究的熱點問題.目前,針對燃煤發電裝備緩變故障預測技術的研究還處于起步階段,相關的研究學者和成果都比較少.雖然一些研究學者進行了初步的有益嘗試[68-70],但是由于百萬千瓦超超臨界機組熱力系統結構復雜、子系統及設備之間存在較強的耦合性、系統運行工況復雜多變,準確的故障預測難度非常大.因此,百萬千瓦超超臨界機組緩變故障預測方法有待深入研究.
表1 對比了基于解析模型的方法和數據驅動的發電設備工況監控方法.基于解析模型的發電設備工況監控具有一定的理論支撐,能夠反映發電系統的主要規律.但是,機理模型參數眾多,需要對過程機理有充分了解和認知.此外,模型參數辨識難、實用性較差.特別是對發電過程這一復雜的物理化學反應和能量轉化過程來說,單純基于機理的解析模型很難保證精度和準確性.數據驅動的方法不需要假設或對模型參數的經驗估計,具有強大的建模能力.雖然利用數據驅動的方法對電廠設備進行狀態監測和故障診斷越來越受到研究學者關注并在工程實踐中獲得廣泛應用,但是,它在理解過程運行特性、分析故障機理、解釋故障原因方面仍然具有一定的局限性.

表1 基于解析模型和數據驅動的發電裝備工況監控方法總結Table 1 A comparing summary between analytical-model-based methods and data-driven methods for condition monitoring of power generation equipment
上述的傳統工況監控方法大多針對單一特定運行模式進行工況監控的研究.然而,在火電熱力系統實際運行過程中,負荷的頻繁變化會使得熱力系統關鍵設備部分運行參數的均值和方差隨時間發生改變,呈現出明顯的非平穩特性[71],由此導致裝備的變工況問題非常普遍.穩態工況與過渡工況的頻繁交替,給運行異常的及時檢測帶來了較大困難.一方面,故障特征很容易被非平穩趨勢所掩蓋,正常的工況變化與異常變化難以區分;另一方面,傳統的工況監控方法不能準確地描述非平穩變量間的關系,由此可能導致錯誤的監測結果.
此外,由于變工況現象,尤其是過渡工況的存在,實際火電熱力系統運行過程的工況監控相比單一穩態工況下的工況監控難度更大要求更高.針對非平穩工況監控研究的發展歷程,本節將從典型非平穩分析方法、時間驅動的多模式分析方法和最近興起的條件驅動多模式分析方法3 個方面進行介紹.
2.2.1 典型非平穩分析方法
考慮到實際工業過程運行時的非平穩變化特性,一些信號處理方法廣泛應用于非平穩過程運行工況監控.例如,小波變換[72-74]、短時傅里葉變換[75-77]、Wigner-Ville 分布[78-80]等用于分析非平穩振動信號,實現機械設備過程監測及故障診斷.Huang等[81]提出了經驗模態分解方法,可以用于任何類型的信號的分解.作為一種自適應的時頻分析方法,經驗模態分解在處理非平穩信號上有很大的優勢[82].上述信號處理的方法可以有效處理具有非平穩特性的振動信號,但是這些方法都只適用于分析單個過程變量.
除了信號處理的方法外,一些學者提出利用自適應策略來解決非平穩問題[34,83-84].該策略的主要思想是通過連續更新模型來捕獲非平穩變化.Li等[34]推出了兩種遞歸PCA 算法來自適應更新PCA 監測模型,Yu等[84]推出了遞歸指數慢特征分析算法來解決模型誤更新問題,實現精細化的自適應狀態識別.然而自適應更新策略無法有效區分正常的變化和故障,特別是對于緩慢變化的故障過程容易將故障錯誤的適應進來,存在著一定的局限性.此外,一些傳統的方法通過計算原始非平穩時間序列差分來消除非平穩趨勢[85].Box等[86]與Castillo[87]用差分整合移動平均自回歸模型(Autoregressive integrated moving average model,ARIMA)來描述過程的非平穩特性.Berthouex等[88]提出用ARIMA模型來預測廢水處理過程的運行狀態.但差分處理會導致數據中部分信息的丟失(如動態信息等),從而影響過程監測效果.
針對燃煤發電裝備非平穩運行工況監控,另一種常用的方法是基于協整分析的方法[89-90].Engle等[90]提出了協整理論,認為具有非平穩特性的變量間可能存在著長期的動態均衡關系,即各個變量圍繞著一個共同的長期趨勢隨機波動.這個長期均衡關系就是協整關系.協整關系是由變量所處系統所決定的,描述了變量之間內在本質的相互關系,協整變量的線性組合是平穩的.根據這樣的理論觀點,如果能夠建立起工程系統變量之間的協整關系模型,那么當系統發生故障而造成變量之間關系被改變時,相應的信息便會反映在模型殘差(新息變量)中.因此,通過對模型殘差進行分析,便可以得到故障特征和系統狀態信息.Chen等[91]首次將協整分析用于工業蒸餾裝置的狀態監測,為復雜工業過程的非平穩運行工況監控帶來了新的思路和方法.其主要原理是,當過程運行在正常工況下時,可以建立非平穩變量間的協整模型,并得到一個平穩的殘差序列;當運行過程中有故障發生時,系統中參數或結構會發生變化,從而影響變量間的動態關系,此時非平穩變量間原有的共同趨勢發生改變,即這些變量不再是協整的,所以其線性組合后的殘差序列也不再是平穩的.因此可以通過對殘差序列進行監測,判斷過程中是否有故障發生.在此基礎上,Li等[92]做了進一步改進,通過對提取的殘差序列進行平穩性檢驗,獲得多個平穩的殘差序列,基于全部的平穩殘差序列建立監測模型,從而更全面地提取過程信息.隨后,協整分析方法開始逐漸應用于工業設備的工況監控中[93-95].
針對百萬千瓦超超臨界機組,由于新能源并網造成的電網負荷波動、峰谷差加大以及用戶側需求的變化,機組常處于大范圍非平穩運行模式.Zhao等[96-102]基于協整分析方法展開了狀態監測和故障診斷的一系列系統性研究,并通過實例驗證了它們的有效性和合理性.針對不斷變化的工況,Zhao等[96]結合協整分析和慢特征分析方法構建了一種面向非平穩動態過程的全工況監測策略,可以通過同時監測長期均衡關系和動態關系來區分運行條件的變化和實際故障.進一步,他們提出火電運行過程是一個平穩特性和非平穩特性混合的復雜過程[97],應該分別提取這兩部分特性并加以分析.基于上述考慮,他們將整個數據空間分成不同的子空間,在不同子空間中植入不同的相似度分析,實現了火電過程微小故障的檢測.更進一步地,針對大規模發電系統,基于稀疏協整分析方法,提出了一種迭代的變量子塊劃分方法[55,99],將非平穩變量根據協整關系的強弱自動劃分到不同的子塊中,用于提取局部的非平穩特性,建立底層模型用于監測過程的局部狀態;并且借助信息融合方法,建立全局模型以衡量不同子塊間的相關關系.在燃煤發電裝備熱力系統中的大量實驗結果驗證了分塊分層的非平穩過程表征模型在泛化能力、計算復雜度以及可解釋性等方面的優勢.在此基礎上,結合對系統時變特性的分析,揭示了協整關系可能存在的時變性.對此,Yu等[100]建立了協整關系的快速增量學習策略,使得模型對于新模式具有快速適應能力.協整分析在非平穩過程的故障診斷中也起著重要作用.Sun等[101]提出了非平穩故障過程故障變量的稀疏性理念,建立了一種基于協整分析的稀疏重構策略,將最小絕對收縮和選擇算子(Least absolute shrinkage and selection operator,LASSO)融合到協整模型中用于在線隔離故障變量,在不需要任何歷史故障數據的情況下對故障變量進行在線分離和診斷.Hu等[102]利用協整分析提取各個故障類之間的公共協整關系和每個類獨特的協整關系,分別建立共性故障診斷模型和特性故障診斷模型,綜合考慮雙重診斷模型,提高了火電裝備故障診斷的性能.
綜上,典型的非平穩分析方法主要包含信號處理的方法、基于自適應更新和基于協整分析的方法.信號處理的方法能有效處理非平穩非線性信號,但只能對單個信號分析,對于多變量復雜耦合的非平穩發電裝備適用性并不高.基于自適應更新的策略能夠快速適應過程新工況,但是如果更新不當,可能錯誤地將故障數據用于模型更新,從而無法有效區分正常的變化和故障.基于協整分析的方法能夠有效挖掘非平穩變量間的長期均衡關系,只需建立單一模型且模型長時間范圍內保持有效,但是其對數據的協整假設在實際過程中可能無法滿足.
2.2.2 時間驅動的多模式分析方法
針對燃煤發電裝備非平穩過程的狀態監測和故障診斷,另一經典的思路是基于工況劃分的多模型方法.燃煤發電裝備運行過程明顯受到外界負荷需求的影響,往往不是運行在單一的穩定工況,而是在平穩態和過渡態之間不斷交替運行,即工況始終在不斷發生變化.因此,傳統的基于單一穩態的單個多元統計模型將削弱不同工況下各自的統計特性,且忽略了過渡過程中變量的統計特性變化,勢必會導致過程特性分析不準確,從而造成監測或者診斷性能的下降.近年來,已有不少學者針對多工況的過程監測和故障診斷進行了研究,提出了基于工況劃分的多模型策略[103-108].其主要思路是進行多穩態工況數據的聚類,對聚類后的數據建立多個局部模型,通過多次建模將局部單工況過程擴展為多工況過程.該方法的首要問題即為如何檢測穩態數據并將數據聚類成不同工況對應的多個子集[103].其中,大多數穩態檢測方法都是在某一個數據窗口內計算數據的均值、方差以及回歸斜率,然后利用統計檢驗的方法對所得結果進行置信度檢驗,將滿足一定置信水平的數據劃分為一個穩態,否則劃分為動態過程[104].另一種常見的劃分穩態的方法是利用Dorr等[105]提出的穩定性因子(Stability factor,SF)來判斷測量變量的平穩性,并根據該因子判斷過程數據是否處于穩態運行,從而將歷史數據處理成穩態數據塊的形式.趙春暉等[8, 57,106-107]建立了數據統計特征與過程內部運行機理的關聯機制,指出可以根據過程變量相關關系的變化反推過程特性的變化,從而將運行狀態分為不同模式.對此,他們建立了時間驅動的多模式分析與表征理論,提出了特性變化度量與模式劃分策略,對非平穩變化特性與頻繁狀態切換問題進行了深入刻畫.此外,高斯混合模型聚類方法同樣適用于工況的識別和判斷.孫賢昌等[108]以測試樣本屬于各個工況的概率為權重,將各PCA 模型中的貢獻量融合為全局相對貢獻量,生成全局相對貢獻圖,實現對多工況過程的故障診斷.
以上方法主要是針對穩態工況下的監控,沒有考慮各穩定工況之間的特性變化和切換[109-111].對此,Zhao等[109]建立了一種軟過渡PCA 模型(Softtransition multiple PCA,STMPCA)方法,克服了子PCA 模型建立中硬劃分和聚類失誤的問題.針對過渡區域,該算法利用0-1 模糊隸屬度作為與過渡模式相鄰的兩個穩態過程的權重系數,通過基于歐幾里得距離的加權平均綜合了相鄰兩個過程的過程特征,增強了過渡監測模型的靈敏性.隨后,Yao等[110]在此基礎上采用了不同的相似度指標來分析各PCA 模型間的相似關系,進一步發展了軟時段過渡方法.Wang等[111-112]建立了多種工業過程多模態及過渡問題的解決方案.以上方法都利用了多變量聚類的方法來進行工況劃分.
2.2.3 條件驅動的多模式分析方法
本節以磨煤機為例介紹傳統時間驅動分析方法的問題.輸入磨煤機的給煤量設定值是根據負荷的變化而變化的,而給煤量設定值的變化會引起設備運行狀態的相應改變,且狀態變化頻繁、無規律可循.以往多模態研究方法是時間驅動的.這種傳統的時間軸分析方法,往往分析時間上的變化規律,采用聚類方法揭示過程運行工況的變化.從時間維度上來看,模式的變化更加繁雜,頻繁的工況切換以及切換的初始和目標工況不同,給建模和理解帶來很大困難,包括時間無序性和在線工況標簽識別等最典型的問題.
考慮到操作工況的變化在時間上的無序性和重復性,浙江大學趙春暉研究團隊[113-114]以發電裝備的磨煤機設備為例,首次提出了條件驅動的多模式分析理論,將傳統的時間軸上繁雜的變工況運行導致的模式變化轉變為條件軸上規律性的多模式變化,消除了非平穩特性的影響,抓住了工況變化的本質,在磨煤機上進行了成功驗證,并廣泛適用于非平穩運行的連續生產工業系統,拓展了非平穩分析的理論方法體系.Zhao等[114]通過對運行工況變化的深入研究,提出了以下認知:1)雖然非平穩運行中操作條件(給煤量設定值)頻繁切換,過程特性隨時間非平穩變化,但過程特性在運行條件驅動下,隨過程操作進程或過程機理特性的變化發生規律性的改變,呈現分模式性的變化規律;2)盡管運行條件(給煤量設定值)隨時間發生變化,但潛在的變量相關性在相同的條件模式下相似,不同條件模式下則有顯著的差異.在該認知基礎上,根據變量相關性是否隨條件變量的變化而改變,可以從條件有序的角度將整個過程分為多個條件模式.如圖5 所示,時間上呈現非平穩變化的數據通過數據重組,轉變為條件軸上有規律的數據分析單元,即條件片.以此最小分析單位作為基礎,在相同的條件片下,過程特性近似一致;按照條件變量的變化,對不同條件片的過程特性相似性進行評估,從而將整個過程劃分為不同條件模式段.條件模式這一全新概念的提出解決了工況變換的時間無序和在線監測時模態難以判斷的問題.根據條件變量的指示,可以直接判斷當前運行過程所處的條件模式.Zhao等[114]提出的多條件模式的表征理論方法,從根本上克服了以往時間驅動分析方法的保守性,增強了人們對條件驅動生產過程變工況和時變特性的理解,有利于不同模式內關鍵信息的分析與提取,顯著提高了模型的精度.條件驅動的多模式分析思想為后續的狀態監測、故障診斷等工況監控任務奠定了基礎,開辟了一條新的研究道路.

圖5 條件軸數據重組(從時間軸非平穩數據到條件軸不同條件片)Fig.5 Rearranging data according to condition axis(from nonstationary data on time axis to different condition slices on condition axis)
表2 總結對比了典型非平穩分析方法、時間驅動的多模式分析、最新興起的條件驅動的多模式分析3 類非平穩工況監控方法.典型非平穩分析方法往往對過程數據具有較為嚴苛的要求,因此對于大范圍非平穩運行且變量復雜耦合的百萬千瓦超超臨界機組適用性較差.時間驅動的分析方法旨在捕捉過程在時間軸上的變化進而將非平穩過程劃分成不同的工況模式進行分析.發電裝備工況復雜,其時間上的無序性和重復性使得現有方法所劃分的模式往往不夠準確且不具有清晰的物理意義.與時間驅動的分析方法相比,條件驅動理念將時間上非平穩變化的數據轉變為條件軸上規則的分析單元,為后續的工況監控研究奠定了基礎.對該類方法的研究還包括對多條件變量耦合影響下的條件模式的劃分以及如何更好地對條件模式建模等.

表2 三類非平穩分析方法對比總結Table 2 Comparison and summary of three types of non-stationary analysis methods
燃煤發電裝備亦具有與其他工業生產過程相似的運行特性.針對此類共性問題的已有研究方法可望直接運用于燃煤發電裝備的狀態監測和故障診斷,實現工況的有效識別.
2.3.1 非線性問題
非線性是工業過程的重要特性.事實上,雖然線性關系直觀明了,但絕大多數的復雜工業過程變量間的關系都是非線性關系.運行工況的多變、設備的復雜耦合,使得燃煤發電裝備的非線性特性更加顯著.由于非線性特性的存在,傳統的線性模型無法有效地對潛在的過程特性進行提取、分析和利用[115],在復雜工業過程中并不適用.
為克服線性工況監控方法的不足,在過去的幾十年中,各種非線性方法[116-124]應運而生.最先用于建立非線性模型的是基于神經網絡的方法[116].例如,Kramer[117]提出了利用自聯想神經網絡來提取數據的非線性主成分分量.考慮到自聯想神經網絡隨著隱含層層數增加反向傳播性能普遍下降,Tan等[118]提出了一個3 層輸入訓練神經網絡,克服了這一局限性,使得神經網絡更易于訓練.Dong等[119]將主元曲線和神經網絡相結合來解決非線性問題.這些基于傳統神經網絡的方法需要離線開發模型,并通過一些優化方法對模型進行訓練.由于當時計算機性能差、數據量小以及傳統神經網絡技術的局限性,基于神經網絡的方法沒有得到廣泛使用,逐漸沒落.隨后,基于核函數的方法被證實能有效解決非線性問題,因而得到了迅速的發展[27,120-122].其主要原理是使用核函數將數據從低維輸入空間映射到高維特征空間中,再進行相應的線性計算,具有較高的運算效率.常用的核方法包括核主成分分析(Kernel PCA,KPCA)[120]、核偏最小二乘(Kernel partial least squares,KPLS)[121]、核獨立成分分析(Kernel independent component analysis,KICA)[122]等.此類方法對核函數和相關參數的選擇依賴較高,但現有的文獻對這類問題的分析討論較少.同時,基于核函數的方法受限于核函數的性質,有時并不能取得較好的在線監測結果.近些年來,隨著人工智能算法的不斷發展和算力的增強,不少基于深度神經網絡的方法也運用到了非線性過程狀態監測領域[28,123-124].特別是具有非線性降維功能的自編碼網絡[28]更是在故障檢測領域得到了廣泛的應用.Yu等[28]首先將自編碼(Autoencoder,AE)網絡應用于工業過程中,并考慮降噪功能,通過訓練中心層較小的多層神經網絡將高維數據轉換為低維特征實現非線性特征的提取,建立了相應的監測模型以檢測異常;通過結合降噪自編碼(Denoising autoencoder,DAE)和彈性網(Elastic Net,EN),隔離出引起故障的關鍵變量.Zhang等[124]則提出了一種基于變分自編碼器(Variational autoencoder,VAE)的非線性工況監控方法.通過在網絡的隱含層中添加高斯分布約束,使得VAE 學習到的隱含層特征服從高斯分布.
對于燃煤裝備運行過程而言,由于運行工況的變化其非線性特性會更加顯著.一般來說,在考慮變工況特性的基礎上,可以很好地將原有連續過程的非線性分析方法拓展到燃煤發電裝備運行工況監控研究中.
2.3.2 線性非線性混雜問題
考慮到不同的工業過程中,往往包含不同程度的非線性關系,還可能同時包含線性和非線性關系[115].因此,在實際工程應用中,有針對性地選擇合適的工況監控方法至關重要.然而,傳統的工況監控方法要么基于先驗知識判斷,要么直接假設過程是單一線性或非線性的.然而這種假設沒有嚴格依據支撐,先驗知識的來源也可能是不可靠的,這直接導致所選擇的方法可能并不符合所分析的實際過程,從而降低了模型精度和在線監測性能.因此,對實際過程線性和非線性關系進行準確判斷十分必要.為此,Kruger等[125]提出了一種基于PCA 模型的非線性度量方法,通過估算不同樣本區域的PCA模型的誤差方差來實現線性與否的判斷.Zhang等[126]基于皮爾森相關性和互信息定義了一種非線性系數,并利用該系數衡量系統的非線性程度.
然而,上述工作均采用單一的線性或非線性分析方法,即:如果判斷大部分過程變量為非線性,則采用非線性方法;反之,如果判斷大部分過程變量為線性,則采用線性方法.實際上,過程數據往往采集自不同的設備或部件,這些設備內部反應(運行)機理不同,設備與設備間的相關關系也極為復雜,從而導致過程變量間的相關性往往不服從簡單的線性關系或者非線性關系,而是呈現出一種混合的相關關系.對于這種具有線性和非線性關系混合特征的工業過程,一方面,采用單一的線性分析方法不能有效解析非線性關系和捕捉狀態變化;另一方面,單一的非線性方法無法有效解析其中隱藏的線性變量關系,亦無法直觀顯示變量之間的關聯性.考慮到實際過程中混合變量相關性問題的普遍性,傳統的過程監測方法無法有效匹配實際過程,因而會導致算法失效,從而產生錯誤的監測信息.為此,Li等[115]提出了一種線性評估方法,通過識別其中存在的線性變量關系實現了線性變量子組劃分,并區分了線性和非線性變量;采用線性和非線性分析方法,分別對不同的變量關系進行建模,實現了對復雜工業過程的精細監測.
對于實際工業運行過程,由于線性非線性混雜,如何有效區分、抽取其中線性和非線性的不同特征,進行分別表征和監測也極具挑戰.
2.3.3 大規模復雜系統問題
百萬千瓦超超臨界機組有兩大主機、三大風機,還有磨煤機、給水泵等多種輔助設備,整個生產過程具有上千個測點,系統規模龐大、參數耦合嚴重.針對此類大規模復雜系統的工況監控問題,首先考慮的是如何對其建模.這里可以分為集中式建模和分布式建模兩種策略.集中式建模的思想是將全流程大規模過程看成是一個整體,將其全部過程變量用于建立監測模型.然而這樣很難從數目眾多的數據中有效地提取出過程信息,以及變量間的相關關系,導致過程監測效果降低.對全流程的燃煤發電系統而言,集中式建模策略不僅會影響監測效果,還會帶來大規模海量數據建模的困難.因此對燃煤發電裝備通常采用分布式建模的方式,即對單個單元或相關關系較強的變量組單獨建立監測模型.分布式建模的關鍵在于合理的過程分塊,對此前人已經展開了相關的研究.MacGregor等[127]提出了一種多塊偏最小二乘算法,該工作通過對局部和全局分別建立模型來考慮整體和局部之間的信息.Westerhuis等[128]通過對比一些分布式監測方法指出如果變量能夠劃分為具有一定意義的子塊,那么針對每個子塊可以采用PCA 或者偏最小二乘(Partial least squares,PLS)算法來建立監測模型.Qin等[129]分析了分塊PCA 和PLS 方法并提出了一種統一多模塊的建模策略.以上分布式監測方法通常是根據過程機理知識進行子塊劃分.在實際工業過程中,詳細的過程知識通常難以獲取.對此,Li等[115]建立了一種基于數據的分布式監測方法,提出了基于線性變量組劃分的分層建模策略和分布式監測方法.Tong等[130]提出了改進的分塊PCA算法,將整個系統劃分為4 個不同的子空間,監測各個子空間中變量的變化情況.除了從數據驅動角度的分塊,還需要綜合考慮不同系統和設備機理和知識,將具有共同屬性的設備歸于同一子系統,在此基礎上再進行變量級別的劃分.此外,針對全流程大規模的監測診斷問題,前人已經做了一些研究[131-132],但是均基于平穩過程假設,如何將全流程非平穩系統劃分為不同的子系統,進而實現分布式監測沒有得到很好的解決.Zhao等[55, 98]根據協整關系的強弱自動劃分不同的變量子塊,并考慮了不同子塊間變量的重疊性.針對非平穩過程的大規模問題的解決還有很多問題需要深入思考,特別是如何在兼顧對非平穩特性分析的基礎上建立合適的分塊方法.此外,對不同的應用目的,相應的分塊思路和角度也應有不同的考慮.
2.3.4 動態性問題
對于發電裝備來說,閉環反饋控制的使用導致裝備運行具有典型的動態特性.比如,對于磨煤機來說,給煤量設定值的變化,引起其他參數的變化,而根據最終輸出的發電功率反饋回來調節給煤量,并對其他參數產生時間上的延遲影響作用.動態特性是指工業過程數據具有的與時間相關聯的特性[38],即時序相關性.受系統耦合和復雜的閉環反饋系統的影響,過程數據往往是強自相關或者動態互相關的,即呈現明顯的動態特性.x(t)=[x1(t),x2(t),···,xm(t)]為當前時刻t的變量值,其中下標m為變量,其會受到過去一段時間變量值x(t-1)~x(t-d)的影響;同時也會對未來一段時間的變量值x(t+1)~x(t+d)產生影響,這里時滯參數d的大小由過程的性質決定.其中,時序相關性包含兩部分:變量的自相關,即xi(t)與xi(t+k),k∈[-d,d]0的相關性;變量間的互相關,即xi(t)與xj(t+k),k∈[-d,d].
目前,對動態性的分析,主要是考慮如何提取過程測量數據中蘊含的時序相關特性,其中的主流是潛投影提取方法.概括說來,直接的動態潛投影方法包括兩大類.第一類是多元統計分析方法的動態擴展[133-136],譬如,動態PCA (Dynamic PCA,DPCA)[133]、動態偏最小二乘(Dynamic PLS,DPLS)[134]等.它們利用歷史樣本拓展過程數據矩陣,然后將拓展后的數據矩陣直接帶入到一些傳統多元統計模型中進行分析[135-136],操作簡單且便于實施,因而應用廣泛.但是這些方法以不同的目標函數進行特征提取并不能保證實現過程動態性的有效表征.并且,它們依賴的動態擴展可能造成變量維度的大幅增加,無法實現數據的降維分析[133-136].針對上述問題,有學者提出了無需經過動態擴展,直接從原始變量中提取時序相關特征的方法[135-136],我們稱之為第二類方法.譬如,動態潛變量模型(Dynamic latent variable,DLV)[135]、動態內部主元分析方法(Dynamic-inner principal component analysis,DiPCA)[136]等.這些方法都是為了找尋投影方向,使得投影后得到的特征與未來或者過去一段時間的數據具有較大的相關性,因此具有一定的對過去或未來數據的預測能力.在這些方法中,“動態特征”往往是指“時序相關性強” 或者“可預測性強”的特征,這些特征所攜帶的過程信息為動態信息,而那些不具有時序相關性的信息,如白噪聲就認為是“靜態信息”.
狀態空間模型是從另一個角度來探究動態問題的方法.上述的DiPCA 等算法,兩個重要的操作就是先降維,再提取時序關系,而狀態空間模型很直接地將這兩個操作表述出來,并且能夠將過程數據的自相關和互相關特征同時進行建模.針對動態過程建模的情況,常常是基于子空間辨識的方法來分析狀態空間方程,常用的方法有規范變量分析方法(Canonical variate analysis,CVA)[37, 137]等.為了解決非線性動態過程的建模問題,Pilario等[138]結合核技巧將狀態空間方程擴展成非線性模型.基于CVA的方法求解簡單且能夠全面地分析過程變量的時序相關性.但由于CVA 在求解過程中涉及到對過程數據矩陣的求逆,當數據存在共線性問題時,其所求解將不穩定,從而影響提取的特征對過程時序性的表征能力.
上述的動態潛變量方法和狀態空間模型雖然已得到廣泛的應用,但是它們局限于模型訓練數據所處的工況,無法識別出過程操作工況的切換,會將過程操作工況的切換錯誤地指示為故障.因此,近些年基于慢特征分析(Slow feature analysis,SFA)的動態過程識別方法逐漸受到學者的關注[139-140].SFA的目標是尋找一組投影方向,使得輸出信號的變化盡可能慢.一般而言,特征中變化最慢的特征最能體現數據本質特性,而快速變化的特征可以認為是一些噪聲.實際上,通過推導可以發現,SFA的目標函數最小化特征的變化速度可以轉變為最大化特征的一階自相關性,SFA 所找到的投影方向是使得過程數據一階時序相關性最大的投影方向.對應變化速度慢的特征,其一階自相關性大;相反,對應變化速度快的特征其一階自相關性小.因此,從時序相關性的角度去衡量SFA 獲得的特征,變化慢的特征是一階時序相關的,也就是一種特殊的時序相關性[37].
基于動態性的分析,需要充分利用所提取出來的動特征以及其他信息對過程運行狀態的變化進行指示.Shang等[141]和Zhao等[96]基于SFA 提出了動靜特性協同分析的思想,同時提取了動態信息和靜態信息,并分別建立不同的監測模型和定義不同的監測統計量.該思想通過動態和靜態信息變化的精細解析,使狀態變化的指示更加精細化.但是基于SFA 所定義的“靜態”與“動態”對應的是原始特征與特征的差分,并不是由時序相關性來衡量,所以這與上面提到的CVA 等方法中的“動態”與“靜態”是不一樣的.如圖6 所示,Zhao等[114]分析了發電過程在不同運行條件上的靜動變化.對于不同的時刻,一方面過程可能處于不同的運行條件下,但顯示出相同的過程動態特性.如圖中的A點和C點,它們分別處于條件1 和條件3 處,但是顯示出相似的過程動態特性(變化速度).另一方面,即使處于相同的運行條件下,過程可能在時間方向顯示不同的動態特性.如圖中的B、D、E、F四個不同的點.它們處于相同的運行條件下,但是具有不同的瞬時特性.B點是從條件1 變化到條件2,而D點則是由條件3 變化到條件2.E和F都運行在條件2 之下,但是它們具有不同的變化速度.

圖6 不同運行條件上的過程動態變化示意圖Fig.6 Illustration of process dynamics under different operating conditions
表3 對以上所述的動態建模方法進行了對比總結.由于百萬千瓦超超臨界機組頻繁深度變負荷,其熱力系統處于動態過渡工況的可能性大大增加,而時序相關性如果沒有得到有效挖掘,正常的動態變化在某些特征參數上的反映與故障引起的變化非常相似,對實時的異常檢測帶來難度.因此,針對百萬千瓦超超臨界機組的狀態監測需要兼顧全工況運行的動態變化特點,進行精細化分析和監測.

表3 動態潛投影建模方法比較Table 3 Comparison of dynamic latent projecting methods
2.3.5 旋轉機械振動分析問題
在燃煤發電裝備的眾多設備中,有很多屬于旋轉機械設備,例如三大主機中的汽輪機和發電機.另外很多常見的輔機,例如各種泵機、風機、磨煤機等,也屬于旋轉機械.由于旋轉機械上的振動信號具有易采集、靈敏性強、可識別度高的特點,目前,對旋轉機械進行故障診斷最重要也是最有效的方法就是對其振動信號進行分析和處理.已有的基于振動信號的故障診斷方法大致分為兩大類:對振動信號進行分析的方法和利用模式識別與機器學習的方法.
目前,對振動信號進行分析和預處理常見的方法主要有:傅里葉變換[142]、小波變換[143]、短時傅里葉變換[144]、經驗模態分解[145]、包絡譜分析[146]等.然后,針對處理得到的多個子信號在時域和頻域計算統計特征,最終往往可以得到維度較多的統計特征.然而,并非所有提取到的特征都會受到故障的影響,唯有準確反映故障信息的關鍵特征才是對故障診斷有用的信息,方可用于旋轉機械設備的故障表征.傳統的基于振動信號的故障診斷方法將提取到的全部統計特征用于建模[147],特征冗余導致了能夠反映故障信息的關鍵特征被掩蓋,使得關鍵特征在故障診斷模型中并未發揮其全部的性能,影響了故障診斷的效果.同時,在關鍵特征的選取過程中,需要充分考慮特征間的相關性,既要選出能夠反映故障信息的關鍵特征,又要避免發生諸如特征間存在耦合關系等特征冗余問題.
近年來,憑借著優越的性能,以機器學習算法為代表的新一代信息技術廣泛應用到故障診斷領域,也為旋轉機械設備故障診斷研究提供了新的思路和方向.目前,常用于處理旋轉機械設備故障診斷的機器學習方法[147]包括:支持向量機(Support vector machine,SVM),人工神經網絡 (Artificial neural network,ANN),決策樹以及貝葉斯方法等.文獻[148]將經驗模態分解(Empirical mode de-composition,EMD)和神經網絡相結合,利用神經網絡對提取到的特征進行分類,為振動信號故障診斷提供了新的思路;文獻[149]提出了一種結合主元分析和決策樹的旋轉機械故障診斷方法,通過主元分析對特征進行降維,然后利用決策樹進行分類得到故障類別;文獻[150]針對于旋轉機械中的軸承設備,提出了一種基于貝葉斯方法的故障診斷方法.
對電廠旋轉機械設備振動信號進行分析的主要目的是提取出振動信號中包含的有用信息.因為振動信號是由多種激勵源共同作用的結果,信號中包含了很多其他設備引起的振動分量以及環境噪聲.如果直接對振動信號進行建模,模型容易受到其他振動分量的影響,有用信息甚至會被噪聲所掩蓋,嚴重影響故障診斷的性能.如何解決振動信號預處理與特征提取時的特征冗余、模態混疊效應、泛化能力差等問題,結合機器學習等高級算法,兼顧不同場景下的遷移和適應問題,是今后旋轉機械故障診斷需要深入研究的方向.
除了上述具有代表性的過程特性之外,發電裝備還具有強耦合性、非高斯等特性.從已獲得的研究成果來看,當前發電裝備的工況監控技術主要面向的是工業過程的非平穩、非線性、動態性等單一過程特性,缺乏對復合特性的考慮.在實際發電設備中這些復雜特性往往是同時存在的,如何對復雜特性耦合情況下的發電過程進行有效的運行工況監測具有重要的研究價值.圖7 展示了發電運行工況監控方法隨時間的發展趨勢,總結了從20 世紀90年代到現在,發電運行工況監控方法30 多年的發展歷程,涵蓋了信號分析方法、解析模型方法、多元統計分析方法以及近年來興起的機器學習與人工智能的方法.從目前的研究情況來看,多元統計方法以其計算方便及解釋清晰等優勢在發電工況監控領域占有主導地位.隨著人工智能技術的迅速發展,基于機器學習和深度學習的方法自從2000 年起也逐漸在發電裝備的工況監控領域嶄露頭角.這些工作通過對發電裝備特點特性的分析挖掘和對其中典型問題的研究,提出了具有針對性的解決方法,為后續研究奠定了很好的基礎.

圖7 發電設備運行工況監控方法發展趨勢示意圖Fig.7 Schematic of development trend of operation monitoring methods of power generation equipment
近年來,工況監控已經成為發電裝備安全可靠運行的重要保證,并已經成為智能電廠發展水平的重要標志.應該指出,發電裝備規模龐大、參數復雜耦合、設備部件眾多、運行動態多變、故障因果不清、不確定性強等特點,導致工況監控的研究還有很多沒有解決的難題以及需要重點關注的研究方向.
在檢測到故障后,進一步確定故障傳播路徑,追溯根源故障變量,也是燃煤發電裝備故障診斷中的重要內容,有助于現場操作人員快速定位發生故障的關鍵設備和部位.已有的故障監測和故障診斷的研究大多認為工業過程是平穩的,以此作為研究前提,忽略了非平穩特性在復雜工業過程中對追溯根源故障變量的不利影響.事實上,對于燃煤發電這樣明顯的非平穩過程,由于故障信息在流程中常依據變量間的因果關系進行傳遞,而非平穩特性造成的偽回歸等問題不利于正確地提取變量間的因果關系.變量間正確的因果關系被非平穩趨勢掩蓋或扭曲,難以準確追溯故障的傳播路徑,進而不能保證根源故障變量定位的準確性.針對非平穩工業過程的故障根因追溯,現有的研究主要從兩個方向展開.一方面,對非平穩時間序列本身進行處理,實現平穩化,如差分方法、符號化等[151],然后對平穩化后的時間序列進行因果關系分析.Staniek 等將數值序列轉化為符號表示,借用傳遞熵的思路構建了抗噪能力強、適用于非平穩的符號轉移熵(Symbolic transfer entropy,STE)[151].隨后又有研究者將其拓展為適用于多變量的部分符號轉移熵(Partial STE,PSTE)[152]和順序轉移熵(Partial transfer entropy on rank vectors,PTERV)[153].另一方面,建立時變的回歸模型,實現非平穩時間序列的因果關系分析,如時變廣義部分有向相干方法[154].Sch?ck等[155]假設回歸模型中的參數是時變的,設計了魯棒時變廣義相干函數,利用卡爾曼濾波估計時變的回歸參數,用頻域格蘭杰判斷變量間因果關系.然而考慮到燃煤發電裝備長期變工況運行,且子系統耦合嚴重,考慮非平穩特性的故障根因追溯依然困難重重.
此外,數據驅動的研究對于故障診斷方面的知識、經驗資源利用率較低.構建具有預測功能和通用性的智能化故障診斷方法是目前國內外學者主要的研究熱點與方向.區別于單純利用數據驅動方法,目前的研究主要是將專家經驗知識與數據分析結合,運用到燃煤發電裝備重要設備的故障診斷.Agrawal等[156]提出了一種基于模型的殘差評估方法,用于在線檢測和診斷火電廠磨煤機中發生的主要故障.該方法利用先驗知識,建立磨煤機動態數學模型進行殘差生成;然后,利用專家知識構建模糊邏輯用于殘差評估,以確定故障的類型和嚴重程度;最后,利用貝葉斯網絡對故障原因進行追溯.隨著人工智能技術的發展,以模糊邏輯為代表的傳統知識驅動方法逐漸被知識圖譜技術所取代.知識圖譜技術[157]的本質是通過可視化方法表示知識并對知識間關系進行探索分析,能夠揭示知識領域的動態發展規律并實現知識共享與重用.Yang等[158]將知識圖譜和貝葉斯網絡相結合,實現維護人員與貝葉斯網絡的推理交互,最終確定故障原因.Zhang等[159]利用云邊協同的思想,基于云端儲存的列車運行故障數據與專家知識,設計了一種基于知識圖譜的列車故障可視化分析方法,該知識圖譜可以清晰地表達不同類型的列車,不同故障和故障原因之間的關系,可以有效地呈現和追溯列車運行故障的原因.劉鑫[157]對面向故障分析的知識圖譜構建技術進行了研究,在分析總結國內外相關技術的研究發展的基礎上,構建了故障本體可視化知識圖譜工具,實現了故障信息動態檢索,提高了故障診斷知識的利用率和共享程度,為故障預測診斷領域知識圖譜構建提供一種可行的解決方案.基于知識圖譜的工業設備故障診斷研究正在不斷深入,學者們正在試圖將工業設備維修專業領域的專家經驗知識建設成知識圖譜,運用語音識別技術、自然語言處理技術對用戶查詢意圖進行解析,通過查詢知識圖譜給出相關故障維修指導.
受電網負荷調度指令變化、煤質波動、環境溫濕度變化等外部擾動因素影響,燃煤發電裝備運行狀態可能并非處于最優區間,造成鍋爐效率、汽輪機熱耗率、環保裝置投運成本等指標變差.因此,針對燃煤發電裝備的工況監控不應該僅僅局限于對生產工況做出正常或異常的識別和判斷,還應能對當前正常運行狀態的優劣水平有進一步的分析.狀態評價是對運行狀態優劣等級的評估,隸屬于廣義上的工況監控范疇.國內的能源結構決定了火電廠在提高經濟性的同時也要承擔著節能減排的重任,因此建立一套客觀公正且精確有效的裝備運行狀態綜合評價系統是非常必要的,可以為國內發電企業進行裝備運行維護、優化裝備檢修提供合理有力的依據.
目前,燃煤發電裝備運行狀態評價主要使用領域專家給出的評價標準或經驗公式,不同專家對于相同問題的處理具有主觀性,且差異性大;而且這些計算公式復雜,評價耗時耗力;此外,有些指標難以量化,僅能給出定性評價.對規模龐大、結構復雜、生產工況頻繁變化、動態時變及數據間具有強非線性耦合的百萬千瓦超超臨界機組而言,現有運行狀態評價模型往往得不到滿意的結果,甚至會給出錯誤的評價和操作指導.
此外,雖然有人提出了基于機理模型的運行狀態評價方法,但對于復雜的火電過程,建立機理模型顯然是不切實際的.隨著傳感器技術和數據存儲技術的發展,數據驅動的運行狀態評價方法受到學者的關注.Liu等[160]開發了基于PCA的性能評估方法,該方法提供了基于負載矩陣的離線性能識別技術,但不能有效區分非平穩工況下的性能好壞.Zou等[161]開發了基于層次協整分析主成分分析(Cointegration analysis PCA,CA-PCA)的性能評估方法,解決了平穩性和非平穩性混合的問題.但是,當協整關系不顯著時,這種方法無法達到良好的效果.除此以外,考慮到燃煤發電裝備運行過程的時變特性,Zou等[162]還提出了動靜聯合的運行狀態評價機制,可以更為精細地識別控制器調節作用、運行狀態變化以及性能好壞等.然而上述基于數據驅動的方法解釋性差,在樣本數目少時,可能會出現病態的模型,且運行狀態的好壞難以直接用數據劃定.此外,機器學習、深度神經網絡等人工智能方法還未應用于燃煤發電裝備的運行狀態評價中.
綜上所述,基于專家經驗與數據驅動的方法各有優劣,相輔相成.而在發電裝備運行過程中,既有豐富的專家知識,又有龐大的測量數據,傳統的單一評價方法難免厚此薄彼.針對裝備復雜特性,融合專家經驗和測量信號,利用人工智能技術,實現更全面更精細的智能化狀態評價還有待進一步研究.
與基于模型的故障診斷方法相比,數據驅動的故障診斷方法直接從收集的歷史運維數據中挖掘信息,建立基于數據的故障診斷模型,因而不依賴于任何復雜的領域知識,具有更強的泛化性.尤其是近幾年來隨著深度學習的快速發展,以自編碼器、深度卷積網絡、深度信念網絡等為代表的深度學習方法能自動地從高維、冗余的數據集中提取有用的深度特征用以建立診斷模型,成為復雜工業過程故障診斷方法的主流之一,也逐步應用于發電裝備的故障診斷.
盡管這些深度學習方法相對于傳統故障分類具有更高的診斷準確率,但它們都需要大量的樣本來訓練網絡,在數據集樣本較小時,這些方法的準確率會大打折扣甚至難以奏效.而在實際工業場景中,目標故障案例往往沒有或很少有可用的數據存儲下來.為了克服某些故障樣本采集困難的問題,可以采用遷移學習的方法,將從一些容易獲得的歷史故障(訓練故障)中獲取的知識應用到那些難以采集或采集代價昂貴的故障(目標故障)中.因此,Lu等[163]將具有最大平均誤差項的深度神經網絡集成在一起,提出了一種用于故障診斷的深度遷移學習方法,該方法不需要任何目標故障樣本即可獲得高精度的性能.Wen等[164]也利用稀疏自編碼器對訓練和目標故障進行深度域自適應.Chai等[165]基于對抗學習思想,提出一種用于跨域工業故障診斷的細粒度對抗網絡方法.該方法同時從域層次與故障類層次進行深度域適應,相對于前述工作,能夠對源域與目標域的條件分布進行更細粒度對齊,從而保證跨域診斷的有效性.此外,為提升模型精度、保證模型能在增量數據環境下有效更新,Chai等[166]提出一種具有雙增量學習能力的斜隨機森林算法,使模型在已有類別或新類別樣本到來時能夠有效更新.雖然上述工作對目標域內的故障樣本沒有要求,但深度遷移學習實際上解決的是訓練域與目標域之間的域漂移問題,而無法解決零樣本問題.
零樣本故障診斷[167]是一項極具挑戰性的故障診斷研究任務,在沒有目標故障樣本可用于訓練的情況下實現建模.這種情形在工業領域是很普遍的,但之前尚未有相關的研究,這限制了傳統的數據驅動方法在實際過程中的應用.Feng等[167]首次將零樣本學習的理念引入到發電過程,提出基于故障描述的屬性遷移方法來解決發電裝備的零樣本故障診斷任務.該方法使用人工定義的故障描述而非收集的故障樣本來確定故障類別.定義的故障描述由故障的一些屬性組成,包括故障設備和位置、故障影響,乃至故障的原因等.對于目標故障而言,其相關屬性可以從同一發電裝備的其余故障的描述中預先學習和遷移得到.接著,便可以在無需其他任何數據訓練的情形下,基于定義的故障描述診斷目標故障.該方法還從理論上分析和解釋了基于故障描述的方式進行零樣本故障診斷的有效性和可行性.
考慮到實際工業過程中,故障工況的零樣本、少樣本問題非常常見,對于故障樣本缺乏情況下的診斷問題,還有很多細節需要思考.故障描述本質上也是一種知識,結合知識和數據進行研究,將是未來的重點研究思路和可行方向.
目前國內外對電力行業的遠程診斷都有相應的研究工作.遠程狀態監測與故障診斷的實現模式有簡單離線遠程狀態監測與故障診斷、通過視頻會議實現遠程監測與故障診斷、基于客戶機/服務器模式的在線遠程監測與故障診斷和基于瀏覽器/服務器模式的在線遠程監測與故障診斷等.但是,這些商業化遠程診斷系統的設計理念、彼此間的性能和結構差異較大,功能單一.主流的遠程診斷系統主要是通過設備監測系統的顯示和定時巡查方式對目標對象的運行狀態進行監視,且更加關注信號層面的監測,使得典型監測系統以安全保護為目標,通常在設備出現明顯故障時報警,難以及時發現處在初期的設備異常.國外引進軟件無法適應國內企業的生產管理模式,尤其是集團級生產流程.發電企業地域分散,如果不進行自主的技術創新,這些應用信息系統就將成為彼此相互隔離的信息“孤島”,不僅要耗費大量的人力進行日常維護工作,也難以發揮應有的作用.
目前,我國在發電廠設備狀態監測和故障診斷系統方面的研究發展比較快,各種類型的廠級設備狀態監測軟件陸續投入運行,一些電力集團公司也開始整合內部資源實施規模經營的管理戰略.建立集團診斷中心運行平臺,集中遠程監測診斷設備狀況,已經成為發電集團生產管理信息化建設的必然趨勢.但這類軟件的開發尚處于探索階段,規模不大,且僅針對特定的監測對象進行設計和開發,如汽輪機軸系振動在線監測等,各個軟件之間的關聯度很小,相互之間的數據交換和共享功能較弱.國外發電設備生產廠商也紛紛建立狀態監測診斷中心和推出遠程診斷服務.由于生產管理模式的不同,國外監測診斷軟件或運營商,有的提供監測和診斷服務但不向客戶提供相關軟件;有的提供監測和診斷服務的同時也提供部分相關軟件,但服務的范圍和軟件的功能各不相同,一般也都是針對特定的設備或監測對象、系統封閉、獨立運行的專用系統,所產生的數據不能共享.目前的一個發展趨勢是建立數據中心平臺,實現遠程監控與中心數據平臺的緊密結合.該模式有利于系統專家知識庫的積累以及各監測終端的信息共享.同時各發電企業也已為集團級數據中心平臺集成了必要的硬件設備、數據庫系統、數據接口系統和管理軟件.
本文介紹了燃煤發電裝備變負荷深度調峰導致的非平穩運行特性和全流程復雜耦合特性,在此基礎上總結了發電過程區別于一般連續過程的問題,對面向發電裝備工況監控的數據驅動算法近30 年的發展進行了回顧和分析.同時,本文梳理了目前存在的問題,并進一步介紹了發電裝備工況監控未來可能的發展方向.隨著信息化和工業化的深度融合,應對互聯網、大數據、云計算等信息領域新技術發展,推進火電行業的智能轉型升級,是加快構建高效、清潔、低碳、可持續的電力工業體系的必然選擇.在常規能源方面,以裝備和設備狀態監測與故障診斷為主的智能工況監控已成為推動智能電廠發展的關鍵技術,未來的發展趨勢是全自主、閉環的工況監控系統,即在人員不參與的情況下完成持續的工況監控,形成智能化決策,需要時還可以無需或僅需少量人為干預,由診斷系統發出相應的控制命令,對裝備施加適當的控制,快速修復某些故障影響,提高裝備設備運行的透明化水平,保障裝備的安全可靠運行.人工智能最新理論及其在工程科技領域的深入應用為解決燃煤發電裝備的工況監控提供了新的手段和新的思路.