基于知識數據化表達的制冷空調系統故障診斷方法

2022-08-10 09:49:34孫哲金華強李康顧江萍黃躍進沈希

化工學報 2022年7期

孫哲，金華強，李康，顧江萍，黃躍進，沈希，2

（1 浙江工業大學機械工程學院，浙江杭州 310014； 2 浙江農林大學光機電工程學院，浙江杭州 311300；3 浙江工業大學教育科學與技術學院，浙江杭州 310014）

引言

隨著近年來能源與碳排放問題的突顯，世界各國紛紛制定自己的能源戰略，我國也將能源戰略放在了突出的位置，提出了“碳達峰·碳中和”的戰略目標[1]。制冷空調系統主要用于建筑的環境調節，也可用于工業環境控制，其能耗已成為建筑能耗的重要組成部分，約占社會能耗總量的20%[2]。由于制冷空調系統結構復雜、設備種類繁多，存在多種熱質交換和功熱轉換形式，在運行過程中不可避免會發生各類故障。相關研究表明，制冷空調系統故障運行會造成15%～20%的能耗增加[3]。

長期以來，空調系統的運行維護管理以“定期檢修+報警搶修”模式為主，盲目性高且難以發現隱性故障。通過人工智能的方式可極大提高故障特征的自主辨識，實現全時段智能監控，降低對運維人員專業素養的依賴[4]。制冷空調系統是一類復雜的熱力系統，故障狀態下系統的熱力參數會較原狀態產生偏離，即故障的熱力學征兆，如溫度升高、壓力降低等。偏離后的熱力參數值不僅與故障狀態有關，同時受環境、負荷、工況等諸多因素影響，使得故障和征兆之間的關系不僅復雜而且存在不確定性。這種故障-征兆的復雜映射關系給故障診斷規則制定帶來極大挑戰，使得基于規則的故障診斷方法難以保證精度。以深度學習為代表的數據驅動方法憑借其強大的特征提取能力，可以較好地解決復雜熱力系統的診斷難題。Sun 等[5-6]針對熱泵空調系統的深度學習故障診斷方法展開研究，提出一種基準模型+深度卷積網絡的診斷框架，實現了系統偏離特性的高效提取，很好地提升了復雜熱力系統的診斷精度。Wang 等[7]面向現場應用場景展開診斷方法研究，利用貝葉斯網絡實現特征高效篩選，解決了現場診斷傳感器數量少、成本受限等實際問題。van de Sand 等[8]針對冷水機組故障診斷問題，提出一種基于區域自適應的數據驅動診斷方法，緩解了監督學習對標記樣本的依賴。劉旭婷等[9]針對冷水機組提出一種基于稀疏局部嵌入深度卷積網絡的故障診斷方法，采用稀疏局部嵌入代替卷積核，有效避免了復雜的訓練和調參。王路瑤等[10]基于長短時記憶神經網絡提出一種空調系統傳感器故障檢測方法，有效緩解了大滯后系統時序建模精度低的難題。Xiao 等[11-14]較早提出了基于貝葉斯網絡的診斷框架，大量研究成果為學科后續發展提供極具價值的新思路。Li 等[15-17]提出一系列基于深度學習的智能診斷算法用于解決多聯機、空氣源熱泵、熱泵熱水器等諸多裝置的故障診斷問題。

數據驅動方法的優勢在于可以從數據中自學習復雜映射關系，這就使得其對標記樣本的質量和豐富度具有嚴重依賴，而真實應用場景中足質足量的標記樣本往往難以獲取。隨著智能化技術逐步走向應用，解決標記數據依賴問題已成為當下研究的重中之重，近兩年來越來越多的學者[18]針對這一問題展開研究。將機理知識融入數據驅動不僅可以降低對標記數據的依賴，同時可以提高診斷方法的魯棒性和可靠性。張鈸等[19]指出，將機理知識融入數據驅動是新一代人工智能發展的必經之路。制冷空調系統故障診斷的實質是通過對系統表現的征兆進行模式識別而得出診斷結論，故障和征兆的定性關系可以通過熱力學分析得出，其征兆的規律性描述正是診斷模型的診斷依據。因此，通過故障規律性知識指導實現故障的模式識別，在理論上是可行的。然而，實際情況中，制冷空調系統常面臨環境多變、負荷多變以及控制需求多變的問題，導致其運行工況持續處于動態過程。動態條件下的系統征兆也會隨之變化，使得故障和征兆的映射關系出現不確定性，這種動態征兆是難以通過熱力學精準分析的。如何利用定性的靜態征兆知識指導實現動態系統的故障診斷是一個非常困難的問題。

本課題組前期研究發現，制冷空調系統故障征兆的實質是熱力參數偏離正常基準，多變工況下參數偏離的方向一致，其差異在于偏離大小。例如高負荷下相同故障的參數偏離量更大。利用熱力學機理分析容易得到故障條件下參數的偏離方向，但卻難以針對所有工況預測出偏離大小。而事實上，診斷的目標只是將故障類別識別出，無論何種偏離程度均對應同一類故障結果。如果利用一種隨機生成的策略在偏離方向的基礎上獲得不同偏離大小的偽樣本，則相當于得到了不同工況下系統故障的標記數據，進而解決標記樣本不足的問題。因此，本文提出一種基于知識數據化表達的制冷空調系統故障診斷方法。首先，通過機理分析構建故障的定性偏離矢量，然后通過一種數據隨機縮放策略實現知識的數據化表達，達到信息擴增的目的。在實施診斷時為了將真實系統的熱力參數轉換成生成樣本的偏離形式，提出一種基于基準模型的偏離特性的表征策略。最終，以知識驅動代替標記樣本實現制冷空調系統的故障診斷。

1 制冷空調系統故障診斷知識的數據化表達

制冷空調系統故障狀態的表現形式是熱力參數的偏離，這種偏離包含大小和方向兩部分。對于同一種故障而言，不同系統間以及同一系統在不同條件下的特征偏離方向是一致的，不同點在于偏離大小，其受到系統結構、環境條件和運行工況等不同因素的影響。如果要精確計算出理論上的偏離大小無疑是十分困難的。而事實上，故障診斷完全可以僅依賴不同熱力參數的偏離方向進行識別。因此，定性的偏離知識表達理論上是可以支撐故障診斷的。可以通過熱力學分析、數值仿真、實驗測試等手段獲得特定系統的故障定性偏離規律，這種規律是模糊的偏離方向和偏離程度，如參數1偏大且偏離程度為嚴重。詳細的偏離知識示例見3.1節。

這種定性的規則較早被應用到制冷空調系統故障診斷中，稱之為基于規則的診斷方法[20]，然而精度均不理想，導致這種結果的原因是制冷空調系統復雜且多變，故障和征兆之間的映射關系不僅高度非線性且具有一定的不確定性。而數據驅動方法可以通過學習數據分布中的深度特征而實現故障-征兆間復雜映射關系的擬合，其診斷精度遠高于基于規則的方法。因此，2010 年以后，絕大多數制冷空調故障診斷研究都聚焦于數據驅動方法[21-25]。如果能將制冷空調系統故障的定性偏離規律以數據的形式表達并通過信息擴增手段豐富其信息量，則可以在不依賴真實標記數據的條件下充分利用數據驅動優勢。

故障狀態參數偏離的表示形式可以稱之為故障診斷知識的多維偏離矢量，每一個參數既含有方向又含有程度，如果對不同的偏離程度賦予特定的值，則從數據的角度可以將其看作一條標記樣本。然而僅利用這一條標記樣本顯然無法滿足數據驅動模型的訓練。如何對多維偏離矢量的信息進行擴增，是亟需解決的問題。由于不同偏離大小代表不同情形下的故障數據，這種情形越多代表數據的信息越豐富。在一定的范圍內對賦值后的多維偏離矢量進行縮放則可以模擬生成不同情形下的標記數據。本文提出一種數據隨機縮放策略，基于多維偏離矢量生成大量偽數據，用于深度模型訓練。數據隨機縮放策略的目的就是使多維偏離矢量各個維度經過等比放大或縮小，實現不同偏離量的模擬。縮放策略的目的是增加矩陣數據的信息熵，以提高深度模型的學習效果。偏離數據是故障模式識別的依據，其主要特征在于偏離方向和偏離大小，對于深度模型而言，相同的偏離方向下不同的偏離幅值對模型分類具有明顯影響。不同制冷空調系統由于運行工況、所處環境以及故障嚴重程度的差異，同一種故障的偏離幅值存在差異，用于訓練的數據需要盡可能多地包含不同偏離幅值樣本。數據縮放策略就是基于這一思路，對矩陣數據乘以縮放系數后得到放大或縮小的矩陣樣本，如式(1)所示。

多時間步多維度的偏離數據構成矩陣數據，矩陣數據的所有元素均等比縮放，得到新的樣本。這里縮放前的矩陣數據可以是真實偏離矩陣也可以是人工賦值的偏離矢量。通過多個縮放系數對矩陣數據縮放可以得到多組新的矩陣數據，例如利用0.5、0.75、1.5、2.1 四個縮放系數對同一矩陣數據縮放就可以得到四個新的矩陣數據。縮放系數在設定的縮放范圍內隨機取值，而縮放系數的個數取決于診斷模型所需的訓練樣本數，這通常可以根據神經網絡模型的大小而確定，例如訓練樣本需要包含每類故障3000 組樣本，則在縮放范圍內隨機生成3000個縮放系數。

圖1 是以三類故障為例對縮放策略進行描述，每類故障選取四個特征(蒸發溫度TRE、冷凝溫度TRC、吸氣溫度T_suc、排氣溫度TR_dis)，每一行代表一個時間點，每個樣本是6×4矩陣數據，這里具體數值是根據偏離矢量設定的偏離值，每類故障對應一個偏離矩陣。圖1 中分別為3、0.5、1.5 這三個縮放系數生成的三個樣本，該樣本作為診斷模型的輸入。圖中的縮放過程與上文描述有兩處不同：(1)紅色參數并沒有進行縮放；(2)每個縮放后的數值均添加了一個較小的隨機數。

圖1 數據隨機縮放策略Fig.1 Data random scaling strategy

由于真實樣本具有一定的不確定性，簡單利用縮放系數進行偽樣本生成，其效果是不理想的。本文進一步提出對生成樣本添加標準正態分布的高斯噪聲，豐富數據的信息復雜度，以此提升模型準確性和魯棒性。標準正態分布是最符合自然界真實分布的，利用該類噪聲可以更好地模擬系統真實擾動。噪聲添加策略使性能得到提升的原因主要有兩個方面：(1)真實殘差數據本身是有較大隨機波動的，單純的等比縮放與真實情況不符，高斯噪聲模擬的是系統的隨機擾動，而偏離量模擬的是系統偏離正常工況，二者疊加則表示不同隨機擾動下系統均呈現一種固定的偏離模式，而故障診斷的目的就是識別這種模式，使生成分布與真實分布更接近；(2)添加噪聲實質是添加擾動，這種思路借鑒了神經網絡中的Dropout 層[26]，該網絡層通過隨機失活部分神經元以實現擾動添加，使神經網絡學習過程得到強化，從而有效避免神經網絡過擬合，是公認的提升神經網絡魯棒性的方法。本文借鑒這一思路以添加噪聲的方式強化神經網絡學習過程，使得模型更加聚焦于偏離規則這種共性特征。同時，噪聲的添加強度對診斷結果影響較大，弱噪聲起不到模擬擾動的作用，強噪聲則會引入過多的干擾從而降低診斷精度，因此，需要實驗驗證最優的噪聲添加強度。

此外，本文還提出隨機縮放策略有三個關鍵的技巧，可以保證其有效實施。(1)并不是所有特征都進行縮放，不產生偏離的特征不進行縮放，這些不偏離的特征可以根據故障自身的規律人為指定，如圖1 中紅色數據，以避免非偏離參數的誤差被放大強化。(2)不產生偏離的特征要設置一個小于1 的值，比如0.1，實驗證明這樣比1 的效果好很多。(3)縮放系數的生成范圍設定非常關鍵，縮放范圍需要考慮目標系統可能出現的嚴重程度，越嚴重的故障偏離量越大，而這種偏離量可以根據經驗估算。縮放后的偏離數據的上下限應包含所有故障程度下的偏離范圍。例如目標系統可能出現的冷凝溫度最大故障偏離小于5℃，最小故障偏離大于1℃，設定的該偏離矢量值為2，則縮放范圍需覆蓋(0.5,2.5)。由于多維偏離矢量的不同參數縮放范圍可能不同，最終的統一縮放范圍應取大。經過隨機的縮放后，生成的偽數據包含了各類情況下的系統故障信息，以此訓練深度模型可以很好地保證其在實際診斷時的適用性。這一過程的實質就是實現了故障診斷知識的數據化表達，其完整的流程見圖2。

圖2 知識的數據化表達流程Fig.2 The expression process of digitized knowledge

2 基于知識數據化表達的制冷空調系統故障診斷方法

基于數據化的知識實現完整的制冷空調系統故障診斷流程見圖3。方法分為兩個部分。(1)模型訓練：使用數據化的知識訓練診斷模型，使之得到故障診斷的劃分邊界，訓練完畢的模型用于診斷目標系統故障類別。(2)診斷實施：通過偏離特性表征策略，使真實運行數據以偏離殘差的形式表征，這種表征形式和數據化的知識形式相同，從而使得診斷模型可以對其進行診斷分類。

圖3 診斷總體流程圖Fig.3 The flowchart of proposed method

2.1 生成樣本一致性評估方法

第1節中利用隨機縮放策略實現了知識數據化表達，生成了帶有標記的偽數據，這種生成數據的質量高低決定了訓練模型的診斷效果。因此，首先要對生成樣本的一致性進行評估，目的是為了獲得和真實分布差異最小的生成樣本。

對于數據分布的距離評估有很多種方法，如核最大平均差異(kernel maximum mean discrepancy，MMD)[27]、瓦瑟斯坦距離(Wasserstein distance)[28]和弗雷歇距離(Fréchet inception distance，FID)[29]等。其中MMD 距離最常用于估計兩分布差異[30]。在固定的核函數下，MMD指標用于度量真實分布和生成分布的差異，MMD 值越小，代表兩分布差異越小。MMD指標可以定義為式(2)：

式中，Pr和Pg分別表示兩個待度量分布；xr和xg為分布中具體樣本；k是映射函數。xr和xg分別理解為兩個不同數據集內的數據樣本，式(2)的目的是尋找一個映射函數k，使得計算出的所有樣本平均距離有最大值，即得到了MMD 值。通過MMD 評估對知識數據化表達策略進行優化，最終實現生成樣本的質量最優。

2.2 目標系統偏離特性的表征策略

生成數據其實質是系統熱力參數偏離特征，而目標系統直接采集的運行數據是真實的熱力值。如果要使用生成數據訓練模型診斷目標系統，則必須將目標系統的數據以偏離特征的形式予以表征。偏離特征是指故障狀態下熱力參數偏離理論正常值，獲取偏離特征則首先需要精準得到理論上的基準值。熱力參數受到多種因素影響，呈現非線性、強耦合的特征。如排氣壓力這一熱力參數不僅與系統結構和工質有關，還與環境溫度、負荷大小、控制目標溫度等多種因素有關。要想在考慮眾多因素的情況下準確預測熱力健康值是十分困難的。本課題組前期提出一種基于深度神經網絡的制冷空調系統基準模型[5]，該模型融合卷積網絡、編-解碼器、循環神經網絡，以數據驅動的方式解決了大滯后、強耦合系統建模困難的問題，模型結構如圖4所示。該模型處理時序數據，每個樣本包含前置時間段(t1～tn)和預測時間段(tn+1～tn+m)。前置時間段僅包含狀態參數，通常為10～15個時間步長，預測時間段包含之后的時間步的輸入參數，結合后續診斷模型要求的數據結構，預測時間段可以是10～20 個時間步長。前置時間段的數據是二維矩陣數據(參數個數×時間步長)，表征預測開始前一段時間系統的持續狀態，對大滯后系統預測具有重要作用，這里使用卷積網絡處理前置時間段數據并輸入到編-解碼器。通過解碼器將前置狀態信息編碼到固定長度的向量并輸入到循環神經網絡，作為該網絡的初始值，可以較好地繼承預測時間段開始時刻系統所處的狀態。循環神經網絡根據每一個時刻的輸入變量預測對應時刻的狀態變量，最終實現多步狀態變量的預測。詳細的模型介紹和實驗分析可以參考文獻[5,30]。模型的輸入為系統的外界自變參數，包括環境參數、控制參數、負載參數，例如環境溫度、壓機轉速、膨脹閥開度、風機轉速等。輸出的預測值為系統的因變參數，主要包括系統各類溫度、壓力等熱力參數，通常為故障的敏感特征參數。具體的輸入輸出變量需要根據數據集確定，本文使用的參數選擇方案見3.1 節。基準模型利用健康系統采集的運行數據訓練，實現健康系統的擬合，屬于回歸建模問題。由于健康運行數據通常容易獲取，因而該訓練策略不會限制基準模型的實際應用。

圖4 制冷空調系統基準模型結構Fig.4 The structure of refrigeration and air-conditioning system benchmark model

利用該基準模型實現制冷空調系統基準預測，并以此計算出目標系統參數偏離量，即實現了運行數據向偏離特征的轉換。此時的偏離值是真實的偏離值，但不同熱力參數的偏離值含義不同，如排氣壓力偏離0.1 MPa 已經偏離很大了，而排氣溫度偏離0.5℃都不算大，這是由于不同參數的量綱不同。為了保證所有偏離量的含義相同，需要對其去量綱化。這里使用基準模型的每個參數下的誤差作為量綱去除的系數，誤差可以在驗證數據集上通過對基準模型預測值和真實值求平均差得到，例如在健康數據集中基準模型對排氣溫度的預測誤差為0.5℃，則對每個真實的排氣溫度殘差除以0.5，得到統一的去量綱偏離量。具體表征策略如下。

第一步：獲取系統的熱力基準信息。即得到系統各特征參數健康狀態下的理論值，該理論值受到環境、工況、負荷等多因素的共同影響。

第二步：獲取敏感特征的殘差值。即將第一步獲取的基準值和系統實測值做差，得到的差值的實質是熱力偏離量。

第三步：計算殘差與基準誤差量的比值。基準值獲取依賴預測模型，其自身帶有一定誤差，使得不產生偏離的特征亦會產生較小的殘差量，該值可以通過訓練數據集計算得到。通過計算殘差和誤差的比值可以清晰得到偏離倍數，同時對不同量綱實現統一。

本文提出的使用人工生成的偏離參數作為模型的訓練數據的方法，診斷實施時同時需要將目標系統的運行數據轉化為偏離殘差，而不是直接使用實際運行數據。其主要原因及優勢為：(1)偏離殘差的本質是故障特征，以偏離的形式表征故障可以極大降低數據的復雜度，抵消熱力系統自身滯后性和非線性對診斷帶來的影響，從而提高診斷精度。該結論在前期研究工作中已證明[5]。(2)本文利用生成數據代替真實標記數據以解決標記數據不足的問題，利用故障熱力學偏離規律可以生成偏離殘差，但卻無法生成真實的運行數據。因此，要想實現知識數據化表達，這種數據必須是偏離殘差數據。

2.3 基于卷積神經網絡的故障診斷模型

第1節介紹了數據縮放策略以實現知識的數據化表達，隨著生成數據量的增多，生成數據分布和真實數據分布的重合度會隨之增加，但仍然不會完全重合，這就需要診斷算法具備一定的擴展性。深度神經網絡通過多層復雜變換處理樣本深層特征，可以較好地對樣本分布進行擴展。殘差數據是典型的多維時序數據，可以將其認為是一種矩陣數據。因此，診斷模型使用深度卷積網絡搭建，以充分利用其對矩陣數據復雜特征的學習能力，具體結構見表1。模型使用生成的偽數據訓練，從而解決對真實標記數據的依賴。實施診斷時，將目標系統的數據經過2.2 節方法轉化后輸入模型，模型輸出即為故障預測類別。矩陣數據的列數等于敏感特征的數量，而行數是截取的時間步長度，通常會根據敏感特征數據選擇時間步長度，使其行列數接近。

表1 深度診斷模型網絡結構Table 1 The network structure of deep diagnosis model

3 實驗數據集與平臺

3.1 實驗數據集

本文利用ASHRAE RP-1043 數據集進行實驗研究[31]。ASHRAE RP-1043 是美國供暖、制冷與空調工程師學會于1999 年啟動的項目，全名為fault detection and diagnostic (FDD) requirements and evaluation tools for chillers，旨在建立一個用于制冷系統故障診斷研究及方法評估的數據集，該數據集包含不同負載、不同故障條件下的制冷裝置瞬態和穩態的運行數據。項目測試系統為一臺制冷量為90 冷噸(316.5 kW)的離心式制冷機組(圖5)，使用R134a 制冷工質，機組安裝在70℉(21.1℃)的恒溫室中。該數據集是一個常用的公開數據集，以此作為實驗數據集可以較好地驗證提出方法的有效性。

圖5 制冷機組結構原理圖[31]Fig.5 Schematic diagram of chiller structure[31]

本文選擇項目中6 類故障和1 類健康數據，每類故障包含4 種不同嚴重程度。這6 類故障分別是：冷凝器結垢(cf)、冷卻水流量減少(fwc)、冷凍水流量減少(fwe)、含非凝性氣體(nc)、制冷劑泄漏(rl)、制冷劑過充(ro)。每種故障不同嚴重程度的模擬條件見表2。

表2 不同嚴重程度故障的模擬條件Table 2 Simulated conditions for faults of various severity

針對這一數據集，Comstock 等[32]對其特征的敏感程度及其偏離特性進行了研究，選定了7 個關鍵特征用來表征故障，分別是：蒸發器進出口水溫差(TEI-TEO)、冷凝器進出口水溫差(TCO-TCI)、蒸發器壓力(PRE)、冷凝器壓力(PRC)、過冷度(TRCsub)、吸氣過熱度(Tshsuc)、排氣過熱度(Tshdis)。并建立了不同故障下特征參數的偏離矢量表(表3)，這一表格就是故障偏離特性的定性知識表達。本文根據這一知識進行診斷，而在現實診斷過程中亦可以通過理論推演、人為經驗等多種方式獲取定性知識表達。

表3 故障的多維偏離矢量Table 3 Multi-dimensional deviation vector of failure

由于偏離特性的表征需要用到基準模型，根據2.2 節中對基準模型的介紹，需要從ASHRAE RP-1043 數據集中分離出用于基準模型輸入輸出的變量集。基準模型的輸出變量就是上述7 個故障特征，而輸入變量應該是系統的自變量，包含環境相關變量及控制相關變量，具體包括：蒸發器入水溫度、冷凝器入水溫度、交互換熱器冷凝側入水溫度、交互換熱器冷凝側出水溫度、交互換熱器蒸發側入水溫度、交互換熱器蒸發側出水溫度、外部入水溫度、外部出水溫度、熱水入水溫度、熱水出水溫度、冷凝器水流量、蒸發器水流量、小型蒸汽閥開度、大型蒸汽閥開度、三通閥開度、外部水閥開度。

3.2 算法運行環境

深度學習算法使用Tensorflow 和Python 編程實現，版本分別為2.6.0 和3.9.7，開發環境為Pycharm 2018。GPU 加速算法使用CUDA11.2 和cuDNN8.1支持庫。算法的運行平臺為一臺圖形服務器，GPU是NVIDIA GeForce RTX 3080Ti，CPU 是Intel i9-11900K，內存為64 G，操作系統是64位Windows 10。

4 實驗與分析

本節對前文提出方法進行實驗分析。首先，針對目標系統訓練基準模型，進而實現偏離表征，獲取后續對比實驗所需格式的真實樣本。然后，利用MMD 算法對生成樣本和真實樣本的一致性進行評估，驗證最優數據生成策略。進一步，利用生成數據訓練診斷模型并在真實數據集上驗證分析，得到最佳診斷策略。最后，與當下主流的監督學習對比，驗證提出方法的有效性和優勢。

4.1 目標系統數據的偏離表征

目標系統數據的偏離表征依賴基準模型實現，基準模型的精度決定了表征的準確性。參照圖4構建基準模型，并利用目標系統的健康運行數據訓練，使之可以良好地擬合健康系統動態特性。模型使用12000組樣本訓練，每組樣本的時間步長為12，并在3000 組不參與訓練的測試數據集上驗證模型精度。模型的輸入參數為環境和控制相關變量，決定了系統的外部條件，這里使用3.1 節中選定的輸入參數。輸出參數為熱力狀態參數，是受外部條件作用下的系統表現，這里選擇的是表3 中的7 個關鍵參數。使用Adam 優化器和MSE 損失函數，訓練100 輪后，測試數據集上的損失值為0.0015。在3000 組健康測試樣本上進行模型誤差計算，得到7個關鍵參數的誤差絕對均值(表4)。這里誤差均值是3000組樣本上預測值和真實值的平均偏離量，如TEI-TEO 的誤差均值為0.045，代表基準模型對該參數預測的平均誤差為0.045℃，可見預測精度已非常高，遠超物理模型的預測精度。

表4 基準模型的預測誤差絕對均值Table 4 The absolute mean of the prediction error of the benchmark model

利用訓練好的基準模型對目標系統的狀態值進行預測，得到目標系統所處環境和控制條件下理論參數的健康基準值，并與實測值進行做差，得到偏離殘差值。進一步去量綱化，將殘差除以表4 中基準模型誤差，得到偏離比例系數，其數學表達見式(3)。

式中，y表示偏離比例系數；yreal表示真實值；ypre表示預測值；err表示模型誤差值。這種比例系數的形式與生成的偽數據形式一致，實質上偽數據就是為了模擬偏離比例系數。

由于偏離比例系數通常大于1，對于一些嚴重的故障，偏離比例系數可能達到20，神經網絡對這種數據不太適用，需要進行歸一化處理。深度學習中的歸一化包括兩類：嚴格歸一化、非嚴格歸一化。利用arctan 等函數將數據嚴格限制到小于1 的方式屬于嚴格歸一化，這種方式適用于無法處理大于1的算法。然而，這種歸一化對數據進行了非線性處理，使得部分數據區間的差異被放大或縮小，給算法識別帶來難度。而非嚴格歸一化則不會強制限定到1 以內，其處理方式更加自由。本文使用線性歸一，對所有偏離數據除以5，屬于非嚴格歸一化。系數5是根據經驗設定，該值與系統制冷量有關，通常制冷量越大該值應該越高，使處理后的數據最大值接近1。這種線性歸一可以使數據范圍更加收斂，同時最大程度保留原有數據的有效信息。

4.2 基于MMD的生成樣本一致性評估

基于隨機縮放策略的數據生成需要首先進行多維偏離矢量的選值和縮放范圍設定。其中，多維偏離矢量選值指的是對不同偏離程度的特征賦予具體的數值，而縮放范圍設定則是限制樣本隨機縮放的上下限。這一過程需要考慮到對象實際物理情況和設計的診斷范圍。Comstock等[32]對ASHRAE RP-1043項目中故障的偏離特性進行了實驗分析，得出了定性的偏離規律。雖然直接利用這些定性規律實現動態工況故障診斷是十分困難的，但相關規律可以作為本文知識來源。而對于其他情形的診斷過程，亦可以根據對目標系統的相關經驗設定偏離矢量選值和縮放范圍。本文參考文獻[32]對表3 中多維偏離矢量的取值按照偏離程度分別設定，↑/↓取值為2/-2，↑↑/↓↓取值為5/-5，↑↑↑/↓↓↓取值為10/-10，↑↑↑↑/↓↓↓↓取值為20/-20，●取值為0.1，縮放范圍為0.7～3.0。

本文研究中發現，單純利用隨機縮放生成的偽數據很難接近真實分布，這主要是由于真實系統具有高度復雜且不確定的特性，使得真實的殘差樣本具有較高的隨機擾動性。針對這一特點，本文提出對生成數據添加隨機噪聲的策略，使生成數據與真實數據一致性更佳。噪聲的添加效果與添加噪聲的幅值有密切關系，噪聲太小作用無法體現，而噪聲太強會破壞數據原有結構。接下來利用實驗方式對不同強度噪聲添加以及無噪聲添加的生成數據進行樣本一致性評估。如表5 所示，對添加的標準正態分布噪聲進行系數相除，得到不同強度的噪聲，同時與不添加噪聲的生成數據對比。用于評估的真實數據集包含每類故障2000組樣本。

從表5 可以看出，不添加噪聲的生成數據與真實數據的MMD 值普遍高于添加噪聲的生成數據，表示不添加噪聲的生成質量較差。而添加噪聲的生成數據MMD 值隨添加強度增加呈現先下降后上升趨勢，不同故障類別的最小MMD 值對應的噪聲強度不同，整體分布于2 倍標準正態分布噪聲(/0.5)和20 倍標準正態分布噪聲(/0.05)之間。其中，對于正常數據、cf 故障以及rl 故障而言，最小MMD 值出現在更弱的噪聲添加策略處，而其他故障的最小MMD 值則對應相對較強的噪聲添加策略。深入分析可知，偏離程度越明顯的故障類別適于添加更強的噪聲，這是因為其自身的偏離較大，更強的噪聲也不會對其偏離特性產生較大的影響。而自身偏離較小的故障則對噪聲更加敏感，太強的噪聲會明顯干擾其正常分布。由于MMD 分布的評估并不能完全代表其最終的診斷效果，且在/0.5 和/0.05 添加策略之間的MMD 值差異并不大，因此，最終的噪聲添加策略需要進一步結合診斷實驗確定。

表5 不同策略下生成樣本和真實樣本的MMD評估Table 5 MMD value of generated samples and real samples under different strategies

4.3 基于知識數據化的故障診斷實驗驗證

本節對基于知識數據化的診斷方法進行實驗驗證，驗證數據集來自ASHRAE RP-1043，該數據集細節已在3.1 節描述。本節結合4.2 節實驗結果，針對MMD 值最小的5 種噪聲添加策略和無噪聲添加策略進行6組對照實驗。診斷模型利用生成的偽數據訓練，每種故障類別包含3000 組樣本，共計21000組樣本。其中，按照3∶1的比例分割訓練集和驗證集。使用Adam 優化器，批大小為128，訓練50輪。完成訓練的模型在真實數據集上進行測試，測試集上每類故障2000 組樣本，結果如表6 所示。可以看出，添加不同強度噪聲的生成策略下診斷精度和MMD 評估呈現較高的相似性。/0.15 的正態分布噪聲添加下，模型的診斷精度整體上最高，而/0.15 的噪聲強度正好是5 類添加噪聲強度中的中間水平，這是一種綜合效果的體現。同時可以發現，在不同嚴重程度數據測試上，越嚴重的故障越容易被診斷出來，越輕微的故障診斷效果越差。這應該是由于輕微故障表征不明顯且被動態工況波動覆蓋，導致診斷難度提升。最終表明，使用標準正態分布除0.15的噪聲添加下，訓練模型的診斷性能最佳，總體正確率可達82.67%，比不添加噪聲的診斷精度高11.64%。由于實際應用時，這類漸變熱力故障并不需要太高的響應速度，完全可以多次診斷后綜合決策，因此這一診斷精度已經較好地滿足實際應用需求。

表6 不同生成策略下故障診斷精度對比Table 6 Comparison of fault diagnosis accuracy under different generation strategies

進一步對最優生成策略下卷積網絡的全連接層輸出進行可視化處理。如圖6 所示，分別利用不同嚴重程度數據進行可視化分析，每種故障200 組樣本。可以看出，整體上診斷模型對7 個類別可以較好聚類和分離，但仍存在部分故障的空間分布較近，使得相互誤診率較高。如Level1 中cf 和rl 的空間分布存在部分混疊，rl 和正常數據分布接近，Level2 中rl 和正常數據分布十分接近，造成實際診斷中Level1 的cf 和rl 以及Level2 的rl 故障診斷精度較差。這主要是由于cf和rl故障在輕微狀態下隱匿性較高，被熱力補償和動態工況波動所覆蓋，導致征兆不明顯。這種情形即便是監督學習也很難達到較高的識別精度。

圖6 模型全連接層輸出特征的可視化Fig.6 Visualization of model fully connected layer

4.4 與監督訓練故障診斷方法的對比分析

現階段智能診斷算法以數據驅動的監督學習模式為主。因此，有必要將監督訓練模型與本文方法對比研究。監督學習算法最主要的問題是標記數據獲取困難，在無法獲取覆蓋全局信息的數據集時，模型的適應性存在較大局限。不同嚴重程度的故障數據分布不同，僅利用單一嚴重程度數據訓練的模型在其他嚴重程度上會產生精度下降的現象，而實際上可能的嚴重程度是無限多的，很難獲取所有可能嚴重程度的標記數據。本文針對這一現實問題，對比不同訓練數據下的監督學習方法和本文提出方法的診斷精度和自適應性，驗證本文方法的優勢。

本節設置6 組對比實驗，分別是本文提出的知識數據化方法和利用Level1、Level2、Level3、Level4以及Level1～Level4 全部數據作為訓練樣本的監督學習方法。模型的結構設計和表2 相同，每類故障使用2000 組樣本，使用Adam 優化器，批大小為128，訓練50輪。

圖7 展示了對比結果。從總體精度上來看，利用知識數據化表達的診斷精度為82.7%，這一結果比使用全部數據訓練模型的88.2%差，這是很容易理解的，當數據充足時監督學習的效果理應最好，本文重點對比標記數據不充足的情況。從前5組對比實驗來看，本文提出的方法僅次于利用Level2 數據集訓練的模型，診斷正確率低0.8%，而相比于其他3 組實驗的正確率分別高出2.8%、5.9%、20.3%。進一步分析診斷方法在不同嚴重程度上的適應性。本文提出方法和4組單一嚴重程度數據訓練方法在不同嚴重程度驗證集上的最優診斷正確率分別為：93.8%、83.6%、93.0%、92.8%、95.5%，而最優最差正確率的差值分別為：27.2%、9.1%、19.7%、42.8%、70.1%。綜合可以看出，對比4 組監督學習，本文提出的方法在最優診斷和最優最差差值上均處于中間水平，結合該方法完全無須標記數據的特性，表明該方法具有替代監督學習算法的潛力，具有明顯優勢。

圖7 與監督學習的診斷精度對比Fig.7 Comparison of diagnosis accuracy with supervised learning

5 結論

本文提出一種基于知識數據化表達的制冷空調系統故障診斷方法，通過將故障特征偏離的先驗知識轉化為數據，解決現有監督學習算法過度依賴標記數據的問題。同時，針對目標系統運行數據，提出一種基于基準模型的數據偏離特性表征方法，將數據的偏離特性提取出來，使之適應于生成數據的形式統一，從而適應于生成數據訓練的模型。具體結論如下。

(1)提出一種隨機縮放策略用于將知識轉化為數據形式并實現信息擴增，其中，提出一種生成數據的噪聲添加策略，通過添加不同強度的高斯噪聲實現生成分布和真實分布的拉近。實驗表明，添加噪聲的確會優化生成分布和真實分布的距離，且隨著噪聲添加強度的增加，分布距離呈現先變小后變大的趨勢。同時，噪聲添加強度受到故障自身偏離程度的影響，偏離越明顯的故障越應添加高強度噪聲。

(2)從故障診斷實驗驗證可知，添加噪聲可以明顯提升最終診斷精度，且不同噪聲強度對診斷的影響不同，其隨著噪聲添加強度增加，診斷精度呈現先提升后降低的趨勢，其結論與MMD 評估結論基本一致。不同噪聲添加強度中，添加/0.15 標準正態分布噪聲數據后，診斷的整體精度最佳，最優的總體診斷精度可達82.67%，比不添加噪聲的診斷精度高11.64%。

(3)與4 組單一嚴重程度數據監督訓練方法對比，本文提出方法僅比使用Level2 數據訓練方法的正確率低0.8%，而比其他3 組實驗的正確率分別高出2.8%、5.9%、20.3%。在4 個嚴重程度分別驗證實驗中可以看出，本文提出方法無論是在最優診斷率還是最優最差的正確率差值上均處于中間水平。結合本文方法完全無須標記數據的特性，其優勢明顯。

綜上，本文提出的知識數據化表達方法較好地解決了監督學習對標記數據的依賴，同時保持了較高的診斷精度，在制冷空調故障診斷領域具有廣闊的應用前景。然而，該方法仍然具有一定不足之處。在方法層面上，利用噪聲添加雖然一定程度上模擬了真實系統的隨機特性，然而熱力系統具有時序特點，隨機性仍然遵循一定時序規律，因此在隨機信息模擬方面如果可以將真實系統時序性考慮進去，則可以使生成分布與真實分布更加接近；在應用層面上，該方法以典型故障偏離知識為基礎，因而針對微弱、早期、隱性故障的診斷精度不高，主要是由于這類故障征兆不明顯，需要更加復雜的知識作為依據，后續研究中應該更加豐富先驗知識的形式，不僅包含定性偏離，還應包含參數間相互映射關系等信息。在知識獲取層面上，要研究更加多樣的獲取方式，包括數值仿真系統、實驗系統、理論推導、相似系統知識遷移等多種手段，充分發揮領域專家知識優勢，將其作為重要指導依據。如果可以解決上述問題，則該方法的應用場景將會進一步拓寬。