趙丹,范波,Kushnazarov FARRUH
(美的集團暖通與樓宇事業部,上海 201702)
單元式空調廣泛應用于家用和商用場所,與人民生產和生活密切相關,所以其系統運行的穩定性和高效性至關重要[1]。云技術在近些年得到了迅猛發展,單元機空調的實時運行狀態參數可通過網絡上傳到云平臺上。為了充分挖掘云平臺數據價值,基于數據的線上空調故障診斷是一種主要應用方向。而在基于數據的故障診斷方法中,空調運行狀態的異常檢測是故障診斷的基礎工作。
基于云數據的單元式空調的異常檢測具有如下價值:1)可以在機組運行早期就及時發現問題,從而避免機組進一步的損壞,提高機組的可靠性;2)降低潛在維修成本,避免部件的不可逆損害;3)降低故障診斷和維修周期,異常運行數據提早發現,然后再通過對異常數據的分析診斷,精確故障定位,進而實現提早精準備件,及時維修;4)降低人力,基于機器學習的診斷算法代替人工經驗判斷,對于海量的數據,可大幅解決人力成本;5)提高售后服務質量,通過節省人力、物力和時間,可大幅提高售后服務效率,保證設備在整個生命周期內高效并安全運行,實現“無打擾”維保。
導致單元式空調異常運行的原因是空調發生了故障。按照故障產生原因可分為磨損性故障,錯用性故障和固有的薄弱性故障;按照系統功能喪失程度分為永久性故障、非永久性故障;按照故障發生速度可分為突發性故障和漸發性故障。空調系統的故障主要包括傳感器故障和熱力系統故障,傳感器的故障包括固定偏差、漂移故障、精度下降和完全失效等;熱力系統故障包括制冷劑泄漏、換熱器臟堵、風機故障、壓縮機失效、系統效率下降等[2-4]。
對于空調系統異常檢測,目前的研究主要集中在空調設備的故障診斷方面。KARAMI 等[5]提出了一種用高斯混合模型方法。VERBERT 等[6]采用貝葉斯網絡開發了診斷模型。在能耗異常處理方面,廣泛采用3 種方法。第一種是利用統計學方法設定閾值。劉丹丹[7]利用回歸分類算法,在基于統計學算法設定每個類別的閾值,進而識別異常能耗。第二種是基于聚類算法檢測離群數據,劉丹丹等[8]提出的方法不僅能檢測出異常,還能給出離群程度。卿曉霞等[9]利用決策樹算法識別異常能耗日用能模式,將每小時的平均能耗和最好能耗作為特征向量,再利用離群點檢測算法(Local Outlier Factor,LOF)判定異常。第三種方法是通過對比模擬的基準數據和實際數據的偏差來判定異常,莊池杰等[10]采用主成分分析(Principal Components Analysis,PCA)算法進行降維,然后提出一種基于網絡的LOF 算法異常檢測。簡富俊等[11]使用了一類支持向量機無監督機器學習方法對電力用戶負荷異常進行檢測。
空調設備云平臺每時每刻都有大量數據產生,這樣大數據、維度高、范圍寬成為數據挖掘的難點。現有異常檢測方法,雖然可靠性高、計算精確,但計算資源耗費高,更適合小樣本、分類不均衡的環境[12-14]。另外,現有的異常檢測算法多為對正常樣本描述,會出現大量的誤檢和漏檢情況。
孤立森林(Isolation Forest,IF)是一種高效的非監督的異常檢測算法[15]。它利用異常點少、異常點特征值和正常數據差別大的特點來孤立異常點。此算法時間效率高,可處理海量數據。現有的基于云數據的異常檢測,數據量大、維度高、要求計算資源小以及運算速度快。因此,孤立森林方法比較適合基于云平臺的空調異常檢測。
云平臺上可采集大量的單元式空調運行數據,但合理應用此數據做異常檢測還存在以下挑戰:1)云平臺的數據中標簽化的異常數據非常少,所以無法采用監督的學習方法,只能采用無監督學習;2)出于成本原因,單元式空調器上布置的傳感器非常少,導致上傳到云端的數據點極少,進而用于異常判斷的特征量較少;3)單元式空調的運行參數變化速度快、變化幅度大,這也增加了異常檢測的難度;單元式空調器的種類多樣,安裝條件多樣,對異常診斷模型的泛化能力和遷移能力也提出了挑戰;4)現有的機器學習算法對計算資源要求高,能夠適用于工程應用的算法較少[16-20]。
為了高效及時檢測出單元式空調器的運行異常,滿足工程中實際應用需求,部署在云平臺上的異常診斷算法需要滿足以下要求:1)盡可能檢測出系統的運行異常;2)不允許有誤報,因為誤報會導致維修人員額外工作量,造成資源浪費;3)泛化能力強,可適用于不同類型、不同工況、不同安裝條件的各種單元式空調器;4)檢測周期不應超過12 h,保證問題可以當天處理完成。本文的研究目的在于開發滿足以上需求的基于云數據平臺的單元式空調器的異常檢測方法。
針對在實際工程中很難獲得標簽化的異常數據的困難,本文提出了采用基于物理仿真模型生成大量正常和異常數據進而訓練模型的思路。
針對單元式空調的運行參數變化速度快、變化幅度大、種類多樣以及安裝條件多樣等情況,對異常診斷模型的泛化能力和遷移能力提出了挑戰。本文提出在數據生成時窮舉全運行范圍數據進行模型訓練,同時在特征工程中,采用基于專家經驗,生成獨立于機型和運行工況的新特征參數,進而提高模型的泛化能力。
基于云端數據的線上單元式空調器異常診斷方法具體開發思路如下:1)建立基于物理特性的單元式空調器仿真模型,仿真模型可以準確反映工況和控制變化對運行參數的影響趨勢;2)基于實驗數據對仿真模型修正,使仿真模型精度滿足要求;3)再根據修正的仿真模型在空調器運行的全工況范圍內生成正常運行數據和異常數據;4)針對生成的仿真數據,進行數據分析,包括數據關聯度分析,敏感性分析,找出對系統運行異常比較敏感的特征和其關聯性;5)基于專家經驗,對選取的特性參數泛化處理,生成獨立于工況和設備尺度的新特征;6)通過反復調參測試,找出性能最優的模型算法;7)采用實際云端數據驗證異常診斷算法的有效性。具體如圖1所示。

圖1 異常方法開發思路
選取普遍應用的單元式空調器,由1 個壓縮機、1 個翅片管式冷凝器、1 個翅片管式蒸發器、1 個電子膨脹閥、2 個風扇和其他電控部件組成。本文選取的單元機額定制冷量為11,546 W。
選用穩態基于物理公式的建模方法對此單元式空調器建模[21],然后采用標準工況下測試數據對模型進行修正,修正后模型預測換熱和功率的誤差在2%以內。模型的輸出參數選取實際工程中可得到的參數,包括室內機進口空氣溫度(℃),室內機進口空氣相對濕度(%),室外機進口空氣溫度(℃),室外機進口空氣相對濕度(%),室外機盤管進口溫度(℃),室外機盤管中間溫度(℃),室外機盤管出口溫度(℃),壓縮機排氣溫度(℃),壓縮機吸氣溫度(℃),排氣壓力(Pa),吸氣壓力(Pa),吸氣壓力對應飽和溫度(℃),排氣壓力對應飽和溫度(℃),室內機盤管中間溫度(℃),室內機出口管壁溫度(℃),壓縮機轉速(r/min),壓縮機功率(W),壓縮機電流(A),室內機風扇功率(W),室內機風扇轉速(r/min),室外機風扇功率(W),室外機風扇轉速(r/min)。
數據的工況范圍需要覆蓋全面運行工況,室內溫度最低為14 ℃,最高為33 ℃,相對濕度最大為100%,最小為10%;室外溫度最低為-30 ℃,最高為45 ℃,相對濕度最大為100%,最小為10%。
對于異常數據生成,選取常見的壓縮機、風扇、內外換熱器故障以及制冷劑泄漏下的性能數據。壓縮機效率下降,由下降5%到下降50%;風機效率下降5%到下降50%;內機換熱器臟堵率由5%到90%;外機換熱器臟堵率由5%增至90%;制冷劑泄漏量由5%到泄漏50%。
按照以上范圍均勻生成正常數據和異常數據,共生成50,988 組正常數據和3,136 組異常數據,其中單一故障導致的異常數據占總數據量的4%,混合故障導致的異常數據占總數據量的2%。
為了增強模型的泛化能力,使特征參數盡量獨立于工況和空調型號大小,新特征包括壓縮機排氣過熱度、吸氣管過熱度、壓縮機壓比、內機盤管進口空氣溫度與吸氣口飽和溫度差、排氣壓力對應飽和溫度與外機盤管進口空氣溫度差、吸氣壓力對應的飽和溫度與排氣壓力對應的飽和溫度差、外機盤管進口空氣溫度與冷凝溫度差、內機盤管溫度與蒸發溫度差、壓縮機功率與轉數三次方之比、風扇功率與轉數三次方之比等。
基于生成的仿真數據,可得出所有基本特征和新增特征對空調系統運行異常的敏感度,進而可根據各特征對空調異常度的敏感性,優選特征集,得到更精確的預測模型。通過數據分析,所有基本特征和新增特征對空調系統運行異常的貢獻度敏感度可計算得出。根據以上敏感度分析可知,室外機環境溫度、壓縮機排氣溫度、吸氣溫度、壓縮機功率、冷凝器管壁傳熱溫差、內機風扇功率系數和蒸發器管壁傳熱溫差對系統運行異常都相對敏感。
常用的異常檢測算法包括:孤立森林、基于角的離群點檢測、基于聚類的局部離群因子檢測、基于直方圖的離群點檢測和K近鄰。將正常和異常的仿真數據用于訓練和測試各算法,測試結果如表1所示。檢測效果的評價指標為異常點檢出率和檢出異常點的準確率。異常點檢出率指模型正確檢測出的異常點數占總實際異常點數的百分比;檢出異常點的準確率指正確檢測出的異常點數占總檢測出異常點的百分比。兩個指標越高,說明檢測效果越好。各算法測試結果顯示,孤立森林在異常點檢出率和檢出異常點的準確率均有絕對優勢。

表1 異常檢測算法檢測效果比較
為了評估不同特征組合對訓練效果的影響,本文選取4 種特征集。特征集a 僅包括原有的設備可采集到的特征參數,不做任何處理;特征集b 僅包括處理過的特征參數;特征集c 包括處理過的特征參數以及部分敏感度較高的原特征參數;特征集d僅包括敏感度比較高的處理過的特征參數。
為了評估不同特征集的檢測效果,本文分別采用不同的特征集訓練模型,得出的各特征集檢測效果如表2所示。可知特征集b 綜合指標最好,特征集d 綜合指標最差,主要因為此特征集特征數最少,但其綜合指標與最好的特征集b 也相差不多,說明在測量特征少的情況下,也可以采用特征集b。

表2 不同特征集的檢測效果比較
從云平臺選取廣東某辦公樓空調運行數據驗證本文提出的異常檢測算法,在設備運行12,000 h后將制冷劑釋放25%。采用本文方法進行異常檢測,采用特征集b 訓練模型,可成功檢測12,000 h后的異常狀況,進而證實此方法有效性。
本文提出了一種基于孤立森林方法的單元式空調器在線異常檢測方法,得到如下結論:
1)在數據方面,針對帶有標簽異常數據難于獲取問題,提出通過修正的仿真模型生成數據的方法,可生成大量的正常和異常數據用于檢測模型訓練和評估;
2)在算法方面,通過對孤立森林、基于角的離群點檢測、基于聚類的局部離群因子檢測、基于直方圖的離群點檢測和K近鄰等現有異常檢測模型評估,發現孤立森林方法在異常點檢出率和檢出異常點的準確率都占有突出優勢,檢出率在25%以上,檢出正確率在67%以上;
3)在特征選擇方面,為了提高模型的泛化能力,提出了基于工程經驗和物理意義的新特征;應用新特征可在保證模型精度的前提下簡化特征變量數,同時提高模型的可移植性;
4)采用現有云平臺數據訓練孤立森林模型,可成功檢測出制冷劑泄漏的異常情況,證實了方法的有效性;
5)本文開發的方法在單元式空調器上得到驗證,此方法還可推廣到多聯機等其他空調設備上;文中僅采用了一種孤立森林模型用于異常檢測,后續將考慮采用模型融合方法進一步提高檢測精度。