鐘寒露,周鎮新,陳煥新*,吳俊峰
(1-華中科技大學能源與動力工程學院,湖北武漢 430074;2-壓縮機技術國家重點實驗室(壓縮機技術安徽省實驗室),安徽合肥 230031)
在我國,空調是用電量的主要組成部分之一,它約占整個住宅用電量的30%[1]。多聯機由于其能耗低、熱舒適性高和靈活的安裝方式被廣泛應用于各類建筑中[2]。多聯機系統是種通過控制壓縮機制冷劑循環和制冷劑液體進入室內換熱器的流量來滿足室內冷熱負荷的直接蒸發式制冷系統[3]。多聯機系統通過滿足不同室內負荷需求和獨立單元控制來提供靈活性[4]。
壓縮機是多聯機系統中重要的組成部分,一旦受到損壞或發生回液等可能的故障,最終會造成系統故障和經濟損失[5]。BREUKER 等[6]的研究表明,壓縮機故障會產生最高昂的維修費,約占單體式空調系統維修費用的24%。多種故障都會導致回液,造成閥門、連桿和活塞損壞,如蒸發器或冷凝器盤管結構、制冷劑過充和膨脹閥故障等[6]。此外,液態制冷劑還可能導致機油從壓縮機殼體中帶出,從而造成暫時性的潤滑損失[6]。在封閉式壓縮機的多聯機系統中,若發生機械故障,必將產生高昂的更換壓縮機的費用[7]。因此,為了減少多聯機系統的損壞和保持室內舒適度[8-9],及時診斷壓縮機回液故障十分必要。
盡管壓縮機回液故障愈發受到重視,但在公開文獻中,與其他組件故障相比,如制冷劑泄漏[10-12]、傳感器故障[13-14],僅有少量研究致力于診斷回液故障。以往關于壓縮機的故障研究主要集中在密封泄漏[15]、閥故障[16]、活塞沉降[17]和結垢[17]上。只有BREUKER 等[6]和WANG 等[7]對回液做過一些研究。BREUKER 等[6]給出了造成回液的幾種原因,但是沒有給出具體的診斷方法。WANG 等[7]基于數據驅動的方法對壓縮機回液進行離線診斷,但沒有驗證模型的在線診斷能力。
主成分分析[13,18-19]和決策樹[7,19-20]因其優越的性能而被廣泛應用于數據驅動的故障檢測與診斷模型中。主成分分析可以通過正交變換和主成分提取將一組高維、可能相關的變量轉換為低維線性不相關變量,以達到降維和信息提取的目的[22]。決策樹通過樹形結構來呈現決策/分類過程,具有決策簡單和可解釋性強的優點。因此,本文結合主成分分析和決策樹來診斷壓縮機回液故障。
本文首先利用相關分析和專家知識消除冗余變量,將離散數據集分為訓練數據集和測試數據集。然后由主成分分析處理訓練數據集,采用分類決策樹算法構建主成分分析-決策樹分類模型。最后采用主成分分析-決策樹分類模型診斷在線數據。測試數據集用來驗證模型的準確性,將兩個在線實時數據導入已建立的模型中,以檢測在線故障診斷性能。
主成分分析已成為統計中典型的降維和信息提取方法。本文將介紹信息提取理論的概述。主成分分析的其他詳細理論可在文獻[13,23-25]中找到。
假設有n維樣本集Q=(x(1),x(2),...,x(m)),首先按照式(1)對所有樣本進行中心化,以獲得集中樣本集Q1。

根據等式(2)獲得數據集的協方差矩陣,然后根據等式(3)對矩陣XXT進行特征值分解。在式(3)中W是XXT的n′特征向量的矩陣,而λ是XXT的特征值。

接著取出最大的n′個特征值的特征向量(w1,w2,...,wn'),并對所有特征向量進行歸一化以形成特征向量矩陣W。并根據公式(4)對每個數據集中的每個樣本x(i),轉換為新的樣本z(i)。

最后得到輸出的新數據集Q′=(z(1),z(2),…,z(m))。此外,新得到的主元變量均為原始變量x的線性組合,且各主元變量之間互不相關。
決策樹算法經過不斷的發展,目前被廣泛用于數據挖掘和機器學習領域[26],因其以樹形結構呈現決策/分類過程而具有決策簡單和可解釋性強的優點。當前可用的兩種最常見的決策樹算法為分類決策樹[27]和C4.5[28]。本文利用分類決策樹建立決策樹模型,對壓縮機液體回液進行故障診斷。
分類決策樹算法[7,21,29]是一種二進制遞歸分割技術。當前樣本分為兩個子樣本,因此生成的每個非葉子節點都有兩個分支,生成的決策樹是簡單的二叉樹。圖1所示為用于多聯機故障診斷的基于分類決策樹的樹結構,“正常”表示真實的正常數據樣本,“故障”表示真實的液體回注故障數據。一棵完全生長的樹通常會考慮每個屬性,這會導致樹很大且過擬合。因此,我們通常使用復雜度參數或最大樹深度來更改樹結構。

圖1 用于多聯機分類的基于分類決策樹的樹結構
在線故障診斷策略如圖2所示。它主要包括3個階段:數據收集和處理、模型構建和測試以及在線故障診斷。

圖2 主成分分析-決策樹故障診斷方法流程
第一階段是數據收集和處理。將傳感器按時序獲取的原始多聯機系統運行參數進行積分,并剔除缺失值。相關分析的結果用作選擇變量的基礎。
第二階段是模型構建和文本。將采集數據的2/3用作訓練數據,1/3 用作測試數據。主成分分析方法用于重建數據以獲得新的主成分變量。然后將新的主成分變量用作分類與回歸樹的輸入變量,以建立故障診斷訓練模型。將測試數據作為驗證集來驗證模型的準確性。通過混淆矩陣[30-31]評估故障診斷的準確性。
第三階段是在線故障診斷。傳感器收集多聯機系統的實時運行數據,并將其傳輸到已建立的故障診斷模型,以執行壓縮機回液故障在線診斷。
實驗操作和數據收集均嚴格按照相關準則進行,以確保實驗和數據的完整性和可靠性。
圖3所示為實驗系統和主要傳感器分布。由圖3 可知,多聯機系統由5 個室內機和1 個室外機組成。為了清晰顯示制冷劑的流動方向,實線表示高壓管道,而虛線表示低壓管道。
此多聯機系統使用的是R410A 制冷劑,標準充注量為9.9 kg。室外機和室內機的額定容量分別為28 和7.1 kW。本文將壓縮機進氣管的表面結霜視為壓縮機回液的外部表現。應該注意的是,故障2模型的運行工況不同于正常模式和故障1。將室內干球溫度Ti從22 ℃調整到10 ℃,將室外干球溫度To從7 ℃更改為-7 ℃,以確保觀察到結霜狀態。詳細的實驗條件如表1所示,室內機開機臺數為n。

表1 3 種模型的詳細測試條件
兩種引起回液的方法:1)圖3 中的方法#1,是通過銅管將高壓側液體制冷劑旁路到蓄能器入口;2)圖3 中的方法#2,是在140%的制冷劑充注量下實現的。正常充注水平應為100%。兩種方法的最終結果都是在多聯機系統中造成回液。

圖3 實驗系統及主要傳感器分布
所有傳感器都在實驗之前進行了校正,以確保測量值的準確率。數據采集軟件將會把系統上傳感器采集到的數據每3 s 記錄一次并保存。剔除缺失值后,實驗總共獲得了17,217 條離線數據,其中包括7,478 條正常數據,9,739 條回液數據。所有收集到的離線數據有2/3 被劃分為訓練數據,其余1/3 劃分為測試數據。具體如表2所示。將故障1 和故障2 視為同一種回液故障。

表2 不同類型數據集中的樣本數
初始監視變量最多可以有50 個,但是許多狀態變量是布爾型的,不利于故障檢測與診斷模型的開發。在消除了控制變量和布爾變量之后,保留了10 個最佳變量,1~6 為溫度變量,7~8 為運行電流,9~10 為運行頻率,具體如表3所示。

表3 10 個最佳變量類型
在故障檢測與診斷模型建立過程中,冗余變量嚴重影響了訓練數據模型的可靠性[32]。因此,消除冗余變量十分重要。圖4所示為所有變量的置信矩陣,能直觀展示出10 個變量之間的相關性。圖4 中的數字越大,說明變量之間的正相關越強,絕對值越接近于1,變量間相關性越強。其中正號表示正相關,負號表示負相關。
如圖4所示,有6 組數據相關性大于0.9,甚至有的變量幾乎完全相關。如Tcom.shell和Tcom.dis、Tevap和Taccu.out、Ifan和ffan、Tcond和Icom等。注意,一些變量和多個變量都是強相關的,如Tcond甚至與三種變量有強相關性。在專家變量知識與保證模型精度相結合的原則下,剔除了4個變量:Tcond、Tevap、Tcom.shell和Ifan,還剩6 個變量:ffan、Tcom.dis、Taccu.in、Taccu.out、Icom和fcom。

圖4 初始變量的置信矩陣
將所有離線數據分為兩部分,其中三分之二作為建模數據,三分之一作為測試數據。正如在1.1 節中所討論的,主成分分析具有信息提取和降維的優點。因此,首先對收集到的數據變量進行主成分分析,然后形成新的主成分變量作為決策樹模型的輸入變量,從而有效避免了模型由于信息技術的深度限制而造成的信息利用不完全的影響。
從1.1 節的結果可知,新形成的主成分變量是原始變量的線性組合,組合系數如表4所示。組合系數的絕對值越大,主成分包含的原始變量的信息越多,其表示形式越強。例如,主變量1(RC1)中的最大組合系數為0.86,它對應于原始變量Taccu.out。因此,RC1 是原始變量Taccu.out的最強代表。

表4 新主元變量的組合系數
以主成分分析形成的主成分變量作為分類決策樹算法的輸入變量,得到壓縮機液回液故障診斷模型,如圖5所示。該模型最后使用RC1 和RC5兩個主要變量進行故障診斷。為了避免模型過度擬合,決策樹深度設置為2。

圖5 主成分分析-決策樹方法在壓縮機液體回液故障診斷中的樹狀結構
如表5 和表6所示,所提出的主成分分析-決策樹方法使用實驗測試數據顯示出良好的故障診斷性能。訓練數據集和測試數據集的總體分類準確性均高達97%。對于故障狀況的診斷,訓練和測試數據集的準確度高達98.88%和98.77%。只有大約1%的數據無法正確診斷。

表5 基于訓練數據集診斷結果的混淆矩陣

表6 基于測試數據集診斷結果的混淆矩陣
由故障診斷模型可知,可以通過監控以下6 個運行參數(fcom、Tcom.dis、Taccu.in、Taccu.out、Ucom和ffan)來診斷壓縮機是否發生了回液。文中進行了兩個驗證主成分分析-決策樹模型在線故障診斷的實驗,測試條件與離線數據收集之前的測試條件相同。當多聯機系統穩定運行時,傳感器開始實時傳輸數據以進行診斷。具體的在線數據集信息如表7所示。

表7 兩組在線數據集信息
傳感器收集的數據將實時傳輸到故障診斷模型中。表8 和表9所示為在線診斷結果的混淆矩陣。該模型對故障的診斷準確度超過了98%,這種出色的在線診斷性能表明此模型可用于壓縮機回液故障診斷中。實時在線故障診斷結果如圖6所示。

表8 基于在線數據集1 診斷結果的混淆矩陣

表9 基于在線數據集2 診斷結果的混淆矩陣

圖6 兩種運行數據的在線故障診斷結果
為了比較相同類型的診斷,將兩種相同類型的診斷結果放在同一張圖中。如圖6(a)所示,盡管稍后會誤判一些正常數據,但在開始的38 min 內,兩次在線診斷的準確性非常高,幾乎沒有錯誤診斷。通過檢查原始數據,大規模錯誤判斷的原因是系統在此時間段內進行了除霜。圖6(b)顯示了兩次故障類型的診斷結果。兩次結果均表明,該方法對回液的檢測具有良好的診斷效果,只有極少的故障數據無法正確判斷。
本文提出了一種針對多聯機系統壓縮機的在線回液故障診斷方法,該方法分三步將決策樹與主成分分析結合起來,將11,478 個離線觀測數據用于模型建立,采用兩個在線實時數據集對在線故障診斷模型進行性能驗證,得到如下結論:
1)主成分分析有效整合了變量信息,決策樹模型使用兩個主元“RC1”和“RC5”作為分類變量;這兩個主要元素分別表示原始變量Taccu.out和Tcom.dis;
2)此方法可以在線診斷壓縮機回液故障,實驗數據和在線數據的總故障診斷準確性分別超過了97%和93%;
3)在線數據的壓縮機回液故障診斷準確率高達98%,表明該模型可以進行準確的故障預警,該模型識別正常狀態的準確率約為87%,雖然低于整體準確度,但仍可被實際使用。