于仙毅,巫江虹,高云輝
(1 華南理工大學機械與汽車工程學院,廣東廣州510641; 2 美的暖通設備有限公司,廣東佛山528300)
天然工質R290(丙烷)制冷劑具有傳熱性能好、綠色環保等優點[1],然而R290 的可燃性限制了其在制冷行業的應用范圍,精確識別制冷劑泄漏是可燃制冷劑安全應用亟待解決的問題。制冷系統實際部件類型繁多,不同系統故障造成的系統狀態參數變化具有一定相似性,無法直接通過系統原始狀態參數精確識別制冷劑泄漏[2]。
制冷劑泄漏可以分為突發性和漸變性[3]。突發性泄漏發生時間短,對系統造成的反饋影響較為迅速,同時制冷劑大量且快速地泄漏至環境中,會有較為明顯的現象[4]。而漸變性泄漏(亦可稱為緩慢泄漏)發生的時間較長,制冷劑泄漏緩慢,對系統的影響是長期且細微的,系統部件密封不嚴、管道接頭故障是造成制冷劑緩慢泄漏的主要原因[5-6]。這兩類制冷劑泄漏發生的頻率與維護費用都比較高,尤其是目前對于緩慢泄漏難以第一時間識別,一般只能在系統能效發生明顯衰減后才進行排查檢測[7-8]。所以運用制冷系統狀態數據,提取制冷劑泄漏特征參數,從而精確快速地識別系統是否發生制冷劑泄漏,可以減少不必要的能耗和設備損耗,降低制冷劑對環境的影響,亦可減少目前可燃制冷劑的應用限制,在實際應用中具有一定的意義[9-10]。
現有關于制冷劑泄漏識別的研究集中在兩個方向:一個方向是通過實驗測試,研究制冷劑泄漏的系統狀態參數變化并進行統計分析[11-15];另一部分是結合模式識別、數據挖掘中的不同方法來進行制冷系統故障檢測與診斷研究[16-23]。在這些研究中所涉及的用于判別制冷劑泄漏的特征參數種類繁多,但針對不同類型制冷系統所進行的制冷劑泄漏性能測試實驗,一般是以制冷劑充注量不足代替實際泄漏實驗,通過對數據進行擬合,從而給出各參數與制冷劑充注量的關系,用其中靈敏度最高的參數來表征制冷劑泄漏;在制冷系統故障領域的研究,用來檢測和診斷故障的特征參數或特征參數集有不同的獲取方法,大部分沒給出具體特征參數與具體故障間的關聯性。
制冷系統是一種典型的非線性系統,各相關參數間存在不同的相關性,例如制冷劑泄漏將導致蒸發溫度、蒸發壓力、制冷量、COP 下降,壓縮機功率上升;但蒸發器結垢也會導致蒸發溫度、蒸發壓力、制冷量下降,壓縮機功率上升[24]。因此通過簡單統計分析某些特征參數來比較正常工況與泄漏工況,所得的結果存在極大的局限性,并且不能明確是否存在其他干擾工況造成類似結果。基于信號處理的診斷方式難以在復雜的制冷設備系統上找到準確的泄漏故障對應的診斷指標,并且輕微泄漏故障時的準確診斷對故障閾值的準確性和精度提出很高的要求[8]。基于核函數的診斷方式能通過對數據空間和特征空間的非線性變換將耦合性強的原始數據在高維空間中容易區分,在故障智能診斷方式中應用越來越廣泛[25]。
本文采用基于核函數的泄漏故障診斷識別方法,支持向量機模型(SVM)在學習樣本數較少的情況下比其他人工智能方法有更強的適應性、更好的分類能力和泛化能力[26],因此本文選用支持向量機模型為泄漏分類模型。主成分分析方法(PCA)能對數據進行降維處理,將多個相關變量轉化為少數幾個獨立變量并且能保留原始數據絕大部分信息,是一種高效的數據集中特征提取的方法[27]。
本文通過對一套空氣源熱泵熱水系統進行泄漏工況、正常工況、干擾工況的實驗測試,獲取各工況下系統狀態參數變化的數據,采用主成分分析法對這些實驗數據進行制冷劑泄漏特征提取,主成分分析可以對數據所處特征空間進行變換,得到實驗樣本數據在新特征空間——主成分上的分布。運用所提取出的主成分結合支持向量機分類方式建立熱泵熱水系統的制冷劑泄漏識別模型,實現在多種干擾工況下泄漏模式的準確識別。
制冷劑泄漏實驗系統包含蒸汽壓縮制冷循環基礎部件、水路循環部件、泄漏控制部件和測試部件四大部分,各組成部件如表1所示,其中蒸發端風冷由6 個小型風扇串聯的風扇組供風,水路循環由水泵將制熱熱水循環流過水箱、冷凝器不斷與冷凝器換熱,泄漏口是在蒸發器、壓縮機、冷凝器、熱力膨脹閥的連接銅管段分別接出一段銅管,依次裝上常閉手閥、可調節開度閥。通過控制常閉手閥、可調節開度閥的方式控制制冷劑泄漏。制冷劑發生泄漏時,采用軟管將泄漏口與氣體收集袋相連接,收集泄漏的制冷劑。實驗系統的理論系統圖以及測點布置如圖1 所示,實驗臺實物及制冷劑泄漏控制閥和收集袋實物如圖2所示。

圖1 泄漏實驗系統及測點布置示意圖Fig.1 Schematic diagram of leakage test system and arrangement of measurement points

表1 制冷劑泄漏實驗系統部件信息Table 1 Refrigerant leak test system component information
為了獲取多組數據用于熱泵系統制冷劑泄漏識別分析,實驗設計7種泄漏及干擾工況,各工況類型及引入方式如表2所示。為了維持蒸發冷凝端環境溫度,室內通過房間空調器調節維持環境溫度,冷凝水箱端由冰塊以及常溫的開式循環自然水維持水箱水溫。
系統開機穩定后,隨機選取不同時間段的數據作為正常工況數據,穩定后引入泄漏和干擾工況,測得的數據為故障工況數據。實驗獲取正常工況11 組,干擾工況18 組(調節冷凝器水流量3 組,遮擋蒸發器3 組,調松熱力膨脹閥3 組,調緊熱力膨脹閥3 組,25℃水溫3 組,35℃水溫3 組),泄漏工況12 組(每個泄漏點各3 組)。實驗測得22 個溫度、8 個壓力以及1 個壓縮機耗功,根據制冷循環理論計算了系統過熱度、過冷度等10個計算量。各組工況數據經過系統穩定運行態篩選、數據穩態檢測后保留了大小各異的數據,所有正常、泄漏以及干擾工況篩選匯集為原始數據集作為熱泵系統泄漏識別原始特征數據,大小為41×3213。41 個特征變量具體名稱及其符號含義見表3。

表2 恒定水溫熱泵系統測試工況Table 2 Test conditions of the heat pump system with constant water temperature

圖2 制冷劑泄漏實驗實物圖Fig.2 Refrigerant leakage experimental
泄漏速率對泄漏識別有不可忽視的影響。計算12 組泄漏實驗的制冷劑泄漏速率如圖3 所示,12 組泄漏工況按泄漏快慢分為兩類泄漏數據(雖然各組的泄漏速率相差各異,但快速泄漏組的所有泄漏速率均大于所有的緩慢泄漏組速率),以此劃分數據來研究泄漏速率對診斷識別結果的影響。
主成分分析(principal component analysis,PCA)是一種基于多元統計回歸的特征提取方法。它可以對多個變量參數構成的數據特征空間進行線性變換,將樣本數據轉化至新的特征空間內,新特征空間的基向量(主成分)是包含原始變量參數絕大部分內容的綜合指標。經過主成分分析后,具有不同程度相關性的原始變量參數轉化為相互無關的主成分,極大消除了變量參數之間相關性的影響,同時有效減少了數據特征空間的維數。主成分分析基本流程包括原始矩陣標準化、求解相關系數矩陣、求解特征值及特征向量以及主成分提取四個部分,具體計算如下。

圖3 泄漏工況實驗制冷劑泄漏速率Fig.3 Refrigerant leakage rate of experimental in leakage condition
(1)原始矩陣標準化 假設原始泄漏特征訓練集為Xa×b,b個特征量,a個樣本,X=(X1,X2,X3,…,Xb)T,采用式(1)對原始矩陣進行標準化變換。


(2)求解Z的相關系數矩陣R

表3 特征變量名稱符號及對應的系統表征含義Table 3 Name symbols of characteristic variables and their corresponding system representation meanings

(3)求解R的特征值及特征向量

求解式(3)得到b個特征根λ1,λ2,…,λb,求解方程組R×p=λp,得到特征根對應的特征向量P1,P2,…,Pb。用數據矩陣Z的b個特征向量作線性組合得到主成分,形式如下:
式中,F1為第一主成分,F2為第二主成分,Fi為第i主成分。
(4)主成分提取 主成分分析法所得到的主成分包含原始數據的信息,主成分對應的特征值越大,包含的信息也越多。為了提取包含原始信息盡可能多、主成分個數盡可能少的部分主成分,選取個數合適的部分主成分對泄漏識別模型的性能有決定性的作用。主成分貢獻率法(cumulative percent variance,CPV)可用來確定主成分個數[27]。
CPV 法是基于特征值獲取各主成分的方差貢獻率,通過預設的累計方貢獻率來計算所需的主成分個數。
式中,CPVi是第i個主成分的方差貢獻率,λi是第i個主成分所對應的特征值,CPVa是控制限,通過式(4)、式(5)以及一個確定的CPVa,可以計算出包含原始數據絕大部分信息的主成分個數k。
支持向量機(support vector machine,SVM)是建立在統計學理論和結構風險最小化原則上的學習機器,旨在特征空間上找到最佳分離超平面使得訓練集上的不同樣本間隔最大。基礎SVM 可有效解決兩類線性可分的問題,當訓練樣本線性不可分時,可引入松弛因子以及懲罰系數放寬問題的約束條件從而使分類模型在包含一定誤差的條件下將線性不可分樣本數據分類[26]。同時核函數可將訓練樣本從原始空間Rn映射到高維特征空間F上,使Rn的非線性問題轉化為F上的線性問題,在F上尋找最佳分類平面。
對于二分類問題,設數據集為(xi,yi),xi∈Rd,yi∈{-1,+1},i=1,2,…,N,其中xi是樣本變量數據,yi是樣本類標,用于定義最佳分類超平面的判別函數為

式中,sgn(u)為符號函數,u>0則sgn(u)=1,u<0 則sgn(u)=-1;x為待分類樣本;b為閾值偏差;αi為拉格朗日算子,其計算原則如下:

式中,c(c>0)為懲罰系數,決定了對訓練誤差的懲罰力度,用于中和分類的邊界最大化和誤差最小化的矛盾,可以參數優化確定大小。對于式(6),可以證明存在部分αi非零,其對應的樣本點在分列邊界上,成為支持向量。
偏差b是樣本點、類標和權重的線性組,組合形式如下:

式中,xi為任意一個支持向量,yi為其類標,w是權重矢量

常用的核函數有線性核、多項式核、高斯核等多種形式,具體表達式如表4所示。

表4 不同核函數類型的SVM模型表達式及其參數Table 4 SVM model expressions and parameters of different kernel function types
圖4 是基于PCA 與SVM 的制冷劑泄漏識別模型,原始數據庫數據標準化后進行主成分提取,生成方差貢獻率依次減小的主元特征。根據累計方差貢獻率值依次增加原則選擇主成分組合,在MATLAB2015b 的Classification Learner 工 具 箱 里 依次選用不同SVM 分類模型對主元組合特征用于泄漏與非泄露兩類數據進行二分類判別,依據分類效果確定理想的主成分泄漏特征和分類SVM 模型。理想特征和SVM 模型的組合成為訓練好的泄漏識別模型,新測試的數據標準化后得到用于泄漏識別的測試集,根據訓練模型的理想主元組合的系數載荷矩陣計算后數據作為泄漏模型測試的輸入,檢測訓練好的泄漏識別模型對新數據的分類效果,以此判斷熱泵系統是否發生制冷劑泄漏,并評價該模型的性能。當泄漏識別模型的識別性能較好時,可以用于對熱泵系統的泄漏故障的診斷應用,即對于監測的未知工況數據,通過識別模型的分類預測處理就能用于判斷熱泵系統是否發生泄漏故障。對于測試集和未知監測數據的分類識別流程如圖4中不同顏色線圖所示。對于多分類判別的故障診斷,方法與之相似。
識別模型的性能由模型預測結果和真實結果的混淆矩陣來表征,以二分類的混淆矩陣為例說明,混淆矩陣定義如表5所示。行內容為真實結果,列為識別結果,可知TP 和TN 為發生泄漏或未泄漏情況都識別正確的樣本數,FN 和FP 為發生和未發生泄漏情況識別錯誤的樣本數。

表5 二分類結果的混淆矩陣Table 5 Confusion matrix of binary classification results
好的識別模型對應的混淆矩陣的主對角位置元素盡可能大,其他位置元素越小越好。通常還有準確率、錯誤分類率和命中率、虛警率來表征分類模型的整體性能和對每一類別(泄漏和非泄漏)的評價性能,具體定義如表6 所示。多分類的混淆矩陣與之類似。

圖4 基于PCA-SVM的制冷劑泄漏識別模型Fig.4 Refrigerant leak identification model based on PCA-SVM

表6 泄漏識別模型評級評價指標及其定義Table 6 Leak identification model rating evaluation index and its definition
3.1.1 PCA 特征提取結果分析 PCA 特征提取將原始特征組成的數據參數線性變換后得到新的特征空間,在新的特征空間內選擇表征泄漏的特征組。表7 是對泄漏識別原始數據的主成分分析后的結果,其中,每一行為一個新特征,稱為主元(主成分),1~41 的列為相應的41 個原始特征的系數,各原始特征與之對應的系數乘積之和就是主元特征,每個主元特征對應的原始數據協方差矩陣的特征值、方差貢獻率、累積方差貢獻率也列在表中。由表可知,前3 個主元的方差貢獻率在所有主元特征中比重較高,累計方差貢獻達80%;前7 個主元累積方差貢獻率超過95%,可見,由原始41 個特征經過PCA 變換后變成41 個新的相互獨立的新主元特征,而前3 個主元特征已經反映了80%的原始信息,前7 個主元特征已反映了96.5%的信息,用這些主元特征組表征泄漏,相比原始41 個特征,PCA 主元特征個數大大減少,是常用的數據降維方式。
3.1.2 識別結果與分析 將實驗測得的原始數據按4∶1的比例隨機分成訓練集和測試集分別用于泄漏模型的訓練和檢測。PCA 主成分提取后選擇序號靠前的主元成為SVM 輸入量,為了評估主元個數對SVM 分類性能的影響,按累計方差貢獻率逐漸遞增的原則選擇主元個數是3、4、5、6 和7 五種主元組合。不同主元組合輸入不同核函數類型的SVM 模型中進行分類識別,依據分類結果評價不同主元特征組作為泄漏特征的性能。其中不同核函數類型的SVM模型如表8所示。不同累計方差貢獻率的主元組合和不同核函數類型的SVM 模型的交叉組合形成5× 6 平面搜索式的識別模型訓練過程,圖5 是訓練過程不同模型的識別準確率結果,圖6 是訓練過程中命中率和虛警率結果,可知不同評價指標在相同模型上有相同識別性能結果,即某個識別模型的準確率Acc越高,對應命中率TPR也越高,而虛警率FPR越低,反之亦然。

表7 泄漏特征的主成分分析結果Table 7 Principal component analysis results of leakage characteristics

表8 不同核函數類型的SVM模型信息Table 8 SVM model information of different kernel function types
分析圖5 準確率結果圖的形狀可知,SVM 模型的核函數類型對泄漏識別模型性能影響較大,序號兩端的Linear SVM 和Coarse Gaussisn SVM 模型的準確率遠低于其他模型;不同方差貢獻率的主元組合在相同核函數類型的SVM 模型中識別性能大致呈遞增趨勢,但在Fine Gaussian SVM 模型中,不同方差貢獻率的主元組合的識別準確率均較高。圖中最大值的點為(0.87,4,1),即前四個主成分組成的主元組,其累積方差貢獻率為87%,在Fine Gaussian SVM 模型中訓練的泄漏識別模型對測試集數據的分類識別的結果準確率達到100%,此泄漏識別模型性能優異,具有極佳的識別準確性。表9 為該模型的具體訓練結果。

圖5 泄漏識別模型訓練過程識別準確率變化Fig.5 Change of recognition accuracy in the training process of leak recognition model
PCA-SVM 模型在二分類泄漏故障診斷中識別性能極佳,為了驗證PCA-SVM 模型的診斷性能,在多故障工況下做PCA-SVM 診斷識別研究。原始數據集按表2 的模擬故障工況劃分為8 類工況,分別為正常、泄漏、冷凝器臟堵、蒸發器臟堵、膨脹閥預緊力過小、膨脹閥預緊力過大以及變水溫工況。由于在二分類泄漏故障診斷識別中Fine Gaussian SVM 模型均優于其他SVM 模型,但不同主元個數在相同的SVM 模型中的泄漏識別性能的變化規律并非完全一致,本小節多故障工況的PCA-SVM 模型采用改變主元個數,確定Fine Gaussian SVM 模型建立了4 個PCA-SVM 模型,模型命名方式為Modelpca,其中Model-pca4 表示“主元個數為4,SVM 為Fine Gaussian 核函數型”的PCA-SVM 模型,其他類似。同時為了增加對照組,直接用Fine Gaussian SVM 模型對原始數據進行訓練和識別建立Model-o模型。5 個模型對同一數據集對多種工況進行多分類識別,得到8×8的混淆矩陣。圖7是5種模型在各故障工況下的診斷識別準確率對比,表10是對應的混淆矩陣。

表9 泄漏/非泄漏模式下PCA-SVM 識別模型及性能Table 9 PCA-SVM leak identification model and performance

圖6 泄漏識別模型訓練過程識別命中率和虛警率變化Fig.6 Changes in the TPR and FPR during the training process of the leak recognition model
由圖可知,在多類故障分類診斷中,同一模型對不同故障的識別性能不同,不同模型在同一故障中的診斷性能也有差異,總體來看,所有模型對蒸發器結垢故障診斷效果不佳。由表可知,多個模型易將蒸發器結垢故障誤判為正常工況,分析實際制冷設備系統上,蒸發器結垢的過程是長期累積的,風機風量足夠大時,蒸發器結垢臟堵引起系統運行工況的改變相對來說是小的,與緩慢泄漏類似,這些故障對系統正常運行的影響比其他故障輕微,診斷模型性能也會受影響。與直接SVM 分類相比,PCA-SVM 模型在所有故障的診斷識別中都優于Model-o 模型,但Model-pca7 的診斷識別性能比Model-o 差,而Model-pca5 性能是最佳的。值得注意的是,5 個模型在多故障診斷上對泄漏故障的診斷識別效果均較好。因此如果單考慮對泄漏工況的診斷識別,PCA-SVM 模型是非常有效的模型。

圖7 不同模型在各個故障的診斷識別準確率Fig.7 Diagnosis and recognition accuracy of different models in each fault
在泄漏/非泄漏的二分類模式下和多工況分類模式下,PCA-SVM 模型對泄漏工況的診斷識別性能都保持較好的水平,但不同故障強度對診斷模型的性能有很大的影響。泄漏速率不同一定程度上能表征泄漏故障強度的差異,為了研究泄漏速率對泄漏故障診斷識別的影響,本節以圖3 所示的結果將泄漏工況數據劃分為緩慢泄漏和快速泄漏兩類,在二分類和多工況分類的模型中分別研究不同泄漏速率的泄漏故障。
3.3.1 泄漏/非泄漏模式下的速率影響研究 3.1 節中對原始數據集進行二分類識別研究得到泄漏識別性能較好的PCA-SVM 模型,模型特點為核函數為Fine Gaussian 型,主元個數不同。上述模型中泄漏模式為全部泄漏工況數據,非泄漏模式為包含正常工況以及其他干擾工況。分別以緩慢泄漏數據集和快速泄漏數據集代替原來的泄漏模式數據集,改變主元個數,得到4 種PCA-SVM 模型,在兩個新的數據集中進行泄漏/非泄漏二分類診斷識別,得到不同泄漏故障下的識別準確率如圖8 所示,其中Refleak 為3.1 節原始數據集的泄漏/非泄漏識別結果,Model-pca4 表示“主元個數為4,SVM 為Fine Gaussian 核函數型”的PCA-SVM 模型,其他模型同理。
由圖8可知,主元個數選擇不同,模型的識別性能也不同,并非主元個數越多,模型性能越好,在三類泄漏識別中,Model-pca5 均維持在較高的精度,對所有二分類的泄漏識別中均保持了100%的準確性,但比較不同泄漏速率下的二分類泄漏性能可知,雖然Model-pca5 模型的三種泄漏識別性能都一樣,但從所有模型的性能對比看,緩慢泄漏識別的準確率低于快速泄漏識別,因此泄漏速率的快慢對泄漏識別的性能有影響。

圖8 四種模型各泄漏故障的診斷識別準確率對比Fig.8 Comparison of the diagnostic and identification accuracy of each leakage fault of the four models
3.3.2 多分類模式下的速率影響研究 為了在相同的數據集中同時研究對快速泄漏和緩慢泄漏的識別性能,將原始數據的正常工況和泄漏工況數據聚集成新的數據集,其中泄漏分為緩慢泄漏和快速泄漏,采用相同的PCA-SVM 模型研究方法對數據集做三分類識別研究,結果如圖9 所示。其中Model-pca4 表示“主元個數為4,核函數類型為Fine Gaussian SVM 的PCA-SVM 模型”,其他模型同理。表11 是識別結果的混淆矩陣,同理二分類的混淆矩陣的定義,矩陣豎方向為實際工況分類,橫方向為預測工況分類。
由圖9 可知,在剔除干擾故障時,PCA-SVM 模型對正常工況的識別結果幾乎為100%,但泄漏識別性能要弱于正常工況的識別準確性,其中,四個模型對緩慢泄漏的識別性能均弱于快速泄漏,而Model-pca5 的診斷識別性能比其他模型效果更佳,這與圖8的結果相似。因此不論是二分類泄漏識別或是多分類泄漏識別中,泄漏速率對模型的性能均有影響,相同條件下,同一個模型對快速泄漏的識別性能會優于緩慢泄漏。
分析表11可知,所有模型對緩慢泄漏的識別誤差主要在于將緩慢泄漏誤判為快速泄漏,但Model-pca7 的誤差還易將泄漏誤判為正常,而Model-pca5很好地避開了這個誤差,模型總體性能最佳。

表10 不同模型在各個故障的診斷識別的混淆矩陣Table 10 Confusion matrix of different models in each fault diagnosis identification

表11 四種模型在相同數據集的各泄漏診斷識別結果混淆矩陣Table 11 Confusion matrix of leakage diagnosis and identification results of four models in the same data set

圖9 四種模型在相同數據集中的各泄漏診斷識別準確率對比Fig.9 Comparison of leakage diagnosis and identification accuracy of four models in the same data set
主成分特征提取將原始41 個特征線性變換后得到方差貢獻率不同的主元,選擇前少數個主元輸入SVM 模型訓練得到識別性能優異的泄漏識別模型,少數個主元大大減少了模型的輸入參量,精簡了識別模型。但是求解主元仍需要所有原始測試及計算特征參量,過多的測試參量不利于PCASVM 模型在實際系統的泄漏識別應用,若人為隨機縮減原始特征參數,無法保證泄漏相關性較強的特征參與主成分提取,從而有可能削弱PCA-SVM 模型的識別性能。因此將原始特征依據與泄漏的相關性程度進行篩選,再用于PCA-SVM 泄漏識別模型,理論上可有效精簡實際系統測試參數并保證泄漏識別精度,特征選擇(feature select)便可實現上述篩選[28]。
3.4.1 RefliefF 特征選擇算法簡介 ReliefF 是一種著名的過濾式特征選擇方法,根據樣本類間距離與類內距離的大小來評估不同特征對不同類樣本的敏感度,將基于特征對近距離樣本的區分能力賦予特征不同的權重從而評價這種敏感度,權重小于某個閾值的特征值將被剔除。特征的權重越大,表示該特征的分類能力越大。具體算法參考文獻[29]。
3.4.2 RefliefF 特征選擇結果 圖10是41個原始特征經RefliefF 篩選后權重分布結果,改變RefliefF 算法中取樣個數k值(k∈[10,24],k∈N),得到15 次特征選擇結果[30]。由圖可知,多次特征選擇的結果具有良好的一致性,權重分配集中在第3、21、23、38號等原始特征上,說明這些特征與目標類相關性較大。按照權重大小排序原則,綜合權重閾值取w≥0.005 和w≥0.01 的結果,選擇編號為式(10)所示的10 個泄漏特征組合,其中測試參數9 個,計算參數1個,特征具體在熱泵熱水系統上表征含義見表3。相比于原始41 個特征(測試參數31,計算參數10),系統測試參量大大減少。


圖10 RefliefF特征選擇權重結果Fig.10 RefliefF feature selection weight result
分析權重集中的特征量在熱泵系統上的實際意義可知,蒸發端壓力參數比冷凝端壓力參數對系統泄漏敏感性更高,其中40 號特征(蒸發器進出口壓差)綜合權重遠大于其他特征;冷凝端溫度參數比蒸發端溫度參數對系統泄漏敏感性更高,在所有系統測點溫度中3號特征(壓縮機出口溫度)的綜合權重最大,熱泵系統發生制冷劑泄漏時排氣溫度對此較為敏感;其他權重較大的特征還有21 號(蒸發器出風溫度)、23 號(壓縮機耗功)、25 號(冷凝器過冷度)、36號(節流閥溫差)以及38號(冷凝器進出口壓差)。以上特征在熱泵系統發生制冷劑泄漏時具有較強的相關性,在實際熱泵系統泄漏識別時重點測試這些參數。

表12 RefliefF特征選擇前后的PCA-SVM 泄漏識別模型及性能結果對比Table 12 Comparison of PCA-SVM leak identification model and performance results before and after RefliefF FS
3.4.3 ReflieF 特征選擇后的PCA-SVM 泄漏識別結果 特征選擇后的原始數據按式10 所示的編號篩選數據,得到新的10 維數據集。將新10 維數據重新進行主成分分析,再輸入SVM 模型進行分類訓練,具體流程和3.1 節二分類泄漏識別流程相同。為了全面比較RefliefF 特征選擇前后的泄漏模型識別結果,每種方式各選取三個訓練模型如表12 所示,兩種方式的最理想模型分別是序號1 和序號4的模型。
對比特征選擇前后的識別結果可知,PCA-SVM識別模型具有較高的識別精度,理想組PCA-SVM模型的識別準確率高達100%,在642 組測試集數據中,只有1 組泄漏數據被誤判為非泄漏。RefliefF 特征選擇后的理想PCA-SVM 模型的識別準確率和命中率等略遜于特征選擇前的模型,考慮Acc 值也高達97.8%,模型的識別性能也能滿足熱泵系統的泄漏識別應用要求。RefliefF 特征選擇將原始41 個特征參數縮減至10個,同時保留了絕大部分泄漏相關性信息,主成分提取后選取4 個主元特征用作支持向量機的輸入,泄漏模式的識別結果仍保持在較高的精度水平。精簡的特征參數便于實際設備運行參數的采集,同時降低了數據收集成本,因此經過RefliefF特征選擇后的PCA-SVM 泄漏識別模型更有利于實際應用。
本文以空氣源熱泵系統模擬泄漏、正常、干擾工況實際采集的數據為基礎,結合主成分分析特征提取方法和支持向量機分類模型建立了用于熱泵系統的制冷劑泄漏識別的PCA-SVM 模型;采用RefliefF特征選擇算法對原始特征參數進行篩選,精簡特征參數后的PCA-SVM 模型和特征選擇前的模型對比,研究結論如下。
(1)采用實際制冷劑泄漏進行實驗,相較于采用充注量不足替代制冷劑泄漏的研究更能表現制冷系統發生泄漏的實際熱力學和動力學特征。
(2)建立了用于熱泵熱水系統制冷劑泄漏識別的PCA-SVM 模型,分別在二分類和多分類識別模式下驗證了PCA-SVM 模型的識別精度,在測試集數據驗證中,泄漏識別準確率最高為100%,其中Model-pca5模型在多個診斷識別中性能均最好。
(3)研究了不同故障和泄漏速率對模型的診斷識別性能的影響,在二分類和多分類識別模式下,PCA-SVM 模型對緩慢泄漏工況的識別性能均弱于快速泄漏,干擾故障中蒸發器臟堵工況識別性能最差,上述工況屬于對系統運行影響輕微的故障,PCA-SVM 模型對輕微故障診斷識別性能有待進一步加強。
(4)用RefliefF 特征選擇方式對原始41 個特征參數進行篩選,選擇了蒸發器進出口壓差、壓縮機耗功、壓縮機進出口溫度等10個特征參數用于泄漏識別的數據特征。特征選擇后用相同的PCA-SVM方法進行泄漏識別研究,識別結果也保持在較高的精度水平,在二分類泄漏識別中準確率為97.8%。特征選擇后大大減少了數據特征個數和數據采集成本,識別結果也保持較高精度,因此經過RefliefF特征選擇算法優化的PCA-SVM 模型更有利于熱泵熱水系統的實際應用。
(5)文章的PCA-SVM 模型是在R134a 熱泵熱水系統上采集數據建立的泄漏識別模型,考慮制冷設備以及制冷劑的一般性,該模型后續可在不同制冷劑的設備上驗證普適性。制冷劑泄漏識別研究在可燃制冷劑危險預警、故障檢測診斷、設備維護等方面具有重要的應用前景。