孫 哲 金華強(qiáng) 顧江萍 黃躍進(jìn) 王新雷 鄭愛(ài)武 沈 希③
(*浙江工業(yè)大學(xué)機(jī)械工程學(xué)院 杭州310023)
(**浙江工業(yè)大學(xué)教育科學(xué)與技術(shù)學(xué)院 杭州310023)
(***伊利諾伊大學(xué)香檳校區(qū)農(nóng)業(yè)與生物工程學(xué)院 厄巴納IL61801)
(****加西貝拉壓縮機(jī)有限公司 嘉興314011)
我國(guó)北方推行“煤改電”政策以來(lái),熱泵系統(tǒng)的使用量逐年增加。相關(guān)研究表明,熱泵系統(tǒng)能源消耗約占建筑能耗一半以上[1],而建筑能耗作為用能大戶,在社會(huì)總能耗中占比超過(guò)40%[2]。熱泵系統(tǒng)運(yùn)行故障會(huì)導(dǎo)致其效率降低,造成大量能源浪費(fèi),及時(shí)、準(zhǔn)確地診斷出相關(guān)故障可以最大限度地保證系統(tǒng)高效運(yùn)行,達(dá)到節(jié)約能源的目的。
現(xiàn)階段熱泵系統(tǒng)故障診斷方法逐漸朝著智能化方向發(fā)展,眾多研究提出了一系列基于數(shù)據(jù)驅(qū)動(dòng)和深度學(xué)習(xí)的故障診斷模型,提高了診斷精度。文獻(xiàn)[3]構(gòu)建了深度模型用于空氣源熱泵漸變故障診斷,較好實(shí)現(xiàn)了早期漸變故障的預(yù)警與診斷。文獻(xiàn)[4]基于離散化貝葉斯網(wǎng)絡(luò)診斷制冷機(jī)組,并在ASHRAE RP-1043 數(shù)據(jù)集上驗(yàn)證,得到了較高的診斷精度。文獻(xiàn)[5]利用循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建診斷模型,實(shí)現(xiàn)空氣源熱泵熱水器制冷劑泄漏亞健康的預(yù)警與診斷。文獻(xiàn)[6]對(duì)近年來(lái)建筑能耗智能診斷方法做了相關(guān)綜述,較為詳細(xì)地描述了熱泵系統(tǒng)智能故障診斷的研究現(xiàn)狀。然而這些診斷方法都需要大量的、帶有故障標(biāo)記的訓(xùn)練數(shù)據(jù)實(shí)現(xiàn)模型訓(xùn)練。而在實(shí)際系統(tǒng)中,并沒(méi)有那么多故障數(shù)據(jù),這些數(shù)據(jù)也很難準(zhǔn)確標(biāo)記出故障類型,這一限制成為了智能診斷方法實(shí)際應(yīng)用的瓶頸之一。要想實(shí)現(xiàn)高精度的故障診斷,必須具有充足的、均衡的訓(xùn)練數(shù)據(jù)集,即每種故障都具有足夠的數(shù)據(jù)量。解決辦法之一是利用有限的數(shù)據(jù)量進(jìn)行數(shù)據(jù)擴(kuò)充,生成更多的高度仿真的數(shù)據(jù),從而解決數(shù)據(jù)量不足、數(shù)據(jù)集不均衡的問(wèn)題。因此,如何生成高質(zhì)量的仿真數(shù)據(jù)成為了解決故障診斷實(shí)際應(yīng)用的關(guān)鍵。
近年來(lái)一種新型智能算法——生成對(duì)抗網(wǎng)絡(luò)(generative adversarial networks,GAN),在圖像生成等領(lǐng)域得到了極大的關(guān)注,該算法利用自我博弈的方式高效地學(xué)習(xí)訓(xùn)練數(shù)據(jù)樣本的概率密度分布,并利用學(xué)習(xí)到的參數(shù)生成更多的仿真樣本。這一技術(shù)迅速成為生成模型的主力軍,在數(shù)據(jù)生成質(zhì)量上遠(yuǎn)優(yōu)于其他數(shù)據(jù)生成算法,如自回歸網(wǎng)絡(luò)、變分自編碼等。利用生成對(duì)抗網(wǎng)絡(luò)有望實(shí)現(xiàn)熱泵系統(tǒng)故障數(shù)據(jù)集的擴(kuò)充,進(jìn)而解決智能故障診斷對(duì)數(shù)據(jù)量的依賴問(wèn)題。
一些學(xué)者在相關(guān)領(lǐng)域的數(shù)據(jù)擴(kuò)充方向應(yīng)用GAN 取得了可喜的成果。文獻(xiàn)[7]較早地在生物醫(yī)學(xué)領(lǐng)域應(yīng)用了GAN,實(shí)現(xiàn)人腦核磁共振圖像的生成,解決了生物醫(yī)學(xué)圖像數(shù)據(jù)短缺的問(wèn)題。文獻(xiàn)[8]同樣利用GAN 實(shí)現(xiàn)人腦核磁共振圖像生成,以提高腦部腫瘤智能識(shí)別的精度。文獻(xiàn)[9]將GAN 引入語(yǔ)音識(shí)別領(lǐng)域,利用條件GAN 生成更多的語(yǔ)音數(shù)據(jù),解決帶標(biāo)記的語(yǔ)音數(shù)據(jù)量不足的問(wèn)題。為提高生成數(shù)據(jù)質(zhì)量,將語(yǔ)音數(shù)據(jù)轉(zhuǎn)化到頻域,以降低GAN 的訓(xùn)練難度。文獻(xiàn)[10]利用GAN 實(shí)現(xiàn)圖像數(shù)據(jù)集擴(kuò)充,解決圖像分類研究中因圖像數(shù)據(jù)不足造成的模型表達(dá)能力差的問(wèn)題。文獻(xiàn)[11]將GAN 引入機(jī)械故障診斷領(lǐng)域,利用深度卷積GAN 實(shí)現(xiàn)機(jī)械運(yùn)行數(shù)據(jù)集的擴(kuò)充,解決機(jī)械故障診斷過(guò)程中因數(shù)據(jù)集不均衡導(dǎo)致診斷精度偏低的問(wèn)題。
以上研究雖然證明GAN 在數(shù)據(jù)集擴(kuò)充方面具有一定優(yōu)勢(shì),但尚無(wú)學(xué)者將這一技術(shù)應(yīng)用到熱泵系統(tǒng)故障數(shù)據(jù)集擴(kuò)充方向。熱泵系統(tǒng)故障數(shù)據(jù)相比于其他數(shù)據(jù)有著自身的特點(diǎn)。具體而言,不同故障數(shù)據(jù)間差異非常小,如健康系統(tǒng)的冷凝溫度可能為54.5 ℃,而冷凝器結(jié)垢系統(tǒng)的冷凝溫度可能為55.5 ℃。這種不明顯的差異給不同類別的數(shù)據(jù)生成帶來(lái)了較大難度,其直接的結(jié)果是生成的各種類別數(shù)據(jù)可能相互混淆,無(wú)法達(dá)到提高診斷精度的目的。因此,本文針對(duì)熱泵系統(tǒng)故障數(shù)據(jù)的這一特點(diǎn),提出了利用熱泵基準(zhǔn)模型將運(yùn)行數(shù)據(jù)轉(zhuǎn)化為殘差數(shù)據(jù),并利用GAN 學(xué)習(xí)殘差數(shù)據(jù),從而增大數(shù)據(jù)間的差異性。并針對(duì)GAN 訓(xùn)練困難的問(wèn)題,設(shè)計(jì)了具體可行的超參數(shù)方案和訓(xùn)練方法,實(shí)現(xiàn)了熱泵系統(tǒng)故障數(shù)據(jù)集擴(kuò)充。
生成對(duì)抗網(wǎng)絡(luò)(GAN)于2014 年提出[12],隨后的幾年內(nèi)得到了領(lǐng)域內(nèi)極大的關(guān)注。GAN 通過(guò)對(duì)抗的過(guò)程訓(xùn)練生成模型,包括2 個(gè)神經(jīng)網(wǎng)絡(luò),即判別網(wǎng)絡(luò)和生成網(wǎng)絡(luò)。訓(xùn)練的目標(biāo)是使得生成網(wǎng)絡(luò)G學(xué)習(xí)到真實(shí)數(shù)據(jù)的概率分布。
早期的GAN 使用的全連接神經(jīng)網(wǎng)絡(luò)構(gòu)建生成模型和判別模型。定義一組噪音變量pz(z),并通過(guò)構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò)G(z;θg) 將噪音變量映射到數(shù)據(jù)空間。然后,再構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò)D(x;θd),其輸出為單一的標(biāo)量,表示x屬于真實(shí)數(shù)據(jù)的概率。通過(guò)梯度下降的方式訓(xùn)練判別模型D,使其最大化正確判斷數(shù)據(jù)真實(shí)與否的概率。同時(shí),訓(xùn)練生成模型G,使其最小化log(1-D(G(z)))。以上的訓(xùn)練過(guò)程表示,生成模型G和判別模型D在進(jìn)行二元極大極小博弈,該博弈過(guò)程可以表示為
其中,pdata是真實(shí)數(shù)據(jù)的分布,pz是隱空間的分布。
原始的GAN 存在許多問(wèn)題,包括訓(xùn)練困難、容易發(fā)散等。為提高GAN 的使用性,后續(xù)研究逐漸提出了一系列新的版本,提高了訓(xùn)練穩(wěn)定性,包括Wasserstein GAN[13](WGAN)以及它的改進(jìn)版本W(wǎng)GAN-GP[14]。
WGAN 使用Wasserstein 距離作為損失函數(shù)來(lái)訓(xùn)練GAN,解決了當(dāng)真實(shí)分布與生成分布不存在重疊時(shí)的梯度消失問(wèn)題。Wasserstein 距離的定義如式(2)所示。

其中,∏(Pr,Pg) 是所有以Pr和Pg為邊界的聯(lián)合分布集合。但是這一定義中的infγ ~∏(Pr,Pg)沒(méi)有辦法直接求解,因此將式(2)變換成式(3)的形式。

這里函數(shù)f必須滿足Lipschitz 連續(xù)條件,即‖f‖≤1。為了使其滿足這一條件,WGAN 將判別網(wǎng)絡(luò)D中的參數(shù)限制在[-c,c]之間。
后續(xù)的研究發(fā)現(xiàn)WGAN 有時(shí)同樣會(huì)出現(xiàn)收斂失敗的現(xiàn)象,導(dǎo)致這一現(xiàn)象的原因是強(qiáng)制限制了網(wǎng)絡(luò)參數(shù)范圍以滿足Lipschitz 連續(xù)條件[14]。因此,該項(xiàng)研究提出一種利用梯度懲罰的策略來(lái)代替強(qiáng)制限制,并基于此策略提出了一種新型GAN 變體——WGAN-GP。這一新型結(jié)構(gòu)訓(xùn)練穩(wěn)定、易于收斂,得到了廣泛的應(yīng)用。
評(píng)價(jià)GAN 模型是一項(xiàng)非常具有挑戰(zhàn)性的工作。對(duì)于復(fù)雜的生成數(shù)據(jù),不僅需要評(píng)價(jià)其與真實(shí)數(shù)據(jù)概率分布間的差異,也需要評(píng)價(jià)數(shù)據(jù)自身的多樣性。目前尚沒(méi)有公認(rèn)的權(quán)威評(píng)價(jià)方法。文獻(xiàn)[15]對(duì)常見(jiàn)的GAN 評(píng)價(jià)方法做了詳細(xì)的對(duì)比分析,得出核最大平均差異(kernel maximum mean discrepancy,MMD)和1-最近鄰(1-nearest neighbor,1-NN)指標(biāo)是2 個(gè)非常優(yōu)秀的評(píng)價(jià)指標(biāo),不僅可以用來(lái)區(qū)分真實(shí)對(duì)象和生成樣本,還可以識(shí)別模式丟棄(modedropping)和模式坍塌(modecollapsing),以及檢測(cè)過(guò)擬合。
Kernel MMD 指標(biāo)可以定義為

在一些固定的核函數(shù)K下,MMD 指標(biāo)度量了真實(shí)分布Pr和生成分布Pg之間的差異,兩分布差異越小,則MMD 值越小。文獻(xiàn)[16]提出的parzen窗估計(jì)是MMD 的一種特殊形式。
1-NN 則用于成對(duì)的樣本檢驗(yàn),用于評(píng)估兩分布的相似性。給定兩組樣本,滿足| Sr |=| Sg|,可以計(jì)算在兩分布上訓(xùn)練的1-NN 分類器的LOO(leave-one-out)精度,其中Sr全部標(biāo)記為正樣本,Sg全部標(biāo)記為負(fù)樣本。與其他精度度量不同的是,當(dāng)| Sr|=| Sg|非常大時(shí),LOO 精度應(yīng)服從約為50%的準(zhǔn)確率,當(dāng)兩個(gè)分布相匹配時(shí),即滿足50%的準(zhǔn)確率。當(dāng)LOO 低于50%,則說(shuō)明生成分布過(guò)擬合真實(shí)采樣分布。而當(dāng)LOO 遠(yuǎn)大于50%,甚至接近100%時(shí),說(shuō)明兩分布差異很大。
本文將利用MMD 和1-NN 2 種評(píng)估指標(biāo)對(duì)生成數(shù)據(jù)的質(zhì)量進(jìn)行評(píng)估,判斷其與真實(shí)數(shù)據(jù)分布間的差異大小。
本文研究熱泵系統(tǒng)故障數(shù)據(jù)集擴(kuò)充方法,其目的是在標(biāo)記數(shù)據(jù)不足的情況下提高診斷精度。因此,必須依靠一種診斷方法驗(yàn)證添加生成數(shù)據(jù)后診斷精度的變化。
本文選擇前期提出的研究成果,一種基于深度學(xué)習(xí)的熱泵系統(tǒng)故障診斷方法[3]。該方法首先建立熱泵系統(tǒng)基準(zhǔn)模型,用于計(jì)算健康系統(tǒng)的理論狀態(tài)值,如冷凝溫度、排氣溫度等。然后利用實(shí)測(cè)狀態(tài)值減去理論值,得到殘差數(shù)據(jù)。最后利用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建診斷模型,利用殘差數(shù)據(jù)訓(xùn)練模型,并利用訓(xùn)練完成的模型實(shí)現(xiàn)熱泵系統(tǒng)故障診斷。
本文構(gòu)建兩類訓(xùn)練數(shù)據(jù)集,一類數(shù)據(jù)集只包含真實(shí)數(shù)據(jù),另一類數(shù)據(jù)集則是由真實(shí)數(shù)據(jù)和生成數(shù)據(jù)組成的混合數(shù)據(jù)集,具體數(shù)據(jù)集內(nèi)的數(shù)據(jù)量詳見(jiàn)后文第3.5 節(jié)。
本文利用GAN 學(xué)習(xí)數(shù)據(jù)的分布特性,并生成更多的仿真數(shù)據(jù),用于擴(kuò)充診斷算法的訓(xùn)練數(shù)據(jù)集。如第1.3 節(jié)介紹,本文選用的診斷驗(yàn)證算法先要利用基準(zhǔn)模型獲得熱泵系統(tǒng)的運(yùn)行殘差數(shù)據(jù),后利用殘差數(shù)據(jù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)故障診斷。因此,數(shù)據(jù)集擴(kuò)充方法既可以是擴(kuò)充原始運(yùn)行數(shù)據(jù)集,也可以擴(kuò)充殘差訓(xùn)練數(shù)據(jù)集。擴(kuò)充原始數(shù)據(jù)集也需要利用基準(zhǔn)模型將其轉(zhuǎn)化為殘差數(shù)據(jù)供卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練。
熱泵系統(tǒng)運(yùn)行數(shù)據(jù)和殘差數(shù)據(jù)有著較大的差別。運(yùn)行數(shù)據(jù)是熱泵系統(tǒng)的熱物理參數(shù),如壓縮機(jī)排氣壓力、排氣溫度、冷凝器入口溫度等。隨著熱泵系統(tǒng)運(yùn)行工況的調(diào)整,這些熱物理參數(shù)變化較大,一定程度上覆蓋了因系統(tǒng)故障造成的參數(shù)變化,這些是熱泵系統(tǒng)故障診斷困難的原因之一。直接利用GAN 學(xué)習(xí)運(yùn)行數(shù)據(jù),就需要學(xué)習(xí)到不同故障數(shù)據(jù)間的差異,生成的數(shù)據(jù)也必須包含這些差異,否則無(wú)法達(dá)到提高診斷精度的目的。然而熱泵系統(tǒng)結(jié)構(gòu)復(fù)雜,具有強(qiáng)耦合、大滯后的特性,準(zhǔn)確學(xué)習(xí)運(yùn)行數(shù)據(jù)及故障間的差異具有較大難度。而殘差數(shù)據(jù)則相對(duì)簡(jiǎn)單,所謂殘差是指故障系統(tǒng)與健康系統(tǒng)在相同條件下各個(gè)參數(shù)的差值。在基準(zhǔn)模型精度足夠高的條件下,健康系統(tǒng)的殘差數(shù)據(jù)應(yīng)接近0,不同故障系統(tǒng)的不同參數(shù)殘差各不相同,使得故障數(shù)據(jù)間的差異性明顯。利用GAN 直接學(xué)習(xí)殘差數(shù)據(jù)可以降低學(xué)習(xí)難度,提高數(shù)據(jù)生成質(zhì)量。
但殘差數(shù)據(jù)的生成需要依賴基準(zhǔn)模型,使得生成殘差的同時(shí)引入了基準(zhǔn)模型自身的誤差,模型精度越高,殘差質(zhì)量越好。本文選擇文獻(xiàn)[3]中的基準(zhǔn)建模方法,這種基準(zhǔn)模型融合卷積網(wǎng)絡(luò)、編-解碼器、循環(huán)網(wǎng)絡(luò),可以在熱泵系統(tǒng)工況頻繁遷移的條件下實(shí)現(xiàn)高精度建模,最大限度避免了殘差計(jì)算過(guò)程中的誤差引入。
因WGAN-GP 模型在訓(xùn)練穩(wěn)定性方面的優(yōu)勢(shì),本文以這一模型為基礎(chǔ),利用深度卷積網(wǎng)絡(luò)搭建生成器和判別器,并根據(jù)數(shù)據(jù)集特性對(duì)模型以及參數(shù)設(shè)置進(jìn)行優(yōu)化改進(jìn),最終實(shí)現(xiàn)高質(zhì)量的數(shù)據(jù)生成。
算法主要包括2 個(gè)部分:(1) 生成網(wǎng)絡(luò)G,采用上采樣深度卷積網(wǎng)絡(luò);(2) 判別網(wǎng)絡(luò)D,采用下采樣深度卷積網(wǎng)絡(luò)。
生成網(wǎng)絡(luò)G的作用是接收輸入的噪音數(shù)據(jù),利用網(wǎng)絡(luò)前向傳播算法生成數(shù)據(jù)樣本,數(shù)據(jù)結(jié)構(gòu)為二維矩陣結(jié)構(gòu)。生成網(wǎng)絡(luò)G的訓(xùn)練目的是學(xué)習(xí)從噪音隱空間到樣本數(shù)據(jù)x的映射關(guān)系。生成網(wǎng)絡(luò)G的損失函數(shù)表示為式(5),pg表示生成數(shù)據(jù)的分布。從損失函數(shù)可以看出,其計(jì)算值與判別器的診斷結(jié)果相關(guān),這也是生成對(duì)抗兩個(gè)過(guò)程不可分割的地方。

判別網(wǎng)絡(luò)D的作用是接收真實(shí)數(shù)據(jù)樣本和生成數(shù)據(jù)樣本,利用網(wǎng)絡(luò)前向傳播算法最終給出數(shù)據(jù)是否屬于真實(shí)數(shù)據(jù)的二元概率值,取概率較高的標(biāo)簽為最終判定值。判別網(wǎng)絡(luò)D和生成網(wǎng)絡(luò)G是在相互對(duì)抗的狀態(tài)下完成訓(xùn)練的,判別網(wǎng)絡(luò)G的損失函數(shù)表示為

其中,pr表示真實(shí)數(shù)據(jù)的分布,p^ω表示真假數(shù)據(jù)間的抽樣數(shù)據(jù)的分布。生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)在對(duì)抗學(xué)習(xí)中共同提高,最終使生成網(wǎng)絡(luò)G可以生成概率分布非常接近真實(shí)數(shù)據(jù)分布的樣本數(shù)據(jù)。
生成網(wǎng)絡(luò)的目的是生成接近真實(shí)數(shù)據(jù)分布的高質(zhì)量數(shù)據(jù),用來(lái)迷惑判別網(wǎng)絡(luò)。而判別網(wǎng)絡(luò)則不斷優(yōu)化使得可以準(zhǔn)確區(qū)分生成數(shù)據(jù)和真實(shí)數(shù)據(jù)。在這樣一種對(duì)抗訓(xùn)練過(guò)程中,兩個(gè)網(wǎng)絡(luò)共同優(yōu)化,最終使得生成網(wǎng)絡(luò)可以生成非常接近真實(shí)數(shù)據(jù)的樣本。為提高生成數(shù)據(jù)的質(zhì)量,每個(gè)GAN 模型只生成一種故障數(shù)據(jù),多個(gè)GAN 模型共同實(shí)現(xiàn)故障數(shù)據(jù)集的擴(kuò)充。具體的GAN 算法構(gòu)架見(jiàn)圖1,運(yùn)行數(shù)據(jù)先由基準(zhǔn)模型轉(zhuǎn)化為殘差數(shù)據(jù),而生成網(wǎng)絡(luò)則直接由噪音數(shù)據(jù)生成殘差數(shù)據(jù)。兩種殘差數(shù)據(jù)混合在一起輸入判別網(wǎng)絡(luò),作為訓(xùn)練數(shù)據(jù)優(yōu)化判別網(wǎng)絡(luò),使其可以更好地區(qū)分真實(shí)數(shù)據(jù)和生成數(shù)據(jù)。生成網(wǎng)絡(luò)的訓(xùn)練則需要結(jié)合判別網(wǎng)絡(luò),將判別網(wǎng)絡(luò)的參數(shù)固定使其不能優(yōu)化,生成網(wǎng)絡(luò)不斷生成新的數(shù)據(jù)并將其標(biāo)記成真實(shí)數(shù)據(jù),利用判別網(wǎng)絡(luò)診斷并計(jì)算損失值,利用反向傳播算法優(yōu)化生成網(wǎng)絡(luò)。如此往復(fù)實(shí)現(xiàn)持續(xù)的對(duì)抗優(yōu)化,直到訓(xùn)練輪數(shù)結(jié)束。

圖1 GAN 算法構(gòu)架
GAN 模型訓(xùn)練困難,在現(xiàn)有模型基本結(jié)構(gòu)的基礎(chǔ)上需通過(guò)調(diào)節(jié)具體參數(shù)實(shí)現(xiàn)訓(xùn)練收斂,因此一些參數(shù)調(diào)整方面的優(yōu)化對(duì)任務(wù)的實(shí)現(xiàn)具有重要作用。近年來(lái),許多學(xué)者相繼提出了一系列GAN的訓(xùn)練技巧,給GAN 的實(shí)際應(yīng)用帶來(lái)了幫助,如NIPS2016 以及ICCV2017 上SoumithChintala 總結(jié)的GAN 訓(xùn)練技巧。本文結(jié)合相關(guān)研究?jī)?nèi)容,根據(jù)自身研究特點(diǎn),使用如下訓(xùn)練技巧。
(1) 除生成器第一層和判別器最后一層外,不使用全連接神經(jīng)網(wǎng)絡(luò)。
(2) 生成器激活函數(shù)選擇方面,除最后一層外,均使用rule 函數(shù)。最后一層根據(jù)數(shù)據(jù)的歸一情況,若范圍為[-1,1]則使用tanh 函數(shù),若為[0,1]則使用sigmoid 函數(shù)。
(3)判別器激活函數(shù)選擇情況,除最后一層外,均使用leakyrelu 激活函數(shù)。最后一層根據(jù)數(shù)據(jù)真?zhèn)螛?biāo)記法決定,若為傳統(tǒng)GAN 標(biāo)記法,即fake 數(shù)據(jù)標(biāo)記為1,valid 數(shù)據(jù)標(biāo)記為0,則使用sigmoid 函數(shù);若使用帶有梯度懲罰(gradient penalty)的標(biāo)記法,即fake 為1,valid 為-1,dummy 為0,則使用tanh 函數(shù)。
(4)數(shù)據(jù)真?zhèn)蔚臉?biāo)記使用軟標(biāo)簽,即不要簡(jiǎn)單地使用1 或者-1 來(lái)表示,而是添加[0,0.1]的隨機(jī)噪音,將標(biāo)記改為[-1,-0.9]以及[0.9,1]之間的隨機(jī)數(shù)。
(5)在生成每一層卷積層之后,添加一層batchnormalization(BN)層。
(6)若使用WAGN-GP 模型,在判別器中不要使用batchnormalization 層。
(7)無(wú)論是生成器還是判別器,卷積核的數(shù)據(jù)應(yīng)比較多,本文實(shí)驗(yàn)中,使用的最大卷積核數(shù)量達(dá)到了256。
(8)無(wú)論是生成器還是判別器,均不使用池化層。
(9)判別器不使用太深的卷積網(wǎng)絡(luò),通常2~3層的深度最好,太深的判別器范圍診斷效果不好。
(10)每訓(xùn)練一輪生成器,通常需要訓(xùn)練n次判別器,本文設(shè)置n=3。
本文所用GAN 模型的生成器和判別器均使用深度卷積網(wǎng)絡(luò),具體結(jié)構(gòu)參數(shù)見(jiàn)表1 和表2。利用以上訓(xùn)練技巧和優(yōu)化的參數(shù),可以實(shí)現(xiàn)熱泵系統(tǒng)殘差數(shù)據(jù)的高質(zhì)量生成。

表1 生成器網(wǎng)絡(luò)結(jié)構(gòu)

表2 判別器網(wǎng)絡(luò)結(jié)構(gòu)
本文實(shí)驗(yàn)數(shù)據(jù)來(lái)自項(xiàng)目組搭建的熱泵系統(tǒng)故障診斷實(shí)驗(yàn)平臺(tái),平臺(tái)可以分成3 個(gè)子系統(tǒng),即熱泵子系統(tǒng)、電氣子系統(tǒng)和軟件子系統(tǒng),其結(jié)構(gòu)原理見(jiàn)圖2。

圖2 實(shí)驗(yàn)平臺(tái)結(jié)構(gòu)圖
熱泵子系統(tǒng)的詳細(xì)介紹見(jiàn)表3,冷媒選擇R134A。電氣子系統(tǒng)包括數(shù)據(jù)采集、機(jī)構(gòu)控制和DA輸出。數(shù)據(jù)采集系統(tǒng)采用研華數(shù)據(jù)采集系統(tǒng)。軟件子系統(tǒng)采用LabVIEW2018 編程。每間隔30 s 進(jìn)行一次運(yùn)行數(shù)據(jù)采集,采集完畢的數(shù)據(jù)存儲(chǔ)在MySQL數(shù)據(jù)庫(kù)。

表3 熱泵子系統(tǒng)介紹
實(shí)驗(yàn)平臺(tái)可實(shí)現(xiàn)8 種系統(tǒng)狀態(tài)模擬,包括健康狀態(tài)、冷凝器結(jié)垢、蒸發(fā)器結(jié)垢、制冷劑泄漏、冷凝器蒸發(fā)器同時(shí)結(jié)垢、冷凝器結(jié)垢且制冷劑泄漏、蒸發(fā)器結(jié)垢且制冷劑泄漏和冷凝器蒸發(fā)器結(jié)垢且制冷劑泄漏。采集的數(shù)據(jù)參數(shù)見(jiàn)表4。

表4 采集數(shù)據(jù)變量
GAN 訓(xùn)練需要利用一定數(shù)量的真實(shí)數(shù)據(jù),實(shí)驗(yàn)中對(duì)每類故障單獨(dú)訓(xùn)練。每類故障選擇500 組樣本構(gòu)成訓(xùn)練集,batchsize 設(shè)置為200,共訓(xùn)練10 萬(wàn)輪。每完成1000 輪,對(duì)生成模型進(jìn)行保存,并利用生成模型生成一批數(shù)據(jù),用于GAN 模型質(zhì)量的評(píng)估。
本文提出利用GAN 直接學(xué)習(xí)殘差數(shù)據(jù)代替學(xué)習(xí)原始運(yùn)行數(shù)據(jù),以此用來(lái)降低GAN 訓(xùn)練難度。為驗(yàn)證這一方法的有效性,在GAN 訓(xùn)練中分別讓其學(xué)習(xí)殘差數(shù)據(jù)和原始數(shù)據(jù),并對(duì)生成的數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估。
算法利用Python 3.6 編程,開(kāi)發(fā)環(huán)境使用Pycharm 2017 版本。深度學(xué)習(xí)框架使用Keras 2.2.4,這是一種成熟的深度學(xué)習(xí)頂層封裝框架,其底層使用TensorFlow 運(yùn)算,最新版的TensorFlow 框架已經(jīng)融合Keras。
硬件環(huán)境為一臺(tái)圖形工作站,CPU 為Intel Xeon E5-1650 v3,GPU 為NVIDIA Quadro K2200,工作站內(nèi)存為16 GB,操作系統(tǒng)為Windows 7 X64,訓(xùn)練算法運(yùn)行在GPU 上。
為驗(yàn)證GAN 生成數(shù)據(jù)的質(zhì)量,本節(jié)利用MMD指標(biāo)對(duì)生成數(shù)據(jù)與真實(shí)數(shù)據(jù)間分布差異進(jìn)行評(píng)估。本文提出利用GAN 模型學(xué)習(xí)熱泵系統(tǒng)殘差數(shù)據(jù)代替原始數(shù)據(jù),用于提高數(shù)據(jù)生成質(zhì)量。因此,本節(jié)利用MMD 分別評(píng)估兩種GAN 模型生成數(shù)據(jù)(原始生成數(shù)據(jù)和殘差生成數(shù)據(jù))的質(zhì)量,用于驗(yàn)證利用殘差數(shù)據(jù)訓(xùn)練GAN 的有效性。MMD 指標(biāo)是考量?jī)山M數(shù)據(jù)分布差異的一種方法,MMD 值越小,兩組分布差異越小,可以用來(lái)驗(yàn)證生成數(shù)據(jù)和真實(shí)數(shù)據(jù)的接近程度。
本節(jié)對(duì)實(shí)驗(yàn)不同訓(xùn)練輪數(shù)對(duì)應(yīng)的生成數(shù)據(jù)進(jìn)行MMD 分析,對(duì)比原始數(shù)據(jù)生成實(shí)驗(yàn)和殘差數(shù)據(jù)生成實(shí)驗(yàn)在相同訓(xùn)練輪數(shù)時(shí)生成數(shù)據(jù)的質(zhì)量,實(shí)驗(yàn)結(jié)果見(jiàn)圖3。圖中展示了兩組GAN 訓(xùn)練實(shí)驗(yàn)中各類故障生成數(shù)據(jù)隨訓(xùn)練輪數(shù)增加MMD 評(píng)分的變化。其中,health 表示健康系統(tǒng)數(shù)據(jù)、co 表示冷凝器結(jié)垢故障、ev 表示蒸發(fā)器結(jié)垢故障、re 表示制冷劑泄漏故障、c_e 表示蒸發(fā)器結(jié)垢冷凝器結(jié)垢故障、r_c表示冷凝器結(jié)垢制冷劑泄漏故障、r_e 表示蒸發(fā)器結(jié)垢制冷劑泄漏故障、r_c_e 表示蒸發(fā)器結(jié)垢冷凝器結(jié)垢制冷劑泄漏故障。
兩組實(shí)驗(yàn)均進(jìn)行10 萬(wàn)輪的對(duì)抗訓(xùn)練。由圖3可知,隨著訓(xùn)練輪數(shù)的增加,所有故障生成數(shù)據(jù)的MMD 值均呈現(xiàn)下降趨勢(shì),說(shuō)明對(duì)抗生成訓(xùn)練持續(xù)優(yōu)化,證明前文所描述的GAN 網(wǎng)絡(luò)結(jié)構(gòu)及其超參數(shù)設(shè)定是可行的。對(duì)比不同故障數(shù)據(jù),原始數(shù)據(jù)生成實(shí)驗(yàn)中的健康生成數(shù)據(jù)的MMD 值相比于其他數(shù)據(jù)偏低,但仍然呈現(xiàn)下降趨勢(shì),在訓(xùn)練輪數(shù)接近10 萬(wàn)輪時(shí),MMD 值約為0.32,屬于可接受范圍,其他故障生成數(shù)據(jù)的質(zhì)量則更高。對(duì)比原始數(shù)據(jù)生成實(shí)驗(yàn)和殘差數(shù)據(jù)生成實(shí)驗(yàn),發(fā)現(xiàn)殘差數(shù)據(jù)生成實(shí)驗(yàn)的MMD值普遍低于原始數(shù)據(jù)生成實(shí)驗(yàn),數(shù)據(jù)質(zhì)量更加接近真實(shí)數(shù)據(jù),造成這一現(xiàn)象的主要原因在于數(shù)據(jù)自身的差異性。原始數(shù)據(jù)不同故障以及不同時(shí)刻下數(shù)據(jù)自身差異性較小,例如,冷凝器結(jié)垢亞健康和健康系統(tǒng)對(duì)比,冷凝溫度變化幅度小于2 ℃,而冷凝溫度的基數(shù)約為55 ℃,波動(dòng)比例約為4%。而相對(duì)于殘差數(shù)據(jù),冷凝器結(jié)垢故障和健康系統(tǒng)對(duì)比,前者的冷凝溫度殘差約為-0.2 ℃,而后者的冷凝溫度殘差在[-0.01,0.01]之間,波動(dòng)比例超過(guò)20 倍。這一現(xiàn)象說(shuō)明不同時(shí)刻以及不同健康程度下,殘差數(shù)據(jù)的差異性更加明顯,使得GAN 生成數(shù)據(jù)更加容易。
從圖3 可以得出結(jié)論,殘差數(shù)據(jù)生成實(shí)驗(yàn)的數(shù)據(jù)相比于原始數(shù)據(jù)生成實(shí)驗(yàn)質(zhì)量更優(yōu)。接下來(lái)對(duì)10 萬(wàn)輪訓(xùn)練完畢的數(shù)據(jù)進(jìn)行交叉驗(yàn)證,即分析不同故障數(shù)據(jù)間的MMD 值,用于驗(yàn)證生成數(shù)據(jù)對(duì)不同故障標(biāo)簽的區(qū)分程度。

圖3 基于MMD 指標(biāo)的評(píng)估結(jié)果對(duì)比圖
對(duì)于真實(shí)數(shù)據(jù)而言,同一故障類別的數(shù)據(jù)分布相同,MMD 值較低;而不同故障類別的數(shù)據(jù)分布不同,MMD 值較高。系統(tǒng)生成數(shù)據(jù)也符合這一情況。表5 展示了原始數(shù)據(jù)生成實(shí)驗(yàn)的MMD 指標(biāo)交叉驗(yàn)證數(shù)據(jù)。從表中可以看出,相同類別的生成數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的MMD 值明顯低于不同類別的MMD 值。證明生成的數(shù)據(jù)分布跟對(duì)應(yīng)類別的真實(shí)數(shù)據(jù)分布接近,跟不同類別的真實(shí)數(shù)據(jù)分布差異較大。

表5 原始數(shù)據(jù)生成實(shí)驗(yàn)MMD 交叉驗(yàn)證表
同樣地,表6 展示了殘差數(shù)據(jù)生成實(shí)驗(yàn)的MMD交叉驗(yàn)證數(shù)據(jù)。與原始數(shù)據(jù)生成實(shí)驗(yàn)相同,殘差數(shù)據(jù)生成實(shí)驗(yàn)中,相同類別的生成數(shù)據(jù)和真實(shí)數(shù)據(jù)MMD 值較低,不同類別的生成數(shù)據(jù)和真實(shí)數(shù)據(jù)MMD 值較高。且同一類別的MMD 值普遍比對(duì)應(yīng)的原始數(shù)據(jù)生成實(shí)驗(yàn)的MMD 值低,再次證明了殘差數(shù)據(jù)生成實(shí)驗(yàn)的優(yōu)勢(shì)。

表6 殘差數(shù)據(jù)生成實(shí)驗(yàn)MMD 交叉驗(yàn)證表
通過(guò)利用MMD 指標(biāo)對(duì)兩組實(shí)驗(yàn)進(jìn)行驗(yàn)證分析發(fā)現(xiàn),無(wú)論是不同訓(xùn)練輪數(shù)下的MMD 值還是交叉驗(yàn)證的MMD 值,殘差數(shù)據(jù)生成實(shí)驗(yàn)的生成質(zhì)量均優(yōu)于原始數(shù)據(jù)生成實(shí)驗(yàn)。因此,從MMD 評(píng)分的角度來(lái)看,利用殘差數(shù)據(jù)生成是一種更優(yōu)的方法。
GAN 模型質(zhì)量評(píng)估尚處于開(kāi)放研究狀態(tài),沒(méi)有一種權(quán)威的指標(biāo)可以全面評(píng)價(jià)生成數(shù)據(jù)的質(zhì)量。為更加準(zhǔn)確地評(píng)估實(shí)驗(yàn)結(jié)果,本文利用MMD 指標(biāo)的同時(shí)使用1-NN 指標(biāo)再次評(píng)估,并綜合評(píng)估結(jié)果進(jìn)行分析,以期得出更加真實(shí)的結(jié)論。1-NN 指標(biāo)與MMD 不同,前者的理想值是0.5,在[0.5,1]之間時(shí),值越低越好,但是低于0.5 則說(shuō)明生成數(shù)據(jù)存在過(guò)擬合。
利用評(píng)估指標(biāo)對(duì)不同訓(xùn)練輪數(shù)的GAN 生成數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估,并將評(píng)估結(jié)果列于圖4。從圖中可以看出,原始數(shù)據(jù)生成實(shí)驗(yàn)的結(jié)果并不理想,隨著訓(xùn)練輪數(shù)的增加,部分故障數(shù)據(jù)的1-NN 值存在上升情況,而其他故障數(shù)據(jù)也沒(méi)有表現(xiàn)出良好的單調(diào)性。在訓(xùn)練2 萬(wàn)輪之后,數(shù)據(jù)的1-NN 值基本穩(wěn)定,對(duì)抗訓(xùn)練不再能夠繼續(xù)優(yōu)化。而殘差數(shù)據(jù)訓(xùn)練實(shí)驗(yàn)中,雖然下降幅度也不太明顯,但整體1-NN 值較原始數(shù)據(jù)生成實(shí)驗(yàn)的更低,更加接近0.5 的理想狀態(tài)。說(shuō)明殘差數(shù)據(jù)生成實(shí)驗(yàn)?zāi)芨玫財(cái)M合真實(shí)數(shù)據(jù)分布,數(shù)據(jù)質(zhì)量更高。產(chǎn)生這一現(xiàn)象的原因是殘差數(shù)據(jù)自身更加明顯的差異性導(dǎo)致的,這一差異性降低了模型的學(xué)習(xí)難度。

圖4 基于1-NN 指標(biāo)的評(píng)估結(jié)果對(duì)比圖
對(duì)10 萬(wàn)輪訓(xùn)練完畢的數(shù)據(jù)進(jìn)行交叉驗(yàn)證,分析不同故障數(shù)據(jù)間的1-NN 值,驗(yàn)證不同故障標(biāo)簽生成數(shù)據(jù)的區(qū)分程度。表7 展示了原始數(shù)據(jù)生成實(shí)驗(yàn)的1-NN 指標(biāo)交叉驗(yàn)證數(shù)據(jù)。從表中可以看出,相同類別的生成數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的1-NN 值明顯低于不同類別的1-NN 值。證明生成的數(shù)據(jù)分布跟對(duì)應(yīng)類別的真實(shí)數(shù)據(jù)分布接近,而跟不同類別的真實(shí)數(shù)據(jù)分布差異較大。同時(shí)發(fā)現(xiàn),同類別的數(shù)據(jù)的1-NN 值均大于0.75,證明生成數(shù)據(jù)質(zhì)量不是很理想。

表7 原始數(shù)據(jù)生成實(shí)驗(yàn)1-NN 交叉驗(yàn)證表
表8 展示了殘差數(shù)據(jù)生成實(shí)驗(yàn)的1-NN 指標(biāo)交叉驗(yàn)證數(shù)據(jù)。從表中看出,同樣是相同類別的生成數(shù)據(jù)的1-NN 值較低,不同類別的1-NN 值較高,證明GAN 模型可以針對(duì)不同類型數(shù)據(jù)進(jìn)行區(qū)分生成。觀察同類別的1-NN 值發(fā)現(xiàn)平均在[0.58,0.7]之間,優(yōu)于原始數(shù)據(jù)生成實(shí)驗(yàn),再次證明殘差數(shù)據(jù)生成方式的優(yōu)勢(shì)。

表8 殘差數(shù)據(jù)生成實(shí)驗(yàn)1-NN 交叉驗(yàn)證表
經(jīng)過(guò)1-NN 指標(biāo)的驗(yàn)證,可以得出同樣的結(jié)論。利用殘差數(shù)據(jù)生成方法實(shí)現(xiàn)數(shù)據(jù)集擴(kuò)充,得到的數(shù)據(jù)質(zhì)量更高,更加接近真實(shí)分布。
第3.3 節(jié)和第3.4 節(jié)中分別利用MMD 指標(biāo)和1-NN 指標(biāo)對(duì)生成數(shù)據(jù)與真實(shí)數(shù)據(jù)分布間的差異進(jìn)行了評(píng)估,證明利用GAN 生成的數(shù)據(jù)與真實(shí)數(shù)據(jù)分布相近,且殘差生成實(shí)驗(yàn)的質(zhì)量更高。本文研究數(shù)據(jù)集擴(kuò)充的目的是提高熱泵系統(tǒng)故障診斷精度,因此有必要進(jìn)一步利用診斷方法驗(yàn)證添加生成數(shù)據(jù)對(duì)最終診斷精度的影響。
本節(jié)共設(shè)計(jì)兩組實(shí)驗(yàn)從兩個(gè)維度驗(yàn)證生成數(shù)據(jù)添加對(duì)診斷精度的影響。每組實(shí)驗(yàn)中又分為利用原始數(shù)據(jù)生成實(shí)驗(yàn)數(shù)據(jù)和殘差數(shù)據(jù)生成實(shí)驗(yàn)數(shù)據(jù)進(jìn)行驗(yàn)證的兩類。
實(shí)驗(yàn)1 中訓(xùn)練數(shù)據(jù)集包含8 類故障數(shù)據(jù)子集,每類故障數(shù)據(jù)子集均包含500 組真實(shí)數(shù)據(jù)樣本,以及一定數(shù)量的生成數(shù)據(jù)樣本。按每類生成數(shù)據(jù)樣本的添加量不同,分別構(gòu)成5 個(gè)混合訓(xùn)練數(shù)據(jù)集,包含的每類生成數(shù)據(jù)樣本分別為0 組、500 組、1000 組、1500 組、2000 組。訓(xùn)練的參數(shù)設(shè)置及訓(xùn)練輪數(shù)參考文獻(xiàn)[3]中設(shè)置。訓(xùn)練完成的模型利用未參與訓(xùn)練的測(cè)試數(shù)據(jù)集測(cè)試診斷精度,測(cè)試數(shù)據(jù)集包含8 類真實(shí)故障數(shù)據(jù),每類2000 組樣本,實(shí)驗(yàn)結(jié)果見(jiàn)圖5。可以看出,隨著生成數(shù)據(jù)數(shù)量的增加,整體診斷準(zhǔn)確率呈現(xiàn)先增加后減少。在真實(shí)數(shù)據(jù)和生成數(shù)據(jù)比例為1 ∶1 時(shí),整體診斷準(zhǔn)確率最高。同時(shí)發(fā)現(xiàn),在訓(xùn)練數(shù)據(jù)量較低時(shí),即便全部是真實(shí)數(shù)據(jù),診斷準(zhǔn)確率也非常低。對(duì)比原始數(shù)據(jù)生成實(shí)驗(yàn)和殘差數(shù)據(jù)生成實(shí)驗(yàn)發(fā)現(xiàn),利用生成的殘差數(shù)據(jù)擴(kuò)充訓(xùn)練數(shù)據(jù),其診斷準(zhǔn)確率的提高效果遠(yuǎn)高于原始數(shù)據(jù)擴(kuò)充的效果。隨著生成數(shù)據(jù)的不斷增加,整體準(zhǔn)確率會(huì)出現(xiàn)少量下降,說(shuō)明數(shù)據(jù)生成質(zhì)量依然存在干擾,不斷增加生成數(shù)據(jù)的同時(shí)引入了干擾項(xiàng)。

圖5 固定真實(shí)數(shù)據(jù)量的診斷驗(yàn)證實(shí)驗(yàn)
實(shí)驗(yàn)2 的設(shè)計(jì)與實(shí)驗(yàn)1 類似,不同之處在于混合訓(xùn)練數(shù)據(jù)集中每類故障數(shù)據(jù)量固定為2000 組,其中真實(shí)數(shù)據(jù)與生成數(shù)據(jù)按4 ∶0、3 ∶1、1 ∶1、1 ∶3、0 ∶4 的5 種比例組合,構(gòu)成5 個(gè)不同的訓(xùn)練數(shù)據(jù)集。同樣利用每類2000 組未參與訓(xùn)練的真實(shí)數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果見(jiàn)圖6。可以看出,原始數(shù)據(jù)生成實(shí)驗(yàn)中,隨著真實(shí)數(shù)據(jù)比例的降低,整體診斷精度下降,說(shuō)明利用生成數(shù)據(jù)代替真實(shí)數(shù)據(jù)會(huì)在一定程度上犧牲準(zhǔn)確率。而殘差數(shù)據(jù)生成實(shí)驗(yàn)中,隨著真實(shí)數(shù)據(jù)比例的降低,整體診斷精度下降并不明顯,僅在全部使用生成數(shù)據(jù)訓(xùn)練時(shí)存在明顯的準(zhǔn)確率下降。

圖6 固定總體數(shù)據(jù)量的診斷驗(yàn)證實(shí)驗(yàn)
以上兩組實(shí)驗(yàn)說(shuō)明,利用GAN 進(jìn)行數(shù)據(jù)集擴(kuò)充是具有一定意義的。在數(shù)據(jù)量有限的情況下,利用生成數(shù)據(jù)增加訓(xùn)練數(shù)據(jù)量可以達(dá)到提高診斷精度的目的。而對(duì)比原始數(shù)據(jù)生成實(shí)驗(yàn)和殘差數(shù)據(jù)生成實(shí)驗(yàn)發(fā)現(xiàn),殘差數(shù)據(jù)生成實(shí)驗(yàn)的效果明顯優(yōu)于原始數(shù)據(jù)生成實(shí)驗(yàn),這一結(jié)論與第3.3 節(jié)和第3.4 節(jié)的結(jié)論是一致的。
隨著近年來(lái)深度學(xué)習(xí)的迅速發(fā)展,越來(lái)越多的熱泵故障診斷方法引入深度學(xué)習(xí)技術(shù),得到了很好的效果。但基于深度學(xué)習(xí)的故障診斷依賴大量帶有標(biāo)記的故障數(shù)據(jù),而實(shí)際上熱泵系統(tǒng)的故障數(shù)據(jù)非常難獲取,給深度學(xué)習(xí)的應(yīng)用帶來(lái)困難。本文提出利用新興的智能算法——生成對(duì)抗網(wǎng)絡(luò)(GAN),實(shí)現(xiàn)熱泵系統(tǒng)故障數(shù)據(jù)集的擴(kuò)充,解決訓(xùn)練數(shù)據(jù)不足、數(shù)據(jù)集不均衡等問(wèn)題。文章的主要工作及貢獻(xiàn)總結(jié)如下。
(1)針對(duì)熱泵系統(tǒng)運(yùn)行數(shù)據(jù)間差異較小且復(fù)雜度高的問(wèn)題,提出利用熱泵系統(tǒng)基準(zhǔn)模型將運(yùn)行數(shù)據(jù)轉(zhuǎn)化成殘差數(shù)據(jù),增大數(shù)據(jù)間差異化,降低數(shù)據(jù)復(fù)雜度。利用GAN 學(xué)習(xí)殘差數(shù)據(jù)的分布,將生成的殘差數(shù)據(jù)用于故障分類器的訓(xùn)練,實(shí)現(xiàn)故障診斷精度的提高。
(2)針對(duì)GAN 模型訓(xùn)練困難、易出現(xiàn)模式坍塌等問(wèn)題,提出一系列訓(xùn)練技巧來(lái)提高模型訓(xùn)練穩(wěn)定性。并針對(duì)熱泵數(shù)據(jù)自身特點(diǎn),設(shè)計(jì)并優(yōu)化的GAN模型中生成器和判別器的結(jié)構(gòu)參數(shù),真正實(shí)現(xiàn)穩(wěn)定、高效的故障數(shù)據(jù)集擴(kuò)充。
(3)為驗(yàn)證生成數(shù)據(jù)和真實(shí)數(shù)據(jù)間的分布差異,利用MMD 和1-NN 指標(biāo)對(duì)生成數(shù)據(jù)進(jìn)行驗(yàn)證。結(jié)果顯示,隨著GAN 訓(xùn)練輪數(shù)的增加,MMD 和1-NN指標(biāo)均呈現(xiàn)下降趨勢(shì),證明訓(xùn)練過(guò)程處于持續(xù)優(yōu)化。利用交叉驗(yàn)證,同類故障數(shù)據(jù)間的MMD 和1-NN 指標(biāo)均遠(yuǎn)小于不同類別的指標(biāo)值,證明GAN 可以準(zhǔn)確區(qū)分故障類別。同時(shí),利用殘差數(shù)據(jù)訓(xùn)練的GAN 模型在兩類指標(biāo)上均優(yōu)于原始數(shù)據(jù)訓(xùn)練的模型,證明利用殘差數(shù)據(jù)訓(xùn)練GAN 是一種有效的優(yōu)化方法。
(4)利用診斷方法對(duì)引入生成數(shù)據(jù)的診斷實(shí)驗(yàn)進(jìn)行驗(yàn)證。在含有固定500 組真實(shí)樣本的驗(yàn)證實(shí)驗(yàn)中,隨著生成數(shù)據(jù)數(shù)量的增加,診斷精度先提高后輕微降低,在真實(shí)數(shù)據(jù)和生成數(shù)據(jù)量為1 ∶1 時(shí),診斷精度最高。在固定2000 組樣本總量的驗(yàn)證實(shí)驗(yàn)中,隨著生成數(shù)據(jù)比例的增加,診斷精度輕微下降,但并不明顯,僅在全部使用生成數(shù)據(jù)時(shí)精度明顯下降。證明基于GAN 的數(shù)據(jù)擴(kuò)充對(duì)診斷精度的提高具有積極意義。
綜上所述,本文提出的熱泵系統(tǒng)故障數(shù)據(jù)集擴(kuò)充方法對(duì)數(shù)據(jù)不足情況下的故障診斷精度具有明顯的優(yōu)化效果,可一定程度上降低對(duì)標(biāo)記數(shù)據(jù)的依賴,擴(kuò)大智能診斷方法的應(yīng)用范圍,是一種應(yīng)用前景廣闊的方法。而作為數(shù)據(jù)生成質(zhì)量的重要保證,生成模型評(píng)價(jià)方法至關(guān)重要,目前尚無(wú)成熟評(píng)價(jià)體系,因此可作為未來(lái)研究方向之一,嘗試構(gòu)建從距離分布、多樣性以及熱泵數(shù)據(jù)獨(dú)有特性保留程度等多方面綜合評(píng)價(jià)的體系,實(shí)現(xiàn)更為全面的生成模型質(zhì)量評(píng)估。