孫全勝
(中石化股份公司天津分公司裝備研究院)
工業加熱爐是煉化裝置的重要設備,其安全運行直接影響裝置的長周期生產和企業的經濟效益。 焦化爐、常減壓爐等工藝介質屬于易結焦介質,在運行過程中,常因燃燒狀況不好使得爐管受熱不均,出現局部超溫的現象。 如果工業加熱爐長時間運行在超溫狀態, 將會導致爐管結焦、開裂、鼓脹變形甚至爆管。 因此,必須采取措施減小熱強度的不均勻性。 但工業加熱爐燃燒過程具有瞬態變化、隨機湍流等特征,給溫度分布的測量帶來困難, 導致燃燒調整沒有可靠依據。目前, 大多采用基于成像裝置 (Charge Coupled Device,CCD)的攝像機作為二維輻射能量分布傳感器,但該類攝像機價格高,經濟性不強。
傳統工業加熱爐的爐溫通常只能通過傳感器或成像裝置獲得,價格高昂。 隨著計算機技術的進步,機器學習算法,包括基于BP神經網絡的方法、基于模糊最小二乘支持向量機等被應用到爐溫預測中,但是預測能力有限;人工智能興起后,深度學習算法,包括粒子群神經網絡[1,2]、基于卷積神經網絡的算法也被應用到工業領域,但大部分都是基于時間序列的預測方法,對于短期數據進行的實時預測效果不佳,因此并沒有得到廣泛推廣。
筆者的研究是將深度學習方法應用于工業加熱爐溫度場的預測。 生成對抗網絡(Generative Adversarial Nets,GAN)是一種具有強大數據生成能力的深度學習模型[3],在數據增強、圖片生成等領域應用廣泛[4,5]。 本研究中,筆者研究選用信息最大化生成對抗網絡 (Information Maximizing Generative Adversarial Nets,infoGAN)作為基礎算法框架,同時選取結合最優傳輸距離生成對抗網絡 (Wasserstein Generative Adversarial Nets,WGAN)的損失函數代替原有損失。利用工況數據和計算流體動力學 (Computational Fluid Dynamics,CFD)仿真得到的溫度場數據作為訓練算例進行有監督訓練, 并且將結果用Matlab進行可視化,實現任意爐膛截面和爐管表面溫度場云圖的實時三維顯示。
infoGAN由生成器、 鑒別器和分類器組成[6],網絡結構如圖1所示, 其中,c′為分類器判斷出的隱含編碼。 隨機噪聲向量z是生成器的輸入,生成器的作用是生成盡可能接近訓練樣本的假樣本以欺騙鑒別器;鑒別器則通過比較訓練的樣本數據x和生成器獲得的假樣本G(z),計算出假樣本數據接近真樣本的概率。 infoGAN將GAN網絡和信息理論相結合, 引入隱變量編碼和生成數據之間的互信息關系約束,將連續噪聲向量z分成兩個部分:一部分是不可壓縮的噪聲;另一部分是隱含編碼c,且c可以是離散值,通過建模隱藏編碼和生產樣本的對應關系, 從而達到改變輸入噪聲控制生成樣本的目的。在本方法中,將處理后的工況數據視為隱含編碼, 訓練生成器得到一個重建溫度場, 并與CFD仿真溫度場一起投入鑒別器進行真假判斷, 使得模型最終能夠僅憑借工況數據生成與CFD仿真溫度場足夠接近的重建溫度場。

圖1 infoGAN網絡結構
GAN的目標函數定義為:

其中,E代表期望值,x~Pdata(x)代表樣本數據x滿足分布Pdata(x),z~Pz(z)代表隨機噪聲向量z滿足分布Pz(z)。
對于兩個變量X和Y,它們之間的互信息I(X;Y)定義為:

其中,p(x,y)是X和Y的聯合概率密度函數,p(x)和p(y)分別代表了X和Y的邊緣概率密度函數。
H代表熵,則互信息又可以表達為:

β代表超參數,則最終損失函數的表達式為:

最初的GAN 模型在理論和實踐中并不成熟,GAN的訓練需要大量的樣本,并且訓練次數也很多,模型難以得到最理想結果,而且很容易出現梯度消失[7]或者模式崩潰[8]的問題。 因此,筆者采用WGAN原理進行改進[9],所設計的網絡模型如圖2所示,生成器每個網絡塊都包括了轉置卷積層(Deconv)、批次歸一化層(Batch Normalization,BN) 和全連接層 (Fully Connected,FC),激活函數選擇LeakRelu,最后一層選擇Sigmoid激活函數。 完整網絡中總共使用了4個網絡塊,每個轉置卷積層卷積核K的大小均為4,卷積核個數N分別為8、16、32、64,步長S為2。 設計的鑒別器網絡與生成器類似, 共包含4個卷積層(Conv) 以及對應的批次歸一化層和LeakRelu激活層,每層的卷積核個數分別為64、32、16、2,卷積核大小為4,步長為2,最后使用一個全連接層得到0或1的判別結果。 分類器網絡與鑒別器共享網絡參數,僅在最后一層發生改變,經過兩個全連接層輸出分類標簽。


圖2 改進的網絡模型
為了更好地訓練模型, 筆者設計了一個擴張通道進行溫度場仿真, 具體幾何模型及其尺寸如圖3所示。 進口為長方形,出口為正方形(邊長10 cm);計算域通道在豎直方向上先擴張后變成平直段,水平方向通過豎直方向的截面拉伸得到。

圖3 擴張通道的幾何模型及其尺寸
CFD仿真相當于在計算機上虛擬地做流體實驗來模擬實際情況,基本原理是數值求解流體流動的微分方程。 在遇到復雜問題時,人為難以進行理論分析或直接做實驗,相比之下,CFD只需使用相應軟件就可以通過模擬實際環境得到可靠的實驗數據, 甚至可以通過CFD軟件進行實驗的同時發現新的實驗現象[10]。
本次實驗采用CFD數值模擬的方法, 輸入變量有進口速度、溫度和氣體導熱系數,輸出變量有計算域的溫度場和速度場。 采用ANSYS ICEM17.0進行計算網格劃分, 采用ANSYS FLUENT 17.0進行數值模擬。
計算域中幾個典型位置的溫度分布:進口處氣體溫度為輸入變量之一, 外界環境的溫度為300 K。 由于壁面與外界環境的換熱,通道內氣體溫度降低且越靠近壁面氣體溫度越低。 計算域內氣流的溫度在300~1 500 K。
對于仿真得到的370組數據, 選取250組作為訓練集、60組作為測試集、60組作為驗證集。 先將原始一維的50 933個點處理成二維數據訓練,再將一維數據用于訓練,只取溫度數據,為了方便訓練,將數據歸一化到(0,1)之間,其變換公式如下:

式中 t——溫度,K;
tmax——溫度最大值,K;
tmin——溫度最小值,K。
學習率(Learning Rate,LR)是深度學習中一個很重要的超參數,它主要在梯度下降法中發揮作用。 梯度下降法的目的是尋找函數的最優解。而學習率則是起始尋優步長,深度學習網絡中各部分權重ω的計算式為:

其中,α為學習率,loss為神經網絡所選擇的損失函數。
學習率設置過小,收斂速度就會非常緩慢,進而導致網絡效率低下;學習率設置過高,可能導致網絡學習過程中錯過最優解, 在最優解附近來回擺動,因此,設置恰當的學習率是很重要的。 最初對生成器和鑒別器設置了相同的學習率, 即0.01。但是在訓練過程,鑒別器的loss極小(接近0),而生成器的loss則較大且不穩定, 持續在0.2~1.0擺動,說明生成器為了結果能混淆鑒別器而在反復進行調整,但由于鑒別器判別能力過強,使得生成器不管怎么調整也無法得到最優解, 這將導致整體模型無法收斂。為了解決這個問題,筆者決定為生成器和鑒別器設置不同的學習率, 并按照初步實驗結果將鑒別器學習率設置為生成器的5倍。
隱空間代表網絡學習到的訓練樣本的特征數,隱空間維度有下限無上限。 通過以往經驗,如果隱空間維度過小,則生成圖片變化很小;但對于工業數據預測來講, 對于每一個固定的條件,溫度場的變化范圍很小,因此,其隱空間維度不應過大,否則生成的溫度場結果將不穩定且訓練耗時較長。 綜合上述分析,需要尋找能夠滿足本項目的適合的隱空間維度大小。
批次訓練樣本數(Batch Size,BS)是指一次訓練過程中所用到的樣本數量。 由于模型數據集較大,如果每次訓練都使用全尺寸訓練集,將會導致模型訓練緩慢、 內存空間不足且泛化性能一般。 但過小的批次訓練樣本數會使得模型收斂緩慢。 因此,需尋找既能滿足效率要求又能滿足精度要求的批次訓練樣本數。
由于不同參數之間的結果會互相影響,并不是完全解耦合的, 最優值會隨著其他參數的變化發生改變, 并且每個參數對最終結果的影響也是非線性的。因此,無法逐個對上述參數進行單獨尋優, 即需要尋找的最優參數是學習率、 隱空間維度、批次訓練樣本數共同作用的組合。筆者通過對上述參數設置在合理范圍內設置多個組合, 以尋找結果最優的參數搭配。 將生成器和鑒別器學習率設在0.000 1~0.010 0,隱空間維度設在5~180,批次訓練樣本數設置在10~270。 以平均相對誤差為結果評價標準,部分訓練條件和結果見表1。

表1 不同參數下部分預測結果
采用表1第4組參數組合能夠在較短的時間內得到較優的結果, 而第12組雖然能獲得最優結果,但其所需的時間開銷是第4組的數倍, 綜合分析后決定采用第4組的參數組合進行后續訓練, 即生成器和鑒定會別器學習率分別為0.000 1和0.000 5,批次訓練樣本數為10,隱空間維度為20。
CFD仿真數據的輸入速度變化范圍為0.5~2.75 m/s,變化步長為0.25 m/s;輸入溫度變化范圍為600~1 500 K,變化步長為100 K;氣體導熱系數變化范圍為0.024 2~0.242 0 W/(m·K), 變化步長為0.024 2 W/(m·K)。 隨機選取其中60組作為測試集計算預測溫度值與CFD真值的相對誤差, 表2展示了其中的10組。

表2 部分輸入條件下預測溫度與CFD真值的平均相對誤差
在訓練過程中損失函數值的變化趨勢如圖4 所示。

圖4 損失函數值變化趨勢
用Matlab軟件進行可視化處理, 其中一組溫度場的可視化與真實情況如圖5所示。

圖5 預測結果與真實溫度場對比
可以看出, 采用infoGAN網絡作為基本框架的深度學習方法能夠較好地擬合工業加熱爐原始溫度場的分布情況,且在參數調整后,所得結果的平均相對誤差絕對值在6%以下,基本滿足需求。
該方法的實現,可以僅依靠基本的工況數據得到對應工況下與CFD仿真溫度場平均相對誤差絕對值在6%以下的實時溫度場預測,可以據此得到加熱爐處于最優燃燒狀態下的操作建議,并對超出允許操作參數的情況進行預警,保證加熱爐的長期高效運行。
筆者借鑒GAN的思想, 對infoGAN網絡進行修改, 使得網絡可以訓練帶有離散標簽值的數據; 在infoGAN中引入WGAN損失函數進行優化,同時探究了學習率、批次訓練樣本數和隱空間維度大小對網絡訓練結果的影響,并選擇最優參數對網絡進行訓練, 采用Matlab軟件做出可視化處理, 實現了工業加熱爐溫場預測的良好效果,在測試集上平均相對誤差絕對值在6%以下。該方法具有良好的應用前景。